书
书
书犐犆犛
35
.
240
.
01
犔
70
中华人民共和国国家标准
犌犅
/
犜
36335
—
2018
信息技术
藏文字符排序规范
犐狀犳狅狉犿犪狋犻狅狀狋犲犮犺狀狅犾狅犵狔
—
犛狆犲犮犻犳犻犮犪狋犻狅狀犳狅狉犮狅犾犾犪狋犻狅狀狅犳犜犻犫犲狋犪狀犮犺犪狉犪犮狋犲狉狊
2018
06
07
发布
2019
01
01
实施
国家市场监督管理总局
中国国家标准化管理委员会
发布目
次
前言
Ⅰ
…………………………………………………………………………………………………………
1
范围
1
………………………………………………………………………………………………………
2
规范性引用文件
1
…………………………………………………………………………………………
3
术语和定义
1
………………………………………………………………………………………………
4
藏文字符排序原则
2
………………………………………………………………………………………
附录
A
(
资料性附录
)
藏文音节和梵文转写藏文音节的一维展开
5
……………………………………
参考文献
6
………………………………………………………………………………………………………
犌犅
/
犜
36335
—
2018
前
言
本标准按照
GB
/
T1.1
—
2009
给出的规则起草
。
请注意本文件的某些内容可能涉及专利
。
本文件的发布机构不承担识别这些专利的责任
。
本标准由全国信息技术标准化技术委员会
(
SAC
/
TC28
)
提出并归口
。
本标准起草单位
:
中国电子技术标准化研究院
、
青海师范大学
、
西藏自治区藏语文工作委员会办公室
、
中国藏学研究中心
、
青海民族大学
、
西藏大学
、
中国科学院软件研究所
、
西北民族大学
。
本标准主要起草人
:
黄鹤鸣
、
熊涛
、
多拉
、
欧珠
、
安见才让
。
Ⅰ
犌犅
/
犜
36335
—
2018
信息技术
藏文字符排序规范
1
范围
本标准规定了信息处理用藏文字符和梵文转写藏文字符排序原则
。
注
:
包括但不限于
GB
/
T13000
—
2010
、
GB16959
—
1997
、
GB
/
T20542
—
2006
、
GB
/
T22238
—
2008
中所规定的藏文
字符和梵文转写藏文字符
。
本标准适用于藏文信息处理
。
2
规范性引用文件
下列文件对于本文件的应用是必不可少的
。
凡是注日期的引用文件
,
仅注日期的版本适用于本文件
。
凡是不注日期的引用文件
,
其最新版本
(
包括所有的修改单
)
适用于本文件
。
GB
/
T13000
—
2010
信息技术
通用多八位编码字符集
(
UCS
)
GB16959
—
1997
信息技术
信息交换用藏文编码字符集
基本集
3
术语和定义
下列术语和定义适用于本文件
。
3
.
1
字符
犮犺犪狉犪犮狋犲狉
供组织
、
控制或表示数据的元素集合中的一个元素
。
3
.
2
字符串
犮犺犪狉犪犮狋犲狉狊狋狉犻狀犵
能看作一个单独对象的字符序列
。
3
.
3
编码字符
犮狅犱犲犱犮犺犪狉犪犮狋犲狉
被赋予编码的字符
。
3
.
4
图形字符
犵狉犪狆犺犻犮犮犺犪狉犪犮狋犲狉
不同于控制功能的字符
,
通常具有书写
、
打印或显示的可视表示
。
3
.
5
占位字符
狊狆犪犮犻狀犵犮犺犪狉犪犮狋犲狉
显示时占用宽度的字符
。
3
.
6
不占位字符
狀狅狀狊狆犪犮犻狀犵犮犺犪狉犪犮狋犲狉
显示时不占用宽度的字符
,
用于和前导的字符串相组合
。
注
:
前导的字符串可能是一个占位字符也可能由一个占位字符和几个不占位字符构成的序列
。
3
.
7
梵文转写藏文字符
狋狉犪狀狊犾犻狋犲狉犪狋犻狀犵犜犻犫犲狋犪狀犮犺犪狉犪犮狋犲狉
GB
/
T13000
—
2010
和
GB16959
—
1997
所收集的梵文转写藏文字母以及由这些字母的垂直组合
1
犌犅
/
犜
36335
—
2018
形成的字符
。
3
.
8
第一类元音
狋狔狆犲狅狀犲狏狅狑犲犾
元音
、
、
、
、
、
、
、
、
、
、
、
以及
。
3
.
9
第二类元音
狋狔狆犲狋狑狅狏狅狑犲犾
元音
和
。
3
.
10
排序
犮狅犾犾犪狋犻狅狀
给定字符或者字符串之间的先后顺序
。
3
.
11
排序元素
犮狅犾犾犪狋犻狅狀犲犾犲犿犲狀狋
为了实现字符间的排序而为每个字符赋予的数值
。
4
藏文字符排序原则
4
.
1
藏文符号
、
数字以及字母间的顺序
藏文中符号
、
数字以及字母间的先后顺序为
:
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
同一个辅音字母的不占位字符要排在占位字符的后面
。
因此
,
所有辅音字母的占位字符和不占位
字符间的先后关系为
:
、
、
、
、
、
、
、
、
、
、
、
、
。
字母
、
、
、
作为下加辅音时
,
相应的不占位字符间的顺序为
:
、
、
、
。
元音符号之间的顺序为
:
、
、
、
、
、
、
、
、
、
、
、
、
、
、
。
图形符号
分解成
、
、
后进行排序
。
符号
、
、
、
、
、
、
、
、
、
、
、
不参与排序
,
也就是说这些符号的出现
,
不影响一个藏文字
符串的序性
。
符号
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
可以不参与排序
,
这些字符是否参与
排序由用户来决定
。
4
.
2
藏文音节的排序
4
.
2
.
1
藏文音节通用结构
典型的藏文音节由基本辅音字母
、
前加辅音字母
、
上加辅音字母
、
下加辅音字母
、
元音符号
、
后加辅音字母以及又后加辅音字母组成
。
有些藏文音节有两个下加辅音
,
而有些梵文转写藏文字符有两个元音
。
因此
,
藏文音节的通用结构应包含基本辅音字母
、
前加辅音字母
、
上加辅音字母
、
第一下加辅音字母
、
第二下加辅音字母
、
第一类元音符号
、
后加辅音字母
/
第二类元音符号以及又后加辅音字母
,
如图
1
所示
。
2
犌犅
/
犜
36335
—
2018
图
1
藏文音节通用结构
4
.
2
.
2
通用结构中各个位置上的字母
基本辅音不能空缺
,
基本辅音是
34
个辅音字母
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
、
中的某一个
;
前加辅音可能空缺也可能
是辅音字母
、
、
、
、
中的某一个
;
上加辅音可能空缺也可能是辅音字母
、
、
中的某一个
;
下加辅
音字母可能空缺也可能是辅音字母
、
、
、
中的某一个
,
这时辅音字母
、
、
往往变形为
、
、
;
第
一类元音可能空缺也可能是元音符号
、
、
、
、
、
、
、
、
、
、
、
和
中的某一个
;
第二类元音可能
空缺也可能是元音符号
和
中的某一个
;
后加辅音可能空缺也可能是辅音字母
、
、
、
、
、
、
、
、
、
中的某一个
;
又后加辅音可能空缺也可能是辅音字母
或者
。
4
.
2
.
3
藏文音节的排序规则
为了实现两个藏文音节间的排序
,
首先
,
把参与排序的两个音节用一个二维的通用结构表示
;
其次
,
按照特定的顺序把二维的音节展开成一维字符串
(
参见附录
A
),
展开时如果某个位置上的字母空缺
,
则用一个特殊字符替代
,
这个特殊字符的排序元素小于任何藏文字符的排序元素
;
最后
,
通过按照从左向右的顺序比较两个一维字符串得到原音节之间的先后顺序
。
其中
,
将二维藏文音节展成一维字符串的特定顺序为基本辅音字母
、
前加辅音字母
、
上加辅音字母
、
第一下加辅音字母
、
第二下加辅音字母
、
第一类元音符号
、
后加辅音字母
/
第二类元音符号以及又后加辅音字母
。
4
.
2
.
4
受语法影响音节的分解
受语法影响的藏文音节可能不符合藏文音节通用结构
。
例如
:
受属格助词
影响的音节
、
等
,
受终结词
影响的音节
、
等
,
受构形词缀
影响的音节
、
、
、
等以及受构形词缀
和属格助词
双重影响的音节
。
对于受词缀
、
和
影响而不符合通用结构的音节
,
排序时把词缀
、
和
分别看作一个独立的音
节而将剩余部分看作一个音节
。
这样原音节被切分成了一个音节序列
,
而序列中的每个音节都符合藏文音节通用结构
。
示例
:
受语法影响的音节
被切分成音节序列
后
,
则序列中的音节
、
以及
都符合通用结构
。
4
.
2
.
5
特殊音节中字母之间的位置关系
GB-T 36335-2018 信息技术 藏文字符排序规范
文档预览
中文文档
9 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2025-07-17 23:28:18上传分享