热门问题
时间线
聊天
视角
藏文
藏语等语言的书写系统 来自维基百科,自由的百科全书
Remove ads
藏文(藏语:བོད་ཡིག་,威利转写:bod yig,藏语拼音:Pöyig)是藏语、宗喀语、锡金语、普米语等语言的文字系统,基本上是一种元音附标文字,它根据古典藏语语音而建立,共三十个字母。目前通用的藏文罗马化方案为威利转写方案。除此之外,还有藏语拼音、《藏文拼音教材(拉萨音)》拼音方案、及THL拼音等罗马化方案。

藏文是吐蕃时代公元7世纪由国王松赞干布派遣藏族语言学家吞弥·桑布扎到北印度学习梵文[1],回国后引用兰札文创制的。
藏文虽是为书写藏语而创制,但也和很多其它婆罗米系文字一样,能用于书写梵语。另外,在汉藏语系诸语中,藏文的历史长度、文献丰富程度都仅次于汉文。不过,这大量的文献中,绝大多数皆系佛教典籍,世俗文献不算太多。
Remove ads
藏文书写方法
藏文每个音节有一个基字,确定该音节的中心辅音,基字上方或下方可以加元音附标表示不同的元音。基字上方有时有一个上加字,下方有时有一到两个下加字,前边有时有一个前加字,表示该音节的声母是复辅音。复辅音的连接顺序依次为前加字、上加字、基字、下加字。基字后边有时有一到两个后加字,表示该音节有一到两个辅音韵尾。


以下为藏文书写的示例之一:
上面的藏文有一个音节“བསྒྲོནད”(威利转写:bsgrond),由前加字ba、上加字sa,基字ga,下加字ra,元音o、第一后加字na、第二后加字da构成。bsgrond是7世纪的藏语语音,随着现在拉萨音里复辅音以及部分韵尾的消失和声调的出现,该词已转变读成/ʈʂø̃˩˨/(藏语拼音:zhön,藏文拉萨音拼音:zhoenv)。
- 前加字只能是 ག /g/、 ད /d/、 བ /b/、 མ /m/、 འ /ɦ/。
- 上加字只能是 ཪ /r/、 ལ /l/、 ས /s/。
- 下加字只能是 ◌ྲ /r/、 ◌ /j/、 ◌ྭ /w/、 ◌ླ /l/ 和用于音译梵文里送气浊辅音的送气符号 ◌ྷ,有一个复辅音 གྲྭ /grwa/ 有两个下加字 ◌ྲ /r/ 和 ◌ྭ /w/。
- 第一后加字只可能是 ཪ /r/、 ག /g/、 བ /b/、 མ /m/、 འ /ɦ/、 ང /ŋ/、 ས /s/、 ད /d/、 ན /n/、 ལ /l/。
- 第二后加字只可能是 ས /s/ 和 ད /d/,在现代藏语里不再发音,ད /d/ 在现代藏语中已经不用。
另外,以下是藏文带头字(དབུ་ཅན་)和无头字(དབུ་མེད་)两种字体和国际拉丁文转写的列表:

Remove ads
藏文的子音(གསལ་བྱེད་)除了第5行第4列的 ཝ (wa) 以外,字母表由最上方开始到第5行为止,在纵横两个方向的顺序安排上具有语音学的意义。字典的排列顺序即是由左而右、由上到下。
单音节的声调有高平调与低平调(略为上升)两种。必须注意以下两点:
- 第4列(正确地来说应该是鼻音与接近音)的基字有前加字或上加字时,声调将从低平调(或低升调)转为高平调。(请参考下面的章节)
- 高平调与低平调有-ག(g)、-གས(gs)、-ད(d)、-བ(b)、-བས(bs)、-ངས(ngs)、-མས(ms)、-ས(s) 等后加字或再后加字时,声调会往下降,形成高降调与低升降调。
另外,母音开头的字使用最后的无音价字母ཨ来表示。
Remove ads
由于基字本身带有母音[a],因此需要其他四个母音符号(དབྱངས་)来书写其他母音。另外,a [a]、o [o]、u [u]三个母音后面遇到舌尖音的后加字-ད(d)、-ན(n)、-ལ(l)、-ས(s)时,发音会变成 ä [ɛ]、ü [y]、ö [ø]。
- 前加字:ག་ད་བ་མ་འ།
- 上加字:ར་ལ་ས།
- 下加字:ཡ་ར་ལ་ཝ།
- 第一后加字:ག་ང་ད་ན་བ་མ་འ་ར་ལ་ས།
- 第二后加字:ད་ས།
- 反体字(ལོག་ཡིག་):ཊ་ཋ་ཌ་ཎ་ཥ་ཀྵ།
- 并体字(མཐུག་ཡིག་):གྷ་དྷ་ཌྷ་བྷ་ཛྷ།
藏文字体
经过几千年的发展,藏文从吞弥桑布札创制开始至今,藏文字体已经发展出近几十种之多,但是总结起来主要为两大类,乌金体与乌梅体。[2]
二者的区别在于乌金体有冠体为其显著的特点,即每个字母最上一笔是横直的,字母排列时,上端必须在一条直线上,形似平顶帽。而乌梅体则省略了这条横线,此为两者最显著的区别。
在印刷与官方文书方面一般多使用乌金体,因其字体看起来比较大气故此。而乌梅体则较多的使用于手写录入。
藏文字母表
以下图片以乌金体为例:
-
ཀ的笔顺
-
ཁ的笔顺
-
ག的笔顺
-
ང的笔顺
-
ཅ的笔顺
-
ཆ的笔顺
-
ཇ的笔顺
-
ཉ的笔顺
-
ཏ的笔顺
-
ཐ的笔顺
-
ད的笔顺
-
ན的笔顺
-
པ的笔顺
-
ཕ的笔顺(基于པ)
-
བ的笔顺
-
མ的笔顺
-
ཙ、ཚ、ཛ的笔顺(基于ཅ、ཆ、ཇ)
-
ཝ的笔顺
-
ཞ的笔顺
-
ཟ的笔顺
-
འ的笔顺
-
ཡ的笔顺
-
ར的笔顺
-
ལ的笔顺
-
ཤ的笔顺
-
ས的笔顺
-
ཧ的笔顺
-
ཨ的笔顺
Remove ads
巴尔蒂语有4个扩充的字母用于表示其特有的辅音:
- 目前尚没有人明确地知道藏文 འ ('a-chung)在创制时的用途和所代表的发音是什么。藏文中,对于C1VC2和C1C2V类型的音节,如果C1既可为前加字也可为基字,而C2既可为后加字又可为基字,为了区分C1VC2与C1C2V这两种不同的音节,就需要在书写C1C2V时在V的位置填入 འ,此时 འ 似无实在作用,仅作为占位符使用。根据藏梵对音,འ 是用来标注梵文的长元音的,似乎也表明它没有实际的发音用途。但在藏文的动词变位方面,འ 却是重要的构成现在时的前缀之一。在比较语言学上,它又似与汉语ɦ-前缀相对应。对于 འ 的用途,目前较流行的说法有:
- 认为它代表某种鼻音,用ɴ-表示。
- 认为它代表ɦ-或相近的发音。
- 认为它代表对后继辅音的“前鼻化”(prenasalisation)。
- 认为它没有具体对应的发音,或者它有多种不同的用途。
数字
藏文数字与阿拉伯数字一一对应,但写法不同。
标点符号
- ༄〔段首〕
- ་〔音节结尾〕
- །〔句末〕
- ༎〔段末〕
- ༺〔左括号〕
- ༻〔右括号〕
- ༼〔左大括号〕
- ༽〔右大括号〕
- ༴〔重复符号〕
书写梵文
- च छ ज झ(ca cha ja jha)转写为 ཙ ཚ ཛ ཛྷ(tsa tsha dza dzha)是古往规定,现代转写也可用 ཅ ཆ ཇ ཇྷ(ca cha ja jha)。
罗马化
由于藏语和藏文在文字上不能一致对应,因此藏文的罗马化,有反应实际文字的罗马转写和反应实际语音的罗马拼音。
转写有国际流行的威利转写,美国国会图书馆的USLC转写。威利转写较USLC转写,不用上下标字母。而USLC转写在梵文转写可以和国际流行的梵文转写IAST通用,能准确地标示梵文字母。
拼音有藏语拼音、《藏文拼音教材(拉萨音)》拼音方案、及THL拼音等罗马化方案。藏语拼音是中华人民共和国官方的藏语罗马字母拼写法,主要用于人名、地名的拼写。
与现代拉萨音的对应
藏语的7世纪复声母向现代拉萨音单声母的演变规律:
见藏语#文字及语音。
计算机处理
藏文最初于1991年收入Unicode第1版,使用的区段为U+1000–U+104F。然而1993年Unicode 1.1版当中,这一区段被移除(后来在Unicode 3.0用于缅甸文)。1996年7月Unicode 2.0发布后恢复对其支持。
藏文字母使用的区段为U+0F00–U+0FFF。藏文字母区段包括有文字、数字及多个标点符号及宗教文书上使用的特殊符号。下表详列区段内的所有文字(你的浏览器需要支持藏文字母显示):
藏文 Tibetan[1][2][3] Unicode Consortium 官方码表(PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+0F0x | ༀ | ༁ | ༂ | ༃ | ༄ | ༅ | ༆ | ༇ | ༈ | ༉ | ༊ | ་ | ༌ NB |
། | ༎ | ༏ |
U+0F1x | ༐ | ༑ | ༒ | ༓ | ༔ | ༕ | ༖ | ༗ | ༘ | ༙ | ༚ | ༛ | ༜ | ༝ | ༞ | ༟ |
U+0F2x | ༠ | ༡ | ༢ | ༣ | ༤ | ༥ | ༦ | ༧ | ༨ | ༩ | ༪ | ༫ | ༬ | ༭ | ༮ | ༯ |
U+0F3x | ༰ | ༱ | ༲ | ༳ | ༴ | ༵ | ༶ | ༷ | ༸ | ༹ | ༺ | ༻ | ༼ | ༽ | ༾ | ༿ |
U+0F4x | ཀ | ཁ | ག | གྷ | ང | ཅ | ཆ | ཇ | ཉ | ཊ | ཋ | ཌ | ཌྷ | ཎ | ཏ | |
U+0F5x | ཐ | ད | དྷ | ན | པ | ཕ | བ | བྷ | མ | ཙ | ཚ | ཛ | ཛྷ | ཝ | ཞ | ཟ |
U+0F6x | འ | ཡ | ར | ལ | ཤ | ཥ | ས | ཧ | ཨ | ཀྵ | ཪ | ཫ | ཬ | |||
U+0F7x | ཱ | ི | ཱི | ུ | ཱུ | ྲྀ | ཷ | ླྀ | ཹ | ེ | ཻ | ོ | ཽ | ཾ | ཿ | |
U+0F8x | ྀ | ཱྀ | ྂ | ྃ | ྄ | ྅ | ྆ | ྇ | ྈ | ྉ | ྊ | ྋ | ྌ | ྍ | ྎ | ྏ |
U+0F9x | ྐ | ྑ | ྒ | ྒྷ | ྔ | ྕ | ྖ | ྗ | ྙ | ྚ | ྛ | ྜ | ྜྷ | ྞ | ྟ | |
U+0FAx | ྠ | ྡ | ྡྷ | ྣ | ྤ | ྥ | ྦ | ྦྷ | ྨ | ྩ | ྪ | ྫ | ྫྷ | ྭ | ྮ | ྯ |
U+0FBx | ྰ | ྱ | ྲ | ླ | ྴ | ྵ | ྶ | ྷ | ྸ | ྐྵ | ྺ | ྻ | ྼ | ྾ | ྿ | |
U+0FCx | ࿀ | ࿁ | ࿂ | ࿃ | ࿄ | ࿅ | ࿆ | ࿇ | ࿈ | ࿉ | ࿊ | ࿋ | ࿌ | ࿎ | ࿏ | |
U+0FDx | ࿐ | ࿑ | ࿒ | ࿓ | ࿔ | ࿕ | ࿖ | ࿗ | ࿘ | ࿙ | ࿚ | |||||
U+0FEx | ||||||||||||||||
U+0FFx | ||||||||||||||||
注释 |
藏文字母在统一码(Unicode)的编码空间由 0F40 至 0F69。兹表列如下:
1997年9月2日,中华人民共和国国家技术监督局发布了《中华人民共和国国家标准GB 16959—1997 信息技术 信息交换用藏文编码字符集 基本集》(以下简称“《基本集》”),于1998年1月1日起实施。该标准由中华人民共和国电子工业部提出,全国信息技术标准化技术委员会归口,起草单位为西藏自治区藏语文工作指导委员会办公室、西藏大学、西藏自治区技术监督局、西北民族学院、青海师范大学。[3]该标准是中华人民共和国第一个少数民族语言文字的信息处理用国际标准,也是中华人民共和国现行全部藏文信息处理用国家标准。[4]
《基本集》收录的藏文字母,可组成任意藏文词句,包括藏文古籍的文字。1997年《基本集》刚刚发布时,因技术局限,藏文字母的上下叠加构造无法方便处理,难以实现藏文的动态组合,故后来西藏大学藏文信息技术研究中心陆续制定6项藏文信息处理交换标准国家标准。2007年,共有8个国际标准及国家标准获得中华人民共和国教育部批准。经过上述完善,《基本集》已成为如今国际普遍应用的标准,微软、苹果等国际软件企业开发藏文产品时,均依照该标准,如微软从Windows7系统开始便依照该标准支持了藏文字母的上下叠加构造。[4][5]
1984年,西北民族大学教授、中国民族信息技术研究院院长于洪志主持开发了“藏文信息处理系统”、“藏文输入系统”、“藏文操作系统”等。[6]

现有的藏文信息处理中的键盘均是依据西藏大学藏文信息技术研究中心确定的,包括微软2007年推出的Windows Vista操作系统(Operating System,OS)中藏文输入系统也对此基本遵循。过去,包括1998年实施的《基本集》在内,藏文的上下叠加构造无法方便实现;但在西藏大学藏文信息技术研究中心推出的藏文信息处理用国家标准实现了藏文的上下叠加构造之后,藏文的横向组合与纵向叠加已经全部实现。[5]
1998年实施《基本集》后,西北民族学院计算机教师和藏文教师用一年多完成了“藏汉双语信息处理系统”,包括藏文构件集编码、字体、格萨尔信息系统、藏文历算软件、藏药检索、藏医自动诊断、藏文字频统计、藏文办公自动化、藏文数据统计等9个子系统。[6]
2007年11月,甘肃省推出藏文彩信手机报,成为中国第一份藏文彩信手机报。[6]在1998年实施的《基本集》的基础上,西南民族大学民族文字信息处理研究所组成手写藏文手机输入法和藏文字库的课题组,创建24点阵的藏文点阵字库,翻译5000多条手写藏文手机术语。2009年,西南民族大学与北京网道信通科技发展有限公司共同研制的世界上第一款手写藏文手机正式推出,包括GSM手机和CDMA手机两种。[7]2012年6月,中国电信西藏公司藏文版手机上市,受到西藏自治区藏族民众特别是藏传佛教僧众及农牧民的欢迎。[8]
西藏大学藏文信息技术研究中心的主要研究方向是藏文信息技术基础理论和应用,重点研发了藏文字符编码、输入法、字库(符合国际标准的最大藏文字库,支持梵音藏文相互转写,支持微软及Linux操作系统)、操作系统(2008年与中国科学院共同研发了藏文版的红旗操作系统,为世界第一款从底层编码的藏文操作系统)、上网软件、办公软件、文字识别(藏文OCR文字识别系统);此外还包括:藏语自然语言处理、藏文模式识别、藏文信息安全、藏文数字媒体技术与工程、藏文嵌入式。该中心研制的新一代藏文软件已应用到西藏自治区第二代身份证制作中。拉萨市公交车语音报站系统即该中心研制的藏文嵌入式的应用。该中心还将建设一个大规模藏语语料库,以推出基于安卓操作系统的藏文智能手机,并能支持藏文的手写及语音输入技术。[4]
参考文献
参阅
外部链接
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads