藏语拉萨话机读音标系统设计与实现

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

藏语拉萨话机读音标系统设计与实现
陈小莹;艾金勇
【摘要】文章通过收集整理藏语拉萨话的音系,归纳出对应的音系特征,依据SAMPA的设计原则并参照汉语和藏语的国际音标,最终设计并实现了藏语拉萨话机读音标系统.藏语机读音标的设计可以为藏语语音工程的实现打下坚实的基础,可以真正地实现文音转换功能.
【期刊名称】《电脑与信息技术》
【年(卷),期】2016(024)002
【总页数】3页(P9-11)
【关键词】藏语;拉萨话;机读音标;SAMPA
【作者】陈小莹;艾金勇
【作者单位】西藏民族大学信息工程学院,陕西咸阳712082;西藏民族大学图书馆,陕西咸阳712082
【正文语种】中文
【中图分类】TP391
机读音标SAMPA(Speech Assessment Methods Phonetic Alphabet)是1987- 1989年间欧洲的ESPRIT(欧洲信息技术研究开发战略计划)开发的一种计算机可读的音标系统,该系统采用拉丁字母、数字以及其它简单易于输入的键盘符号组合形式来替代目前国际音标中的各种特殊符号。

目前世界上各种语言的语音数据库都使用该符号系统,使得计算机在输入国际音标时更加方便,同时也能便捷
的表示出各种复杂的国际音标符号。

但是每一种语言的音标都有各自的语言版本,不同版本之间的SAMPA表并不能完全兼容,因此SAMPA表并不能表示出所有
语言的国际音标。

针对SAMPA表的这个缺点,1995年伦敦大学的语言学教授提出并设计了X- SAMPA这种可以代表所有国际音标的单一代码表,它是在SAMPA的基础上进行扩充,可以用ASCII字符表示国际音标的所有符号[1]。

这样,SAMPA就成为一个在国际音标基础上可以表示世界上各种语言的机读音标系统。

汉语和藏语同属于汉藏语系,两种语言之间在语音上有相同之处。

汉语的SAMPA 相关研究已经比较成熟,所以对藏语各方言区机读音标的设计可以借鉴成熟的汉语语音技术[2]。

首先收集整理藏语拉萨话的音系;其次归纳出对应的音系特征,最后对照汉语和藏语的国际音标,完成藏语拉萨话机读音标系统的设计。

2.1声母设计
藏语拉萨话的声母系统比较简单,约30个左右,没有复辅音声母,除浊鼻音m、n、ȵ、ɳ外,拉萨话中没有浊声母,全为清音。

塞音中不带音不送气的塞音有p、t、c、k、?5种;塞擦音中不带音不送气的塞擦音有ts、、ʨ 3种;擦音中清擦
音有s、ɬ、、ɕ、c、h 6种;颤音r没有特定的音位;边音l;还有半元音w、j,声母系统主要是单辅音声母[3]。

依据SAMPA的设计原则,藏语拉萨话声母在SAMPA_WT转换时,基本上采用
键盘上可以直接输入的符号,并且尽可能与其国际音标一致,不易引起音位混淆[4]。

具体见表1。

在拉萨话声母SAMPA_WT设计部分,基本上采用键盘上可以直接输入的符号,
其它难以用键盘输入的国际音标,直接使用和国际音标相近的且未使用过的键盘符号来标记。

具体按如下方法设计:
(1)如果国际音标可直接用ASCII字符表示,为节约空间和击键次数,拉萨话声
母的SAMPA_WT机读音标直接采用藏语的国际音标表示。

不送气清塞音p、t、c 和k,半元音j和w,不送气塞擦音ts,擦音s和h,鼻音m和n,边音l在SAMPA_WT均按照其发音部位和发音方式参照X- SAMPA设计,它们的机读音
标SAMPA_WT分别标记为/p/,/t/,/c/,/k/,/j/,/w/,/ts/,/s/,/h/,/m/,/n/,/l/;
(2)对于其它难以用键盘输入的国际音标,直接使用和国际音标相近的且未使用过的键盘符号来标记。

不送气塞擦音和擦音,这些国际音标符号用键盘不方便输入,同时为了和已经使用过的/ts/,/s/区分且表明相关性,在该国际音标的基础上添加符号“`”来标记它
们的SAMPA_WT,分别标记为/ts`/,/s`/;
不送气塞擦音ʨ、浊擦音r和擦音ɕ,这三个符号在键盘上不存在,SAMPA_WT
分别标记为/ts\/,/z\/,/s\/;
同样鼻音ɳ、ŋ和擦音ɬ的国际音标符号在键盘上也不存在,在设计它们的SAMPA_WT时直接沿用
X- SAMPA码表,分别标记为/J/,/N/和/K/。

(3)送气清塞音ph、th、ch和kh,送气塞擦音tsh,h、ʨh和在SAMPA_WT 转换时,对应的机读音标SAMPA_WT分别标记为/p_h/,/t_h/,/c_h/,/k_h/,/ts_h/,,/ts\_h/。

2.2韵母设计
藏语拉萨话的韵母系统相对复杂一些,总共有50个左右,除去/a/、/i/、/u/、
/e/、/o/5个基本元音外,还包含/ε/、/y/、/Ø/ 3个元音,一共有8个单元音,
此外还有复合元音/au/、/iu/以及包含辅音韵尾的韵母。

藏语拉萨话韵母由核心元音与韵尾两部分组成,有Ɂ、k、p、m、ŋ、r 6个辅音韵尾。

藏语的元音没有单
独构成音节的,都带有声母,单独韵母时都带有喉塞辅音Ɂ[5]。

在包含辅音韵尾的韵母SAMPA_WT的设计部分,采用单辅音和基本元音的SAMPA_WT组合来实现。

具体见表2、表3。

单元音韵母/a/、/i/、/u/、/e/、/o/、/y/及其对应长元音的SAMPA_WT机读音标直接采用藏语的国际音标来表示,分别标记为/a/,/i/,/u/,/e/,/o/,/y/和/a:/,/i:/,/u:/,/e:/,/o:/,/y:/。

单元音韵母/ε/和/Ø/及其对应的长元音,直接参照X- SAMPA的标准来设计,它们的SAMPA_WT分别标记为/E/和/$/,对应的长元音的SAM PA_WT分别标记为/E:/和/$:/。

在拉萨话辅音韵尾的韵母SAMPA_WT设计部分,当辅音韵尾Ɂ、k、p、m与元音/a/、/i/、/u/、/e/、/o/、/y/、/ε/、/Ø/分别结合时,辅音韵尾采用与其国际音标相同的字符,元音/ε/、/Ø/的SAMPA_WT转换规则和单元音韵母一致;当辅音韵尾ŋ与元音/a/、/i/、/u/、/e/、/o/分别结合时,同样为了和其它相同字母区分,在国际音标的基础上辅以键盘上其它符号表示它们的SAMPA_WT,辅音韵尾ŋ在SAMPA_WT采用/N/表示,其它元音采用与其国际音标相同的字符。

2.3声调处理
现代藏语拉萨话中包含声调,它具有区别语义和语法的作用,在拉萨话语音结构中起着十分重要作用[5]。

金鹏在《藏语简志》中提出可以将藏语拉萨话的声调按照宽式标音分为54,55,12,14四类,同时也分析了拉萨话声调和声韵母之间的对应关系[6]。

在声调SAMPA_WT设计部分,对拉萨话53,55,12,14四个声调,本文采用调值作为声调的机读音标SAMPA_WT。

本文选取拉萨话作为藏语卫藏方言区的代表,通过归纳整理拉萨话音系特征,在遵循SAMPA的原则下,参照X- SAMPA以及汉语成熟的SAMPA_SC系统完成了藏语拉萨话SAMPA系统的设计。

藏语机读音标的设计可以为藏语语音工程的实现打下坚实的基础,可以真正实现文音转换功能。

同时也为藏语韵律特征研究、语
音合成以及语音识别等语音工程领域研究提供科学依据。

【相关文献】
[1]于洪志,高璐,李永宏,等.藏语机读音标SAMPA_ST的设计[J].中文信息学报,2012(04):66- 72.
[2]张家騄.汉语普通话机读音标SAMPA- SC[J].声学学报(中文版),2009(01):81- 86. [3]陈小莹,艾金勇.藏语拉萨话塞音、塞擦音VOT声学分析[J].电脑与信息技术,2015(06):4- 6.
[4]李永宏,孔江平,于洪志.藏语文-音自动规则转换及其实现[J].清华大学学报(自然科学版),2008(S1):621- 626.
[5]胡坦.藏语(拉萨话)声调研究[J].民族语文,1980(01):22- 36.
[6]金鹏.藏语简志[M].北京:人民出版社,1983.。

相关文档
最新文档