藏文拉丁转写方案

合集下载

汉字拉丁化二字母法新文字方案

汉字拉丁化二字母法新文字方案

汉字拉丁化二字母法新文字方案
汉字拉丁化二字母法新文字方案:
一、定义
汉字拉丁化二字母法是指将汉字转换为对应的英语字母,并由此创建
出一种兼容汉语和英语的新文字方案。

它的目的是使英语语言的用户
可以更容易地掌握汉语,同时也让汉语用户可以更容易使用英语。

二、具体实现
汉字拉丁化二字母法是将汉字发音转换为相应的英语字母,以写出一
种能够在汉语和英语之间对应的、汉语发音对应英语字母的新文字方案。

具体的实现方式分为三部分:
1. 单音节汉字:将汉字转换为与其发音相对应的大写英文字母,一般
情况下,单音节汉字将转换为单字母,如“元”将转换为“Y”。

2. 多音节汉字:将汉字转换为与其发音对应的双字母组合,多音节汉
字将转换为双字母,如“必”将转换为“B-I”。

3. 声母:汉字拉丁化二字母法中的声母使用音素法来表示,声母有“b”“p”“m”“f”“d”“t”“n”“l”“g”“k”“h”等,多音节汉字的发音首先是声母,之后是韵母。

三、结束
汉字拉丁化二字母法是一种更易于掌握的文字方案,可以帮助英语用户更好地理解汉语,也能让汉语用户更好地使用英语。

未来,伴随着科技、特别是计算机技术的发展,汉字拉丁化二字母法将会在华文传播中发挥越来越多的作用。

汉字拉丁化方案

汉字拉丁化方案

汉字拉丁化方案汉字拉丁化方案引言汉字拉丁化是一种将汉字转换为拉丁字母表的方案,其目的是为了方便在国际交流、信息处理和计算机输入输出等方面使用汉字。

汉字作为一种象形文字,其复杂的构造和数量众多的字形给拉丁化带来了一定的挑战。

本文将介绍几种常见的汉字拉丁化方案,并讨论其优缺点以及应用场景。

拼音方案拼音方案是最为常见的一种汉字拉丁化方案。

它通过用拉丁字母来表示汉字的发音,以构建一种简单直观的拼音系统。

目前最为广泛使用的拼音方案是汉语拼音方案,它由国家标准化管理委员会规定,并于1958年正式公布。

汉语拼音方案使用26个字母(包括a-z)来表示21个声母和36个韵母,并通过一些特殊符号来表示声调。

**优点:**- 简单易学,符合拉丁字母表的规范。

- 适用于语言学研究、教育和计算机输入输出等方面。

**缺点:**- 无法准确表达汉字的字形和意义,容易引起歧义。

- 存在多音字和同音字的问题,使得理解和使用时容易产生困惑。

拼音方案的应用场景非常广泛,特别是在语言学、教育和计算机输入法中。

无论是中文学习者还是外国人,通过学习拼音方案,都可以更方便地了解和使用汉字。

注音符号方案除了拼音方案外,还有一种常用的汉字拉丁化方案是注音符号方案。

注音符号是台湾推广的一种音标符号,它通过注音符号来表示汉字的读音,并配以相应的符号来表示声调。

注音符号方案在台湾地区被广泛使用,并且在一些中文输入法和字典中也有使用。

**优点:**- 可以较为准确地表示汉字的读音和声调。

- 使用方便,适合作为输入法方案。

**缺点:**- 注音符号方案只适用于台湾地区,国内使用较少。

- 注音符号方案无法直接表示汉字的字形和意义。

注音符号方案主要适用于台湾地区的教育和输入法场景。

在这些场景中,通过注音符号可以较为准确地表示汉字的读音和声调,方便学习和输入。

数字拼音方案数字拼音方案是一种特殊的汉字拉丁化方案,它通过将汉字拼音转换为数字的方式表示。

这种方案主要用于计算机输入法和信息处理中,可以简化对汉字的处理和存储。

汉字转写方案

汉字转写方案

汉字转写方案1. 概述汉字转写是指将汉字用外文(通常是拉丁字母)拼写出来的一种方法。

汉字转写方案的设计旨在将中文的发音转换为外文拼音,以方便外国人学习、拼读和理解汉字。

2. 历史背景在与世界交流日益频繁的现代社会中,汉字转写成为了必不可少的工具。

在中国古代,人们使用音韵书籍记录了汉字的发音规律,但直到近代才真正出现了汉字转写的系统化方案。

自19世纪末20世纪初开始,一系列的汉字转写方案应运而生,成为了国际上交流中使用的主要工具。

3. 汉字转写方案的分类根据使用的拉丁字母的不同,汉字转写方案可以分为不同的类型。

以下是一些常见的汉字转写方案:3.1 Wade-Giles(韦氏拼音)Wade-Giles是最早出现的汉字转写方案之一。

由英国传教士托马斯·韦德和赫伯特·吉尔斯于19世纪末提出。

这一方案使用了大量的音标符号,并且与汉语音韵并没有直接的对应关系。

3.2 Pinyin(拼音)拼音是中国政府于1958年制定的官方汉字转写方案。

拼音方案使用了较少的音标符号,便于学习和使用。

拼音方案与汉语音韵有一定的对应关系,方便外国人学习和拼读汉字。

3.3 Bopomofo(注音符号)Bopomofo是台湾地区常用的汉字转写方案。

它使用了一系列特殊的注音符号,可以准确地表示汉字的音韵。

Bopomofo在台湾教育系统中被广泛应用,并且也在汉字输入法中使用。

3.4 Jyutping(粤拼)粤拼是广东话(粤语)的汉字转写方案。

它使用了拉丁字母和一些特殊符号来表示广东话的发音,方便外国人学习和使用粤语。

4. 不同汉字转写方案的应用不同的汉字转写方案在不同的国家和地区具有不同的应用。

以下是一些典型的应用示例:•Wade-Giles方案主要用于早期的西方学术研究和书籍中。

•拼音方案成为了中国大陆和许多国际场合中最主要的汉字转写方案,如在中国大陆的教育系统、商务交流和外国人学习汉语等方面。

•Bopomofo方案主要应用于台湾地区的教育系统和媒体。

藏文拉丁转写方案

藏文拉丁转写方案

藏文拉丁转写方案藏文拉丁字母转写是指将藏文字母转换成拉丁字母,从而使藏语罗马化的文字转写方法。

在国内外有各种各样的转写方案。

在此介绍现在国内外较通用的威利(Wylie)转写方案。

(注,在威利方案中三十个辅音字母的第六组第三个字母(第23个辅音字母)用的是' ,而在此用字母v)转写方案:(对应关系)(1)辅音字母(2)元音转写时以藏文书写顺序,把藏文的每一个字符转换成相应的拉丁字母。

也就是说将把一个字按它的基字(ming gzhi)、元音(dbyngs)、前加字(sngon vjuk)、后加字(rjes vjuk)、再后加字(yang vjuk)、上加字(mgo can)、下加字(vdogs can)按手写顺序拆成其相应拉丁字母的方法。

切记必须按照正确的手写顺序拆字。

如:吐蕃,转写为bod;拉萨,转写为lha sa;安多,转写为a mdo;康巴,转写为khms pa;卫藏,转写为dbus gtsang;雪域,转写为gnags ljongs;扎西,转写为bkra shis;转写方法详解:对于一个字儿,(1)如果不含有元音字母,那么转写时需要将在基字对应的拉丁字母后面加一个a;如果含有元音字母,那么在基字后面不需要加a,可以理解成用元音替代了字母a(2)如果含有上加字,那么转写时需要把其对应的拉丁字母写在基字对应的拉丁字母前(完全符合手写顺序);如果含有后加字、再后加字,那么后加字对应的拉丁字母写在基字对应的拉丁字母后,再后加字对应的拉丁字母跟在后加字之后(完全符合手写顺序);如果含有下加字,那么下加字对应的拉丁字母要写在基字对应的拉丁字母后。

如果其下加字不含有元音字母,那么在下加字对应的拉丁字母后面需要加一个a,如果含有元音字母,那么元音字母对应的拉丁字母跟在下加字对应的拉丁字母后。

(3)如果其前加字是第三个辅音(g),而其基字是第六组第四个字母,即第24个辅音字母(y)时,需要在g和y之间加一个点(.)否则会有混淆的。

自己整理的藏语入门知识

自己整理的藏语入门知识

自己整理的藏语入门知识主题一:藏语与汉字的关系藏文有头字声母表以及对应罗马字读音剑桥中国古代史一汉藏同源词对照表藏语自7世纪起有文字,由30个辅音字母和5个元音字母组成。

语言研究者也常常使用拉丁字母来转写藏语,较通行的一个方案是于道泉设计的,只使用26个拉丁字母,不用附加符号。

藏语属于汉藏语系,所以藏语和汉语之间存在并不遥远的关系,两种语言来自同一原始语。

估计是西兀前4000年到6000年左右。

藏文保留了上古汉语的古音,包括复杂的复辅音。

藏语和汉语之间存在很多同源词。

但由于汉语经历因许多语音变化,特别是历史上方游牧民族的融入,不能直接把现今普通话的发音用来进行比较,必须运用上古汉语的构拟。

比如藏语的数字作为基础词汇和汉语上古音类似,构成同源词。

图为数字作为同源词在上古汉语与藏语数字间的类似性。

还有一些汉藏语系的基础词也具有类似性(见右图剑桥中国古代史79页)。

其他还比如,江,汉字上古音【Kroong】,藏语【Klung】;水,汉字上古音【0 iuI】;藏语【chhu.】。

然而,汉语和藏缅语之间有共同的数词一至十,但"千"和"万"却各并不相同,而在汉语中,"千"和"万"在殷商时期就已经出现,那么汉语与藏缅语与的分化必定早于殷商时期。

语言学家们大致推断,这个时间距今约4000-5000年左右。

除此以外,汉语的基础词方向名词"东南西北"也与其他任何汉藏语系支系不同,也出现最早,且不晚于殷商时期。

藏文保留了上古汉语的古音,包括复杂的复辅音。

以下举上几个有代表性的汉藏同源词(由于上古汉语的发音为后人所拟构,因此可能和实际的发音有所误差,所以在确定这些字的真实发音之前,所有的拟构字前方都加上*的符号):汉藏语同源词汉字上古音藏语虱*sr?k shig 吾*?aa nga 语*?a?ngag 飞*p?r vphur 死*sij?shi 杀*sreet bsad 目*mruk mig 耳*n?rna 二*nis gnyis 三*s?m gsum 四*slijs bzhi 五*?aa?Inga 主题二:藏语的辅音字母学习(一)、三十个辅音字母藏文有三十个辅音字母:1.辅音字母都能单成音节,单成音节时,发音都带有元音a。

藏语文语转换系统关键技术的研究

藏语文语转换系统关键技术的研究

2 藏 语 文 本 预 处 理
2 . 1 藏 文分词
藏 文分词 是 藏文信 息处 理 的一项基 础性 工作 。它
换系统 就显 得尤 为 重 要 。 同时 , 藏 语 文语 转 换 的实 现 将 会大 大 丰富藏 族地 区人 民 的生活 , 拓宽 信息 获取 、 发
布 和交 流 的渠道 , 对 藏 族 地 区 的社 会 稳 定 、 民族 团结 、 和谐进 步 有着重 要 意义 。
1 . 2 语音 合成历 史及 现状 回顾
是将 连 续 的藏 文文 本按 照一定 的算 法根 据藏 语语 法规 则切 分成 词 的过 程 。藏文 分 词 作 为语 音合 成 、 机 器 翻 译、 语 音识别 等研 究工作 的必 要前 提 , 在藏 文信 息处 理 领 域 很 是 重 要 。 下 面 本 文 就 藏 文 分 词 来 加 以 探 讨
行 了相关 文献 的研 究 和实 验 , 但 对 藏 语 语 音研 究 还 不
够深 入 , 国外对 藏语 语音 合成 方面 也未 曾有 相关报 告 。
答系统 , 电子邮件 的语音服务 以及残疾人语音辅助等
领 域 。藏语 文语转 换 系统 的研究 及应 用具 有很 重要 的 意义 , 尤其 是对 于藏 族地 区 的幼儿 和老人 , 藏语 文语 转
藏文分词方法跟其他语言分词方法类似, 都可以
用 基于 规则 的或 基于统 计 的方法 , 目前 , 作 者 阅读 过 的
诸 多文 献 中 , 处 理藏 文分 词 大 多 是用 基 于规 则 的正 向 最大 匹配上 加格 助词 的正 向最 大 匹配 , 另 外 有 逆 向的
在 2 0 世纪末 , 可训练 的语 音合 成 方法 诞 生 。而后 又

藏文转写系统的设计与实现

藏文转写系统的设计与实现

藏文转写系统的设计与实现随着信息技术的发展,藏文的数字化处理成为一项重要任务。

为了实现藏文语言文字的自动处理和数字化传播,设计和实现一款高效的藏文转写系统变得尤为重要。

本文将介绍藏文转写系统的设计与实现,探讨其在提高藏文数字化处理效率和保护藏文文化遗产方面的重要性。

一、引言藏文是藏族人民的主要语言文字,对于藏族文化的传承和发展有着举足轻重的作用。

然而,由于藏文的特殊性,包括字符数量庞大、字形繁多以及复杂的音韵和文法体系等特点,使得对藏文的数字化处理变得困难和耗时。

因此,设计和实现一款高效的藏文转写系统是十分必要的。

二、设计原则1. 准确性:藏文转写系统应该准确地将藏文文本转写为易于处理和存储的文本形式。

系统应准确地识别藏文字符和音节的对应关系,确保转写结果的准确性。

2. 高效性:为了提高处理效率,系统应设计优化算法和数据结构,减少处理时间和资源消耗。

系统应能够快速处理大量的藏文文本。

3. 用户友好性:系统应提供简洁易用的用户界面,方便用户输入和操作藏文文本。

系统还应该支持多种输入方式,如键盘输入、手写输入等。

4. 可扩展性:在设计和实现藏文转写系统时要考虑到未来可能出现的新的需求和技术发展。

系统应具备良好的可扩展性,便于对未来需求的适应和扩展。

三、系统实现1. 数据预处理:首先,需要对输入的藏文数据进行预处理,包括字符编码转换和文本分割。

字符编码转换可以将输入的藏文字符转换为计算机可识别的编码形式。

文本分割可以将整篇藏文文本切割为单个的词或句子,方便后续处理。

2. 字符映射表:为了实现藏文转写,系统需要建立一个字符映射表,将藏文字符映射到计算机可处理的字符。

这个映射表可以采用一对一的对应关系,也可以采用多对一的映射关系,根据具体的需求进行设计。

3. 转写算法:根据字符映射表,系统可以实现转写算法。

转写算法通过扫描输入的藏文文本,根据映射表将藏文字符逐个转换为计算机可处理的字符。

算法可以根据不同的需求和场景进行优化,以提高转写的效率和准确性。

藏语

藏语

藏语方言分歧较大,卫藏方言人名“次仁”,安多方言说“才让”,文字写法却是一样的。

一般认为藏文创制于公元7世纪初,是松赞干布的大臣图弥三菩札从印度留学回来,,根据梵文创制的。

实际上,7世纪以前就已经有藏文了。

它也与象雄文、克什米尔文有关系。

藏文字母30个,都是辅音,带有声调,不标元音符号时辅音带a音,如第一个字母读ga,第二个字母读ka.与普通话一样,拉萨口语清辅音送气与不送气对立,而不是清浊对立。

每个音节中,位于音节中心的字母叫基字,基字可以有上加字、前加字、下加字、后加字、再后加字,后两种表示韵尾,其余表示声母。

拉萨口语,声母有36个,韵母有50个,实际拼写远比30个字母要丰富。

字母la写在ha上面时,表示的音在汉、英、法等语言里都没有。

它的发音方法是:舌卷起,接触齿背,“拉萨”(Lhasa)第一个音节的声母就是这个音。

后加字为-la、-da(低升调)、-sa、-la (高降调)时,元音[a]变成了[ε](英语air 前半部),[u]变成[y](汉语普通话的“鱼”),[o]变成了[鴀(法语deux的元音)。

这样,可以表示复杂的语音,又可区分开同音词。

在韩、法、德语里,这三种变音都是常见的。

上图:藏文元音符号与辅音字母藏文诞生有13个世纪了,有过文字上的小改革,变化很小,而藏语语音有了很大变化。

文化名人“八思巴”(1239—1280)的名字有两个音节,“八思”的-s(韵尾)现在不发音了,所以这个名字今译应当是“帕巴”。

有文字的民族,时间一久,就免不了面对文字与口语的差距。

语言的演变是必然的,要让文字与读音完全一致,在某个时期办得到,几百年以后就可能行不通了。

保持文字的相对稳定,制订把文字与现今读音联系起来的规则,可以解决文字和读音的差距问题。

这种历史音变造成的学习难度,并不比英语无章可循的拼读形式难。

花上一周,完全可以学会藏语语音,可是没有任何人敢说他能准确读出任何英语单词。

藏文的稳定性,对于发展文化和教育是有贡献的。

藏语拉萨话语音学习

藏语拉萨话语音学习
2.从“音”的角度出发,“音节=声母+韵母+声调”。
声母、韵母和声调是藏语音节的三要素,缺一不可。“基字+元音”构成藏语语音的基础,四类加字[后加字(再后加字),下加字(再下加字)、上加字和前加字]对此产生稳定影响,具体而言,
(1)后加字仅影响韵母,并决定声调的升降;
(2)其他加字仅影响声母,并决定声调的高低。
(2)声调升降:这四个后加字仅仅改变声调的升降,不改变声调的高低,即:高平调(f,调值55)→高降调(h,调值52);低升调(v,调值13)→低升降调(w,调值132)。
“文读”
“白读”
声调

âb,ib,ub,eb,ôb
[əp],[ip],[up],[ep],[op]
f→h,v→w
元音:闭音;
-p尾:须添加。
元音:长音(未标出);
-ŋ尾:须添加。
元音:实际为长音(未标出);
-ŋ尾:[ŋ](ㅇ)
2.同时影响韵母以及声调的后加字(བ、ག、ས、ད)
(1)韵尾添加:朝鲜语有7种类型的韵尾,但韵尾的数量远远多于7个,原因在于部分送气清辅音发生音变,从而充当韵尾。在藏语中,“半”送气清辅音བ、ག转化为对应不送气音[p]、[k],从而充当韵尾;而清辅音ས、ད未发生相应转化,从而不能充当韵尾。
以下着重说明,五个后加字在藏语拉萨话“白读”中的影响。
“文读”
“白读”
声调

aa(r),ii(r),uu(r),ee(r),oo(r)
[a:(r)],[i:(r)],[u:(r)],[e:(r)],[o:(r)](有时+-r尾)
×
元音:长音;
-r尾:可添Biblioteka 。元音:长音;-r尾:[ɹ](半元音)或[ſ](ㄹ,闪音)。

基于国际标准编码系统的藏文拉丁文转写规则模型

基于国际标准编码系统的藏文拉丁文转写规则模型
第 2 总 第 7 期 9卷 1
2 008 年 9 月
西 北 民 族 大 学 学 报( 自然科 学 版 )
V0 . 9. . 12 No 3
J哪 a o N r ws uIe i r a oatsNa rl c n e o I f o h e I rt f tnli ( t a S i c) t t i sy 0 N i ie v u e

r h
棚 嘏
l a
嗣 翻
s h k H S
S H
表 2 藏梵文元音字符与拉丁文的对应表


C \

_ ~
. 、
‘ √

7 L
_ -
、 、
_●


‘-


a 1 , L l
C、 ~

g h
转写
I 1 g n y




TH
t h



DH
d h


‘ |
( a
p t s
z h


p h t s h


I j
b d z

窜 《

b h (h 1 z

韵 嘲
m W
Sp20 e, o 8
基 于国际标准编码系统 的藏文拉 丁文转写规则 模型
祁坤 钰 , 召 卡什 吉 达
( 西北 民族 大 学 中 国民族 信息技 术研 究院, 肃 兰 州 7 o 3 ) 甘 3 0 0
[ 摘

中国拉丁化新文字方案

中国拉丁化新文字方案

中国拉丁化新文字方案摘要:中国拉丁化新文字方案是一种试图用拉丁字母替代汉字的方案,旨在简化汉字书写和提高汉字的国际传播能力。

本文将介绍中国拉丁化新文字方案的背景、目标、主要内容以及可能的影响,并对其可行性进行探讨。

1. 引言中国汉字作为一种千年文字系统,在世界文化遗产中具有重要地位。

然而,随着全球化的加速发展,汉字的复杂结构和书写方式也成为中国学习者和外国人学习汉语的难题。

因此,有人提出了中国拉丁化新文字方案,试图用拉丁字母替代汉字,以简化汉字书写和提高汉字的国际传播能力。

2. 目标中国拉丁化新文字方案的主要目标包括:- 简化汉字书写:通过使用拉丁字母,将汉字的许多复杂字形简化,减少学习者在书写上的困难;- 提高汉字的国际传播能力:拉丁字母是世界上广泛使用的字母系统,将汉字转换为拉丁字母可以使汉字更易于被外国人理解和学习;- 促进信息交流与合作:拉丁化的汉字文字系统可以降低汉语学习的门槛,使更多的人能够理解和使用汉语,从而促进中外人士之间的信息交流与合作。

3. 主要内容中国拉丁化新文字方案主要包括以下几个方面:- 汉字转写:将汉字按照一定字典规则转写为拉丁字母,以保留原汉字的发音和意义。

例如,将汉字“中国”转写为“Zhongguo”;- 拼音标注:在拉丁转写的基础上,使用拼音标注来表示汉字的声调和读音,以帮助学习者正确发音;- 字母组合:由于汉字数量庞大,无法直接用拉丁字母一一对应,需设计字母组合来表示具体的汉字。

例如,“zh”表示“中”,“ch”表示“国”;- 结构调整:汉字的复杂结构需要进行调整,以符合拉丁字母的书写习惯。

例如,“书”字的横、竖结构可以使用“shu”来表示;- 标点符号:用拉丁化的方式表示汉语的标点符号,如句号、逗号、叹号等。

4. 可能的影响中国拉丁化新文字方案的推行可能会带来一些影响:- 文化变迁:汉字作为中国文化的独特象征,其被替代可能会引发文化认同危机,影响一些人的情感和认同感;- 教育改革:从小学到大学的汉字教育都需要进行相应的改革,培养学习者掌握拉丁化新文字方案的技能;- 文字习惯改变:中国人习惯了用汉字进行书写和交流,转而使用拉丁字母会需要一段时间的适应过程。

音系学视角下的汉译格萨尔史诗音译名初探——以《曲木里赤财宝宗》为例

音系学视角下的汉译格萨尔史诗音译名初探——以《曲木里赤财宝宗》为例

落桑旺秋,王双成:音系学视角下的汉译格萨尔史诗音译名初探—以《曲木里赤财宝宗》为例
· 149 ·
二分法
三分法

A式

B式

C式
六分法
高平调
表 3 藏语拉萨话声调分类表(胡坦,1980)
调类/调值
高调 53
低调 131
高降调低升调ຫໍສະໝຸດ 高平 55高降 51
低升 13
低升降 132
55
53
15
35
高,高-高
随着时代发展,越来越多的藏族经典陆续被译 加字共四种字母反映的是古藏语复杂的声母系
成汉文,为国内其他民族了解藏族文化提供桥梁和 窗口。而格萨尔史诗作为藏族文化最具代表意义 的作品 ,其翻译需要规范化和统一化 ,自然是不言 而喻的。本文从音系学视角出发 ,结合笔者翻译
统。共有 30 个单辅音声母 ,115 个二合复辅音声 母,69 个三合复辅音声母,6 个四合复辅音声母,共 220 个声母。[3]藏文是表音文字 ,体现了创制文字 时古藏语的实际发音。但在历史演变过程中,卫藏
[iŋ][yŋ][uan][uən][uɑŋ][uəŋ][yɛn][yn]。[10]
(三)汉文普通话文读音的声调
古汉语分平 、上 、去 、入四声 ,分阴声类和阳声
类后 ,为阴平 、阳平 、阴上 、阳上 、阴去 、阳去 、阴入 、
阳入共八个声调。汉文普通话文读音中入声已经
消失 ,并入其他声调 ,上声中的全浊上声归入了去
(一)汉文普通话文读音的声母 现代汉语与古代汉语比较 ,声母也发生了简 化。普通话声母 22 个,零声母 1 个。辅音声母的总
因为本文所讨论的源语为藏文,所以重点考察 存在于藏文拉萨文读音,但汉文普通话文读音中没 有的音位,以便针对性地研究如何进行相关音译工 作。需要注意的是,两种语言的音系中既存在不同 的音位,也存在相同音位在两套音系中作不同处理 的情况。

拉丁字母与西里尔字母的转写规则

拉丁字母与西里尔字母的转写规则

拉丁字母与西里尔字母的转写规则拉丁字母与西里尔字母是两种不同的字母系统,各自用于不同的语言中。

为了方便交流和研究,需要将两种字母系统之间进行互相转换,这就需要遵循一定的转写规则。

下面将分别介绍拉丁字母转写为西里尔字母和西里尔字母转写为拉丁字母的规则。

一、拉丁字母转写为西里尔字母1. 原则:尽可能保留原文的发音,将拉丁字母转写为最接近的西里尔字母。

2. 具体规则:a. 一般情况下,一个拉丁字母对应一个西里尔字母,如:- a →а- b →б- c →ц- d →д- e →е- f →ф- g →г- h →х- i →и- j →ж- k →к- l →л- m →м- n →н- o →о- p →п- q →к- r →р- s →с- t →т- u →у- v →в- w →в- x →кс- y →й- z →зb. 一些特殊的拉丁字母可能需要用多个西里尔字母来表示,如:- ch →ч- sh →ш- th →тх- ph →фc. 有些拉丁字母在某些语言中具有特殊的发音,在转写为西里尔字母时需要特别处理,如:- c 在法语中发音为/s/,在英语中发音为/k/。

在转写为西里尔字母时,需要根据其发音来选择合适的字母,如:- cecil →сесиль- cinema →синема- j 在英语中发音为/dʒ/,在西班牙语中发音为/x/。

在转写为西里尔字母时,需要根据其发音来选择合适的字母,如:- jeans →джинсы- jalapeño →халапеньо二、西里尔字母转写为拉丁字母1. 原则:尽可能保留原文的发音,将西里尔字母转写为最接近的拉丁字母。

2. 具体规则:a. 一般情况下,一个西里尔字母对应一个拉丁字母,如:-а→a-б→b-в→v-г→g-д→d-е→e-ж→zh-з→z-и→i-й→y-к→k-л→l-м→m-н→n-о→o-п→p-р→r-с→s-т→t-у→u-ф→f-х→kh-ц→ts-ч→ch-ш→sh-щ→shch-ъ→(不转写)-ы→y-ь→(不转写)-э→e-ю→yu-я→yab. 有些西里尔字母在某些语言中具有特殊的发音,在转写为拉丁字母时需要特别处理,如:-ё在俄语中发音为/yo/,在转写为拉丁字母时可写作e 或yo,如:-ёлка→yolka/eolka-щ在俄语中发音为/shch/,在转写为拉丁字母时可写作shch 或sch,如:-щенок→shchenok/schenok-ы在俄语中发音为/ɨ/,在转写为拉丁字母时可写作i 或y,如:-медведь→medved'/medvedi综上所述,拉丁字母与西里尔字母的转写规则是一种重要的语言学工具,能够帮助研究者们进行有效的跨语言交流和研究。

面向智能信息处理的语料库标注质量影响因子——从《汉语人名拉丁转写方案》的设计谈起

面向智能信息处理的语料库标注质量影响因子——从《汉语人名拉丁转写方案》的设计谈起

面向智能信息处理的语料库标注质量影响因子*——从《汉语人名拉丁转写方案》的设计谈起通拉嘎(泉州师范学院图书馆,福建泉州362000)[摘要]语料库是大量自然素材的有序集合,不仅为语言研究提供新的手段,也可以为自然语言信息处理相关研究提供重要支持。

探讨了影响语料库标注的各种原因,以基于蒙古文语料库的《汉语人名拉丁转写方案》为例,分析了各项因子对语料库建设产生的作用,认为标注的规范化发展、标注的准确性、一致性、中立性、通用性是衡量语料库标注质量的关键因素。

[关键词]智能信息处理语料库标注质量汉语人名拉丁转写方案[分类号]TP391.1*本文使用的语料库由内蒙古大学和中科院计算所提供,在此深表谢意。

本文系2013年国家自然科学基金重大项目“跨语言社会舆情分析基础理论与关键技术研究”成果之一。

1引言语料库是大量自然语言素材的有序集合,这些语言素材是书面文本、言语录音或其转写[1],语料库标注是为语料库增加一些语言学信息[2]。

语料库不仅为语言研究提供新的研究手段,也为信息检索、文本分类、机器翻译等自然语言信息处理的研究提供重要支持。

由于国内外语料库建设尚缺乏通用的规范或标准可以遵循,如何衡量语料库标注的质量、语料库标注出现了哪些问题,都值得我们深入探究。

笔者以智能信息处理发展相对薄弱的少数民族信息处理典型代表蒙古文信息处理的子问题——《汉语人名拉丁转写方案》的设计为例,探讨影响语料库标注质量的各类因素。

蒙古文语料库的建设从20世纪80年代开始兴起,由于传统蒙古文书写形式从上至下,蒙古文部分元音、辅音显示形式相同,新以蒙古文语料库建设之初即以拉丁形式转写各式语料,避免了排版、显示、系统兼容及部分歧义问题,把面向信息处理的蒙古文本形式简化为蒙古文(或汉字)包括标点符号等组成的一个字符串问题[3]。

不过与中、英文大规模语料库的发展相比,蒙、藏、维为代表的少数民族语言信息处理的研究与发展相对滞后,语料库经过机器标注之后,还需大量的人工校对过程,这不仅耗时耗力,还因标注者的不同理解,语料有不同层次的标注问题。

藏文罗马转写备忘录

藏文罗马转写备忘录

羅馬轉寫備忘錄略談中國藏學界慣用之拉丁轉寫規則﹝2001.7.30﹞兩岸藏學界的交流透過多次國際學術會議與書刊出版,漸入佳境。

台灣地區大概自1992 年東初出版社引薦大陸學者王堯、褚俊傑合著的《宗喀巴評傳》起,陸續引進若干藏學譯著與書刊。

當然,大陸藏學界特有的轉寫法也漸為人知。

這套深具中國特色的拉丁轉寫規則,是由中國藏學前輩于道泉先生(1901~1992) 所創。

基於目前並無確切的名稱,是故暫稱之謂「VQ轉寫法」!為甚麼給取這麼個怪名? 看官且慢驚愕。

話說當今天下藏文轉寫之法,若非與梵文同路即屬WYLIE 為熟稔,曾於2000.5.19 備忘錄文中說明其間差異,已知以v代'之異;又因ga為前加字時,逕以q代g-之法( 諸如g-yar代以qyar ; g-ya'代以qyav )。

遂以得此二字之增語而立名焉! 豈不是簡單明瞭。

三維立體結構美學VS 恆河女神﹝2000.5.28~6.9﹞數千年前翩翩美少男曼殊室利追求恆河女神妙音天女譜寫的愛情史詩,驚天動地,一發而不可收拾。

一同啜飲神山雪水的子民,以顫動蒼茫的歌聲,撫摩八荒蒼穹之際,律動的音節拍擊大地,高亢的喉吭詠嘆悲歡,就這般探循著天女的氣息和聲韻,藏族先民從無序中觸發出豐富的語音,成為情感相互有序的傳答,接著一一予萬物命名...。

而後,淵源於印度字母形制的藏區文字,逐漸經由碰撞接觸仿傚演化變遷而呈現今日之狀,它那特殊的拼寫層疊結構,具有與漢字相同的「超方言」特徵,但卻是道地的「音節文字」。

藏文的音節結構由簡單發展至繁複,大略可歸納為三十六種連綴形式。

如以縱向觀察基字( m ing g zh i ) 向上下四方衍增的情況,試分四大類來示範轉寫的軌則。

例字中紅色的「輔音字母」即為「基字」。

第一類姑且稱之「一以貫之」型,就是由基字和上加字、下加字、母音符號分別連綴成的單字,底下依音節結構由簡入繁作轉寫示範,為了易於識別,特將基字以紅色顯示,以收一目了然之效。

藏文拉丁字母转写系统

藏文拉丁字母转写系统

藏文拉丁字母转写系统藏文拉丁字母转写系统藏文拉丁字母转写系统本条目含有藏文字母。

如果您的操作系统不能显示,可参考英文版帮助或此网页以获取藏文支持。

藏文拉丁字母转写系统是指将藏文字母转换成拉丁字母,从而使藏语罗马化的一套文字转写系统。

本条目只介绍现在通用的威利(Wylie)转写方案。

1959年,威利(Turrell Wylie)精炼了原有的转写方案,只使用基本的26个拉丁字母,而不需添加字母和添加符号。

在此之后,这套方案成为藏学界尤其是美国藏学界的标准转写方案,并以威利的姓氏来命名。

在以拼音文字为文字形式的语言中,藏语着其特殊的地方:文字系统与语音系统不一致。

现行藏文字母纪录的是11世纪的藏语语音,这与现代藏语的语音有着很大的区别(例如,“西藏”一词,根据藏文字母的拉丁文转写为bod,而现代拉萨方言则是pö(音标为[p?ø?]),出现了声母清化和韵尾变化等现象)。

因此,任何一种藏语罗马化方案,都要从“描述现代藏语语音”和“转写描述古藏语语音的藏文字母”之间作出抉择。

早期的方案试图采取折中的方式,结果两边都不讨好。

威利转写方案则设计为准确转写藏文字母,而不顾及藏语词汇的现代发音,因此为学术和历史研究机构所接受。

威利转写系统辅音字母辅音?k ? kh ? g ? ngc ? ch ? j ? nyt ? th ? d ? np ? ph ? b ? mts ? tsh ? dz wzh ? z ? ' yr ? l sh ? sh零韵母?未被转写,以元音开头的音节都含有这个字母,可以通过这个特征来准确判断它的存在。

在藏文字母中,同一个音节的辅音字母群,既可能以前后缀的形式出现,也可能作为“根字母”的上缀或下缀。

对藏文字母的前后缀与上下缀,威利转写系统并不区分,因为这并不会构成混淆--除了gy-,既可能是g作为前缀使用,也可能是y作为下缀使用。

威利转写系统作了以下区分:当g作为前缀时,在g与y之间加.。

基于小字符集藏文拉丁转写系统的设计与实现

基于小字符集藏文拉丁转写系统的设计与实现

基于小字符集藏文拉丁转写系统的设计与实现
陈小莹;艾金勇
【期刊名称】《中文信息学报》
【年(卷),期】2016(30)3
【摘要】随着藏语语言信息技术的迅速发展,藏文拉丁转写成为迫切需要解决的重要课题之一.该文在前人有关藏文拉丁转写研究的基础上,设计并实现了基于小字符集方案的藏文拉丁转写系统.文章通过对小字符集编码方案的特征分析,同时根据藏文正字法知识,提出了基于小字符集编码的藏文拉丁转写算法,并对具体算法策略进行了分析和说明,最后在Windows平台进行了程序的实现.藏文拉丁转写方案的设计与实现,可以解决藏文多编码系统之间的兼容性问题.
【总页数】5页(P74-78)
【作者】陈小莹;艾金勇
【作者单位】西藏民族大学信息工程学院,陕西咸阳 712082;西藏民族大学图书馆,陕西咸阳 712082
【正文语种】中文
【中图分类】TP391
【相关文献】
1.藏文拉丁转写的设计与实现 [J], 陈小莹;艾金勇;郭小丹
2.基于国际标准编码系统的维吾尔文拉丁文转写规则研究 [J], 亚森·伊明
3.Linux系统藏文拉丁文转写输入法的实现 [J], 曹晖
4.基于国际标准编码系统的藏文拉丁文转写规则模型 [J], 祁坤钰;达召卡什吉
5.基于机器学习的藏文图像识别系统设计与实现 [J], 杨学斌; 贾磊
因版权原因,仅展示原文概要,查看原文内容请购买。

推广使用少数民族人名汉字音译转写规则实施方案

推广使用少数民族人名汉字音译转写规则实施方案

推广使用少数民族人名汉字音译转写规则实施方案篇一:少数民族语地名汉语拼音字母音译转写法(1976-6)中华人民共和国国家测绘总局和中国文字改革委员会于1965年5月12日发布,1976年6月修订《少数民族语地名汉语拼音字母音译转写法》。

该音译转写法也适用于少数民族语人名的音译转写。

少数民族语地名汉语拼音字母音译转写法[1976-06]第一条少数民族语地名汉语拼音字母音译转写法的主要用途:(1)作为用汉语拼音字母拼写少数民族语地名标准;(2)作为地图测绘工作中调查记录少数民族语地名的记音工具;(3)作为汉字音译少数民族语地名定音和选字的主要依据;(4)为按照字母顺序统一编排我国地名资料和索引提供便利条件。

第二条音译转写发限用《汉语拼音方案》中的26个字母,两个有附加符号的字母和一个隔音符号,为了使转写和记音比较准确,音节结构可以不受汉语普通话音节形式的限制,隔音符号可以在各种容易混淆的场合应用,记音的时候附加符号可以加在特定的字母上面代表特殊语音。

少数民族文字用拉丁字母的,音译转写以其文字为依据。

跟《汉语拼音方案》中读音和用法相同或相近的字母,一律照写;不同或不相近的字母分别规定转写方式,文字不用拉丁字母的,根据文字的读音采用相应的汉语拼音字母表示。

没有文字的,根据通用语音标记。

第三条特殊的地名参照下列办法处理:(1)惯用的汉字译名如果是一部分音译,一部分意译,其音译部分根据音译转写法拼写,意译部分按照汉字读音拼写。

(2)惯用的汉字译名如果是节译,可以斟酌具体情况,有的按照原名全称音译转写,有的按照节译的汉字读音拼写。

(3)汉字译名如果原先:推广使用少数民族人名汉字音译转写规则实施方案)要是为了解决现实生活中语文的不规范问题。

信息化时代来临后,又赋予了它新功能,成为人机两用标准。

少数民族语文第一个标准是1965年发布的《少数民族语地名拼音字母音译转写法》,不但为我国少数民族语言地名标准化提供了工具和依据,而且也成为少数民族语地名标准化纲领性的文件。

对他族藏语教学中疑问代词的输入与习得研究——以卫藏方言为例

对他族藏语教学中疑问代词的输入与习得研究——以卫藏方言为例

语法词汇课程教育研究157学法教法研究对他族藏语教学,指教师将藏语交际技能和相关藏族语言文化知识传授给藏族以外世界所有民族的藏语教学过程。

对他族藏语教学不是一门独立学科,而是一门交叉学科。

它与一些传统学科,如教育学、语言学、心理学、社会学、生理学等,有密切的关系。

另外,它与一些新兴学科,如跨文化交际学、传播学、计算机科学等也有不可分割的关系。

随着时代的发展和地球村的出现,人们间的交流日益频繁。

交流者之间彼此学习语言显得越来越重要,于是各高校、研究单位开设各种语言课的机构和班级也如雨后春笋般速增。

与此同时藏语热已经在世界范围内形成。

国内外许多未进行过藏语教学的学校和机构开始进行藏语教学、藏学研究,于是对他族藏语教学自然承载着它应有的社会重任和历史的使命。

我们加入这个行业也已有十几个春秋,这一学科过去只是重视教学实践,没有对研究工作引起重视,特别是基础理论研究更不为人们所关注。

通过查阅资料,我们不难发现,到目前为止很多学校和机构对对他族藏语教学的教师依然没有理论研究的要求,以完成教学任务为目的。

不过,这样也并非得不偿失,其实使我们这样的教学实践者获得并积累了丰富的教学经验,可以说为后续的研究也积累了一定的实践基础。

正如滴水穿石、条条河流汇成大海,只要我们从事本行工作及相关人员齐心协力为本学科的教学及研究工作付出应有的努力,相信本学科的发展前景将无量光大。

更能为民族团结、社会和谐起到应有的作用。

藏语的教学内容不同于很多其他的语言教学内容,它有一套严谨而独特的教学顺序设置,教学者或学习者无法对其先后顺序规则进行调整。

必须依次按着:辅音字母,基字与元音组合,基字与后加字组合,基字与再后加字组合,基字带下加字,基字带前加字,基字带上加字等以“简入深出”的顺序进行输入。

于是,我们可以根据以上顺序中总结和归纳出藏语中疑问代词的顺序。

而且三大方言中各自偏好使用的疑问代词有所差异。

不管以哪种方言为教学目的,在拼音教学的同时,也要利用已学的各种词性进行具时的短语或句型训练是非常重要的,尤其是疑问句的实训尤为必要。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

藏文拉丁转写方案
藏文拉丁字母转写是指将藏文字母转换成拉丁字母,从而使藏语罗马化的文字转写方法。

在国内外有各种各样的转写方案。

在此介绍现在国内外较通用的威利(Wylie)转写方案。

(注,在威利方案中三十个辅音字母的第六组第三个字母(第23个辅音字母)用的是' ,而在此用字母v)
转写方案:(对应关系)
(1)辅音字母
(2)元音
转写时以藏文书写顺序,把藏文的每一个字符转换成相应的拉丁字
母。

也就是说将把一个字按它的基字(ming gzhi)、元音(dbyngs)、前加字(sngon vjuk)、后加字(rjes vjuk)、再后加字(yang vjuk)、上加字(mgo can)、下加字(vdogs can)按手写顺序拆成其相应拉丁字母的方法。

切记必须按照正确的手写顺序拆字。

如:吐蕃,转写为bod;拉萨,转写为lha sa;安多,转写为a mdo;康巴,转写为khms pa;卫藏,转写为dbus gtsang;雪域,转写为gnags ljongs;扎西,转写为bkra shis;
转写方法详解:对于一个字儿,
(1)如果不含有元音字母,那么转写时需要将在基字对应的拉丁字母后面加一个a;如果含有元音字母,那么在基字后面不需要加a,可以理解成用元音替代了字母a
(2)如果含有上加字,那么转写时需要把其对应的拉丁字母写在基字对应的拉丁字母前(完全符合手写顺序);如果含有后加字、再后加字,那么后加字对应的拉丁字母写在基字对应的拉丁字母后,再后加字对应的拉丁字母跟在后加字之后(完全符合手写顺序);如果含有下加字,那么下加字对应的拉丁字母要写在基字对应的拉丁字母后。

如果其下加字不含有元音字母,那么在下加字对应的拉丁字母后面需要加一个a,如果含有元音字母,那么元音字母对应的拉丁字母跟在
下加字对应的拉丁字母后。

(3)如果其前加字是第三个辅音(g),而其基字是第六组第四个字母,即第24个辅音字母(y)时,需要在g和y之间加一个点(.)否则会有混淆的。

因为在藏文字母中,同一个音节的辅音字母群,既可能以前加字的形式出现,也可能作为基字的上加字或下加字出现,所以为了辨别加了个点。

如:“墙”转写成gyang,而“裂口”转写成
g.yang。

(4)字与字之间的分隔符点(tsheg)跟竖(shad)转写时点之间用空格代替,而单竖(chig shad)用一个点代替,双竖(nyid shad)用两个点代替,以此类推。

上述是最基本的藏文转写方法,是参考北京藏族文学小组的《rmu thag》藏文期刊第二期中的介绍转写方法的文章(《bod yig la ting yi ger phab vbri byed tshul skor mdor tsam kleg ba》by Tsering D.sharshon)的基础上平时使用过程中总结出来的一点东西,对于藏文构词组成的翻译上可能会有错误,希望大家见谅!因为在此要讲的内容是转写方法而不是有关翻译的。

由于不能正常显示藏文字体,
不能够用藏语举例,使的讲解带来了不少的麻烦,希望在回帖中用himalaya输入法举例并交流。

藏文中还有很多较复杂的字,如梵文、叠加字等,这些较少用的字可能有另外的转写方法,但是我自己不会使用,所以…
在此希望每一个同胞能熟练掌握这个转写方法,因为在网上聊天、手机短信、电子邮件上我们不能够如意使用自己的母语。

我想能够用拉丁字母把转写藏文是使用藏文,传承母语的良好途径,再次鼓励大家使用这个转写方法,因为这个完全是按照藏文字转写,而不是按字母发音,所以完全可以在各个藏区通用。

相关文档
最新文档