信息技术回鹘式蒙古文名义字符变形显现字符和控制字符使用规则
蒙古文语料编码转换与校对方法研究
蒙古文语料编码转换与校对方法研究如今信息现代化的时代,信息的传播、资源的共享也都被电子化、网络化。
大部分信息都是以文字形式传播和共享。
对蒙古文信息而言适应信息时代发展要求是必然的。
随着蒙古文信息处理的发展出现了多种蒙古文编码,例如赛音、蒙科立、明安图、智能编码等。
各种编码字库中,蒙古文字形的对应的编码都不一样,互不兼容,如果没有安装对应的蒙古文字库,计算机里的蒙古文资料将显示为乱码,不能使用。
这样会导致蒙古文信息资源无法传播、共享和研究。
解决这些问题的最有效方法就是编码转换,转换成统一的编码。
本文由蒙古文编码转换和编码校对两大部分构成。
编码转换部分中,首先对目前应用较广泛的两种编码-蒙科立编码、智能编码以及蒙古文国际标准编码进行了详细的分析和对比。
其次将蒙科立编码、智能编码两种编码转换为蒙古文国际标准编码。
编码转换为基于蒙古文变形显现字符集和控制字符使用规则的一种转换方法。
编码转换过程中,先通过编码范围判断和编码在词中不同位置的词形判断编码类型。
编码类型确定之后,如果是蒙科立编码则用蒙科立编码转换为标准码的算法将其转换为标准编码。
如果是智能编码,则用智能编码转换为标准编码的算法将其转换为标准编码。
非标准蒙古文编码,例如蒙科立编码、智能编码都属于形码。
标准编码为音码。
转换成标准编码时,由于这些编码并不是与国际标准编码一一对应,有大量的不确定因素,做不到完全正确的编码转换,会出现错误编码。
另外键盘录入也会产生编码错误。
因此要对转换后的标准编码或者录入产生的蒙古文国际标准编码进行校对。
本文的编码校对是基于蒙古文元音阴阳和谐规则的校对方法。
校对规则为同一字中阴阳元音不能混合出现。
即词中第一个出现的元音为阳性元音,则词中后续出现的元音也是阳性。
词中第一个出现的元音为阴性元音,则词中后续出现的元音也是阴性。
否则将错误编码替换为对应的正确编码。
编码校对实现过程中,用判断元音辅音的算法判断当前编码是元音还是辅音;用判断元音阴阳性算法判断元音的阴阳性;词中第一个出现的元音用获取第一个元音的元音的算法得到;利用获取正确元音错误元音算法对后续出现的原因进行判断,最后用校对单词算法将错误编码替换为为正确编码。
基于多尺度的蒙古文脱机手写识别方法
基于多尺度的蒙古文脱机手写识别方法武慧娟;范道尔吉;白凤山;滕达;潘月彩【期刊名称】《中文信息学报》【年(卷),期】2022(36)10【摘要】蒙古文的一大特点是字符无缝连接,因此一个蒙古文单词有多种字符划分方式。
根据蒙古文这一特点,该文提出了多尺度蒙古文脱机手写识别方法,即让一个手写蒙古文单词图像对应多种目标序列,用多个目标序列同时约束训练模型,使得模型更加精准地学习手写图像的细节信息和蒙古文构词规则。
该文提出了“十二字头”码、变形显现码和字素码3种字符划分方法,且拥有相互包含关系,即“十二字头”码可以分解为变形显现码、变形显现码可以进一步分解为字素码。
多尺度模型首先用多层双向长短时记忆网络对序列化手写图像进行处理,之后加入第一层连接时序分类器做“十二字头”码序列的映射,然后是第二层连接时序分类器做变形显现码序列的映射,最后是第三层连接时序分类器做字素码序列的映射。
用三个连接时序分类器损失函数的和作为模型的总损失函数。
实验结果表明,该模型在公开的蒙古文脱机手写数据集MHW上表现出了最佳性能,在简单的最佳路径解码方式下,测试集Ⅰ上的单词识别准确率为66.22%、测试集Ⅱ上为63.97%。
【总页数】7页(P81-87)【作者】武慧娟;范道尔吉;白凤山;滕达;潘月彩【作者单位】内蒙古大学电子信息工程学院【正文语种】中文【中图分类】TP391【相关文献】1.基于双射变换的脱机手写数字识别方法2.基于GA-BP神经网络的脱机手写藏文识别方法3.一种基于复合特征的脱机手写体字符识别方法4.基于反馈知识迁移的脱机手写体汉字识别方法5.基于GA-BP神经网络的脱机手写藏文识别方法因版权原因,仅展示原文概要,查看原文内容请购买。
蒙古文编码向拉丁转写转换和分音节算法实现
蒙古文编码向拉丁转写转换和分音节算法实现孟和吉雅;山丹【摘要】在蒙古文单词拼写中有很多型同音异词,从字面上难以辨别和区分型同字符的差异,这对蒙古文信息处理方面都带来了一定的困难.但在蒙古文的文字信息处理过程中,解决型同音异词,确定其编码是一项重要研究内容.该文重点讨论如何实现蒙古文的拉丁转写和切分音节,来确定那些型同音异词中的型同字符的问题.%The Mongolian has, lots of words with the same type but different pronunciation. Which challenges the Mongolian information processing. Therefore, it is essential in Mongolian information processing to solve these kind of words and determine the codes. This paper mainly discusses how to realize Latin transformation and syllable segmentation for such words in Mongolian.【期刊名称】《中文信息学报》【年(卷),期】2011(025)004【总页数】4页(P101-104)【关键词】蒙古文;音节;拉丁转写【作者】孟和吉雅;山丹【作者单位】内蒙古大学计算机学院,内蒙古呼和浩特010020;内蒙古社会科学院,内蒙古呼和浩特010020【正文语种】中文【中图分类】TP3911 前言蒙古语是中国蒙古族自治地方的通用语言之一。
在上世纪70、80年代开始研究蒙古文信息处理时,主要是从文字处理开始的,而且制定的蒙古文编码也是表现“字型”为主。
经过几十年的发展,蒙古文信息处理研究已经不仅仅局限于文字处理方面,在语音合成、语音识别、文字识别等也有了一定成果。
回鹘式蒙古文字母表
回鹘式蒙古文字母表回鹘式蒙古文字母表是一种用于回鹘帝国时期的蒙古文字系统,它是早期蒙古文字的重要变体。
本文将介绍回鹘式蒙古文字母表的历史背景、构造、发展以及对蒙古文化和语言的影响。
一、历史背景回鹘帝国是古代蒙古人建立的一个重要政权,其疆域相当广阔,包括中亚、西亚和东欧地区。
回鹘帝国统治时期,蒙古人开创了独特的书写系统——回鹘式蒙古文字母表。
二、构造特点回鹘式蒙古文字母表采用了横行书写的方式,字母形状较为独特。
每个字母由多种连写的线条和弧形组成,形态复杂,具有浓厚的装饰性质。
回鹘式蒙古文字母表共包含35个基本字母,其中包括元音字母和辅音字母。
三、发展演变回鹘式蒙古文字母表在回鹘帝国时期得到了广泛应用,成为该时期蒙古人民书写的主要工具。
随着时间的推移,回鹘式蒙古文字母表逐渐演化为后来的蒙古文和满文等其他文字系统的基础。
四、对蒙古文化和语言的影响回鹘式蒙古文字母表对蒙古文化和语言的发展有着重要的影响。
它不仅是蒙古文化的重要组成部分,还为后来的蒙古文学、历史学等学科奠定了基础。
回鹘式蒙古文字母表的出现和使用,使得蒙古人民能够更加方便地记录和传承自己的历史和文化。
五、回鹘式蒙古文字母表的保护和传承回鹘式蒙古文字母表作为人类宝贵的文化遗产,目前正面临着保护和传承的挑战。
政府和学者们应采取积极措施,加强对回鹘式蒙古文字母表的研究和保护工作,确保它得到充分的保育和传承。
六、结语回鹘式蒙古文字母表是蒙古人民智慧的结晶,它凝聚着丰富的历史和文化内涵。
我们应该重视对回鹘式蒙古文字母表的研究和保护,传承和弘扬这一宝贵的文化遗产,以促进蒙古文化的繁荣和发展。
蒙古文国际标准编码诸规则
蒙古文国际标准编码诸规则
那顺乌日图;确精扎布
【期刊名称】《内蒙古大学学报:哲学社会科学版》
【年(卷),期】1998(0)4
【摘要】蒙古文国际标准编码的制定工作是一项系统工程,它一方面关系到ISO/IEC10646这样的国际标准所必须遵循的各种规定,另一方面也要体现蒙古文等五种文字的各种特点与规律,制定适合这些文字规律特点的各种规则。
本文从理论与实践两个方面探讨了蒙古文国际标准编码的显现规则、“控制符”使用规则和几个标点符号的使用规则。
【总页数】8页(P77-84)
【关键词】蒙古文;国际标准;编码;规则
【作者】那顺乌日图;确精扎布
【作者单位】内蒙古大学蒙古语文研究所
【正文语种】中文
【中图分类】H212
【相关文献】
1.从ASCII码到蒙古文国际标准编码转写软件的设计与实现 [J], 图格木勒;包艳花
2.基于国际标准编码系统的维吾尔文拉丁文转写规则研究 [J], 亚森·伊明
3.关于传统蒙古文网页的国际标准编码及字体处理技术 [J], 陈晓宇;赵久军;郗风江
4.蒙古文、托忒文、锡伯文(含满文)编码方案──我国提出的这一方案已被国际
标准化组织接受 [J],
5.蒙古文国际标准编码的构成原则 [J], 那顺乌日图;确精扎布
因版权原因,仅展示原文概要,查看原文内容请购买。
蒙古文文献数字化建设与OpenType字库的优化
蒙古文文献数字化建设与OpenType字库的优化○宝美荣(内蒙古师范大学图书馆,内蒙古 呼和浩特 010022)[摘 要] 本文主要根据蒙古文文献数字化建设、检索、共享等方面阐述了蒙古文OpenType字库的重要性。
详细分析了win7系统下的蒙古文OpenType字库规则,发现一些规则没有遵循蒙古文语法规则,导致控制符使用繁杂。
为普通用户输入蒙古文带来不必要的复杂性。
本文以蒙古文的语法和书写规则为依据,按照不用控制符或尽量少用控制符原则对字库规则进行优化,提出了对蒙古文字库规则的修正方法,实验表明达到了预期效果。
[关键词] 数字化; 共享; OpenType字库; 规则[中图分类号]G112 [文献标识码]A [文章编号]1672-8610(2014)05-0066-03 利用现代信息技术进行民族文献的数字化对极其宝贵的民族文献资料保存并有效利用、广泛传播等具有深远的意义。
中国蒙古文现代图书近3万种,期刊150多种,古籍1.5万种,收藏蒙古文文献的各级图书馆400多家,所以蒙古文图书文献资源丰富且地域分布广。
所以建立统一的蒙古文文献数字化共建、共享平台是非常有必要。
随着软件硬件技术的不断发展对文献数字化建设提供了良好的环境和平台。
因此蒙古文文献的数字化工作越来越受到人们的重视。
一、蒙古文文献数字化中的共享、检索问题从技术层面分析,目前各高校图书馆使用的蒙古文文献管理系统不尽相同,如汇文、金盘等。
而且各个系统之间不兼容,导致对资源的共享带来很大的困难。
而文献数字化的最终目的是资源的广泛共享。
实现共享要需要统一的文献管理平台。
其根本的统一在于蒙古文编码。
由于蒙古文编码国际标准制定较晚(2002年)导致多种编码(形码、音码等)并存,编码不统一,对资源共享带来一定的障碍。
从语言本身分析,蒙古文是一种复杂的拼音文字。
也是唯一从左到右、从上到下竖排的文字。
这个特点对文字处理技术带来了一定的难度。
除此之外,蒙古文中存在一音多形、一形多音等现象,因普通用户很难100%正确掌握,文字录入过程中难免会出错,所以会影响检索效率。
回鹘式蒙古文字母表
回鹘式蒙古文字母表摘要:一、回鹘式蒙古文的起源与发展二、回鹘式蒙古文的字母表特点三、回鹘式蒙古文在我国的应用与发展四、回鹘式蒙古文在国际间的传播与影响五、回鹘式蒙古文在未来的发展前景正文:回鹘式蒙古文字母表是蒙古族使用的一种拼音文字,起源于公元13世纪。
在我国,这种文字被称为“回鹘式蒙古文”,而在国际上,它被称为“Mongolian script”。
本文将从回鹘式蒙古文的起源、特点、应用与发展等方面进行详细介绍。
一、回鹘式蒙古文的起源与发展回鹘式蒙古文起源于公元13世纪的蒙古帝国。
当时,成吉思汗为了更好地统治庞大的帝国,急需一种统一的语言和文字。
在吸收了回鹘文、藏文、维吾尔文等文字的基础上,回鹘式蒙古文逐渐形成。
随着时间的推移,回鹘式蒙古文不断发展与完善,成为了蒙古族最重要的文字之一。
二、回鹘式蒙古文的字母表特点回鹘式蒙古文的字母表共有26个字母,分为13个元音和13个辅音。
这些字母按照一定的规则排列,形成了音节和单词。
回鹘式蒙古文的字母表有以下几个特点:1.字母形状:回鹘式蒙古文的字母形状类似于中亚地区的其他拼音文字,如维吾尔文、哈萨克文等。
2.字母排列:回鹘式蒙古文的字母按照一定的顺序排列,从左到右,从上到下。
3.音节结构:回鹘式蒙古文的音节结构较为简单,主要由辅音和元音组成。
三、回鹘式蒙古文在我国的应用与发展在我国,回鹘式蒙古文主要用于蒙古语的书写。
近年来,随着国家对少数民族语言文字的保护和支持,回鹘式蒙古文得到了广泛的应用和发展。
不仅在蒙古族人中广泛使用,还在教育、新闻、出版、文化等领域取得了显著成果。
四、回鹘式蒙古文在国际间的传播与影响回鹘式蒙古文不仅在我国得到广泛应用,还在蒙古国等国家受到重视。
在国际间,回鹘式蒙古文对其他拼音文字产生了深远的影响。
例如,托忒文、满文等文字都受到了回鹘式蒙古文的启发和影响。
五、回鹘式蒙古文在未来的发展前景随着全球化的推进,回鹘式蒙古文面临着与其他拼音文字一样的挑战。
蒙古文国际标准编码诸规则
蒙古文国际标准编码诸规则一、背景介绍蒙古文是蒙古族人民使用的一种书写文字系统,广泛应用于蒙古国和中国的内蒙古自治区等地。
为了促进蒙古文的国际化推广和标准化应用,蒙古文国际标准编码诸规则被制定。
本文将全面、详细、完整地探讨这些规则。
二、国际标准编码的意义国际标准编码的制定对于蒙古文的推广和传承意义重大。
它有助于促进蒙古文与其他文字系统的互通性,使得使用蒙古文的国家和地区能够更加便捷地进行信息交流。
同时,国际标准编码也为蒙古文在计算机和互联网领域的应用提供了基础和支持。
三、蒙古文国际标准编码的制定3.1 蒙古文字符的编码规则蒙古文国际标准编码的核心是对蒙古文字符的统一编码规则。
根据Unicode字符编码标准,蒙古文字符采用了专门的编码范围,并按照特定的规则进行排列。
具体而言,蒙古文字符在Unicode标准中的编码范围是0x1800至0x18AF,其中包括了蒙古文基本字符、附加字符以及其他扩展字符。
3.2 蒙古文语音特点的考虑编码规则的制定还需考虑到蒙古文语音特点。
蒙古文具有丰富的声调和发音变化,这对于编码规则的设计提出了一定的挑战。
因此,蒙古文国际标准编码需要充分考虑到语音特点,采用合理的编码方案,确保每个蒙古文字符都能够准确表示其对应的语音。
3.3 兼容性和扩展性的考虑蒙古文国际标准编码的制定还需兼顾到编码的兼容性和扩展性。
兼容性指的是与现有的计算机系统和软件的编码标准兼容,使得蒙古文能够无障碍地与其他文字系统进行交互。
扩展性指的是能够容纳未来蒙古文语言发展中可能出现的新字符和标点符号,保障编码标准的长期可用性。
四、蒙古文国际标准编码的应用蒙古文国际标准编码的应用具有广泛的领域和范围。
首先,蒙古文国际标准编码能够促进蒙古文在计算机和互联网领域的应用,包括蒙古文网站、电子邮件、社交媒体等。
其次,蒙古文国际标准编码也对于蒙古文的教育和研究具有重要意义,为学术交流和知识传播提供了方便。
此外,蒙古文国际标准编码还有助于蒙古文的出版、印刷和数字化处理等领域的发展。
回鹘式蒙古文字母表
回鹘式蒙古文字母表(原创实用版)目录1.回鹘式蒙古文字母表的概述2.回鹘式蒙古文字母表的特点3.回鹘式蒙古文字母表的发展历程4.回鹘式蒙古文字母表的应用领域5.回鹘式蒙古文字母表的价值和意义正文一、回鹘式蒙古文字母表的概述回鹘式蒙古文字母表,又称蒙古文回鹘字母,是一种源于回鹘文的蒙古文字母表。
它主要由蒙古帝国时期的蒙古人使用,以记录蒙古语。
这种文字字母表在 13 世纪至 17 世纪期间广泛流行于蒙古地区,成为蒙古族文化的重要组成部分。
二、回鹘式蒙古文字母表的特点回鹘式蒙古文字母表具有以下特点:1.笔画简单:回鹘式蒙古文字母表的笔画相对简单,易于书写。
2.字母数量较少:回鹘式蒙古文字母表的字母数量较少,基本可以满足蒙古语的表达需求。
3.音节拼写:回鹘式蒙古文字母表采用音节拼写的方式,即一个字母代表一个音节,便于阅读和拼写。
三、回鹘式蒙古文字母表的发展历程回鹘式蒙古文字母表的发展历程可以分为以下几个阶段:1.起源:回鹘式蒙古文字母表起源于回鹘文,回鹘文是古代回鹘人使用的一种文字,主要流传于公元 8 至 9 世纪。
2.形成:在 13 世纪初,成吉思汗统一蒙古各部后,蒙古人开始使用回鹘式蒙古文字母表记录蒙古语。
这一时期,回鹘式蒙古文字母表逐渐形成,并在蒙古帝国范围内广泛传播。
3.发展:在元朝时期,回鹘式蒙古文字母表得到进一步发展。
这一时期,蒙古文字母表开始出现楷书、行书等不同字体,书法艺术逐渐发展。
4.衰落:明朝建立后,蒙古族逐渐失去独立地位,回鹘式蒙古文字母表的使用范围逐渐缩小。
到 17 世纪初,蒙古族开始使用满文记录蒙古语,回鹘式蒙古文字母表逐渐衰落。
四、回鹘式蒙古文字母表的应用领域回鹘式蒙古文字母表主要应用于以下领域:1.文学作品:回鹘式蒙古文字母表是蒙古族文学创作的重要工具,许多蒙古文学作品都是用这种文字字母表写成的。
2.历史文献:蒙古族历史文献中,许多资料都是用回鹘式蒙古文字母表记录的,为我们了解蒙古族历史提供了重要依据。
国家标准公告2014年第21号——关于批准发布《化学试剂六次甲基四胺》等259项国家标准的公告
国家标准公告2014年第21号——关于批准发布《化学试剂六次甲基四胺》等259项国家标准的公告
文章属性
•【制定机关】国家质量监督检验检疫总局(已撤销),国家标准化管理委员会•【公布日期】2014.09.03
•【文号】国家标准公告2014年第21号
•【施行日期】2014.10.01
•【效力等级】部门规范性文件
•【时效性】现行有效
•【主题分类】标准化
正文
国家标准公告
(2014年第21号)
关于批准发布《化学试剂六次甲基四胺》等259项国家标准的公告国家质量监督检验检疫总局、国家标准化管理委员会批准《化学试剂六次甲基四胺》等259项国家标准,现予以公布(见附件)。
国家质检总局
国家标准委。
蒙古文文献数字化建设与OpenType字库的优化【完整版】
蒙古文文献数字化建设与OpenType字库的优化【完整版】(文档可以直接使用,也可根据实际需要修订后使用,可编辑放心下载)蒙古文文献数字化建设与OpenType字库的优化-大学语文论文蒙古文文献数字化建设与OpenType字库的优化○ 宝美荣(内蒙古师范大学图书馆,内蒙古呼和浩特010022)[摘要]本文主要根据蒙古文文献数字化建设、检索、共享等方面阐述了蒙古文OpenType字库的重要性。
详细分析了win7系统下的蒙古文OpenType 字库规那么,发现一些规那么没有遵循蒙古文语法规那么,导致控制符使用繁杂。
为普通用户输入蒙古文带来不必要的复杂性。
本文以蒙古文的语法和书写规那么为依据,按照不用控制符或尽量少用控制符原那么对字库规那么进行优化,提出了对蒙古文字库规那么的修正方法,实验说明到达了预期效果。
[关键词]数字化;共享;OpenType字库;规那么[中图分类号]G112[文献标识码]A[文章编号]1672-8610(2021)05-0066-03利用现代信息技术进行民族文献的数字化对极其珍贵的民族文献资料保存并有效利用、广泛传播等具有深远的意义。
中国蒙古文现代图书近3万种,期刊150多种,古籍1.5万种,收藏蒙古文文献的各级图书馆400多家,所以蒙古文图书文献资源丰富且地域分布广。
所以建立统一的蒙古文文献数字化共建、共享平台是非常有必要。
随着软件硬件技术的不断开展对文献数字化建设提供了良好的环境和平台。
因此蒙古文文献的数字化工作越来越受到人们的重视。
一、蒙古文文献数字化中的共享、检索问题从技术层面分析,目前各高校图书馆使用的蒙古文文献管理系统不尽相同,如汇文、金盘等。
而且各个系统之间不兼容,导致对资源的共享带来很大的困难。
而文献数字化的最终目的是资源的广泛共享。
实现共享要需要统一的文献管理平台。
其根本的统一在于蒙古文编码。
由于蒙古文编码国际标准制定较晚〔2002年〕导致多种编码〔形码、音码等〕并存,编码不统一,对资源共享带来一定的障碍。
中华人民共和国国家标准公告
2023年第12号国家市场监督管理总局(国家标准化管理委员会)批准《通用硅酸盐水泥》等17项强制性国家标准,现予以公告。
关于批准发布《通用硅酸盐水泥》等17项强制性国家标准的公告中华人民共和国国家标准公 告序号标准编号标准名称代替标准号实施日期1GB 175-2023通用硅酸盐水泥GB 175-20072024-06-012GB 4234.9-2023外科植入物 金属材料 第9部分:锻造高氮不锈钢2025-12-013GB 5842-2023液化石油气钢瓶GB/T 5842-20222023-12-014GB 7512-2023液化石油气瓶阀GB/T 7512-20172023-12-015GB 7300.802-2023饲料添加剂 第8部分:防腐剂、防霉剂和酸度调节剂 丙酸部分代替:GB/T 22145-20082024-12-016GB 14925-2023实验动物 环境及设施GB 14925-20102024-06-017GB 18585-2023室内装饰装修材料 壁纸中有害物质限量GB 18585-20012024-12-018GB 19082-2023医用一次性防护服GB 19082-20092025-12-019GB 19083-2023医用防护口罩GB 19083-20102025-12-01国家市场监督管理总局 国家标准化管理委员会二〇二三年十一月二十七日10GB 21252-2023建筑卫生陶瓷和耐磨氧化铝球单位产品能源消耗限额GB 21252-2013,GB 30181-20132024-12-0111GB 21343-2023电石、乙酸乙烯酯、聚乙烯醇、1,4-丁二醇、双氰胺和单氰胺单位产品能源消耗限额GB 21343-2015,GB 31824-2015,GB 30528-2014,GB 30529-20142024-12-0112GB 21344-2023化肥行业单位产品能源消耗限额GB 21344-2015,GB 29138-2012,GB 29139-2012,GB 29439-2012,GB 31829-2015,GB 32035-20152024-12-0113GB 29145-2023钨精矿、钼精矿和焙烧钼精矿单位产品能源消耗限额GB 29145-2012,GB 29146-2012,GB 31340-20142024-12-0114GB 29436-2023甲醇、乙二醇和二甲醚单位产品能源消耗限额GB 29436.1-2012,GB 29436.2-2015,GB 29436.3-2015,GB 29436.4-2015,GB 31535-2015,GB 32048-20152024-12-0115GB 43352-2023快递包装重金属与特定物质限量2024-06-01 16GB 43469-2023便携式机上儿童限制装置2024-12-0117GB 43470-2023全球海上遇险和安全系统 自动识别系统搜救发射器性能和测试要求2024-06-012023年第13号国家市场监督管理总局(国家标准化管理委员会)批准《液压缸 试验方法》等468项推荐性国家标准,现予以公告。
MGC01-01-传统蒙古文名义字符到变形显现字符转换规则(中文)
蒙古文辅音《
1830
, 1833
2.18
蒙古文元音 《 》 前分写辅音
后面接的1820(a)时可以加180E分开写的辅音。有1827
182C
(阳性元音
前 ),182D
(阳性元音前 ), 182E
, 182F
, 1830
, 1831
x), 1835
,1836
, 1837
, 1838
2.19
蒙古文元音 《 》 前分写辅音
2.24 零宽连接符 200D(ZWJ)
2.25 词的定义 由一个或多个蒙古文字符、FVS1、FVS2、FVS3、FVS4、MVS、MRB(至少一个蒙古文字符) 组成的字符序列。
3 标准内容 本标准的内容包括传统蒙古文(现代蒙古文)名义字符到变形显现字符的转换规则。
附加说明
一、本转换规则暂定只适用于现代蒙古文 目前,本转换规则只包含现代蒙古文名义字符及其变形显现字符。在设计上
在本转换规则的举例包含两部分内容:一部分是现代蒙古文当中的常规词汇, 另一部分是不符合现代蒙古文正字法变形规则的错误举例。
选择这些举例的原因是: (1) 字库制作的需要:在做输入蒙古文时,因为随意输入的原因会出现 “一些字符出现在不正确的位置”的情况。但是,字库里必须处理这些现象。那 么必须对该字符在这个不正确的位置上定义一个字形。 (2) 人为输入一些错别字形的需要:由于研究、讲解等原因需要输入一 些错别的字形。 (3) 处理一些古文献的使用方法:蒙古文中的一些拼写规则在以前使用 过,但是现代蒙古文中基本不使用了。但是在某些场合还要输出这样的拼写。 (4) 转换规则尽可能转化一个字符的所有变形:由于蒙古文转换规则复 杂性和发展过程的多变性,现在还不能找出每个字形的使用举例。所以尽量涵盖 每个字符的所有字形的转化情况。因此,在举例里列出了一些异常的单词。 六、多词根词词内分界符(MRD) 在显示蒙古文多词根词过程中,为了准确处理阴阳性、合体字、音节末辅音 等语言学现象时候,需要引入蒙古文多词根词词内分界符概念(MRD,Mongolian Word Root Delimiter)用于完整解决上述语言学问题。该符号在国家标准中尚 未定义,拟计划新申请。在未获得 MRD 正式码位前,暂用其他方案解决上述问题。 如可以使用 ZWJ(200D)、NIRUGU(180A)等替代方案。
回鹘式蒙古文字母表
回鹘式蒙古文字母表
(最新版)
目录
1.回鹘式蒙古文字母表的概述
2.回鹘式蒙古文字母表的历史
3.回鹘式蒙古文字母表的特点
4.回鹘式蒙古文字母表的影响
正文
回鹘式蒙古文字母表,是一种用来记录蒙古语的文字系统,主要在公元 13 世纪至 17 世纪间使用。
其起源可以追溯到公元 9 世纪的回鹘汗国,当时的回鹘人使用了一种基于粟特文的文字系统。
后来,这种文字系统随着回鹘人的西征,传播到了蒙古地区,并在那里与当地的文字系统融合,形成了回鹘式蒙古文字母表。
回鹘式蒙古文字母表的主要特点是其字母形式独特,其中有一些字母形状与其他文字系统中的字母相似,但也有一些是回鹘式蒙古文字母表特有的。
此外,回鹘式蒙古文字母表的语法结构也比较复杂,包含了大量的元音和辅音,以及一些特殊的发音规则。
回鹘式蒙古文字母表在蒙古文化中扮演了重要的角色。
它不仅是蒙古语的主要书写系统,也是蒙古文化的重要组成部分。
在蒙古帝国时期,回鹘式蒙古文字母表被广泛使用,不仅是官方文件和书籍的文字,也是民间交流的主要工具。
同时,回鹘式蒙古文字母表也影响了其他文字系统的发展,例如,满文就受到了回鹘式蒙古文字母表的启发和影响。
然而,随着蒙古帝国的解体,回鹘式蒙古文字母表的使用范围逐渐缩小,最终被基里吉斯文字所取代。
第1页共1页。
回骼式蒙古文
回骼式蒙古文
回骼式蒙古文的规则
回骼式蒙古文是蒙古文的古老写法,主要是以蒙古语的声调进行编写,并且必
须遵循以下的主要规则:
一、首先,每个母音和子音的音量均要相同。
二、其次,所有子音和母音序列
永远以子音开头,以单词和句子周围保持自由灵活。
三、在子音开头的单词中,子音必定跟着一个母音,母音永远在子音之后。
四、在子音结尾的单词中,子音总是以一个音节的形式呈现,不要使用双音节的语调。
五、在母音结尾的单词中,必须有两个子音音节与之相配对,不能只有一个子音。
六、在单词当中不要使用两个辅音字母作为一个辅音复音,必须将它们分成两个单独的音节。
上述便是回骼式蒙古文的主要规则,它是一种比较难用的文字形式,但它丰富
了蒙古文的表达能力,受到不少蒙古族朋友的喜爱。
只要遵循本文提供的这些规则,你就可以尝试用这种古老的文字形式来表达你的想法和心意。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
国家标准《信息技术回鹘式蒙古文名义字符、变形显现字符及控制字符的使用规则》(征求意见稿)编制说明
2017-04
一、工作简况
[内容包括下达计划任务主管部门的完整名称、项目计划发布文件号、本项目的计划代号和主要承办单位完整名称、副主办单位或协作单位完整名称、主要工作过程、主要起草人及其所做的工作等]
根据国家标准化管理委员会下达的2015年第三批国家标准计划任务,《信息技术回鹘式蒙古文名义字符、变形显现字符和控制字符使用规则》(20153399-T-469)由中国电子技术标准化研究院、内蒙古大学等单位研制。
其他单位有:内蒙古自治区蒙古语文工作委员会、北京北大方正电子有限公司、中国科学院软件研究所、呼和浩特民族学院、呼伦贝尔学院。
本标准的预研可追溯至2007年。
2007年10月,内蒙古大学成立了回鹘式蒙古文编码预研小组,对回鹘式蒙古文主要文献以及相关论著进行了详实地考察研究,确定了回鹘式蒙古文编码研制范围和规则等、字符图形,编写了相应的转换规则初稿。
并在北大方正公司的协助下,研制了回鹘式蒙古文输入法。
2009年10月,中国电子技术标准化研究院组织课题研制组及相关专家在呼和浩特市召开了第一次回鹘式蒙古文编码研讨会,集中讨论了回鹘式蒙古文字母形状和结构特点,字形确定相关内容。
2011年11月,中国电子技术标准化研究院组织课题研制组及相关专家在呼和浩特市召开了第二次回鹘式蒙古文编码(国际)研讨会,对回鹘式蒙古文字母体系、编码字符数量及图形、编码原则、标准结构等问题进行了认真讨论,做出了会议相应的决定,会后标准编制组根据专家的意见,形成了本标准的征求意见稿的初稿。
2013年5月,中国电子技术标准化研究院组织标准课题研制组及相关专家在呼和浩特市召开了第三次回鹘式蒙古文编码研讨会,对本标准的征求意见稿的初稿进行了讨论,会后标准编制组根据专家的意见进行了相应的增补修改。
2014年12月,全国信息技术标准化委员会下属蒙古文信息技术国家标准工作组大会确认了本标准的需求、技术成熟度与承担单位,并建议立项。
2015年12月,国家标准化管理委员会下达了标准研制任务。
2016年1月,中国电子技术标准化研究院作为第一承担单位确认了标准工作组成员,工作组对后续工作进行了任务和进度安排。
2016年8月,标准工作组召开学术会议,介绍了回鹘式蒙古文编码国家标准立项申请、标准草案的形成的过程、与现有标准的关系等;与会人员对标准中的技术问题进行了讨论,一致认为,标准规定的内容准确、恰当,可以解决回鹘式蒙古文编码处理的问题,建议标准工作组根据会议意见对标准文本进行修改,进入下一步工作程序。
会后,标准工作组根据专家的意见对有关内容进行了研究,对标准文本作了相应修改,形成了本标准的征求意见稿。
2017年4月,中国电子技术标准化研究院组织专家对标准征求意见稿进行了内审,提出了编辑性修改意见。
2017年5月,全国信息技术标准化技术委员会对外公示根据内审意见修改过的标准征求意见稿,向全国征求意见。
二、标准编制原则和确定主要内容的论据及解决的主要问题
[如技术指标、参数、公式、性能要求、试验方法、检验规则等的论据,包括试验、统计数据,解决的主要问题。
修订标准时应列出与原标准的主要差异和水平对比] 本标准的主要内容是回鹘式蒙古文名义字符、变形显现字符及其控制字符的使用规则。
通用编码字符集GB 13000-2000《信息技术通用多八位编码字符集(UCS)》之中仅规定了蒙古文种在信息处理中的通用规则,而没有针对传统蒙古文、回鹘式蒙古文、满文、锡伯文、托特文自身特点对各自名义字符、变形显现字符和控制字符的专有规则进行分别规定。
回鹘式蒙古文基本字母形状、数量和变体不同于当前使用的传统蒙古文,回鹘式蒙古文正字法与传统蒙古文正字法既有很多一致或相似的内容,也有很大不同。
现有的传统蒙古文信息技术国家标准无法完整、准确地保存回鹘式蒙古文文献。
因此,必须在传统蒙古文编码国家标准的基础上,根据回鹘式蒙古文自身的特点,制定回鹘式蒙古文编码国家标准,特别是对回鹘式蒙古文单个变形显现字符、强制性合体字、非强制性合体字以及自由变体选择
符的使用规则做详细规定。
我国已经发布了GB 25914-2010《信息技术传统蒙古文名义字符、变形显现字符和控制字符使用规则》,本标准与该标准类似,同为规定名义字符、变形显现字符和控制字符使用规则,但用于回鹘式蒙古文。
标准工作组确定以下编制原则:
1、本标准的结构与GB 25914-2010《信息技术传统蒙古文名义字符、变形显现字符和控制符使用规则》基本保持一致;
2、本标准规定的名义字符与GB 25914-2010基本保持一致;
3、在GB 25914-2010的基础上,根据回鹘式蒙古文自身的特点,在本标准增加必需的变形显现字符和控制字符及其使用规则。
三、主要试验[或验证]情况分析
2007年,标准起草单位研制了第一版的回鹘式蒙古文的录入程序,经测试使用,基本可行。
随着后续研究的深入和研究范围的扩大,现已经过了4次修改和扩充。
在此工作中,根据相关文献(回鹘式蒙古文木刻板《孝经》、AWADAR_A、少林寺碑文、YISUNGGE、GUYUG, ABAG_A, ARGVN, HASAN, ALTAN 等可汗的诏书、西宁王、云南王、SVRHARNAI-YIN TVGVJI等)的研究成果,在标准初稿的基础上增加了60多个孤立变形显现字符、16个变体选择符(从公用变体选择符中借用)、1个零宽无间断空格、1个词连接符、7个强制性合体字,30个非强制性合体字,完善了标准的可行性和适用性。
四、知识产权情况说明
[相关知识产权情况的说明。
如果在标准编制过程中识别出标准的某些技术内容涉及专利,则应列出相关专利的目录及其使用理由]
无。
五、产业化情况、推广应用论证和预期达到的经济效果
[电子行业标准必须填写。
对于国家标准如不要求此内容可删除章号和标题]
预期本标准发布实施后,可取得下面效果:
1、对GB 13000和现有蒙古文信息技术标准体系是有效的扩充,将有力地促进在国内蒙古文信息处理产品的规范而统一地实现;
2、直接满足蒙古文文献数字化与典藏以及相关研究需求,对蒙古文信息处理应用推广起到积极的作用;
3、坚实蒙古文信息产业的标准化基础、构建平等竞争的环境,保护和扶助民族信息产业;
4、有利于蒙古语地区民族经济和文化的发展。
回鹘式蒙古文是蒙古族诸多文献的主要载体文字,1580年前的前期蒙古文文献的数字化以回鹘式蒙古文编码为基础,因此,回鹘式蒙古文编码国家标准的研制将对回鹘式蒙古文古文献数字化保存和利用以及对蒙古族文化、经济、社会的发展进一步具有重要的支撑作用,也对当代蒙古族传统文化发扬和发展具有重要的现实意义。
六、采用国际标准和国外先进标准情况
[采用国际标准和国外先进标准的程度,以及与国际、国外同类标准水平的对比情况,国内外关键指标对比分析或与测试的国外样品、样机的相关数据对比情况] 没有发现国外有回鹘式蒙古文编码的任何信息,因而判断为我国独创。
七、与现行相关法律、法规、规章及相关标准的协调性
[与相关的现行法律、法规和规章的符合性,特别是与强制性国家标准的协调性,以及与同类标准和标准体系中其他标准的协调性说明]
本标准与我国的现行法律、法规和强制性标准无冲突;本标准配合GB 13000-2000《信息技术通用多八位编码字符集(UCS)》使用。
八、重大分歧意见的处理经过和依据
对于回鹘式蒙古文的字母体系,向来存在不同的学术意见。
本标准起草组征求了国内专家的意见,并与蒙古国语言学专家进行了共同研究。
结论是坚持已经使用了七百多年的蒙古语文学的十二字头和十一个音节末辅音的字母体系理论。
无其他重要技术分歧。
九、标准性质的建议
[建议是强制性标准还是推荐性标准,对于强制性标准必须列出强制的理由,强制范围] 建议本标准作为推荐性国家标准发布。
十、贯彻标准的要求和措施建议
[内容包括组织措施、技术措施、过渡办法、实施日期等]
建议本标准发布6个月后实施。
十一、替代或废止现行相关标准的建议
[说明废止和/或替代相关标准的情况。
报批国家标准时,如有相应转换、代替、废止的电子行业标准或指导性技术文件,亦应说明]
无。
十二、其它应予说明的事项
无。
国家标准《信息技术回鹘式蒙古文名义字符、变形显现字符和控制字符使用规
则》编制工作组
2017-04-26。