藏文联想记忆输入法研究_马金海、贺胜、卢亚军

合集下载

藏文速记方案

藏文速记方案

藏文速记方案速记原理图斜园斜直带钩直取三级比例速记声母表速记韵母表速记实录藏文速记介绍藏语速记是一个容易引起诸多误会的问题,问题在于传统速记---藏文草书具有很强的速记功能,但藏语速记和藏文速记是两个不同的概念。

诚然,藏文草书与藏语速记都是同一个载体的两种不同的符号系统,有着共同的功能特征,但在如今讲求高效率的社会,藏文草书的速记效率显然不能满足一些特殊场合的速记需要。

而藏文草书的练习难度和区别度显然要比现代速记要低很多。

虽然藏文草书在普通场合可以作为一般人的速记书法,但在秘书等行业领域,草书的记录速度远不能如现代速记般闻听而记,显然需要专业领域的藏文速记才能胜任。

总之,藏文速记与藏语速记有着本质的不同,藏文速记要求正字法的严谨和阅读的规范,对记录速度没有大的要求。

而藏语速记要求记录速度,不注重文字的正字规律,为求效率和简易,将文字上的很多正字规范省略,合并众多同音字,所以两者没有太多可比性。

笔者搜集了多种速记方案,力所能及地研究了一些速记原理,通过对藏语和藏文的系统归纳和统计,设计了这个藏文速记方案,愿为一些速记人员提供方便,以便那些专业人员提出宝贵意见,进一步完善,算是个抛砖引玉的工作了。

但凡现代速记,流派众多,英国多流行皮特曼式速记,美国一律为格瑞戈式速记,即轻线斜曲式,现格瑞戈速记渐成标准,多次赢得速记冠军桂冠,且易于普及和掌握,便仿照其原理制定本方案。

速记符号的确定有着众多标准,其中最重要两条是:一.声符的长度、角度及可选曲线的优劣。

二.韵符可选曲线及其与韵符配合的规律。

藏语速记记录的是口语的读音,实质是藏文拼音的一种简化的写法。

藏文有传统的速记书法,但其速记效率已经不能应对一些特殊的速记需求。

所以设计一种具有现代速记特征的藏文速记方案已是势在必行。

但简化不能随意改变藏语拼音的拼写规则,声韵速记符号应与藏语中的声母和韵母一一对应。

速记一般要求两笔至三笔成字,而传统藏文的拼音有200多个声母和90多个韵母,但口语中的声母和韵母一般只有四五十个,简化同音异形的藏文拼音,以一个速记符号替代多个同音异形的拼音,是现代意义的速记规范。

藏文键盘输入法设计原理

藏文键盘输入法设计原理
根据输入设备的不同可以将输入法分为3类: 1、键盘输入法:目前最成功的藏文输入技术之一。 2、手写笔输入法: 3、语音输入法。 :
藏文键盘输入法原理概述
藏文键盘及外设输入流程图过程:
注意:
(1)输入法管理器调用当前使用的输入法IME 的函数ImeProcessKey (),传送键盘信息到输 入法IME; (2)输入法IME接收到键盘消息,开始输入到 藏文的转换,如果不进行转换,则输入法管 理器将其直接送到应用程序; (3)将转换好的藏文字符(串),输入法IME 通过ImeToAsciiEx()返回参数发送藏文字符 (串)到输入法管理器;
藏文键盘输入原理
西文:敲入的按键就可以直接根据当前的代 码页(Code Page)转换为西文字符的内码 从而显示在当前应用程序的窗口中。 藏文键盘编码输入: (1)藏文编码,即一定的规则(藏文码表)为 藏文编码,从而产生一个“藏文 编码”对 照表。 (2)输入系统:根据码表,编写输入法程序。 (3)用户输入藏文输入码,通过输入系统处理 就可以把藏文输入计算机。
藏文键盘输入原理
输入系统:即翻译程序,负责把输入码翻译 成为藏文机内码,并提供用户一个交互的界 面,提供应用程序一个输入接口。 Condition:输入系统必须先于应用程序得到用 户按键的扫描码或ASCII码,否则如果应用程 序先得到的话,就会对按键进行处理,那样 输入系统就没有办法进行工作了。
setwindowshookexsetwindowshookex码表是在藏文键盘输入中的一个重要的数据码表是在藏文键盘输入中的一个重要的数据结构结构datastructuredatastructure是藏文输入码到机内码转换的核心是藏文输入码到机内码转换的核心corecore是藏文输入码和机内码之间的映射关系是藏文输入码和机内码之间的映射关系mappingmapping是以文件的形式存储在计算机内是以文件的形式存储在计算机内textfiletextfile是存储在是存储在system32system32文件夹文件夹是由一个个表项构成每个表项一般有两个是由一个个表项构成每个表项一般有两个域分别是

藏文文本编码识别方法研究

藏文文本编码识别方法研究

藏文文本编码识别方法研究春燕;曲珍【摘要】讨论了藏文编码识别与转换中的关键问题,介绍了藏文结构特点和统计学特征以及各种可能的识别准则,并进行分析比较.确定了使用以藏文的音节点间距规律和高频音节为特征的识别方法对方正Windows、方正Dos、同元、华光Windows、华光Dos、班智达、ASCII的藏文编码方案、ISO/IEC10646基本集、国家标准扩充集A的藏文编码识别,能够正确地将藏文文本与其他语言进行区分.在对目标样本的测试中,该算法的识别率可达100%.%This paper discusses critical problems with Tibetan encoding identification and conversion. Accordingto Tibetan character structural and its statistical characteristics, it introduces various possible recognition rules, and the results are analyzed and compared. Used characteristics of distance regulation and high frequency between Tibetan syllables to determination encoding identification of FOUNDER Windows, FOUNDER Dos, Tonguer, HURGURNG Windows, HURGURNG Dos, Pandita, the Tibetan encoding based on ASCII, ISO/IEC10646 basic set and Tibetan coded character sets-Extension A, can correctly distinguish Tibetan text with other languages. The rate of recognition reaches 100% using these algorithms on the test documents.【期刊名称】《计算机工程与应用》【年(卷),期】2013(049)001【总页数】4页(P141-144)【关键词】藏文编码;藏文编码识别;音节点【作者】春燕;曲珍【作者单位】西藏大学计算机科学与技术系,拉萨850012;西藏大学计算机科学与技术系,拉萨850012【正文语种】中文【中图分类】TP391.1对藏文文本的识别由两部分实现:一是识别该文本是否为藏文文本,二是识别该藏文文本所使用的编码方案。

基于IMM-IME结构的藏文输入法研究

基于IMM-IME结构的藏文输入法研究
金藏文输入法的主要工作原理是从键盘接收按键并进行处理, 把输入码 转换为藏文各种字符编码, 从而达到输入藏文字的目的@ 该输入法依据计算机键盘布局的基本理论、 若 干原则、 相关科学研究成果和基于藏文语料库的字符、 部件、 音节、 词汇统计数据, 遵循藏语语法规则及
[ 收稿日期] ! * * + 9 * ! 9 ) D [ 基金项目] 国家社科基金! 藏语语料库建设研究》 ( ) * * K重点项目《 * K C L L * * ) ’ [ 作者简介] 贺胜( —) , 男, 安徽安庆人, 讲师, 主要研究方向: 中文信息处理@ ) " ; )
— ! " —
其特殊性和藏文基字与上下、 前后、 又后加字及元音配置的规律, 在对计算机键盘键位的属性进行专门 研究的基础上, 研制出“ 一键多符” ( 即在同一个键位上整合多个藏文部件) 和“ 一键到位” , 即在输入现代 藏文时无需切换上档, 并配合输入提示行、 软键盘, 以及将使用频度最高的藏文“ 隔字符” 布局在空格键 ( ) 上的智能化键盘布局与输入法, 其藏文文本的键盘输入速度和效率成倍提高# ! " $ % & 输入法转换接口的实现 [] 在微软公司的输入法开发规范中, 共设计了 $ 在 ’ 个接口函数 (#这些函数供输入法管理器( ) **) 适当的时候调用# 主要完成以下工作: 输入码到结果字符的转换, ) * + 的初始化和关闭、 ) *+ 的设置以 及) 状态的修改, 输入字符的处理等# 要求用户自己添加代码 * + 的界面、 ) ** 给出了这些函数的规范, 来实现其功能#实际上, 并非每一个输入法编辑器在实现时都需要在所有的接口函数中添加代码, 大部 分情况下很多函数只需保留一个空函数体即可 #下面给出的几个函数, 对于央金藏文输入法来说比较 重要, 必须予以实现# : 此接口函数在用户选择央金藏文输入法时最先由输入法管理器( 调用, 以获得该 ) , ) . 0 1 2 ) **) / 输入法的有关信息 #函数应返回输入法编辑器的初始化信息, 设置当前输入法的各项属性, 以及当前输 入法的用户界面窗口类名称等# : 此接口函数将在用户通过控制面板或系统图标设置央金藏文输入法属性时被输入 ) , 3 4 . 5 1 0 2 6 法管理器调用#在此函数中可以显示属性设置对话框, 为用户配置输入法提供配置窗口界面# : 此接口函数由输入法在处理键盘事件时调用 #询问一个用户键入的键值是否应当 ) , " 2 4 7 8 8 9 : 被) 任何按键, 包括字符、 数字甚至功能键都可能需要被) * + 转换, * + 根据当前输入情况进行判断是 否需要处理和转换 #那些不需要进行转换的, 那些需要转换的, ) ** 可以直接发给应用程序, ) * +就 会通过该函数返回值提示) ** 交给) * + 的下一个函数) , ; 4 < 8 7 1 1 + =进行处理 #例如输入法设有一 个英文半角输人状态, 该状态下所有的按键将都不被转换; 更奇妙的判断是在输入编码之后产生候选字 列表时, 用户在键盘上输人 $ 这些键不应该被直接发往应用程序, 而应该被视为命令 ! ’ 的数字键时, 候选列表为空时所键入的数 ) * + 从候选字列表中选择要输入的藏文字符# 但是在用户没有输入编码, 字则应视为普通的数字输入而不被) 直接发往应用程序 # * + 处理, :该函数的工作是对输入的按键进行处理, 只有当 ) ) , ; 4 < 8 7 1 1 + = , " 2 4 7 8 8 9 : 返回 ; > ? + 时才 调用这个接口函数 #由 ) , " 2 4 7 8 8 9 ** 发往本函数进 :函数判断的需要进行转换的用户按键将被 )

联想记忆法改善学生记忆能力的实证研究

联想记忆法改善学生记忆能力的实证研究

联想记忆法改善学生记忆能力的实证研究摘要:该实验以初中二年级学生为被试,对联想记忆法是否能够有效地提高学生的记忆成绩进行了研究。

结果发现:联想记忆法能够有效地提高学生记忆词语的能力,并且学生的主观组织值显著提高。

关键词:记忆;记忆术;联想记忆法;主观组织一、问题提出记忆在我们的日常生活中,特别是学生的学习中起着非常重要的作用,已有的研究表明,人们记忆能力不容易改变,但是却可以通过获得提高记忆能力的方法。

然而在一般的学校教学中,却没有专门教授学生记忆方法的学科。

所有学生都是根据自己的经验使用简单的重复方式进行记忆。

因此现在的教学中,如何让学生们掌握记忆规律和科学的方法,并且让学生通过这些规律和方法来提高自身的记忆能力,愈来愈成为现在亟须要解决的现实问题。

记忆的方法有很多种,而记忆术是一种比较鲜为人知的记忆方法[1]。

该方法也被称为联想法,是人为的采用特殊的方式进行记忆,以改善记忆效果的技巧和方法。

该方法之前都是出现在一些畅销书中,没有实验证据的支持,但是在天津市的教师资格证的考试用书中提到该方法,该书中指出该方法可以使记忆过程变得生动有趣,因而加强了记忆。

并且这种方法对于学习外语单词,物理或化学符号,地名人名或项目,系列等信息时,非常有用[2]。

近年来一些硕博论文中也针对该方法进行了详细的解释,在另外一些论文研究中还针对这种记忆方法进行了个体实验研究,如高睿娜(2012)的研究[3];还有一部分论文是针对单词的联想记忆进行研究的,如张晓瑜(2003)的研究[4]。

但是这些研究主要是针对联想记忆专家的,或者使用的材料为英语单词。

那么一般的学生经过讲解是否也能掌握这种方法,能够利用该方法提高自己的记忆能力呢?这种方法是否也能够有效的应用于记忆其他的知识?这个问题还有待于进一步的研究。

联想法主要包括地点联想,谐音联想,缩减联想以及关键词联想等具体方法。

无论使用哪种联想方法,都是以以下基本规则为基础的。

1.图像记忆。

央金藏文分词系统

央金藏文分词系统

1央金藏文分词系统史晓东*2卢亚军**3*厦门大学人工智能研究所 361005E-mail:**************.cn**西北民族大学科研处 730030E-mail:*****************摘要:藏文分词是藏文信息处理的一个基本步骤,本文描述了我们将一个基于HMM的汉语分词系统segtag移植到藏文的过程,取得了91%的准确率。

又在错误分析的基础上,进行了训练词性的取舍、人名识别等处理,进一步提高了准确率。

关键字:藏文分词、自然语言处理、HMMA Tibetan Segmentation System – YangjinXiaodong Shi*, and Yajun Lu***Institute of Artificial Intelligence, Xiamen University, Xiamen 361005, China**Northwest University for Nationalities, Lanzhou 730030, ChinaAbstract: We described the porting of a Chinese segmentation system to handle Tibetan. The F-measure of the new Yangjin system is above 91% over a test corpus although the training corpus is relatively small. We also described more processing upon error analysis which led to further improvement.Keywords:Tibetan Segmentation, natural language processing, HMM1 引言随着少数民族语言(主要是藏、维、蒙)到汉语的机器翻译研究逐渐进入人们的视野实验,相关的少数民族语言基础法分析工具也亟待完善。

集音节、梵文和词汇于一体的藏文智能输入系统

集音节、梵文和词汇于一体的藏文智能输入系统

I tl g n i ea n u y tm n o p r tsS l b e nel e tT b tn I p tS s i e I c r o ae yl ls& S n k i & Vo a u ay a a s rt c b lr
W ANG e .a W i1n
( aino hn n r t nTcn l yh ̄tt, a w s Mi ri nvrt, a zo as 3 0 0 hn ) Nt o fC iaI omai e oo ai e No h et n ie U i sy L nhuG nu7 0 3 ,C ia f o h g tu o ts ei
的拉 丁转 写为藏文字丁编码 。这几种输入法虽然有所不 同, 但 从 编码输入 的角 度看 其输入方案均是 以字丁为输入单位 , 且根
藏文 3 0个 字母 和四个元音 的拉 丁字母 转写 , 英文键 用 盘的2 3个键 位 : , , , , , , ,,, ,, n o P rstu v a b C d e g h ijk lm, , , ,,,, , ,
据一个字 丁的叠 加层 数 或其 拉 丁转 写就 有不 等 的击键 次数 。 例如拼写输入法 输入一个 叠加四层 ( 包括 元音 ) 的字丁需 要
三键 到四键 , 一个藏文字 丁对应 唯一一个 编码 , 因此都 是低 效
w,, 分别对 应表示拉丁转写 的字母 a b C d eg h ijk l Yz , , , , , , ,,, ,, m, ,, ,,,, , , Y z。不 同数量拉 丁字母的组合所代 表 n o P rStu vw, ,
的藏文字母用相应 数量的键位组 合 。表 1是藏文 3 0个 字母 、 四个元音 的编码 规则 , 如字母 的拉丁转写 即编码 na n g g 是 ,, a三个键 位的组合。

一种智能高效的手机键盘藏文输入研究

一种智能高效的手机键盘藏文输入研究

说明: / / / 可同时带下加字;/7 一、 可同时带 / 1
上加字; 还可 同时带-l i 带前加字 、 I ̄D 字. : i 例外, 例 .
带 下 加 字 .上 加 字 =i q 要 写作  ̄l 上 D在 .
2 藏文字使用频率 统计
常 用藏文 音节 词语 的频 率统 计,这 里主 要根据 拉 萨 I语 读本 ) 藏汉 拉萨 E语词 典 ) 藏 语 简志 中采 m l 》 、 l 》 、 集 的常 用词语 3万多条 , 处理 得藏文 32 经 96字,其 中包括 少数藏 文拼 写 的外来 字 和个别 古藏 字.经统 计分 析后 , 藏字 构词 频度最 高 的前 3 0个藏字 如表 3所示 ( 用中央 民族大 学转写 方式) .
中华 民族文 化遗 产宝 库 中一 颗璀璨 的明珠 .
藏 族 同胞在 日常 生活 、工作 中有 强烈 的使 用藏文 的需 求愿望 .发送藏文 短信进 行信 息沟 通对 广大 藏族 同胞,
特 别 是对 农 牧藏 区群 众意义 重 大.然 而手机 键盘 输入 藏文 存在 许多 问题 , 中之 一 是输 入速 度较 慢,效率 不 高 . 其
前加字

1 q
可加前加字的 母(4个) 2



目 q E
1车气
E气q








1 可


E气



气日
9气司
9气
说 明 : q 还 可 同 时带 下 加 字 g 可 同时 1 / / /,还
我 国有 五 百多 万(0 1 ) 2 0 年 的藏 族 同胞,不 同方言 间交谈虽有 一定 困难,但进 行藏 文字 书面 交流,除部 分术语

基于Web页面的藏文在线输入技术

基于Web页面的藏文在线输入技术

2008年9月September 2008—260— 计 算 机 工 程Computer Engineering 第34 第18期Vol 卷.34 No.18 ·开发研究与设计技术·文章编号:1000—3428(2008)18—0260—03文献标识码:A中图分类号:TP391.1基于Web 页面的藏文在线输入技术于洪志,何向真(西北民族大学中国民族语言文字教育部重点实验室,兰州 730030)摘 要:Web 页面藏文在线输入技术,能够在浏览器中脱离本机输入法而进行藏文输入,实现藏文网络在线文字交互,为网络系统提供了跨平台的藏文输入解决方案。

阐述了基于Web 页面藏文在线输入技术的工作原理及基本设计思想,介绍藏文在线输入法的组成、内码外码设计原则和输入法流程,对藏文输入法进行系统分析,给出实现模型,论述浏览器内嵌藏文字体信息技术,达到在线、即时的藏文输入。

采用内嵌法和外挂法,实现藏文在线输入技术与主流网页编辑器的整合。

关键词:Web 页面;藏文;在线输入;字体嵌入Tibetan Online Input Technology Based on Web PageYU Hong-zhi, HE Xiang-zhen(Ministry of Education Key Laboratory for Chinese Ethnic Minority Language, Northwest University for Nationalities, Lanzhou 730030) 【Abstract 】By using the technologies of Tibetan online input on the Web, Tibetan characters can be input to a Web browser directly without using local input methods. It accomplishes the online character interaction of Tibetan language, and provides a cross-platform solution of Tibetan input method for a network system. This paper explains the basic design philosophies and the principles of online input technologies of Tibetan language which is based on the Web pages. It establishes the components of the online input method of Tibetan language, the principles to design internal and external codes and the flows of the input method. It applies a system analysis and provides a real model of Tibetan input method, and addresses the information technologies of Tibetan typeface which are embedded inside browsers to achieve online and real-time inputs of Tibetan language. It also implements the combination between online input technologies of Tibetan and main webpage editors by using embedded and external methods. 【Key words 】Web page; Tibetan; online input; font embeddedWeb 页面藏文在线输入技术是基于网页浏览器的藏文输入平台。

藏文计算机通用键盘布局与输入法研究

藏文计算机通用键盘布局与输入法研究

藏文计算机通用键盘布局与输入法研究
卢亚军
【期刊名称】《中文信息学报》
【年(卷),期】2006(20)2
【摘要】为了改进现有各种藏文计算机键盘布局与输入法,本文依据键盘布局的基本理论、若干原则、相关科学数据和基于藏文语料库的字符、部件、音节、词汇统计数据,遵循藏语语法规则及其特殊性,在对键盘键位的属性进行专门研究的基础上,研制出"一键多符"和"一键到位"的智能化藏文计算机通用键盘布局与输入法,其藏文文本的键盘输入速度和效率成倍提高,对藏文印刷、办公自动化和信息处理具有广泛的使用价值.
【总页数】9页(P78-86)
【作者】卢亚军
【作者单位】西北民族大学科技处,甘肃,兰州,730030
【正文语种】中文
【中图分类】TP391
【相关文献】
1.基于藏文编码(基本集)国家暨国际标准的藏文输入法研究 [J], 贺胜;卢亚军
2.女书计算机键盘布局与输入法的研究 [J], 田微;王江晴;朱宗晓;刘赛;程立
3.基于大型藏文语料库的藏文字符、部件、音节、词汇频度与通用度统计及其应用研究 [J], 卢亚军;马少平;张敏;罗广
4.基于汉字拼音输入法和手指作业能力的柯蒂键盘布局评价和改善研究 [J], 魏欣;
骆玉梅;吴文凤;廖斌
5.智能手机背面屏盲打输入法键盘布局设计研究 [J], 罗天伦;邓清;谭紫璇;邱一耕;武汇岳
因版权原因,仅展示原文概要,查看原文内容请购买。

基于统计的藏文音节联想输入

基于统计的藏文音节联想输入
入 方式 —— 前加 字联 想 方 式 、 字联 想 方式 、 字位 联 想 方 式 . 基 基
关键词 : 节 ; 计; 音 统 关联 ; 想输 入 联
中 图分 类 号 : P 1 T 39
文 献 标 识码 : A
文 章 编 号 :0 6 4 0 ( 08 0 — 09 一O 1 0 - 7 22 0 )3 0 6 5
藏文 中的辅音 及元音 的结合形 成 了音 节 , 藏文 在拼写 时 , 它不仅具 有横 向拼写性 , 同时具有 纵向拼写性 , 由纵 向和横 向的组合形成 的平面 文字就是 藏文 中的一 个音 节. 一般地 , 藏文 的文 法 和字 型规则 来 说 , 节 按 音 是 由前加 字 、 基字 、 元音 、 加字与 又后加 字组成 , 后 音节之 间用音 节点符 号“ ’ 隔开. 音节 以纵 向为 单位 时 , 但
收 稿 日期 : 0 8 O — 2 20一 1 O 基金项目: 国家 自然 基 金 项 目( 0 7 0 O . 62 3 9 )
作者简介 : 多杰卓玛( 9O )女 ( 17一 , 藏族) 青海贵德人, , 西北 民族大学 中国民族信息技术研 究院讲师, 从事藏文信 息处理的教学
和研 究.
每一个字 符称为 一个字丁 L. 中字 丁又是 由一个 辅音字母 或几个 辅音字 符在垂直 方 向上 的叠加 而成 的. 1其 ] 一 个音节最 少一个 字丁构成 ; 最多 由 4个字 丁构成 ( 图 1 . 见 ) 因此 , 我们也 可 以说 音节是 由字 丁组 成 的. 这样 形
成 了现代 藏文 的单音节 、 双音节 、 三音节 和 四音节 .
的 结构 特 点 并 分析 了藏 文 音 节 内的前 加 字 与基 字 、 加 字 、 后 加 字 的 关联 关 系 , 对 5 M 藏 文 语 料 的 67 94 6 后 又 并 0 0 6 音 节做 了各 成 分 间的 频 率 统 计. 关联 关 系建 立 了字 丁 之 间 的 简 单 联 想 输 入 模 式 . 出 了藏 文 音 节 的 三 种 联 想 输 用 提

藏文输入编码法及其键盘[发明专利]

藏文输入编码法及其键盘[发明专利]

专利名称:藏文输入编码法及其键盘
专利类型:发明专利
发明人:罗圣仪,刘璐,李明华,刘英杰,张渝平申请号:CN89100794.6
申请日:19890303
公开号:CN1045308A
公开日:
19900912
专利内容由知识产权出版社提供
摘要:一种藏文输入编码法及其键盘,属于计算机科学领域。

本发明提供了多种输入编码,包括字形码、拉丁代字码、区位码,并设计出相应的键盘。

本发明的编码简单、易记、直观、符合藏文书写规律,击键次数少、输入速度快、宜于推广使用。

申请人:航天工业部第七一○研究所
地址:北京市阜成路10号
国籍:CN
代理机构:清华大学专利事务所
更多信息请下载全文后查看。

藏文信息处理技术的研究现状及展望

藏文信息处理技术的研究现状及展望

藏文信息处理技术的研究现状及展望引言藏文(Tibetan script)是藏语族语言的书写系统,使用于藏区地区,包括中国的西藏、青海、四川等地以及印度、尼泊尔等国家。

随着信息技术的快速发展,对藏文信息处理技术的研究也日益受到关注。

本文将探讨藏文信息处理技术的研究现状,并对未来的发展进行展望。

藏文文字特点及相关问题字符结构与排列方式藏文的文字由字母组成,具有特殊的字符结构和排列方式。

它采用垂直书写方式,并且是从左向右排列。

每个字母可分为头部、主干、尾部及下图四个部分,不同于其他文字系统,这种特殊的字符结构带来了一些处理问题。

字符数量与复杂性藏文字符数量众多,超过了其他许多语言文字系统。

藏文字母的数量超过30个,字母的排列方式和组合方式形成了丰富的词汇和句法结构。

这种复杂性增加了对藏文信息处理技术的挑战。

文字识别与分割由于藏文文字的字符结构特殊性,对于藏文文字的识别和分割是一项重要的任务。

很多研究者致力于开发基于机器学习的藏文文字识别系统,以提高自动处理藏文文本的效率和准确性。

藏文信息处理技术的研究现状藏文文字识别技术藏文文字识别技术是近年来研究热点之一。

研究者通过设计和使用神经网络、深度学习、图像处理等方法和算法,尝试将藏文文本从图像中自动提取出来。

这项技术对于藏文信息的电子化、搜索引擎优化等方面具有重要意义。

自然语言处理技术在藏文信息处理中的应用自然语言处理(Natural Language Processing,NLP)技术在藏文信息处理中具有重要的应用价值。

NLP技术可以用于藏文文本的分词、词性标注、句法分析等方面,提高对藏文文本的理解和处理能力。

研究者通过开发和应用NLP算法,试图解决藏文信息处理中的一些问题。

机器翻译技术的发展机器翻译技术用于将一种语言的文本自动转化为另一种语言的文本。

在藏文信息处理中,机器翻译技术被广泛应用于将藏文文本翻译成其他语言的文本,以方便不懂藏文的用户进行阅读和理解。

藏文联想输入法设计

藏文联想输入法设计

藏文联想输入法设计藏文输入法是藏文信息处理技术的一项基础工作,藏文输入法包括藏文单字输入法和词语联想输入法。

文章在讨论藏文输入法实现方法的基础上,设计了藏文联想输入法中的生成树模块、检索模块和联想模块。

标签:藏文信息处理联想输入法生成树一、引言藏文是属于拼写文字,具有纵向和横向组合的特点,一个完整的藏文字由七个部件组成,按书写顺序依次是前加字、上加字、基字、下加字、元音、后加字、又后加字。

藏文输入法就是根据用户的输入查找出相应的藏文字供用户选择,它分为两部分,一是运用分析、综合的方法将藏文字排序,也就是字库和码表的生成;二是运用一定的方法将需要的藏文字从字库中取出来,也就是检索,其难点在于检索算法的构造。

目前已经开发出来的藏文输入法有方正、华光、桑布扎、班智达等,这些输入法不具有联想功能,从而影响了藏文字输入的速度。

本文在讨论藏文输入法实现方法的基础上,设计了藏文联想输入法中的生成树模块、检索模块和联想模块。

二、藏文输入法的实现方法构造藏文外码到内码的转换通常有两种方法,一是采用数组,二是采用有序树。

1.数组方法藏文有30个辅音,将第一个字母相同的藏文字定义为一个数组,共有30个数组,分别用unsigned char zw-a[]、unsigned char zw-b[]、……、unsigned char zw-z[]表示。

根据用户输入的藏文字在相关的数组中查询,得出相应的藏文字供用户选择。

采用数组的方法虽然实现简单,但该方法不易实现藏文的联想功能。

2.有序树方法静态数组不能动态释放内存,由数据结构算法可知,其检索效率不高,因此有必要将藏文单字构成一棵有序树,动态生成与释放,并且在树中的结点域中不包含藏文字,节省资源。

键树是一种特殊的查找树,其树中每个结点不是通常意义的关键字,而是组成关键字中的一个字符,从根到叶子结点的一条“路径”才对应一个关键字。

设字符集{AE,AF,AG,AH,AI,AL,AN,AO,AR,AU,BA,BD,BG,BK,BN,BR,BS},按首字母将其分解得{AE,AES,AEH,AF,AFA,AFD,AFG,AG,AH,AI,AK,AKA,AKD,AKF,AL,AN,AO,AR,AU}和{BA,BD,BG,BGS,BK,BKS,BN,BR,BS}对于关键字个数大于1的集合再按第二个字母进行分解为{{ AF,AFA,AFD,AFG},{ AK,AKA,AKD,AKF }},其它的集合也按类似的方法分解。

藏文信息处理技术的研究现状与展望

藏文信息处理技术的研究现状与展望

藏文信息处理技术的研究现状与展望xx年xx月xx日contents •引言•藏文信息处理技术研究现状•藏文信息处理技术应用研究•藏文信息处理技术发展趋势与挑战•藏文信息处理技术展望目录01引言1研究背景与意义23藏文是中华民族的重要文化遗产,具有重要的历史、文化和科学价值。

藏文信息处理技术的研究对于保护和传承藏族文化、促进民族团结和地区经济发展具有重要意义。

随着信息化和数字化技术的发展,藏文信息处理技术的研究也变得越来越重要和紧迫。

研究内容与方法基于计算机科学和人工智能理论,研究藏文字符的编码、输入、存储、处理、检索等方面的技术和算法。

研究藏文自然语言处理技术,包括分词、词性标注、句法分析、语义分析等方面的技术和算法。

研究藏文智能信息处理技术,包括文本分类、文本聚类、情感分析、智能推荐等方面的技术和算法。

研究藏文信息可视化技术和基于人机交互的智能交互技术。

藏文信息处理技术的研究已经取得了一定的进展,在字符编码、输入、存储和处理等方面已经有了比较成熟的方案和技术。

在智能信息处理方面,藏文智能信息处理技术的研究还比较薄弱,需要加强研究力度和深度。

藏文信息处理技术的研究还需要加强与民族地区文化传承和经济发展的联系,推动技术和应用的创新和发展。

在自然语言处理方面,藏文自然语言处理技术的研究还处于起步阶段,需要进一步发展和完善。

研究现状概述02藏文信息处理技术研究现状03藏文数据资源建设藏文数据资源是藏文信息技术的重要基础,包括藏文语料库、藏文词典等。

藏文信息技术基础研究01藏文字符研究藏文字符集的研究以及藏文字符库的建立,是藏文信息技术的基础。

02藏文编码研究藏文编码是藏文信息技术的另一个基础,包括藏文编码标准、藏文编码算法等。

藏文分词技术研究藏文分词是藏文自然语言处理技术的基础,包括基于规则的分词和基于统计的分词等。

藏文自然语言处理技术研究藏文词性标注技术研究藏文词性标注是藏文自然语言处理技术的另一个基础,包括基于规则的词性标注和基于统计的词性标注等。

藏文联想记忆输入法研究

藏文联想记忆输入法研究

藏文联想记忆输入法研究
马金海;贺胜;卢亚军
【期刊名称】《西北民族大学学报(自然科学版)》
【年(卷),期】2013(034)004
【摘要】文章就藏文联想记忆输入法,介绍了该输入法的联想模块和记忆模块.前者使用字词二级联想,后者使用临时记忆和永久记忆结合的方式,使得输入法能自动联想字词,并且候选列表中的字词排列顺序能够根据用户的输入习惯或风格自动进行调整,使常用字词前置,提高用户的输入效率.该输入法基于藏文编码国家暨国际标准基本集(ISO/IEC10646·1)和与之相一致的Unicode国际标准,使用央金藏文键盘布局,并在微软提供的TSF框架中进行开发,具有较广泛的应用前景.
【总页数】5页(P52-56)
【作者】马金海;贺胜;卢亚军
【作者单位】南京师范大学文学院,江苏南京210097;南京师范大学文学院,江苏南京210097;西北民族大学藏文机器翻译研究所,甘肃兰州730030
【正文语种】中文
【中图分类】TP391
【相关文献】
1.基于藏文编码(基本集)国家暨国际标准的藏文输入法研究 [J], 贺胜;卢亚军
2.藏文输入法研究初探 [J], 仁青诺布;春燕
3.跨Windows和Linux平台的藏文输入法研究 [J], 于洪志
4.藏文输入法中快速自适应编码查询算法研究与应用 [J], 欧珠;大罗桑郎杰;格桑多吉;仁青谱布;拉巴泽仁;次仁罗布
5.基于IMM-IME结构的藏文输入法研究 [J], 贺胜;卢亚军;王正平
因版权原因,仅展示原文概要,查看原文内容请购买。

藏文信息处理技术的研究现状与展望

藏文信息处理技术的研究现状与展望

藏文信息处理技术的研究现状与展望藏文信息处理技术是指对藏文进行处理、分析和应用的技术领域。

藏文作为一种特殊的文字系统,具有独特的语法、词汇和语义特点,因此对其进行信息处理需要特殊的技术和方法。

本文将介绍目前藏文信息处理技术的研究现状,并展望未来的发展方向。

对藏文信息处理技术的研究主要集中在以下几个方面。

首先,文字识别是藏文信息处理的基础。

由于藏文的文字形状复杂,传统的光学字符识别技术难以准确识别藏文。

因此,研究者们提出了基于深度学习的藏文文字识别方法,取得了较好的效果。

其次,机器翻译是藏文信息处理的重要应用之一。

由于藏文和其他语言之间存在较大的差异,传统的统计机器翻译模型难以达到较高的翻译质量。

因此,研究者们提出了基于神经网络的机器翻译方法,取得了较好的效果。

藏文信息处理技术还涉及到文本分类、情感分析、信息检索等方面的研究。

例如,研究者们提出了基于机器学习的藏文文本分类方法,用于对藏文文本进行分类和归类。

同时,研究者们还提出了基于情感词典和机器学习的藏文情感分析方法,用于分析藏文文本中的情感倾向。

未来,藏文信息处理技术仍有许多挑战和发展方向。

首先,如何提高藏文文字识别的准确率是一个重要的研究方向。

虽然基于深度学习的方法取得了较好的效果,但仍存在一些问题,比如在少样本和多样本情况下的表现不稳定。

因此,研究者们可以探索更加有效的特征表示和模型设计方法,提高藏文文字识别的准确率。

如何提高机器翻译的质量是另一个重要的研究方向。

目前,基于神经网络的机器翻译方法已取得了较好的效果,但仍存在一些问题,比如对稀缺词汇和长句的处理能力有限。

因此,研究者们可以探索更加高效和准确的机器翻译方法,提高机器翻译的质量。

如何提高藏文信息处理技术在实际应用中的效果也是一个重要的研究方向。

目前,藏文信息处理技术主要应用于文本分类、情感分析、信息检索等方面,但实际效果仍有待提高。

因此,研究者们可以探索更加有效和实用的方法,提高藏文信息处理技术在实际应用中的效果。

一种藏文自动校对方法

一种藏文自动校对方法

一种藏文自动校对方法引言:随着信息技术的发展,自然语言处理技术也日益成熟。

在藏文自动校对方面,研究者们提出了一种有效的方法,能够自动检测和修正藏文中的错误,提高文本的质量和可读性。

本文将介绍这种藏文自动校对方法的原理和实施步骤。

一、原理:藏文自动校对方法基于统计和规则模型。

首先,通过语料库收集大量的正确和错误的藏文文本,建立统计模型来分析错误出现的规律。

然后,根据规则模型对错误进行判断和修正。

最后,根据修正结果,对文本进行评估和反馈,不断优化模型。

二、实施步骤:1. 数据收集与预处理:从互联网、藏文书籍等渠道收集大量的藏文文本,并进行预处理,包括分词、标注词性等,以便后续的统计和规则分析。

2. 统计模型构建:基于预处理后的数据,建立统计模型,分析错误出现的频率和上下文关系。

通过统计方法,找出常见的错误类型和其出现的规律,为后续的规则模型提供依据。

3. 规则模型设计:根据统计模型的结果,设计规则模型,制定一系列的规则来判断文本中的错误并进行修正。

常见的错误类型包括错别字、语法错误等。

规则模型可以使用正则表达式、有限状态机等方法来实现。

4. 错误检测与修正:根据规则模型,对文本进行错误检测和修正。

首先,对文本进行分词和词性标注,然后根据规则模型逐句判断错误,并进行修正。

修正可以是替换、删除或插入等操作。

5. 评估与反馈:根据修正后的文本,进行评估,统计校对的准确率和效果。

根据评估结果,不断优化统计和规则模型,提高校对的精度和效率。

三、优点与应用:藏文自动校对方法具有以下优点:1. 高效快速:通过自动化的方式,可以快速检测和修正大量的文本,提高工作效率。

2. 准确可靠:基于统计和规则模型,校对结果准确可靠,大大降低了人工校对的错误率。

3. 可扩展性强:方法可以根据需求进行优化和扩展,适用于不同领域的藏文文本校对。

藏文自动校对方法的应用也非常广泛:1. 媒体出版:对报纸、杂志、图书等藏文出版物进行自动校对,提高印刷质量和阅读体验。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第34卷总第92期西北民族大学学报(自然科学版)Vol.34,No.4 2013年12月Journal of Northwest University for Nationalities(Natural Science)Dec,2013藏文联想记忆输入法研究马金海1,贺胜1,卢亚军2(1.南京师范大学文学院,江苏南京210097;2.西北民族大学藏文机器翻译研究所,甘肃兰州730030)櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗櫗[摘要]文章就藏文联想记忆输入法,介绍了该输入法的联想模块和记忆模块.前者使用字词二级联想,后者使用临时记忆和永久记忆结合的方式,使得输入法能自动联想字词,并且候选列表中的字词排列顺序能够根据用户的输入习惯或风格自动进行调整,使常用字词前置,提高用户的输入效率.该输入法基于藏文编码国家暨国际标准基本集(ISO/IEC10646·1)和与之相一致的Unicode国际标准,使用央金藏文键盘布局,并在微软提供的TSF框架中进行开发,具有较广泛的应用前景.[关键词]藏文输入法;联想记忆;TSF;键盘布局[中图分类号]TP391[文献标识码]A[文章编号]1009-2102(2013)04-0052-050引言藏文是国内外使用人数较多的少数民族文字之一.利用先进的计算机技术和语言学理论的新成就及研究方法,是促进藏文信息化建设的重要途径.而藏文的计算机录入、排版是藏文信息化的基础工作,能否高效地输入藏文直接影响着藏文信息化的进程[1].藏文属于表音文字,但不像一般的拼音文字是一维的线性书写文字,而是由前加字、上加字、基字、下加字、后加字、又后加字以及4个元音等组成的二维书写文字,字形上有不同于一般拼音文字的语法、时态信息.因此,在输入法的设计上既要顾及其表音文字的性质,输入时符合藏语使用者的拼读习惯,又要顾及其二维的字形结构,而不宜与其他拼音文字一样单纯地按线性顺序输入.藏文文本中音节与音节之间以隔字符为界(相当于汉文文本中字与字之间的间隙).据卢亚军等(2003年)对约4千万个音节(70MB)的大型语料库的统计分析发现,隔字符的使用频率在所有字符中占到30%左右[2].如果不断地单独输入如此高频率但又缺乏语义功能的形式字符,不仅容易造成输入错误(如遗漏隔字符),而且还会使实际输入效率大大降低.卢亚军等的统计还发现:70MB语料库共5201个标准音节中的前1333个音节累计频率为95%.而另据王维兰等(2004)的统计显示,两千万字的语料库中共5334个标准音节,其中,覆盖文本音节90%的音节只有703个,覆盖文本音节95%的音节有1140个[3].这些统计数据说明藏文的单音节的构词能力非常强,因此单音节之间的同现(即由“二次构词”形成的词组)现象很普遍.若能实现词组级的输入,则既可以实现多个相关联音节字的快速输入,又可以在备选词组中自动嵌入隔字符,减少了输入隔字符的工作量,从而大大提高输入效率.由于字和词的联想输入可以成倍提高输入效率,尤其在大批量文本的输入过程中效果更为明显,所以藏文信息化研究者非常重视这一内容.另外,迄今为止,尚未实现“记忆”或“自学习”功能的藏文输入法,相比汉语来说还比较滞后.基于这两点考虑,本文提出了一种具有联想、记忆功能的藏文输入法.#[收稿日期]2013-11-08[基金项目]国家科技支撑计划项目子课题“汉藏机器翻译子系统开发”(2012BAH14F03-4).[作者简介]马金海(1986—),男,硕士研究生,从事自然语言处理方面的研究.1国内外研究现状目前,国内外的藏文输入法主要有桑布扎、同元、班智达、央金、藏大岗杰、琼迈、不丹宗喀、喜马拉雅等输入法.由于历史和现实条件限制,这些藏文输入法中只有班智达、藏大岗杰输入法实现了简单的词组联想功能.但是这两种输入法都不支持Unicode字符集,从而不能输入完全的现代藏文,有“缺字”现象,而且难以在Internet上进行交互.另外,它们都是以基字为中心进行联想的,输入编码串中第一个字母都被默认为是基字,这并不完全符合藏文的拼读或书写顺序规则.目前,支持Unicode字符集又具有联想功能的藏文输入法是央金藏文输入法,但它仅实现了字符级的联想,尚未实现词组级联想[4,5].另外,由于用户语言习惯或所从事的领域不同,常使用的字词也必然各自迥异.以上各输入法中所使用的都是基于静态统计的字表或词表,即同一输入串所形成的候选字词顺序总是固定不变的,不能根据个人输入风格或习惯进行实时动态的调整,这也就成为了提升输入效率的掣肘.因此,藏文输入法也必须要实现记忆功能.2藏文字词联想输入藏文联想输入的重点和难点在于两级联想:第一级为音节内联想,即由一个或几个字母联想到一个藏文整字;另一级为音节间联想,即在第一级联想的基础上,由一个藏文整字,联想到一个藏文词组.相同的一个输入编码串,有可能组合成字,也有可能组合成词,输入法中应该优先进行字级联想还是词级联想,这涉及到输入法对输入编码串自动切分的方式.2.1相关假设为此,本文提出了三点假设:1)如果输入码串中字母个数较少(如小于3个),则认为用户更倾向于输入字,而不是词组,即优先将该输入码串作为整体进行音节内联想,尽量不做自动切分.2)如果用户连续输入多个(如大于7个)字母,而中间不加任何的隔字符,则认为用户更倾向于输入一个词组,而不是输入多个频次都很高的独立的字.3)用户对藏文音节字的计算机输入顺序是按藏文的书写顺序进行的,即:前加字→上加字→基字→下加字→元音→后加字→又后加字.假设1)可以使输入过程中个数较少的输入字母编码集中于音节字级联想,而免去不必要的词组级联想.假设2)增加了长输入编码串中各字母之间的关联,更符合用户的输入心理,并因此,统一对输入编码串使用最大匹配法进行自动切分.假设3)保证了输入顺序与书写顺序的统一,符合藏文用户习惯,减少了纯粹将第一输入字母作为基字的输入法给用户带来的不便.2.2字词库2.2.1编码本输入法所使用的是藏文的Unicode编码字符集,与汉字的一字一码不同的是,字词表中所存储的各藏文音节字是由各字母编码叠加而成的,所以其编码是不定长的.考虑到隔字符的频繁出现,本输入法的字词表中在各字词的后面都统一加上了隔字符,如:藏文音节字蚢砱烞的编码是:0F40(畟)+0FB1(纚)+0F72(祑)+0F66(砱)+0F0B(烞);藏文词组竘眐烞眐砱烞的编码是:竘眐的编码+0F0B(烞)+眐砱的编码+0F0B(烞).2.2.2存储为了提升藏文音节字和词组在字表和词表中的查找速度,本输入法特别将字库和词库分别用索引表+顺序表的结构进行存储.而且在各索引块中,各元素都是按频次由大到小存放的,从而不必再进行排序操作.2.3核心实现1)生成候选字列表:采用最大匹配法,在字表中查找与输入编码串匹配2的音节字;查找成功后,输出候选字数组,若此时已经达到输入编码串末尾,则返回;否则,进行词表查找.2)生成候选词列表:根据已生成的候选字和尚未匹配成功的输入编码串在词表中查找相应的词,若完全匹配成功,则输出候选词组;否则,对尚未匹配成功的输入编码串重新按最大匹配法进行切分、查找.3)处理数字击键事件:若在生成候选字组或词组后捕捉到数字击键事件时输入编码串尚未完全匹配,则将输入编码框中已匹配的编码串替换成数字所选的候选字词,剩下的编码串继续按1)、2)进行.若在输入编码串中已经完全匹配成功后捕捉到数字击键事件,则将相匹配的候选字词上屏显示.4)处理其他击键事件:若捕捉到的不是数字或其他规定的有效击键事件,则将1)、2)步骤中候选列表的第一项上屏显示.3记忆模块设置记忆模块的目的是通过部分记录用户的输入历史来重新调整候选列表中各字词的排列顺序,将用户常用的字词放在候选列表的前面,以尽量适应用户的使用习惯.如果有输入编码串所对应确定的上屏字串未在原字表或词表中出现,则增加该字串.3.1数据结构本输入法使用临时记忆词表来存储当前应用程序中输入的字词,该词表用记忆编码结构数组MEMORY来存储,其声明如下:struct MEMPW{LPTSTRszPW;//输入编码所对应字或词组DWORD dwFreq;//特定应用程序中输入时被选中的频次};struct MEMORY{TCHARalpTab[14];//有效输入编码struct MEMPW Pw[9];//一个输入编码可能对应多个TCHARchAttrib;//其他属性};该结构中,同一有效编码串对应的字词Pw只记录有9个,原因是目前设计的候选列表框中每页的字词一般在9个左右,若超过该数目,则需要进行翻页,便也失去了记忆模块的必要性.3.2算法流程1)传入参数后,用有效输入编码数组compAlp与各记忆编码结构MEMORY中的alpTab字段进行匹配,若匹配成功,则将Pw数组中的字词根据所记录的当前频次放在候选列表前面,然后将由联想模块所确定的候选字词(去掉与记忆模块中重复的字词)追加在其后.若不能匹配成功,则按联想模块进行,然后将输入编码串和上屏字词信息存入记忆词表中.2)匹配成功的情况下,若上屏字词是临时记忆词表中的字词,则将该字或词频次加1;否则,若上屏字词不是记忆模块中的字词,则将该字词存入相应的Pw中,设置频次为1;若数组Pw中已有9个元素,则用该上屏字词将频次最低的一个元素覆盖.3)当关闭输入法时,将临时记忆词表中的字词写入字表或词表中,并且在原频次的基础上加上本次输入中的相应频次.由此可见,临时记忆词表中的频次可以使对应字词“一步到位”地适应用户当前输入,而将本次输入的字词的频次加到原来的字词表中,实现永久记忆,则可以使字词的频次更能体现用户长期输入的习惯.4输入法的实现本输入法使用了央金藏文输入法的键盘布局设计[7],该键盘布局是第一个利用德沃拉克英文键盘布局理论、基于藏文字符音节词汇等频度统计数据的藏文键盘布局,非常合理科学.例如,其根据藏文音节中各构件之间的配置概率将高频部件布置在了左右两侧,以实现左右手交替击键.另外,该键盘布局将隔字符设置在空格键上,可以使大多都会使用汉语输入法的藏文用户沿用汉语输入法中以空格键作为选择首选项上屏的习惯,并且正好呼应藏文音节字后添加隔字符的输入,而不必特意地再费时来熟悉使用其他键消息作为确定上屏的依据.本输入法使用的编程框架是微软公司提供的TSF(Text Service Framework)输入法框架,它基于COM组件,用于高级文本输入和自然语言处理,是一个设备无关、语言中立、可扩展的系统,提供了一个位于应用程序和输入法实现的间接层[8].应用程序可以从text service(Text service可以是键盘输入、手写识别或语音识别)接受文字输入,而不用考虑文本源的具体细节.对于本输入法,需要程序员自己编写的最重要的在Composition、CandidateList、KeyHandler等几个部分.另外,本输入法也可以利用央金藏文输入法已实现的造字功能新增一些未登录的字或词,即通过OPENTYPE字处理技术实现部件动态叠加的功能,解决藏文的“缺字”问题[9].5结语由于藏文信息化的相对滞后,基础建设上如语义、语法数据库等资源比较匮乏,所以本输入法仅基于字词频统计数据来作为候选列表中排序的依据,而未考虑字词的其他属性,如语义和语法功能等.像汉字输入法一样,随着藏文信息化的发展,未来的藏文输入也要实现云计算、在线词库同步、藏中英三语混合输入、表情输入、皮肤编辑等功能,满足用户多样的需求.另外,还可以充分利用TSF框架,在该输入法的基础上扩展实现手写识别和语音识别输入,进而实现翻译输入等其他文本服务功能.参考文献:[1]江荻,龙从军.藏文字符研究:字母、读音、编码、字频、排序、图形、拉丁字母转写规则研究[M].北京:社会科学文献出版社,2010.[2]卢亚军,马少平,张敏,罗广.基于大型藏文语料库的藏文字符、部件音节、词汇频度与通用度统计及其应用研究[J].西北民族大学学报(自然科学版),2003,24(2):32-42.[3]王维兰.现代藏文语言单位频率和频级关系的统计分析[J].科学技术与工程,2004,4(5):413-417.[4]贺胜,卢亚军,王正平.基于IMM-IME的藏文输入法研究[J].西北民族大学学报(自然科学版),2008,29(3):29-32.[5]贺胜,卢亚军.基于藏文编码(基本集)国家暨国际标准的藏文输入法研究[J].图书与情报,2007,6:45-49.[6]http://www.unicode.org/charts/PDF/U0F00.pdf.[7]卢亚军.藏文计算机通用键盘布局与输入法研究[J].中文信息学报,2006,20(2):78-86.[8]http://msdn.microsoft.com/en-us/library/ms629032(v=vs.85).aspx.[9]唐英敏.基于OpenType的藏文文字处理方法[A].第十届全国少数民族语言文字信息处理学术研讨会论文集[C].2005,243-248.Study on Tibetan Input Method withFunctions of Association and MemoryMA Jin-hai1,HE Sheng1,LU Ya-jun2(1.Department of Literature of Nanjing Normal University,Nanjing210097,China;2.Institute of Tibetan Machine Transla-tion,Northwest university For Nationalities,Lanzhou730030,China)[Abstract]The article proposes a Tibetan input method with functions of association and memory,and pres-ents an association algorithm and a memory algorithm thereof,in which the former adopts double-stage associ-ation,i.e.alphabet-to-word and word-to-phase association,and the latter uses ways of temporary andpermanent memory.By these,the input method can convert an input composition string into any possible relat-ed Tibetan words or phrases.Besides,words or phrases in the candidate list can be adjusted dynamically ac-cording to the inputting habit of a specific user in such a manner that the frequently-used terms are displayed in order of descending frequency at the beginning of the list,whereby improving the input efficiency.[Key words]Tibetan;input method;association;memory;TSF;Tibetan keyboard layout(上接第24页)[9]Deng,S.B.,Bai,R.B.,Hu,X.M.,&Luo,Q.Characteristics of a bioflocculant produced by Bacillus mucilaginosus and its use in starch wastewater treatment[J].Applied Microbiology and Biotechnology,2003,60,588-593.[10]邱忠平,茆灿泉,刘源月等.微生物絮凝剂生产菌的筛选及其絮凝特性[J].环境工程学报,2009,3(7):1185-1188.[11]you y,ren n q,wang a j,et e of waste fermenting liquor to produce bioflocculants with isolated strains[J].International Journal of Hydrogen Energy,2008,33(13):3295-3301.[12]刘军,刘彬彬.微生物絮凝剂的最新研究进展[J].广州化工,2009,37(9):39-42.[13]曾玉彬,黄锋,刘世海等.微生物絮凝剂的研究现状与发展趋势[J].江苏环境科技,2007,20(2):114-117.[14]刘洋,王浩绮,胡永红.微生物絮凝剂研究进展[J].金陵科技学院学报,2006,22(2):75-79.[15]容锵桃,张鸿郭,周少奇.微生物絮凝剂研究进展[J].环保技术,2005,(4):43-46.Screening of Flocculants-producing Strains andOptimization of Culture Conditions in Potato WastewaterYE Yong-li,YU Mei-ling,CHEN Shi-en(College of Life Science and Engineering of Northwest for Nationalities,Lanzhou730030,China)[Abstract]In order to screen out the strains for producing flocculants in potato wastewater,the bacterium,mould and saccharomycetes were screened by using the beef extract peptone medium,potato extract glucose medium and malt extract medium from the potato wastwater.Through preliminary screening and secondary screening,19strains were found with flocculating activity from soil and activated sludge.The flocculating rate from the strain N-3and N-4on kaolin suspension was the highest.The flocculating activity of N-3strains was higher than(90.23%)than that of N-4strains(77.60%).After the culture conditions of N-3strain was optimized,the flocculation efficiency reached93.71%under the condition of initial pH4.5 7.0,30ħ,rotation speed of150r/min and culture time of2days.[Key words]Microbial flocculant;Screen;Culture condition;Flocculating rate。

相关文档
最新文档