基于蒙古文编码国家标准的OpenType字库研究与实现
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 0 1 6年 7月
内 蒙 古师 范 大 学 学报 ( 哲 学社 会 科 学版 )
J o u r n a l o f I n n e r Mo n g o l i a No r ma l Un i v e r s i t y( P h i l o s o p h y& S o c i a l S c i e n c e )
9 / 1 0 , 蒙古 文 L i n u x 和 Op e n Of f i c e . o r g ,Wi n d o ws
不 等长且 有连 接显 示 的特 征 。字符 在单词 的不 同位
置有 着不 同的显现 形式 并且存 在大 量“ 一 字多 形 , 多
Vi s t a / 7 / 8 / 1 0和 Of f i c e 2 0 0 7 / 2 0 1 0等 这些 系统 即 便 采用 了蒙 古文 编 码标 准 , 但 是 名 义 字符 到 变 形 显
0 p e n Of f i c e . o r g和 L i n u x系统 KD E桌 面 , 同时设计
了五套 传统 蒙古 文 Op e n T y p e字库 。但 因多方 面 的 客观原 因导致 未 能获 得 推 广 应用 ; 林 民等 进 行 过 蒙 古文 Op e n T y p e字 库 和 复 杂 文 本 布 局 引 擎 相 关 研 究; 斯 ・劳 格 劳 分 析 了 Un i s c r i b e对 复 杂 文本 变形 的处理 过程 。微 软公 司从 Wi n d o ws Vi s t a 开 始支 持
[ 摘 要] 国 家标 准《 G B 2 6 2 2 6 —2 0 1 0 》 的发布, 为蒙 古 文 变 形 规 则 提 供 了 统 一 的 可 实施 的标 准 。 目前 还 缺
乏 完全 符 合 该 标 准 的 蒙 古 文 变 形 引 擎 和 蒙 古 文 Op e n Ty p e字 库 。 该 文 中提 出 了基 于 上 述 标 准 的 蒙 古 文 ( ) p e n — Ty p e 字 库 变形 模 型 的 解 决 方 案 。 该模 型 的 实 现有 助 于 完善 蒙 古 文编 码 标 准和 《 国家 标 准 》 中的 一 些 关键 概 念 , 提
字 同形” 的现象 。正 因 为蒙 古 文 的 复杂 变 形 显 现特
性, 导致 在计 算机 处理 中变得 极为 复杂 。
现字符 的变形规 则和处 理并 不统 一而 导致 具体实 现
中存 在颇 多 的差 异 和区别 。
蒙古 文 编码标 准 ( 系统 ) 在 国 内外 专 家 、 学 者及
从 计算 机文本 处理 角度 而 言 , 蒙古 文属 于 复杂
一
文本 ( C o mp l e x s c r i p t s ) 语言, 蒙 古 文是 为 数不 多 的
从 上到下 竖写 、 各列 从左 到右 排列 的拼音 文字 , 字符
、
研 究现 状
蒙 古 文 编码 标 准 的具 体 实现 有 : 方 正蒙 文 书版
相 关机 构 的共 同努 力下 于 2 0 0 0年 2月 获得 了 i s o/ I E C J T C 1 /S C 2的批准 , 并且 纳入 I S 0 1 0 6 4 6体 系 中, 成 为 国际化 的蒙 古 文 编码 标 准口 Ⅲ 2 。但 是 蒙 古
“ 方 正蒙文 书版 9 ”系 列是 由北大 方正 公 司与蒙
高 蒙 古 文 编码 标 准 实现 的一 致 性 , 能很 好 地 促 进 蒙 古 文编 码 标 准 的推 广普 及 和 蒙 古文 字体 字库 的 规 范化 发 展 。 [ 关键词] 蒙 古文 ;国 家标 准 ;Op e n T y p e字库 [ 中图分类号] : H 2 1 2 [ 文献标识码] :A [ 文章编号] :1 0 0 1 — 7 6 2 3 ( 2 0 1 6 ) 0 4 — 0 0 8 6 — 0 4
ห้องสมุดไป่ตู้
中所采 取 的技术路 线 和策 略均不 同。 国家标 准 《 G B 2 6 2 2 6 —2 0 1 0信 息 技术 蒙 古 文 变 形 显 现 字 符 集 和
控制字符使用 规则 》 l l 2 ] ( 以下简称 《 国家 标 准 》 ) 从 2 0 1 1年 5月起 开始实 施 , 《 国家标 准 》 中解 决 了蒙 古 文变形 规 则不 统 一 的问 题 。 由于 以往 的 Tr u e Ty p e
字体处 理 途 径 只能 解 决 一 些 特 征 较 简 单 的 文 字 处 理, 其 文字 处理 引擎 与字体 相对 独立 。因此 , 难 以实 现较 复杂 的文 字处 理需求 。这 就需要 按 照上述 标准
J u l y . 2 O 1 6
Vo1 . 45 No . 4
第4 5 卷 第 4期
基 于 蒙 古 文编 码 国家 标 准 的 Op e n Ty p e 字库研究与实现
斯 日古 楞 ,呼 斯 勒
( 内蒙 古社 会 科 学 院 蒙 古语 言信 息技 术研 究所 ,内蒙 古 呼 和 浩 特 0 1 0 0 2 0 )
古文 编码标 准 同步推 出 的排版软 件 。它是 在没有 系
统级 实 现 条件 下 , 采 用 转 换 程序 加 T r u e T y p e字 体
方式 的应 用级实 现技 术路 线 。该 系统 中用 户能很 好
文 变形 显现 字符集 和控 制字 符使 用规则 尚无 实施 的
统 一标 准 , 为数不 多 的实 现蒙 古 文 编 码标 准 的系 统
地体 验蒙 古文 编码标 准 ( 系统) 的概 念 和特 点 ; 中科 院软 件所 与 内蒙古 蒙科 立 软 件公 司始 于 2 0 0 2年 的
两项 国家 8 6 3项 目中基 于开 源 项 目 I C U 和 QT 研 究 开 发 了 蒙 古 文 复 杂 文 本 布 局 引 擎 分 别 应 用 于
内 蒙 古师 范 大 学 学报 ( 哲 学社 会 科 学版 )
J o u r n a l o f I n n e r Mo n g o l i a No r ma l Un i v e r s i t y( P h i l o s o p h y& S o c i a l S c i e n c e )
9 / 1 0 , 蒙古 文 L i n u x 和 Op e n Of f i c e . o r g ,Wi n d o ws
不 等长且 有连 接显 示 的特 征 。字符 在单词 的不 同位
置有 着不 同的显现 形式 并且存 在大 量“ 一 字多 形 , 多
Vi s t a / 7 / 8 / 1 0和 Of f i c e 2 0 0 7 / 2 0 1 0等 这些 系统 即 便 采用 了蒙 古文 编 码标 准 , 但 是 名 义 字符 到 变 形 显
0 p e n Of f i c e . o r g和 L i n u x系统 KD E桌 面 , 同时设计
了五套 传统 蒙古 文 Op e n T y p e字库 。但 因多方 面 的 客观原 因导致 未 能获 得 推 广 应用 ; 林 民等 进 行 过 蒙 古文 Op e n T y p e字 库 和 复 杂 文 本 布 局 引 擎 相 关 研 究; 斯 ・劳 格 劳 分 析 了 Un i s c r i b e对 复 杂 文本 变形 的处理 过程 。微 软公 司从 Wi n d o ws Vi s t a 开 始支 持
[ 摘 要] 国 家标 准《 G B 2 6 2 2 6 —2 0 1 0 》 的发布, 为蒙 古 文 变 形 规 则 提 供 了 统 一 的 可 实施 的标 准 。 目前 还 缺
乏 完全 符 合 该 标 准 的 蒙 古 文 变 形 引 擎 和 蒙 古 文 Op e n Ty p e字 库 。 该 文 中提 出 了基 于 上 述 标 准 的 蒙 古 文 ( ) p e n — Ty p e 字 库 变形 模 型 的 解 决 方 案 。 该模 型 的 实 现有 助 于 完善 蒙 古 文编 码 标 准和 《 国家 标 准 》 中的 一 些 关键 概 念 , 提
字 同形” 的现象 。正 因 为蒙 古 文 的 复杂 变 形 显 现特
性, 导致 在计 算机 处理 中变得 极为 复杂 。
现字符 的变形规 则和处 理并 不统 一而 导致 具体实 现
中存 在颇 多 的差 异 和区别 。
蒙古 文 编码标 准 ( 系统 ) 在 国 内外 专 家 、 学 者及
从 计算 机文本 处理 角度 而 言 , 蒙古 文属 于 复杂
一
文本 ( C o mp l e x s c r i p t s ) 语言, 蒙 古 文是 为 数不 多 的
从 上到下 竖写 、 各列 从左 到右 排列 的拼音 文字 , 字符
、
研 究现 状
蒙 古 文 编码 标 准 的具 体 实现 有 : 方 正蒙 文 书版
相 关机 构 的共 同努 力下 于 2 0 0 0年 2月 获得 了 i s o/ I E C J T C 1 /S C 2的批准 , 并且 纳入 I S 0 1 0 6 4 6体 系 中, 成 为 国际化 的蒙 古 文 编码 标 准口 Ⅲ 2 。但 是 蒙 古
“ 方 正蒙文 书版 9 ”系 列是 由北大 方正 公 司与蒙
高 蒙 古 文 编码 标 准 实现 的一 致 性 , 能很 好 地 促 进 蒙 古 文编 码 标 准 的推 广普 及 和 蒙 古文 字体 字库 的 规 范化 发 展 。 [ 关键词] 蒙 古文 ;国 家标 准 ;Op e n T y p e字库 [ 中图分类号] : H 2 1 2 [ 文献标识码] :A [ 文章编号] :1 0 0 1 — 7 6 2 3 ( 2 0 1 6 ) 0 4 — 0 0 8 6 — 0 4
ห้องสมุดไป่ตู้
中所采 取 的技术路 线 和策 略均不 同。 国家标 准 《 G B 2 6 2 2 6 —2 0 1 0信 息 技术 蒙 古 文 变 形 显 现 字 符 集 和
控制字符使用 规则 》 l l 2 ] ( 以下简称 《 国家 标 准 》 ) 从 2 0 1 1年 5月起 开始实 施 , 《 国家标 准 》 中解 决 了蒙 古 文变形 规 则不 统 一 的问 题 。 由于 以往 的 Tr u e Ty p e
字体处 理 途 径 只能 解 决 一 些 特 征 较 简 单 的 文 字 处 理, 其 文字 处理 引擎 与字体 相对 独立 。因此 , 难 以实 现较 复杂 的文 字处 理需求 。这 就需要 按 照上述 标准
J u l y . 2 O 1 6
Vo1 . 45 No . 4
第4 5 卷 第 4期
基 于 蒙 古 文编 码 国家 标 准 的 Op e n Ty p e 字库研究与实现
斯 日古 楞 ,呼 斯 勒
( 内蒙 古社 会 科 学 院 蒙 古语 言信 息技 术研 究所 ,内蒙 古 呼 和 浩 特 0 1 0 0 2 0 )
古文 编码标 准 同步推 出 的排版软 件 。它是 在没有 系
统级 实 现 条件 下 , 采 用 转 换 程序 加 T r u e T y p e字 体
方式 的应 用级实 现技 术路 线 。该 系统 中用 户能很 好
文 变形 显现 字符集 和控 制字 符使 用规则 尚无 实施 的
统 一标 准 , 为数不 多 的实 现蒙 古 文 编 码标 准 的系 统
地体 验蒙 古文 编码标 准 ( 系统) 的概 念 和特 点 ; 中科 院软 件所 与 内蒙古 蒙科 立 软 件公 司始 于 2 0 0 2年 的
两项 国家 8 6 3项 目中基 于开 源 项 目 I C U 和 QT 研 究 开 发 了 蒙 古 文 复 杂 文 本 布 局 引 擎 分 别 应 用 于