中文信息处理技术原理与应用(7)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


中文编辑排版 关于排版用的精密字模 关于字模数目 关于字体数目
8
中文电子印刷排版系统设备的构成
9



其中数据采集汉字终端、汉字造字终端、图文扫描仪 组成系统的输入设备。 系统的前处理部分输出的结果是经编排好的版面信息, 已有版面格式,但其中的文字是以代码形式提供的, 尚须转换成达到出版印刷质量的汉字字模,包括按指 定要求的字号尺寸规格。这项工作由照排控制机完成。 照排控制机和照排输出设备等构成系统的后处理部分。 照排控制机除了把输出版面信息中的汉字代码转换成 精密汉字字模信息(包括字体、字号尺寸等的变化) 外,尚须要控制照排机输出具有完整信息的版面。用 作系统输出设备的照排机目前普遍使用激光扫描照排 机。型
在2004年4月举行的第一届中文信息处理发展国 际研讨会上, 倪光南院士对中文信息处理的发展进行 了总结,认为中文信息处理的发展走了一个马鞍型。 从20世纪70年代至90年代中期算一个高潮期,90年代 中期进入低潮。自90年代未起,中文信息处理由冷转 热,再度活跃。
10
精密汉字字模和照排控制技术

文字印刷排版系统的主要功能特点是把 文字,各种符号、图形、照片、表格等 在版面上作精确定位。因此,一个排版 系统,先要定出版面精度指标。同时也 要求汉字字模具有相当于版面定位精度 的高质量。也就是要求有高的分辨率等 级。通常精密印刷要求分辨率达到25~ 100线/毫米。具有这种分辨率等级的汉 字字模称为精密汉字字模。
11
一.精密型汉字字模信息压缩技术
精密汉字字模信息的压缩方法,目前应 用较普遍的有: 黑白段长度编码方法 字模笔画轮廓描述方法(也称为矢量描述 方法 ) 精密型汉字字模库


12
黑白段编码方法
汉字字模有规则笔画和不规则笔画
13
二. 字模信息还原和照排控制
在输出版面信息供制版印刷时,必须把字模压缩信息还 原成实际点阵字模,包括按要求形成不同字体,不同字 号尺寸等文字变倍的功能;此外,还要对照排输出设备 实现控制。这两项工作由照排控制器完成。 照排控制器的功能,可以用硬设备实现,也可以用软件 方法实现。 可以用高性能的通用微型机作为控制器的主处理机,以 增强设备的通用性。 照排控制器除了实现上述功能外,尚应具备其它方面的 功能。如提供大容量的缓冲存储,以匹配系统前后处理 部分的工作速度。提供字模变形、旋转、倾斜、镜象排 印、阴阳图变换、打阴影、打斜线、网格,提供灰度等 级、基本图形、曲线等丰富的功能。
中文信息处理技术原理与应用 (七)
北京信息工程学院计算机系 李宝安
1
第七章 中文信息处理技术的应用
中文应用系统发展概况 中文电子印刷排版系统 中文信息检索系统 基于Internet的搜索引擎 中文办公自动化系统

2
中文应用系统发展概况

对我国中文信息处理技术一些经历 的回顾
我国的文字信息处理研发工作开始于一 九七四年。当时国家有一专项工程,代号为七 四八工程(汉字信息处理系统工程),最初拟 定的研发目标有三项。一、精密型中文编辑排 版系统;二、中文信息检索系统;三、中文信 息远距通信系统。
第一个高潮期
中文信息处理的第一个高潮期的核心问题是字的 处理。在这一时期造就了联想、方正、四通等一批靠 中文处理产品起家的企业。
4

中文信息处理的低谷期
90年代中期,电脑由DOS升级到Windows 平台。微软公司自Windows 3.2全面采用当时最 先进的中文信息处理技术,传统的中文信息处 理产品失去了市场。这一时期可以认为是中文 信息处理的低谷,原先做中文信息处理的公司 纷纷转向。

14
激光照排机

激光照排机是照排系统的版面输出设备。它的工作原 理并不复杂,但对光学和机械动作的精度要求却很高。 激光照排机的输出分辨率一般在25~50线/毫米 (635~1270线/吋),高的可达100线/毫米。激光 照排机的工作原理是用一定直径的激光束(若输出分 辨率为40线/毫米,则光束直径为25微米),用声光 调制方法经字模信息的调制后,使光束在感光底片上 感光,于是版面信息便记录到感光底片上。经显影、 定形后,成为制作印刷版用的底版。除了分辨率指标 外,还有输出速度。目前一种连续输出性能的照排机, 输出速度在100~500毫米/分钟。输出样张的幅面, 具有A4,A3,A2几种规格,其中A4,A3是用于书版的, A2用于报版。

中文信息遭遇互联网 -- 推动中文信息处 理进入了第二次高潮
90年代末,互联网忽地热闹起来。无线互 联网,手机、PDA等促进中文信息技术的发展。
5



互联网时代对中文信息处理产生了新需 求 完成从字到语义的跨越 中文检索获普遍关注 机器翻译大发展 识别技术领先国际 语音合成走出实验室
17
三、排版应用软件
在排版应用方面,国内已积累了不少成果。如 能够编排各种文科书版、刊物,各种科技书版, 复杂的数学公式和各种化学分子式、符号也能 自动编排。还能整版地编排各种大、小幅面的 报版。 将多窗口显示技术用于排版处理;开发以图形 处理为特点的排版技术;吸收目前国内外流行 的组版软件包的功能;增加鼠标器定位,用菜 单选择方式指定排版要求的功能;开发、改善 对用户的友好界面,尽可能地方便用户使用。
15
排版软件的功能
一、排版的主要功能 排版的主要功能是使文字、符号、表格、 公式、图形、照片等内容在版面上精确 定位。为此,排版软件设计时要对版面 分割成基本尺寸,以输出分辨率的倒数 来表示这一基本尺寸。也即文字、图形 等能以这一基本尺寸在版面上作上下、 左右调整位置,以达到精密编排的目的。
16
二、批处理和交互式排版 早期的排版软件,是以批处理方式执行的。也 就是用编译方式得出目标程序。至少要在一组 排版命令输入后才能执行和得出结果。近几年 来发展的是一种交互式操作的排版方式,也就 是解释执行的排版方式。计算机可以对每一条 排版命令产生即时和正确的反应。需要解决反 馈显示中的一些技术问题,可以实现全交互式 的排版操作,也即国内目前流行的“即打即排” 操作,将成为另一种流行的排版方式。
6
中文电子印刷排版系统

在文字信息处理技术的基础上,要 求达到高精度地编排出符合印刷出版要 求的版面质量的计算机系统,称为电子 印刷排版系统。它和一般文字处理技术 的主要差别在于编排精度,文字质量, 和要求编排出各种版面(书、报、刊物; 文科和科技版,广告等)的格式。
7
中文电子印刷排版系统技术简介
相关文档
最新文档