文字及其处理技术.
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
……
4.计算机处理文字过程
以“春”字为例: 1.从键盘用拼音输入法输入外码“chun”; 2.从外码表中找出与之对应的汉字机内码; 3.按照“机内码”找到存放字型码的地址; 4.取出“字型码”在屏幕上显示出来。
键盘输入 (输入码)
编码转换 (机内码)
编辑与输出 (输出码)
宋体 全拼编码:chun 五笔字型:dw 区位码 :6625 春 用机内码 表示、存储 用汉字字型 输出汉字
资料3.中文信息处理技术发展简史(见P57-58)
历史上使用的文字处理技术,请按时间顺序排列: ①活字印刷;②机械式打字机;③手写;④雕版印刷; ⑤刻字;⑥计算机文字处理
机械式 打字机 计算机 文字处理
手写
刻字
雕版印刷
活字印刷
从古代的到现在
二、汉字的编码
汉字的输入方法目前有两大类四种:
1.键盘输入法。利用各种汉字输入方法的编码 敲 击键盘来输入汉字。 2.非键盘输入法。目前主要有三种方法:手写 笔 输入、语音输入、扫描识别输入。
课程名称:文字及其处理技术
学 年 版 单 姓 科:信息技术 级:高一 本:教育科学出版社 位:山东省五莲县第一中学 名:厉建阳
§4.1
文本信息加工
4.1.1 文字及其处理技术
一、体验文字处理技术
猜一猜:以下象形字分别是什么?
(休)
(采)
(焚)
( 甘)
(刃)
云南
纳西族
东巴文字
东巴文:现代活着的象形文字,是一种原始的图画象形文字,主要为东巴 教徒传授使用,书写东巴经文,故称东巴文。纳西话叫“思究鲁究”,意 为“木迹石迹”,见木画木,见石画石 。
资料1. 汉字起源于象形文字,至今仍然保留了象形文字的特点。 汉字的造字法有四种:象形、指事、会意、形声。
象形 从字体上看,就是本字倒过来。上部 为树头,下部为树梢,在树梢上加一 小横,就表示这里是树梢。因此,末 的最初的意义是树梢。
指事
会意
金文「明」为日月幷照之会意字。
形声
形声字的一部分是“形旁”表示字义,一部分是“声旁”表 示读音,如:“鸽”是“鸟”形“合”声,“河”是“水” 形“可”声。
1Biblioteka Baidu 用于输入汉字的编码——输入码(外码)
编码方案:区位码、拼音码、王码、自然码 编码类型: ①音 码:将汉字与读音建立对应关系进行编码的方法。 如:全拼双音、双拼双音 ②形 码:将汉字的字形按笔画或组合进行编码的方法。 如:王码、郑码、表形码 ③数字码:将汉字与数字对应的编码方法。如:区位码 简介 ④混合码:将汉字的字形和字音相结合的编码方法。如:自然码
2. 用于存储汉字的编码——机内码(内码)
汉字的机内码是供计算机系统内部、加工处理、传输而统一使用的代码。 目前使用最广泛的是一种两个字节的机内码,如国标码( GB ) 和BIG5码。
ASCII码(American Standard Code for Information Interchange,美国标准信 息交换码)国际通用标准。
资料2.书法是一种凝结了我国民族文化精髓的特殊的艺术形 式。
兰亭集序(局部) 晋·王羲之
印刷字体 宋朝 行书 南北朝 楷书 东汉 草书 西汉 隶书 秦朝 小篆 秦朝 战国文字 春秋战国 金文 西周、春秋 甲骨文 殷周时代
徐冰—方块英文
猜猜看,写得什么?
将26个字母改造成类似中国汉字的偏旁部首
Art For The People
输入码(外码)——汉字的输入 汉字的编码 机内码(内码)——汉字的存储 输出码(字型码)—汉字的输出
录制时间 :2016年5月9日
春
上机实践
⑴用东巴文输入汉字“我” “学习” “我
爱学习” (书本P58)。
⑵利用TrueType 程设计 一个新字或个性化
签名。
课堂 小结
文字的发明是为了更流畅地表述意义、传递经验
汉字起源于象形文字,饱含民族的智慧 体验文字处理技术 文字 及其 处理 技术
(重点、难点)
书法是一门凝结了我国民族文化精髓的艺术 中文信息处理技术发展简史
3. 用于输出汉字的编码——输出码(字型码)
汉字的输出码实际上是汉字的字型码,它是由汉字的字模信息组成。 最基本的是用点阵字型:将汉字分解成若干个“点”组成的点阵字型,将 此点阵字型置于网状方格上,每个方格是点阵中的一个“点” 。 例: 8 × 8 点阵,表示一个汉字,则一个汉字占 8 行,每一行 8 个点, 其中每一个点用一个二进制数表示,值“ 0 ”没有笔形,值“ 1 ”表示有 笔形。
● ● ●●●●●●● ●●●●●●● ●●●●●●● ● ● ● ……
→ 00010000 → 00010000 → 11111110 → 10010010 → 11111110 → 00010000 → 00010000 → 00010000
储存这个字型码需要8×8=64位二进制,即8个字节(1字节=8位二进制)