数字媒体及应用

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

、文本概述

文字:一种书面语言,由一系列称为“字符”()的书写符号构成。

文本:文字信息在计算机中的表示形式,是基于特定字符集的、具有上下文相关性的一个(二进制编码)字符流,

是计算机中最常用的一种数字媒体。组成文本的基本元素是字符,字符在计算机中采用二进制编码表示。

、文本处理

文本在计算机中的处理过程:文本的准备(如汉字的输入)、文本编辑、文本处理、文本存储与传输、文本展

现等,根据应用的不同,各个处理环节的内容和要求可能有很大的差别。

文本的表示与字符的编码

、文本的表示

文本是计算机表示文字及符号信息的最常用也是最基本的一种数字媒体。由于文字和符号采用了二进制编码表

示,因而可以方便地进行编辑、排版和各种分析处理(如统计、排序、分类、索引、检索等)。

、西文字符集编码

字符集:常用字符的集合。

西文字符集:由拉丁字母、数字、标点符号及一些特殊符号组成。

字符的编码:字符集中每一个字符各有一个代码,即字符的二进制表示,称为该字符的编码。

()标准编码字符集。

美国标准信息交换码( ):使用个二进位对字符进行编码(叫做标准码),称为标准。基本的字符集共有

个字符,其中包括个可打印字符(常用字母、数字、标点符号等),个控制字符。

常用的特殊字符的码:空格()、()、()、…、()、()、()、…、()、数字()、()、…、()。

其编码规则为:用位二进制数对每一个字符进行编码(字符的码),在计算机内部则用字符的码存储和表示该字

符。在计算机中的存储方法是:用一个字节(位)来存储一个字符的码。每个字节中多出来的最高位一般保持为“”。

()扩充编码字符集。

标准字符集只有个不同的字符,在很多应用中无法满足要求。按照标准(《七位字符集的代码扩充技术》)的规定,陆续制定了一批适用于不同地区的扩充字符集,每个扩充字符集分别可以扩充个字符,这些扩充字符的编码均是

高位为“”的位代码(十进制数~),称为扩展码。

、汉字编码字集

()汉字编码字符集。

《信息交换用汉字编码字符集·基本集》(),其组成部分包括:

第一部分:字母、数字和各种符号,包括拉丁字母、俄文、日文平假名与片假名、希腊字母、汉语拼音等共个(统

称为图形符号)。

第二部分:一级常用汉字,共个,按汉语拼音排列。

第三部分:二级常用字,共个,按偏旁部首排列。

①区位码:国标字符集构成一个二维平面,它分成行、列,行号称为区号,列号称为位号。每一个汉字或符号

在码表中都有各自的位置,字符的位置用它所在的区号(行号)及位号(列号)来表示。每个汉字的区号和位号分别

用个字节来表示。如:“大”字的区号,位号,区位码是,用个字节表示为: (即十六进制)。

②国标交换码:将字符集中每个汉字的区号和位号必须分别加上(即二进制,十六进制),就可以得到该

汉字的“国标交换码”(简称交换码)。因此,“大”字的国标交换码是:(即十六进制)。

③机内码:把一个汉字看作两个扩展码,使表示汉字的两个字节的最高位()都等于“”。这种高位为的双字节(位)汉字编码就称为汉字的“机内码”,又称内码。即将汉字的区号和位号必须分别加上(即二进制,十六进制),就可以得到该汉字的“机内码”。如:“大”字的机内码是:(即十六进制)。

综上所述,可以总结如下公式:国标码区位码,机内码区位码。

()汉字编码字符集。

只有个汉字,使用时功能不够。年发布,全称为《汉字内码扩展规范》字符集中一共有个汉字和个图形

符号,它与国标汉字字符集及其内码保持兼容。它除了包含中的全部汉字和符号,还包括繁体字和中、日、韩文字中的大量汉字。

的编码是用字节编码表示,第字节的最高位必为“”,第字节的最高位不一定是“”。与保持兼容。

()与汉字编码标准。

①通用编码字符集。全世界约有种语言和文字在使用,需要建立一个多文种文字处理环境。在基础上,使用

代码页号切换不同字符集的方法过于繁琐,且与其他系统不兼容。实现了所有字符在同一字符集中统一编码。用个字

节对全世界现代书面文字所使用的所有字符、符号进行编码(记作)。

其优点是编码空间极大,能容纳足够多的各种字符集(亿字符);缺点是字节的字符编码使存储空间浪费严重。

②编码。汉字编码标准是为了既兼容和,又尽快向编码标准过渡,而在年颁布的汉字编码国家标准。该标

准在和的基础上进行扩充,增加了字节编码,能完全映射基本平面和辅助平面中的字符集,收录的汉字达到个。

例:(单选)在编码中,字母的编码为,那么字母的编码为( )。

....

参考答案:

分析:此题是考查学生对于编码表的掌握情况,由题目中所给的字母的编码为这个已知条件,可以推导出的编码

为,再考虑编码表中字母的顺序是连续的,所以可以得出的编码为,以此类推可得出的编码为。

例:(单选)下列汉字编码标准中,不支持繁体汉字的是( )。

. . .

参考答案:

分析:此题的重点在于考查学生对一些基本知识的记忆,作为不同的汉字编码标准,考生应该熟记每一种编码

内的汉字和字符的数目,以及其中主要包括哪些字符(简体中文、繁体中文、日文、韩文等)。

例:(判断)西文字符在计算机中通常采用码表示,每个字节存放个字符。()

参考答案:对

分析:西文字符的基本元素是英文字母、数字和符号。每个字符在计算机中采用二进位编码形式表示。目前计

相关文档
最新文档