第五章数字媒体及应用

合集下载

第5章-数字媒体及应用

第5章-数字媒体及应用

第5章数字媒体及应用一、选择题[1].中文Word是一个功能丰富的文字处理软件,下面的叙述中错误的是___B___。

A.在文本编辑过程中,它能做到“所见即所得”B.在文本编辑过程中,操作错误不能“回退”(Undo)C.它可以编辑制作超文本D.它不但能进行编辑操作,而且能自动生成文本的“摘要”[2].下列关于计算机合成图像(计算机图形)的应用中,错误的是___C___。

A.可以用来设计电路图B.可以用来生成天气图C.计算机只能生成实际存在的具体景物的图像,不能生产虚拟景物的图像D.可以制作计算机动画[3].在未压缩情况下,图像文件大小与下列因素无关的是___A___。

A.图像内容B.水平分辨率C.垂直分辨率D.像素深度[4].图像处理软件有很多功能,以下___D___不是通用图像处理软件的基本功能。

A.图像的缩放显示B.调整图像的亮度、对比度C.在图片上制作文字,并与图像融为一体D.设计制作石油开采地形图[5].数字视频的一些特性提示我们可对其进行大幅度数据压缩,这些特性中不包含___A___。

A.数字视频的数据量大得惊人B.视频信息中各画面内部有很强的信息相关性C.一些视频细节人眼无法感知D.视频信息中相邻画面的内容有高度的连贯性[6].下列关于数字图像的叙述中正确的是___B___。

A.一幅彩色图像的数据量计算公式为:图像数据量=图像水平分辨率×图像垂直分辨率/8 B.黑白图像或灰度图像的每个取样点只有一个亮度值C.对模拟图像进行量化的过程也就是对取样点的每个分量进行D/A转换D.取样图像在计算机中用矩阵来表示,矩阵的行数称为水平分辨率,矩阵的列数称为图像的垂直分辨率[7].文字处理软件输出汉字时,首先根据汉字的机内码在字库中进行查找,找到后,即可显示(打印)汉字,在字库中找到的是该汉字的___D___。

A.外部码B.交换码C.机内码D.字形描述信息[8].数字摄像头采用的光传感器器件是___D___。

第5章 数字媒体及应用考点

第5章   数字媒体及应用考点

第 5 章数字媒体及应用★出题方向提示●西文与汉字的编码;数字文本的制作与编辑;常用文本处理软件.●数字图像的获取、表示及常用图像文件格式;数字图像的编辑、处理和应用;计算机图形的概念与应用.●数字声音获取的方法和设备;数字声音的压缩编码;语音合成和音乐合成的基本应用和原理。

●数字视频获取的方法和设备;数字视频的压缩编码;数字视频的应用。

★考核知识要点、重点、难点精解★考点: 1 西文与汉字的编码1 .西文字符的编码在计算机中用于表示字符的二进制编码称为字符编码。

目前,国际上使用最多、最普遍的字符编码是ASCII 字符编码。

ASCII 码的全称是“American Standard Code for Information Interchange " ,译为:美国国家信息交换标准字符码。

标准ASCII 码是7 位的编码,可以表示27 = 128 个不同的字符,每个字符都有其不同的ASCII 码值,它们的编码范围是B ~B ( 00H ~ 7FH )。

并且,这128 个字符共分为 3 类,分别是:( l )数字0 ~ 9 ;( 2 ) 26 个大写英文字母和26 个小写英文字母;( 3 )各种运算符号、标点符号和控制符号等。

其中,数字、大写字母、小写字母都是按照它们的自然顺序进行排列,且小写字母的ASCII 码值比其相应的大写字母的ASCII 码值大32 。

例如:大写字母D 的ASCII 码值是68 ,小写字母 d 的ASCII 码值=68 + 32 = 100 。

注意虽然标准ASCII 码是7 位的编码,但由于字节是计算机中最基本的存储和处理单位,故一般仍以一个字节来存放一个ASCII 字符.每个字节中多余出来的一位(最高位b7 ),在计算机内部通常保持为“0”,而在数据传输时和用作奇偶校验位。

扩充ASCII码是8 位,每个ASCII 码字符集分别可以扩充128 个字符,这些扩充字符的编码均为高位为 1 的8 位代码(十进制指数128 ~255 ),称为扩展ASCII码。

第5章 数字媒体及应用

第5章  数字媒体及应用

国标码: 30 21H <= 10 01H +20 20H 机内码: B0 A1H <= 30 21H +80 80H 1011 0000 1010 0001 0011 0000 0010 0001
汉字的编码(六)
(1)GB2312-80汉字编码 GB2312汉字内 码在双字节代 码空间中,其 码位分布于右
5.1.1 字符编码
西文字符的编码
• 字符集:常用字符的集合。 • 西文字符集:由拉丁字母、数字、标点符号及一些特 殊符号组成。 • 字符的编码:字符集中每一个字符各有一个代码,即 字符的二进制表示,称为该字符的编码。 • 字符代码表:字符集中不同字符的编码互相区别,构成 该字符集的代码表。
ASCII字符集和ASCII码
第2字节
0x40-0x7E,0x80-0xFE 第3字节 0x81-0xFE 第4字节 0x30-0x39
23940 158760 0
3种汉字编码的关系
GB2312-80
2个扩充的汉字字符集
00 00
FF
FF 00 00 FF
6763 汉字
GB12345-90
(3)UCS/Unicode与GB18030汉字编码标准
(a)通用编码字符集UCS/Unicode
• 约有6800种语言和文字在使用,需要建立一个多文种
(Multilingual)处理环境
• 在ISO2022基础上,使用代码页号切换不同字符集的
方法过于繁琐,且与其他系统不兼容
• 目标与途径:实现所有字符在同一字符集中统一编码
– 问 题 : 信 息通 信 中 , 汉字 的 区 位 码与 通 信 使用的 控 制码
(00H~1FH)发生冲突。
– 解 决 方 案 :为 了 避 免 汉字 区 位 码 与通 信 控 制码的 冲 突 , ISO2022 规定,每个汉字的区号和位号必须分别加上 32 (即

江苏省计算机等级考试一级历年真题(06-12)第五章数字媒体及应用附答案资料

江苏省计算机等级考试一级历年真题(06-12)第五章数字媒体及应用附答案资料

第五章数字媒体及应用一、判断题l. GBl8030汉字编码标准收录了27484个汉字,完全兼容GBK、GB2312标准。

2. GBl8030汉字编码标准中收录的汉字在GBK编码标准中也能找到。

3. GBl8030是一种既保持与GB2312、GBK兼容,又有利于向UCS/Unicode过渡的汉字编码标准。

4. GB2312国标字符集构成一个二维平面,它分为94行、94列,共有6700多个简体汉字。

5.GB2312国标字符集由三部分组成:第一部分是字母、数字和各种符号;第二部分为一级常用汉字:第三部分为二级常用汉字。

6. GB2312国标字符集中的3000多个一级常用汉字是按汉语拼音排列的。

7. GBK是我国继GB2312后发布的又一汉字编码标准,它不仅与GB2312标准保持兼容,而且还增加了包括繁体字在内的许多汉字和符号。

8. HTML文件是一种使用超文本标记语言进行描述的文本文件,因此使用Windows中的记事本也可以编辑HTML文件。

9. UCS/Unicode中的汉字编码与GB2312、GBK标准以及GBl8030标准都兼容。

10. Windows、Unix和Linux操作系统都开始支持UCS/Unicode编码。

11. Windows操作系统中的“帮助”文件(hlp文件)是一种丰富格式文本。

12.超文本中的超链可以指向文字,也可以指向图形、图像、声音或动画节点。

13. 光学字符识别,即OCR是将纸介质上的印刷体文字符号自动输入计算机并转换成编码文本的一种技术。

14. 汉字输入的编码方法大体分成四类:数字编码、字音编码、字形编殂、形音编码,但使用不同的输入编码方法向计算机输入的同一个汉字,它们的内码是相同的。

15.几乎所有支持丰富格式文本的文本处理软件都能处理RTF格式的文档。

16. 虽然标准ASCII码是7位的编码,但由于字节是计算机中最基本的处理单位,故一般仍以一个字节来存放一个ASCII字符编码,每个字节中多余出来的一位(最高位),在计算机内部通常保持为0。

第5章 数字媒体及应用 例题及答案分析

第5章 数字媒体及应用 例题及答案分析

第 5 章数字媒体及应用★典型例题及考题分析一、选择题分析【例1】英文字母“C ”的十进制ASCII 码值为67 ,则英文字母“G ”的十六进制ASCll 码值为____。

( A ) ( 0 1 1 1 1000 )2( B ) ( 01000111 ) 2( C ) ( 01011000 )2 ( D ) ( 01000011 ) 2分析:数字、大写字母、小写字母的ASCII 码值都是按照它们的自然顺序进行排列,所以" G ”的ASCII 码值为67 + 4 = 71 ,转化为二进制为01000111 。

答案:B【例 2 】对于汉字的编码,下列说法中正确的是____。

①国标码,又称汉字交换码②GB2312 汉字编码为每个字符规定了标准代码③GB2312 国际字符集由三部分组成。

第一部分是字母、数字和各种符号;第二部分为一级用汉字;第三部分为繁体字和很多生僻的汉字。

④高位均为1 的双字节(16 位)汉字编码就称为GB2312 汉字的“机内码”,又称内码。

①GBK 编码标准包含繁体字和很多生僻的汉字②GB18030 编码标准所包含的汉字数目超过3 万( A ) ①②③④⑤(B )①②④⑤( C ) ①④⑤(D )③④⑤分析:GB2312 国际字符集由三部分组成。

第一部分是字母、数字和各种符号,包括拉丁文字母、俄文、日文平假名、希腊字母、汉语拼音等共682 个(统称为GB2312 图形符号); 第二部分为一级常用汉字,共3755 个,按汉语拼音排列;第三部分为二级常用字,共3008 个,因不太常用,所以按偏旁部首排列。

GB18030 编码标准所包含的汉字数目为27000 多个。

答案:B【例 3 】文本编辑的目的是使文本正确、清晰、美观,下列____操作不属于文本处理而属于文本编辑功能。

( A ) 定义超链(B )词语错误检测( C ) 关键词提取(D )词性标注分析:文本编辑的主要功能包括:( 1 ) 对字、词、句、段落进行添加、删除、修改等操作;( 2 ) 字的处理:设置字体、字号、字的排列方向、间距、颜色、效果等;( 3 ) 段落的处理:设置行距、段间距、段缩进、对称方式等;( 4 ) 表格制作和绘图;( 5 ) 定义超链;( 6 ) 页面布局(排版):设置页边距、每页行列数、分栏、页眉、页脚、插图位置等。

第5章数字媒体及应用

第5章数字媒体及应用
ASCII字符集包含96个可打印字符和32个控制字符 采用7个二进位进行编码 计算机中使用1个字节存储1个ASCII 字符
0 X XX X XX X
存在问题:
字符集太小(只有128个字符) 不同国家和地区使用不同的字符集及其编码,互不兼容 东亚地区使用的大字符集无法编码
ASCII码的两个版本
文字信息在计算机中称为“文本”(text),文本是 计算机中最常用的一种数字媒体
文本由一系列 “字符”(character)组成,每个字 符均使用二进制编码表示
文本在计算机中的处理过程是: (3)
文本处理
文本准备
(文字与图表 的输入)
文本编辑
(文本处理软件)
与排版
电子 (文本编辑器)格式化的 文本存储
第5章 数字媒体及应用
基本概念
媒体:信息的表示和传递形式,包括数值、 文字、图像、声音和视频。
数字媒体:数值、文字、图像、声音和视 频的二进制编码。有自然数字媒体和合成 数字媒体两种类型。
5种与计算机信息处理有关的媒体
感觉媒体 如:声音,文字,图画等
表示媒体 如:声,文,图,活动图像的二进制表示
GB2312汉字的编码
每一个GB2312汉字使用16位(2个字节)表 示
为了与ASCII字符相区别,每个字节的最 高位均为“1”
1 X XX X XX X 1 X XX X XX X
第1字节
例如:
第2字节
“南”字的代码是11000100 11001111
(用十六进制表示为C4CF)
区位码
5.1.2. 文本准备
——文稿如何输入计算机
文字符号输入计算机的方法
字符信息的输入

第五章数字媒体及应用练习题带答案

第五章数字媒体及应用练习题带答案

判断题1.西文字符在计算机中通常采用ASCII码表示,每个字节存放1个字符。

T2.GIF格式的图像是一种在因特网上大量使用的数字媒体,一幅真彩色图像可以转换成质量完全相同的GIF格式的图象。

F(如GIF格式的图像的色彩过半数256色)3.DVD与VCD相比其图像和声音的质量均有了较大提高,所采用的视频压缩编码标准是MPEG-2。

F(VCD压缩编码标准是MPEG-1)3.MP3与MIDI均是常用的数字声音,用它们表示同一首钢琴乐曲时,前者的数据量比后者小得多。

F 4.彩色电视信号传输时,是把RGB三基色转换为亮度和色度信号(如YUV)后再进行传输的。

T 5.GB2312-80字符集构成一个二维平面,它分为94行、94列,共有6700多个简体汉字。

T(3755+3008=6763)6.GBK是我国继GB2312-80后发布的又一汉字编码标准,它不仅与GB2312-80标准保持兼容,而且还增加了包括繁体字在内的许多汉字和符号。

T 7.我国多数大城市已开通了数字电视服务,但目前大多数新买的电视机还不能直接支持数字电视的接收与播放。

T 8.将音乐数字化时使用的取样频率通常比将语音数字化时使用的取样频率高。

T9.声波经话筒转换后形成数字信号,再输出给声卡进行数据压缩。

F .声波经话筒10.GB18030是一种既保持与GB2312-80、GBK兼容,又有利于向UCS/Unicode过渡的汉字编码标准。

T 11.图像的大小也称为图象的分辨率(包括垂直分辨率和水平分辨率)。

若图像大小超过了被截掉而无,则屏幕上只显示出图像的一部分,其他多余部分将被截掉屏幕分辨率(或窗口),则屏幕上只显示出图像的一部分,其他多余部分将法看到。

F12.无论使用那种汉字输入法输入同一个汉字时,它们都被转换成为该汉字的机内码。

.无论使用那种汉字输入法输入同一个汉字时,它们都被转换成为该汉字的机内码。

T T 13.联机手写文字比脱机手写体文字更容易识别。

数字媒体及应用1

数字媒体及应用1
第5章 数字媒体及应用
5.1 文本与文本处理 5.2 图像与图形 5.3 数字声音及应用 5.4 数字视频及应用
计算机应用的基础
计算机应用:使用计算机进行信息处理
文字 数值
信息的形态有多种 语言
音乐 图像 ···
其中,文字信息的处理是各种计算机应用的基础
2
5.1 文本与文本处理
5.1.1 字符的编码 5.1.2 文本准备 5.1.3 文本编辑、排版与处理 5.1.4 文本的展现 5.1.5 文本的分类与表示
汉字的特点
数量大;多个国家和地区使用;字形复杂,同音字 多,异体字多
如何编码?
确定收入多少字、哪些字? 汉字在字符集中的排序方式 确定使用的代码结构和代码空间
9
常用的汉字编码字符集
国家标准GB2312 … 汉字扩充规范 GBK 国家标准GB18030 台湾地区的标准汉字字符集CNS 11643 (BIG 5,
40
数字(取样)图像的组成
数字取样图像由M(列) × N(行)个取样点组成 取样点是组成数字取样图像的基本单位,称为“像素” 彩色图像的像素通常由3个彩色分量组成 灰度图像和黑白图像的像素只包含1个亮度分量
机内码:176 161<=> B0 A1H <=> 10110000 10100001
15
GB2312汉字的编码
每一个GB2312汉字使用16位(2个字节)表示
每个字节的最高位均为“1”
在16位代码空间中的码位分布:
00 00
第 2字节
7E A1
FE
16位的代 码空间共 有216 = 65536个 码位
经过这样处理得到的代码称为汉字的“国标交换码” (简称交换码)。

第5章数字媒体及应用2(教案)

第5章数字媒体及应用2(教案)

计算机导论课程教案授课班级XX1503、XX1504 授课形式讲授页码1-5 授课日期第12周教学时数4课时授课章节第五章数字媒体及应用5.3 数字声音及其应用5.4 数字视频及应用教学目标掌握声音获取的方法与设备熟悉波形声音在计算机中的表示、标准与应用了解语音合成和音乐合成的过程与应用了解数字视频的获取方法与设备熟悉视频压缩编码的几种标准及其应用教学重点声音获取的方法与设备波形声音在计算机中的表示数字视频的获取方法与设备视频压缩编码的几种标准及其应用教学难点声音获取的方法与设备数字视频的获取方法与设备视频压缩编码的几种标准及其应用授课手段演示教学实例练习课后体会教学过程新课导入:回顾上次课的内容:提问:数字图像是如何获取的?分为哪几个步骤?请学生回答。

从而引出课题:数字声音是如何获取的呢?今天我们就来学习数字声音和数字视频及应用。

新课讲授:5.3.1 波形声音的获取与播放1.基本概念带宽:组成声音的不同谐波的频率范围称为声音的带宽。

带宽是声音的一项重要参数。

多媒体技术处理的声音信号:主要是人耳可听到的20~20kHz的音频信号(audio) 言语/语音:人说话的声音。

其频率范围约为300~3400Hz全频带声音:音乐声、风雨声、汽车声等其他声音。

其带宽可达到20~20kHz2)声音的数字化过程将模拟声音信号转换成数字编码形式,以便于计算机进行处理的过程。

主要过程为:取样、量化、编码3)声音以数字形式表示的优点:以数字形式存储的声音重放性能好,复制时没有失真数字声音的可编辑性强,易于进行效果处理数字声音能进行数据压缩,传输时抗干扰能力强数字声音容易与其他媒体相互结合(集成)数字声音为自动提取“元数据”和实现基于内容的检索创造了条件2.波形声音的获取设备1)麦克风:将声波转换为电信号2)声卡:进行数字化(话筒或线路输入)可以获取单、双声道的设备3.声音的播放(1) 声音的播放:计算机输出声音的过程,分两步:重建:把声音从数字形式转换为模拟形式将模拟信号经过处理和放大送到扬声器发声(2) 重建过程:由声卡完成音箱分类普通音箱:接收的是重建的模拟声音信号数字音箱:可直接接收声卡输出的数字声音信号,避免信号在传输中发生畸变和受到干扰,其音响效果更加突出5.3.2 波形声音的表示与压缩编码1.波形声音的主要参数数字化的波形声音是一种使用二进制表示的串行比特流。

第5章 数字媒体及应用 例题及答案分析

第5章 数字媒体及应用 例题及答案分析

第 5 章数字媒体及应用★典型例题及考题分析一、选择题分析【例1】英文字母“C ”的十进制ASCII 码值为67 ,则英文字母“G ”的十六进制ASCll 码值为____。

( A ) ( 0 1 1 1 1000 )2( B ) ( 01000111 ) 2( C ) ( 01011000 )2 ( D ) ( 01000011 ) 2分析:数字、大写字母、小写字母的ASCII 码值都是按照它们的自然顺序进行排列,所以" G ”的ASCII 码值为67 + 4 = 71 ,转化为二进制为01000111 。

答案:B【例 2 】对于汉字的编码,下列说法中正确的是____。

①国标码,又称汉字交换码②GB2312 汉字编码为每个字符规定了标准代码③GB2312 国际字符集由三部分组成。

第一部分是字母、数字和各种符号;第二部分为一级用汉字;第三部分为繁体字和很多生僻的汉字。

④高位均为1 的双字节(16 位)汉字编码就称为GB2312 汉字的“机内码”,又称内码。

①GBK 编码标准包含繁体字和很多生僻的汉字②GB18030 编码标准所包含的汉字数目超过3 万( A ) ①②③④⑤(B )①②④⑤( C ) ①④⑤(D )③④⑤分析:GB2312 国际字符集由三部分组成。

第一部分是字母、数字和各种符号,包括拉丁文字母、俄文、日文平假名、希腊字母、汉语拼音等共682 个(统称为GB2312 图形符号); 第二部分为一级常用汉字,共3755 个,按汉语拼音排列;第三部分为二级常用字,共3008 个,因不太常用,所以按偏旁部首排列。

GB18030 编码标准所包含的汉字数目为27000 多个。

答案:B【例 3 】文本编辑的目的是使文本正确、清晰、美观,下列____操作不属于文本处理而属于文本编辑功能。

( A ) 定义超链(B )词语错误检测( C ) 关键词提取(D )词性标注分析:文本编辑的主要功能包括:( 1 ) 对字、词、句、段落进行添加、删除、修改等操作;( 2 ) 字的处理:设置字体、字号、字的排列方向、间距、颜色、效果等;( 3 ) 段落的处理:设置行距、段间距、段缩进、对称方式等;( 4 ) 表格制作和绘图;( 5 ) 定义超链;( 6 ) 页面布局(排版):设置页边距、每页行列数、分栏、页眉、页脚、插图位置等。

CH5 数字媒体及应用

CH5 数字媒体及应用

目前流行的数字视频编码标准
名 称
MPEG-1 H.261
图像格 式
360×288
压缩后的码率
大约1.2 Mb/s ~1.5Mb/s
主要应用
适用于VCD、数码相机、数字摄 像机等
360×288 或 Px64 kb/s (P=1、2时, 应用于视频通信,如可视电话、 180×144 只 支 持 180×144 格 式 , 会议电视等 P≥6时,可支持360×288 格式) 5 Mb/s ~15Mb/s 80 Mb/s ~100Mb/s 用途最广, 如DVD、卫星电视直 播、数字有线电视等 高清晰度电视(HDTV)领域
5.2.4计算机图形 计算机图形
1、景物的计算机表示 建模(几何模型,过程模型或算法模型)、绘制(图像合成) 2、计算机合成图像的绘制 3、计算机合成图像的应用 (1)计算机辅助设计和辅助制造(CAD/CAM) (2)地形图、交通图、天气图、海洋图、石油开采图 (3)作战指挥,军事训练 (4)计算机动画和计算机艺术 此外,还在电子游戏、出版、数据处理、工业监控、辅助教学、 软件工程等许多方面也有着很好的应用。 4、矢量绘图软件 AutoCAD、ARCInfo、PROTEL、SuperMap GIS、CAXA CorelDraw、Illustrator、FreeHand、Microsoft Visio、 Word、PowerPoint 工业标准:OpenGL、Direct-3D
5.3数字声音及应用 数字声音及应用 5.3.1波形声音的获取与播放 波形声音的获取与播放 1、声音信号的数字化 人耳可听到频率范围:20Hz-20kHz 言语(话音、语音):300-3400Hz 全频带声音:20Hz-20kHz 声音信号(模拟)数字化:取样、量化、编码 2、波形声音的获取设备——麦克风和声卡 麦克风的作用是将声波转换为电信号,然后由声卡进行数字化。 3 3、声音的播放 两个步骤(1)重建(解码,数模转换,插值处理)(2)播放 4、声卡的主要功能: 波形声音的获取与编码 波形声音的重建与播放 MIDI消息的输入 MIDI音乐的合成 5.常见声音文件格式: .wav, .pcm, .mp3, .rm, .ra, .wma, .aif

第五章 数字媒体及应用

第五章  数字媒体及应用

第5章数字媒体及应用一、是非题5.1 文本与文本处理5.1.1 字符的编码1.美国标准信息交换码(ASCII码)中,共有128个字符,每个字符都可打印。

N2.西文字符在计算机中通常采用ASCII码表示,每个字节存放1个字符。

Y3.目前美国标准信息交换码(ASCII码)已被国际标准化组织(ISO)批准为国际标准,它也被广泛用于中文字符的编码。

N4.ASCII、GB2312、GB18030、Unicode是我国为适应汉字信息处理需要制定的一系列汉字编码标准。

N28.我国内地发布使用的汉字编码有多种,它们与台湾地区使用的BIG5编码保持兼容。

N5.GB2312国标字符集部分汉字既包含其简体又包含其繁体字。

N 31.GB2312国际字符集构成一个二维平面,它分为94行,94列,共有6700多个简体汉字。

Y7.采用GB2312、GBK和GB18030三种不同的汉字编码标准时,一些常用的汉字如"中"、"国"等,它们在计算机中的表示(内码)是相同的。

Y6.为了与ASCII字符相区别及处理汉字的方便,在计算机内,以最高位均为1的2个字节表示GB2312汉字。

Y8.在仅仅使用GB2312汉字编码标准时,中文占用两个字节,而标点符号"。

"只占用1个字节。

N9.若中文Windows环境下西文使用标准ASCII码,汉字采用GB2312编码,则十六进制内码为C4 CF 50 75 B3 F6的文本中,含有4个汉字。

N33.GBK是我国继GB2312后发布的又一汉字编码标准,它不仅与GB2312标准保持兼容,而且还增加了包括繁体字在内的许多汉字和符号。

Y32.GB18030是一种既保持与GB2312、GBK兼容,又有利于向UCS/Unicode过渡的汉字编码标准。

Y28.GB18030汉字编码标准完全兼容GBK、GB2312标准。

Y10.为了实现全球不同语言文字的统一编码,国际标准化组织(ISO)制定了一个统一的编码标准,称为GB18030。

第五章 数字媒体及应用-五江苏专什本计算机考试

第五章 数字媒体及应用-五江苏专什本计算机考试

第五章数字媒体及应用一、单项选择题1.文本编辑的目的是使文本正确、清晰、美观,下列_______操作不属于文本处理而属于文本编辑功能。

A.定义超链B.词语错误检测C.关键词提取D.词性标注【答案】A【解析】文本编辑与排版的主要功能包括: ( 1)对字、词、句、段落进行添加、删除、修改等操作; ( 2)文字的格式处理:设置字体、字号、字的排列方向、间距、颜色、效果等; ( 3)段落的格式处理:设置行距、段间距、段缩进、对齐方式等; ( 4)表格制作和绘图; ( 5)定义超链; ( 6)页面布局(排版) :设置页间距、每页行列数、分栏、页眉、页脚、插图位置等。

而文本处理强调的是使用计算机对文本中所含文字信息的形、音、义等进行分析和处理。

例如: ( 1)在字、词(短语)层面上进行的处理包括字数统计、自动分词、词性标注、词频统计、词语排序、词语错误检测、自动建立索引、汉字简/繁转换、大陆/台湾编码及术语转换等; ( 2)在句子级别上进行的处理有语法检查、文语转换(语音合成)、文种转换(机器翻译)等; ( 3)在篇章基础上进行的处理有关键词提取、文摘生成、文本分类、文本检索等。

2.下列文件类型中不属于丰富格式文本类型的是_______。

A. XLS文件B. TXT文件C. PPT文件D. HTML文件【答案】B【解析】简单文本由一连串用于表达正文内容的字符(包括汉字)的编码所组成,它几乎不包含任何其他的格式信息和结构信息。

这种文本通常称为纯文本,其文件后缀名是.txt。

经过排版处理后,纯文本中就增加了许多格式控制和结构说明信息,这样的文本称为“丰富格式为文本”。

3.汉字的键盘输入编码方案有几百种之多,基于汉语拼音的编码方法,简单易学,适合于非专业人员的编码是_______。

A.数字编码B.字音编码C.字形编码D.音形结合编码【答案】B【解析】汉字输入编码方法大体分为四类: ( 1)数字编码,这是使用一串数字来表示汉字的编码方法,例如电报码、区位码等,它们难以记忆,很少使用。

第5章 数字媒体及应用

第5章  数字媒体及应用

第5章数字媒体及应用5.1考点5.1.1 文本与文本处理1.西文字符编码——ASCII码(美国标准信息交换码)字符集:128个字符,其中96个可打印字符,32个控制字符。

ASCII码用7位二进制表示,在计算机中用一个字节存放一个ASCII码,最高位通常为“0”。

注意:在ASCII字符集中,大写字母的编码值小于小写字母的编码值。

同一字母的大写的ASCII码比小写字母小32。

2.汉字编码1)GB 2312——1980字符分布在94行94列的二维平面内,有6763个常用汉字,均为简体。

机内码(内码):高位均为1的双字节汉字编码就称为GB 2312汉字的“机内码”。

取值范围:A1H~FEH。

字符集组成:第一部分是字母、数字和各种符号;第二部分为一级常用汉字,按汉语拼音排列;第三部分为二级常用字,按偏旁部首排列。

GB 2312的不足:汉字字数太少,缺少繁体字,无法满足人名、地名、古籍整理、古典文献研究等应用的需要;与ASCII码不兼容。

2)GBK汉字编码(1995)它是对GB 2312编码集的扩充,与GB 2312国际汉字字符集及其内码保持兼容。

收录了繁体字,字数超过2万(21003个)。

与GB 2312保持向下兼容,也使用双字节表示,第1字节最高位必须为“1”。

3)UCS/Unicode与GB 18030汉字编码GB 2312和GBK两种汉字编码主要在大陆使用,港台地区使用Big5汉字编码标准(简称大五码),GB 2312(GBK)和Big5不兼容。

为了实现全球不同语言的统一编码,国际标准化组织(ISO)制定了一个将全世界现代书面文字所使用的所有字符和符号集中进行统一编码,称为UCS标准,对应的工业标准称为Unicode。

为了既与国际标准UCS(Unicode)接轨,有保护已有中文信息资源,我国发布并开始广泛执行新的GB18030汉字编码国家标准,它与GB 2312和GBK保持向下兼容。

GB 18030实质上是UCS/Unicode字符集的另一种编码方案,它采用单字节编码、双字节编码和四字节编码,与GBK(GB 2312)保持兼容。

第五章 数字媒体及应用-五

第五章 数字媒体及应用-五

第五章数字媒体及应用一、单项选择题1.文本编辑的目的是使文本正确、清晰、美观,下列_______操作不属于文本处理而属于文本编辑功能。

A.定义超链B.词语错误检测C.关键词提取D.词性标注【答案】A【解析】文本编辑与排版的主要功能包括: ( 1)对字、词、句、段落进行添加、删除、修改等操作; ( 2)文字的格式处理:设置字体、字号、字的排列方向、间距、颜色、效果等; ( 3)段落的格式处理:设置行距、段间距、段缩进、对齐方式等; ( 4)表格制作和绘图; ( 5)定义超链; ( 6)页面布局(排版) :设置页间距、每页行列数、分栏、页眉、页脚、插图位置等。

而文本处理强调的是使用计算机对文本中所含文字信息的形、音、义等进行分析和处理。

例如: ( 1)在字、词(短语)层面上进行的处理包括字数统计、自动分词、词性标注、词频统计、词语排序、词语错误检测、自动建立索引、汉字简/繁转换、大陆/台湾编码及术语转换等; ( 2)在句子级别上进行的处理有语法检查、文语转换(语音合成)、文种转换(机器翻译)等; ( 3)在篇章基础上进行的处理有关键词提取、文摘生成、文本分类、文本检索等。

2.下列文件类型中不属于丰富格式文本类型的是_______。

A. XLS文件B. TXT文件C. PPT文件D. HTML文件【答案】B【解析】简单文本由一连串用于表达正文内容的字符(包括汉字)的编码所组成,它几乎不包含任何其他的格式信息和结构信息。

这种文本通常称为纯文本,其文件后缀名是.txt。

经过排版处理后,纯文本中就增加了许多格式控制和结构说明信息,这样的文本称为“丰富格式为文本”。

3.汉字的键盘输入编码方案有几百种之多,基于汉语拼音的编码方法,简单易学,适合于非专业人员的编码是_______。

A.数字编码B.字音编码C.字形编码D.音形结合编码【答案】B【解析】汉字输入编码方法大体分为四类: ( 1)数字编码,这是使用一串数字来表示汉字的编码方法,例如电报码、区位码等,它们难以记忆,很少使用。

数字媒体及应用培训教材

数字媒体及应用培训教材

行号 区号
列号 位号
① 汉字区位码:采用双字节编码。 汉字在代码表中的行号、列号
例如:“大”字的区号20,位号83,区位码是20 83
用2个字节表示为:00010100 01010011
② 国标码: ➢ 问题:
信 息 通 信 中 , 汉 字 的 区 位 码 与 通 信 使 用 的 控 制 码 ( 00H ~ 1FH)发生冲突。 ➢ 解决方案:
(2)颜色空间:指彩色图像所使用的彩色描述方法, 也叫颜色模型,如RGB、YUV等颜色模型。
(3)像素深度:像素所有颜色分量的二进位数之和, 决定了不同颜色的最大数目。
计算机基础
像素深度 1 4 8 16 24
颜色总数 2 16
256 65536 16672216
图像名称 单色图像 索引16色图像 索引256色图像 HI-Color图像 真彩色图像
规定了信息交换用的基本图形、字符及其二进制编码 的十六进制表示,同时收录了主要的少数民族文字。 •编码方式:
在GB2312和GBK的基础上进行了扩充,采用单字节/双 字节/四字节三种方式编码,码位数160多万。
计算机基础
二、 文本处理 1、文本:文本是基于特定字符集的、具有上下文相关性
的一个字符流,每个字符都使用二进制编码表示。 2、文本在计算机中的处理过程
JPEG 2000
计算机基础
标准JPEG
五、常用图像文件格式:BMP、TIF、GIF、JPEG/JP2
常用图像编辑软件:Photoshop、paint、ACDSee
六、计算机图形的概念及其应用
使用计算机根据景物的模型生成图像的过程称为图 像合成,所产生的数字图像称为计算机图形。
ห้องสมุดไป่ตู้
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

5.1 字符与文本处理
由于计算机中所有信息均以二进制形式 传输、存储及处理。为此,需要按一定 的规则对数字、字符、汉字、声音、图 像等用二进制进行编码。
1.西文字符的编码
• 字符集:常用字符的集合。 • 西文字符集:由拉丁字母、数字、标点符号及
一些特殊符号组成。 • 字符的编码:字符集中每一个字符各有一个代
特性:呈现为一种线性结构,以行、字为单位,顺序写作与阅读是 最通用的文本文件格式,文件体积小,阅读不受限制,几乎所有的文字 处理软件都能识别和处理。不能插入图片、表格等,不能建立超链接。
2、格式文本
为了使文本能以整齐、醒目、美观、大方的形式展现给用户,人们 还需要对纯文本进行设定,确定文本所在页面的大小、文本在页面上的 位置及布局等,这个过程称为文本的格式化,也称为“排版”。排版后 的文本就增加了许多格式控制和结构信息,称为“丰富格式文本”。
1.区位码:是我国于1981年颁布的国家标准GB 2312 -80,即《中华人民共和国国家标准的汉字编码》, 用四位十进制数码表示对应的汉字,前两位表示区号, 后两位表示位号。用于表示汉字在字库中的位置,共 表示6763个简体汉字。称为基本字库集。
其中:一级汉字库有3755个,以汉语拼音为序排列;
二级汉字库有3008个,以偏旁部首为序排列;
文本的分类与表示
使用计算机制作的数字文本,根据用途分为:简单文本、丰 富格式文本和超文本三类。
1、简单文本(纯文本)
是由一连串的字符组成的,除了用于表达正文内容的字符(包括汉字) 及“回车”、“换行”、“制表”等有限的几个打印(显示)控制字符之外, 几乎不包含任何其他格式信息和结构信息。这种文本通常称为纯文本或 ASCII文本,在PC机中的文件后缀名是.txt。
5.2.1 图像的获取
1、图像的数字化
图像的获取(capturing):从现实世界中获得数字图像的过程 实质上是模拟信号的数字化过程,步骤如下:
扫描:将画面划分为M(行) ╳ N(列)个网格,每个网格称为一个取样点。 一幅模拟图像就被转换为M╳N个取样点组成的一个阵列。
分色:将彩色图像取样点的颜色分解成三个基色(例如RGB三基色),如果 不是彩色图像(即灰度或黑白图像),则不必进行分色。
等4种,在同一种汉字编码字符集中,使用不同的编码方法向计算机输入 的同一个汉字,它们的内码不同。(X) (2019判) 【例】1KB的内存空间能存储512个汉字内码,约存_14__个24×24点阵汉 字的字型码。(2019填) 【例】在24×24点阵的汉字字库中,存储每个汉字字型码所需的字节是70B。 (X)(2019判断)
练习
• 1、文本编辑的目的是使文本正确、清晰、美观,下列 _BCD_____操作属于文本处理而不属于文本编辑功能。 (2019多选) A、添加页眉页脚 B、统计文本字数 C、文本压缩 D、识别并提取文本中的关键字
• 2、不同文本中处理软件使用的格式控制和结构说明信 息并不统一,不同的丰富格式文本互不兼容,因此一 些公司联合提出了一个中间格式,称为___D____格式。 (2019单选) A、DOC B、PDF C、HTML D、RTF
码,即字符的二进制表示,称为该字符的编码。
标准ASCII字符集
• 美国标准信息交换码(American Standard Code for Information Interchange):使用7 个二进位对字符进行编码(叫做标准 ASCII码)
• 基本的ASCII字符集可表示27=128个符号: 96个可打印字符(常用字母、数字、标 点符号等)和32个控制字符。
简化、重码减少。
缺点:不易掌握。
4、汉字的输出
• 区位码、国标码和机内码均不能表示汉字的字形。 为了显 示和打印,计算机内必须保存汉字的字 形。
• 计算机内一套汉字所有字符的形状描述信息的集 合叫“字库”
• 不同的字体对应不同的字库。 • 汉字字形有两种描述方法,点阵字形和轮廓字形。
• 点阵字形:
2D图像获取设备(如扫描仪、数码相机等):只能对图片或景物 的2D投影进行数字化。
3D图像获取设备: 3D扫描仪能获取包括深度信息在内的3D 景物的数字化信息。
5.2.2 图像的表示与压缩编码 1、图像的表示方法与主要参数
从取样图像的获取过程可以知道,一幅取样图像由M ╳ N个取样点 组成,每个取样点是组成取样图像的基本单位,称为像素(picture element, 简写为pel)。彩色图像的像素是矢量,它由3个彩色分量组成,灰度或黑 白图像的像素只有1个亮度值。
3、超文本
传统的纸质文本其内容的组织是线性(顺序)的,因而读者总 是按顺序先读第1页,再读第2页、……,这就是“线性文本”。
超文本(hypertext)的概念是对传统文本的一个扩展。除了传统 阅读方式之外,它还可以通过链接、跳转、导航、回溯等操作, 实现对文本内容的跳跃式阅读和访问。
超文本的结构:
取样:测量每个取样点每个分量的亮度值。 量化:对取样点每个分量的亮度值进行A/D模数转换。



扫描

分色
取样 取样 取样
量化


量化

量化

2、数字图像获取设备
图像获取的设备:从现实世界获得数字图像的设备,通称为 数字图像获取设备。
图像设备的功能:将现实的景物输入到计算机内,并以取样 图像的形式存放在计算机中。
还有682个常用的非汉字字符(图形、符号)。
位号:
1 2 3 ……………… 94
区1 号9 : 16
字母、数字和各种符号 一级汉字
(3755个)
…… ……
55
二级汉字
56
(3008个)
87
94
(扩充使用)
GB2312-80字符集(94行☓ 94列)
2.国标码:在信息通信中,汉字的区位码与通信使 用的控制码(00H~1FH)发生冲突。由于传输的需要, 需将区位码的区码和位码各加上(00100000)2,即 32, 便成了国标码。作为汉字信息交换使用。
3.机内码:是指在计算机中用二进制表示的汉字编 码。是计算机系统内部用于对汉字进行存储、处理、传 输的代码。由于汉字数量多,1个汉字需要占2个字节来 存放汉字的内码。
在计算机中汉字字符必须与英文字符ASCII编码区 别开来,以免造成混乱。汉字机内码中两个字节的最高 位均置为“1”。
重点知识点:
GB2312-80汉字编码标准:
中,含有的汉字和西文字符的个数分别是_3个2个__。(2019填空)
GBK国标汉字内码扩展集:
我国目前汉字总数大约有6万字左右,但GB2312-80只有6763个简 体汉字,在Windows中不够用。因此,我国在2019年发布GBK-95,全 称为《汉字内码扩展规范》, GBK-95国标汉字内码扩展集中一共有 21003个简繁体汉字和883个图形符号,共收入21886个汉字和图形符 号,它与GB2312国标汉字字符集及其内码保持兼容。
5.2 图像与图形
计算机中的数字图像按其生成方法可以分为两大类: 1、取样图像(sampled image):从现实世界中通过数字化设备 获取的图像。也称为:点阵图像(dot matrix image)、位图图像 (bitmap image)。简称图像(image)。 2、矢量图形(vector graphics):计算机合成的图像(synthetic image)。 简称图形(graphics)。
– 用一组排成方阵(16×16、24×24、32×32 ……)的 比特来表示一个汉字,1表示是 点,0表示空白。
– 字模码:用点阵表示的汉字字形代码,它是汉字的输 出形式。
• 练习:使用16×16点阵描述10个汉字,需要多少 个字节?(16×16÷8×10)
字符的点阵描述
重点知识点:
汉字的输入和输出: 【例】汉字输入的编码方法有数字编码、字音编码、字形编码和形音编码
标准ASCII码在计算机中实际用了8位二进制表示一个字符,最高 位设为“0” ,在数据传输时可用作奇偶校验位。
扩充ASCII字符集
• 标准ASCII码是七位的编码,但字节是计算机中最基本的处理单位, 故以一个字节来存放一个ASCII字符。每个字节中多出来的一位一般 保持为“0”。
• 扩充ASCII字符集:标准ASCII字符集只有128个不同的字符,在很多 应用中无法满足要求。按照ISO2022标准(《七位字符集的代码扩充 技术》)的规定,ISO陆续制定了一批适用于不同地区的扩充ASCII字 符集,每个扩充ASCII字符集分别可以扩充128个字符,这些扩充字符 的编码均是高位为1的8位代码(十进制数128~255),称为扩展 ASCII码。
A
B
a1 b1
a3 a2
b2
C
D
c1 d1
c2
E
F
G
H
e1
f1
g1
h1
超文本的应用: Windows等一些软件中的“帮助”文件; 使用浏览器从Web服务器上下载的网页(html或htm 文件)。
超媒体(Hypermedia):超文本中的节点不单是文本 节点,还包含图形、图像、声音或动画节点,这种基 于多媒体信息结点的超文本,有时也称为“超媒体” 。
• 用键盘输入汉字,不可能一键一字,必须用几个 字符代表 一个汉字,这几个字符叫做汉字的 “输入编码” 。
• 汉字的输入编码与汉字的内码是不同范畴的概念。 使用不同的输入编码方法向计算机输入的同一个 汉字,它们的内码是相同的
汉字输入编码方法的分类:
数字编码:使用一串数字来表示汉字的编码方法,例如电报码、 区位码等。缺点: 难以记忆,不易推广。
例如:計算機係等繁体汉字和冃冄円冇鎔等生僻的汉字。
重点知识点:
常用汉字编码标准:
相关文档
最新文档