第9章 MPEG声音

合集下载

第九章计算机多媒体技术例题与解析

第九章计算机多媒体技术例题与解析

第九章计算机多媒体技术例题与解析【例9-1 】根据多媒体的特性,_属于多媒体的范畴。

A.交互式视频游戏B.录像带C.彩色画报D.彩色电视机【答案与解析】多媒体的特性包括同步性、集成性和交互性。

在列出的4个选项中,只有“交互式视频游戏”符合这些特性,因此答案是A。

【例9-2】多媒体计算机主要特点是_ 。

A.较大的体积B.较强的联网功能和数据库能力C.大多数基于Client/Server模型D.较强的音视频处理能力【答案与解析】多媒体计算机的主要任务是处理多媒体信息,由于多媒体信息包含非常巨大的数据量,因此对多媒体计算机的运算能力要求很高;由于多媒体信息最终要通过音频、视频的形式进行表达,因此对多媒体计算机的音视频处理能力有很高的要求。

另一方面,多媒体计算机对网络和数据库并没有必然的要求。

因此答案是D。

【例9-3】目前,音频卡一般不具备功能。

A.录制和回放数字音频文件B.混音C.语音特征识别D.实时解压缩数字音频文件【答案与解析】录制和回放数字音频文件、混音和实时解/压缩数字音频文件都是目前的主流声卡所能提供的功能。

但语音识别属于人工智能的范畴,一般通过专用的软件(例如ViaV oice)来实现,音频卡一般不提供。

因此答案是C。

【例9-4】以下说法中,是不正确的。

A. USB接口可以连接多种多媒体设备B. VGA接口用于连接显示器C. IEEE 1394接口可用于连接数码相机D. SCSI接口不能用于连接扫描仪【答案与解析】SCSI接口—小型计算机系统接口是一种较为特殊的接口总线,具备与多种类型的外设进行通信的能力,支持包括磁盘驱动器、磁带机、光驱、扫描仪在内的多种设备。

因此答案是D。

【例9-5】使用Windows“画图”不能实现的功能是。

A.在图画中输入文字B.将图画放大到全屏模式显示并进行编辑C.设置背景色和前景色D.擦除图画中的一块矩形区域【答案与解析】在“画图”中,如果选择“查看”中的全屏,则可以以全屏的方式整幅查看当前图片,但在这种状态下无法对图画进行编辑。

第九章多媒体

第九章多媒体

第九章多媒体1.以下关于多媒体技术的描述中,错误的是。

(C)A.多媒体技术将各种媒体以数字化的方式集中在一起B.“多媒体技术”是指将多媒体进行有机组合而成的一种新的媒体应用系统C.多媒体技术就是能用来观看的数字电影的技术D.多媒体技术与计算机技术的融合开辟出一个多学科的崭新领域2.下面的图形图像文件格式中,可实现动画。

(B)A.WMF格式B.GIF格式C.BMP格式D.JPG格式3.下面的多媒体软件工具,由Windows自带的是。

(A)A.MediaPlayer B.GoldWave C.WinAmP D.Rea1Player4.下面功能中不属于MPC的图形、图像处理能力的基本要求。

(B)A.可产生丰富形象逼真的图形B.实现三维动画C.可以逼真、生动地显示彩色静止图像D.实现一定程度的二维动画5.下面说法中是不正确的。

(C)A.电子出版物存储容量大,一张光盘可存储几百本书B.电子出版物可以集成文本、图形、图像、动画、视频和音频等多媒体信息C.电子出版物不能长期保存D.电子出版物检索快6.下面4个工具中_____属于多媒体制作软件工具。

(D)A.photoshop B.Firworks C.PhotoDraw D.Authorware7.要把一台普通的计算机变成多媒体计算机,______不是要解决的关键技术。

(A)A.视频音频信号的共享B.多媒体数据压编码和解码技术C.视频音频数据的实时处理和特技D.视频音频数据的输出技术8.数字音频采样和量化过程所用的主要硬件是。

(C)A.数字编码器B.数字解码器C.模拟到数字的转换器(A/D转换器)D.数字到模拟的转换器(D/A转换器)9.下面设备中不是多媒体计算机中常用的图像输入设备。

(C)A.数码照相机B.彩色扫描仪C.条码读写器D.彩色摄像机10.下面硬件设备中,____不是多媒体硬件系统必须包括的设备。

(D)A.计算机最基本的硬件设备B.CD-ROMC.音频输入、输出和处理设备D.多媒体通信传输设备11._____不是MPC对音频处理能力的基本要求。

《多媒体技术基础》第3版 答案

《多媒体技术基础》第3版 答案

1《多媒体技术基础》第3版练习与思考题参考答案林福宗清华大学计算机科学与技术系2008-2-15linfz@第1章多媒体技术概要1.4 无损压缩是什么?无损压缩是用压缩后的数据进行重构(也称还原或解压缩),重构后的数据与原来的数据完全相同的数据压缩技术。

无损压缩用于要求重构的数据与原始数据完全一致的应用,如磁盘文件压缩就是一个应用实例。

根据当前的技术水平,无损压缩算法可把普通文件的数据压缩到原来的1/2~1/4。

常用的无损压缩算法包括哈夫曼编码和LZW等算法。

1.5 有损压缩是什么?有损压缩是用压缩后的数据进行重构,重构后的数据与原来的数据有所不同,但不影响人对原始资料表达的信息造成误解的数据压缩技术。

有损压缩适用于重构数据不一定非要和原始数据完全相同的应用。

例如,图像、视像和声音数据就可采用有损压缩,因为它们包含的数据往往多于我们的视觉系统和听觉系统所能感受的信息,丢掉一些数据而不至于对图像、视像或声音所表达的意思产生误解。

第2章无损数据压缩2.4 现有5个待编码的符号,它们的概率见练习表2-2。

计算该符号集的:(1) 熵;(2)霍夫曼码;(3) 平均码长。

(1) 熵Σ =-0.4×(0.4)-2×0.2*(0.2)-2×0.1(0.1) 2log2log2log 21()()log()niii Hapapa==−=0.4×1.3219+0.4×2.3219+0.2×3.3219=0.5288+-0.9288+0.6644=2.1220 (位) (2) 编码树和霍夫曼码练习图2-1 编码树代码分配不唯一(3) 平均码长L=0.4+0.4+0.6+0.4+.04=2.2(位/符号)第3章数字声音编码3.1 音频信号的频率范围大约多少?话音信号频率范围大约多少?(1) Audio: 20~20000 Hz(2) Speech: 300~3400 Hz3.4 采样频率根据什么原则来确定?奈奎斯特理论和声音信号本身的最高频率。

PPT设计与制作第9章-PPT影音

PPT设计与制作第9章-PPT影音
AVI格式的优点是图像质量好,可 以跨平台使用;缺点是体积过于庞 大,而且压缩标准不统一。
MPEG格式
MPEG即运动图像专家组格式, 比 如 VCD、 DVD , 今 天 常 用 的有MP4格式。
03
SWF格式
SWF是一种支持矢量和点阵图形 的动画文件格式,被广泛应用于 网页设计,动画制作等领域。
MOV格式
9.2 设置声音属性
9.2.2 设置声音的隐藏
在幻灯片中选中声音图标,切换至“播放”面板,如图9-7中单击“音频选项” 选项板中的“放映时隐藏”复选框,在放映幻灯片的过程中会自动隐藏声音的图标, 如图9-10所示。
图9-10 声音图标隐藏前后对比
9.2 设置声音属性
9.2.3 音频的剪辑
在幻灯片中选中声音图标,切换至“播放”面板,如图9-7中单击 “编辑”组 中单击“剪裁音频”按钮打开“剪裁音频”对话框,如图9-11所示。拖动绿色的 “起始时间”滑块和红色的“终止时间滑块”设置音频的开始时间和终止时间,单 击“确定”按钮后,滑块之间的音频将保留,其余音频将被裁剪掉,如图9-12所示。
图9-11 音频剪辑对话框
图9-12 调整剪裁起点与终点
9.2 设置声音属性
9.2.45 设置音频的淡音入量与淡出效果
在幻灯片中选中声音图标,切换至“播放”面板,如图9-7中单击“编音辑频”选组项” 的组“的淡 “入 音” 量和 ”“ ,淡 根出据”需微要调进框行中设分置别,输如入图时9-间14值所,示如。图9-13所示。
图9-1 插入音频
图9-2 “插入音频”对话框
9.1 声音的插入与调整
9.1.2 添加各类声音
3)执行操作后,如图9-3所示,可以拖曳声音图标至合适位置,按<F5>键后 时幻灯片播放,点击播放按钮就可以听到插入的声音。

第9章自测题习题及答案(选择题)

第9章自测题习题及答案(选择题)

9.4 自测题9.4.1 选择题自测1、以下关于多媒体技术的描述中,错误的是____。

A:多媒体技术将各种媒体以数字化的方式集成在一起B:多媒体技术是指将多媒体进行有机组合而成的一种新的媒体应用系统C:多媒体技术就是能用来观看的数字电影技术D:多媒体技术与计算机技术的融合开辟出一个多学科的崭新领域2、以下硬件设备中,不是多媒体硬件系统必须包括的是____。

A:计算机最基本的硬件设备B:CD-ROMC:音频输入、输出和处理设备D:多媒体通信传输设备3、以下设备中,不属于音频设备的是____。

A:声卡B:DV卡C:音箱D:话筒4、下列对多媒体计算机的描述中,较为全面的一项是______。

A:只能用于编辑音频功能的计算机B:带有高分辨率显示设备的、具有大容量内存和硬盘的、包含功能强大中央处理器(CPU)的,并具有音视频处理功能的计算机C:只能用于编辑视频功能的计算机D:带有磁带机的计算机5、以下接口中,一般不能用于连接扫描仪的是____。

A:USBB:SCSIC:并行接口D:VGA接口6、以下设备中,不是多媒体计算机中常用的图像输入设备的是____。

A:数码照相机B:彩色扫描仪C:条码读写器D:数码摄像机7、下面功能中,不属于MPC对图形、图像处理能力的基本要求的是____。

A:可产生丰富形象逼真的图形B:实现三维动画C:可以逼真、生动地显示彩色静止图像D:实现一定程度的二维动画8、声音文件中,具有较好的压缩效果并保持较好的音质是______。

A.WAV文件B.MIDI文件C.MP3文件D.AU文件9、以下对视频设备的描述中,正确的是______。

A:视频设备只能采集视频数据,不能播放视频数据B:视频采集卡的功能是用于采集视频数据C:视频采集卡的功能是用于采集音频数据D:视频设备包括音频采样卡、合成器、中高频音箱、话筒、PC的声卡、耳机等10、以下对音频格式文件的描述中,正确的是______。

A:MIDI 文件很小,但 MIDI 文件不能被录制,必须使用特殊的硬件和软件在计算机上合成B:MIDI 文件很大,是通过麦克风录制的C:WAV 文件通常很小,可以从 CD、磁带等录制自己的 WAV 文件D:WAV 文件通常比MIDI文件小11、以下对音频格式文件的描述中,正确的是______。

第9章 多媒体通信系统

第9章 多媒体通信系统
硬件配置高,运算速度快,传输速率高,存储量大,硬 盘读取速度快
音频处理硬件:用于处理音频信息,它可以把话筒、 录音机、电子乐器等输入的声音信息进行模数转换、 压缩等处理,也可以把经过计算机处理的数字化的声 音信号通过还原(解压缩)、数模转换后用音箱播放 出来,或者用录音设备记录下来
视频信息处理硬件:用来支持视频信号的输入与输出
49媒体网关控制协议在媒体网关控制器和媒体网关之间传递信息常用协议mgcp协议mediagatewaycontrolprotocolmegacomgcp的扩展可以用于包括atm等在内的更广泛网络环境50sip系统与其他系统的互连互通13与h323系统的互连网关主要完成媒体流和信令转换首先完成地址解析和映射不仅要识别地址类型而且还要根据地址映射的规则将其变换为相应的对方地址类在进行sip和h323协议媒体流的转换时既要完成sip网络侧和h323网络侧的语音数据和视频编码算法映射又要协商主被叫所使用的端口地址ip地址是否使用回声控制等
H.245协议用于控制各种信道(如语音、视频和数据信道) 的使用和性能,完成终端之间通信能力的协商、初始通信、 逻辑信道建立、通信结束等功能。
9.1. 1媒体和多媒体(1/4)
媒体
定义 表示、传播和存储信息的载体
分类 感觉媒体(Perception Medium) 表示媒体(Representation Medium) 显示媒体(Presentation Medium) 存储媒体(Storage Medium) 传输媒体(Transmission Medium)
在多媒体系统中,媒体之间是相互关联的,即以 时空同步的方式存在;而在多种媒体系统中,媒 体与媒体之间可以是孤立的,相互间毫无关系的。 例如:因特网的Web服务可以为用户提供声音、文 本和图像的服务,但它们之间不存在同步机制, 是一种典型的多种媒体服务方式

第九章 视频信息检索

第九章  视频信息检索
数字视频信息 处理与传输
侯 颖 houying@
第九章
9.1 概述
视频信息检索
一、信息检索概述
随着计算机网络技术和多媒体技术的快速 发展, 发展,每天都有大量的图像和视频信息不断涌 现出来,我们被“淹没”在信息的海洋中。 现出来,我们被“淹没”在信息的海洋中。如 何组织、管理这些海量地、 何组织、管理这些海量地、包含大量非结构化 信息的数据, 信息的数据,并且从中有效地查询和检索出有 用地信息,这就是信息检索地任务。 用地信息,这就是信息检索地任务。
9.1
概述
所谓信息检索 所谓信息检索,就是根据用户的信息需求 信息检索, ,从信息集合中检索出与用户信息需求相关的 信息子集。 信息子集。 视频信息数据量极其庞大, 视频信息数据量极其庞大,并且图像数据 在组织结构、 在组织结构、表达形式等方面也不同于传统地 文字数据,如何对它们进行组织、表达、 文字数据,如何对它们进行组织、表达、存储 管理、 、管理、查询和检索是对传统数据库技术提出 一个严峻挑战重大挑战 重大挑战。 地一个严峻挑战重大挑战。特别是视频信息检 索问题, 索问题,尤其是基于内容地视频和图像检索技 术已经成为国内外研究的热点问题。 术已经成为国内外研究的热点问题。
9.1
概述
9.1
产生, 检索, 利用。 产生, 检索, 利用。
概述
信息的生命周期有三个主要阶段: 信息的生命周期有三个主要阶段:
9.1
概述
信息单元, 信息集合用来表示一个数据单元,可以是任 何的物理单元。 何的物理单元。如:文件、一个电子邮件、 文件、一个电子邮件、 WEB网页、图像、视频、音频。 WEB网页、图像、视频、音频。 网页 元数据是关于数据的组织、数据域及其关系 元数据是关于数据的组织、 的信息。 的信息。元数据为各种形态的数字化信息单 元和资源集合提供规范的一般性的描述。 元和资源集合提供规范的一般性的描述。

多媒体技术第9章 光盘存储技术

多媒体技术第9章 光盘存储技术

9.1.3 部分CD产品简介
7.V-CD
是Video CD的简称,意为视频小型光盘。 1993年制定了VCD1.1的标准。
1994年又在VCD1.1的基础上增加了播放控制 (屏幕菜单) 和高清晰度图像等功能,制定了VCD2.0标准。
VCD标准采用了CD-ROM/XA数据格式,因此可在配 置了CD-ROM驱动器的PC基础上播放,普通的CD唱机 增加VCD解码板也可播放VCD。 VCD盘可连续播放74分钟的录像节目。其图像优于VHS 录像质量,伴音质量可达到CD的效果。
第九章 多媒体光盘存储技术
9.2.4数据是怎样从CD盘读出的
9.2 CD工作原理
1.CD盘上的数据要用CD驱动器来阅读。 CD驱动器由光学读出头、光学读出头驱动机构、 CD盘驱动机构、控制线路以及处理光学读出头读 出信号的电子线路等组成。
9.2.4数据是怎样从CD盘读出的
2. 光学读出头是CD系统的核心部 件之一,它由光电检测器、透 镜、激光束分离器、激光器等 元件组成。
9.3.3声音数据的通道编码
2.为什么要把8位数转换成14位数
实际在通道码合并时,为了满足游程长度的 要求,在通道码之间再增加了3位来确保读出信号 的可靠性,于是在激光唱盘中8位的数据就转换成 了17位的通道代码。
第九章 多媒体光盘存储技术
9.3 CD-AUDIO
9.3.4 CD盘如何批量生产
激光唱盘(CD-DA)、数字激光视盘(V-CD)和CDROM的制作过程都相同,大致分成三个阶段: 原版盘预制作。 原版盘制作。 大批量复制。
5.CD-R
可录式光盘。1989年制定了它的规范。 它可多次在空余部分写入数据,适合于小 规模单一发行的CD制品或数据备份,资料 存档等。

Premiere Pro CS5 非线性编辑基础教程第9 章 音频特效

Premiere Pro CS5 非线性编辑基础教程第9 章  音频特效
• 9.1.2 音频信号的数字化处理技术
• 随着科学技术的发展, 无论是广播电视、电影、音像公司、唱片公 司还是个人录音棚,都在使用数字化技术处理音频信号。数字化正成 为一种趋势, 而数字化的音频处理技术也将拥有广阔的前景。
上一页 下一页 返回
9.1 音频概述
• 1.数字音频技术概述 • 数字音频是指把声音信号数字化, 并在数字状态下进行传送、记录
• 9.2.1 使用音频单位
• 对于视频来说, 视频帧是其标准的测量单位, 通过视频帧可以精确 地设置入点或者出点。然而在Premiere Pro CS5 中, 音频素材应当使用毫秒或音频采样率来作为显示单位。效果如图9- 1 所示。
• 9.2.2 在时间线上编辑音频
• 在对声音和音频技术有了一定了解后, 便可开始对影片中的音频素 材进行编辑处理。本节将介绍添加音频素材的不同方法以及如何设置 音频素材的播放速度和声道等内容。
• 与之前所介绍的视频过渡相同, Premiere Pro CS5 将 音频过渡也集中放置在“效果” 面板中。在“效果” 面板内依次展 开“音频过渡”→“交叉渐隐” 选项后, 即可显示Premier ePro CS5 内置的3 种音频过渡效果。
• 1.添加音频过渡 • “交叉渐隐” 文件夹内的不同音频转场可以实现不同的音频处理效
• 9.4.2 应用音频特效
• 1.添加音频特效 • 与前面所介绍的视频特效相同, Premiere Pro CS5 将
音频特效也集中放置在“效果” 面板中。在“效果” 面板内依次展 开“音频特效” 选项后, 即可显示Premiere Pro CS5 内置的音频特效效果。 • 将选择的音频特效效果, 拖入时间线中的音频素材上, 为其添加需 要的音频特效。

第9章 计算机多媒体技,考试试题序号37-40题,共考4题

第9章 计算机多媒体技,考试试题序号37-40题,共考4题
以下工具中,属于多媒体创作工具的是()。-->Authorware
以下关于WinRAR的描述中,错误()使用WinRAR进行解压缩时,必须一
以下关于多媒体技术的描述,错误。多媒体技术就是能用来观看的数字电影
以下关于多媒体技术的描述中,正确。多媒体技术是指将多种媒体进行有机
以下关于多媒体技术同步特性的描述中,不正确。指单一媒体播放的特性
录制声音时,要确保连接到计算机上的音频输入设备是()。-->麦克风
描述最全面的应用光存储系统主要有()。CD-ROM光存储系统﹑CD-R 光存
默认启动“画图”的方法是单击()。-->所有程序→附件→画图
能够处理各种文字、声音、图像和视频等多媒体信息()。多媒体计算机
扫描仪可应用于()。-->图形图像扫描输入
以下接口中,一般不能用于连接扫描仪的是()。-->VGA接口
以下类型的图像文件中,没有进行压缩处理的文件类型是()。-->BMP
以下哪个不是多媒体技术的典型应用()。-->Word 文档的存储
以下哪种类型的文件因为它们本身就是以压缩格式存储的。JPG 图像文件
以下软件中,不属于音频播放软件的是()。-->Premiere
有关WinRAR 软件说法正确的是()。-->WinRAR 默认的压缩格式是 RAR
有些类型的文件本身是以压缩格式存储的,例如()。-->.rmvb 文件
有些类型的文件本身是以压缩格式存储的,例如()。-->mp3 音频文件
在“画图”工具中,不可以对图像进行的操作是()。-->插入音频文件
在Windows2010 中,波形声音文件的扩展名是()。-->WAV
下面设备中()不是多媒体计算机中常用的图像输入设备。-->麦克风

什么是mpeg标准

什么是mpeg标准

什么是mpeg标准MPEG标准是一种数字视频和音频压缩标准,它是一种用于数字媒体数据压缩和传输的国际标准。

MPEG是Moving Picture Experts Group的缩写,它由ISO(国际标准化组织)和IEC(国际电工委员会)共同制定和管理。

MPEG标准的制定旨在实现数字媒体的高质量压缩和有效传输,从而在有限的带宽和存储空间下实现高质量的音视频传输。

MPEG标准的发展可以追溯到20世纪80年代初,当时数字视频和音频技术开始崭露头角。

随着数字媒体技术的迅速发展,人们对于数字视频和音频的高质量压缩和传输提出了更高的要求。

MPEG标准的制定正是为了满足这一需求而诞生的。

MPEG标准主要包括几个部分,其中最为重要的是MPEG-1、MPEG-2、MPEG-4和MPEG-7。

MPEG-1标准最早应用于VCD(视频光盘)和MP3音频压缩格式,它在音频和视频压缩方面取得了重大突破,为数字媒体的发展奠定了基础。

MPEG-2标准则应用于DVD、数字电视和广播等领域,它在视频压缩和传输方面取得了重大进展,使得高清晰度视频的传输成为可能。

MPEG-4标准则更加注重对多媒体内容的交互和多样化呈现,它为数字媒体的互动应用和多媒体通信提供了更多可能性。

而MPEG-7标准则是一种描述多媒体内容的元数据标准,它为多媒体内容的检索、管理和应用提供了基础。

MPEG标准的核心是对音频和视频数据进行压缩和解压缩,以实现高效的传输和存储。

在MPEG标准中,音频和视频数据被分别处理,然后通过特定的压缩算法进行压缩,最终以数字比特流的形式进行传输。

MPEG标准的压缩算法主要包括运动补偿、离散余弦变换、量化和熵编码等技术,这些技术的应用使得音视频数据在保证一定质量的前提下得以大幅度压缩,从而实现了高效的传输和存储。

除了音视频压缩和传输,MPEG标准还涉及到多媒体内容的描述、交互和管理等方面。

MPEG-7标准的出现为多媒体内容的检索和管理提供了更加便捷的方式,它通过描述多媒体内容的特征、结构和语义信息,使得用户可以更加准确和方便地检索和管理多媒体内容。

9-2第九章 多媒体篇-Media Center

9-2第九章 多媒体篇-Media Center

9.4 Windows Media CenterWindows media center中文可以称之为多媒体娱乐中心,它是一种构建于windows Vista基础之上的操作系统。

从数学的角度来说,windows media center是windows Vista的一个超集,它除了能够提供windows Vista的全部功能之外,还在娱乐功能上进行了全新的打造。

通过一系列的全新娱乐软件、硬件,为用户提供了从视频、音频欣赏到通信交流等全方位的应用。

不过media center不是独立存在的,因为并不是所有的家用电脑都可以运行media center。

media center对电脑的硬件有特殊要求,满足了特殊要求的电脑称之为media center pc。

而media center pc的制造商都是微软的pc制造伙伴。

个人用户想要自己diy攒一台media center pc是不行的。

1. Windows media center 的必须具备哪些相关的硬件设备?media center不是一个简单的操作系统,而是一个必须和pc硬件结合起来看的整体概念。

首先,作为media center的载体,电脑应具备较高的性能,至少要达到windows Vista的最小系统要求。

其次,它还得具备以下一些硬件设备:⑴media center的遥控器,让计算机上的所有娱乐活动均触手可及,同时亦可把它作为键盘和鼠标的补充设备。

⑵遥控器红外(ip)传感器,除了让遥控器和计算机互通信息外,还可以用它对有线电视或者卫星电视的机顶盒进行控制。

⑶TV调谐设备,用来接收有线电视、卫星电视或者电视天线的节目信号。

⑷硬件编码器,可以把有线电视、卫星电视或电视天线接收的电视节目录制到硬盘上。

⑸电视信号输出设备,可以将计算机上的media center内容显示在电视机屏幕上。

⑹数字音频输出设备,把来自计算机的数字音频输出到现有的家庭娱乐系统中。

第9章计算机多媒体技术真题及答案

第9章计算机多媒体技术真题及答案

第9章计算机多媒体技术网考真题(选择题)1.下列说法中,不正确的是______。

A. 电子出版物存储容量大,一张光盘可存储几百本书B. 电子出版物可以集成文本、图形、图像、视频和音频等多媒体信息C. 电子出版物不能长期保存D. 电子出版物检索快参考答案: C 所属章节:[计算机多媒体技术]2.下列选项中,能处理图像的媒体工具是______。

A. WordB. ExcelC. WPSD. Authorware参考答案: D 所属章节:[计算机多媒体技术]3.要把一台普通的计算机变成多媒体计算机,要解决的关键技术不包括______。

A. 数据共享B. 多媒体数据压编码和解码技术C. 视频音频数据的实时处理和特技D. 视频音频数据的输出技术参考答案: A 所属章节:[计算机多媒体技术]4.下列设备中,多媒体计算机常用的图像输入设备不包括______。

A. 数码照相机B. 彩色扫描仪C. 键盘D. 彩色摄像机参考答案: C 所属章节:[计算机多媒体技术]5.下列硬件设备中,多媒体硬件系统必须包括的设备中不含______。

A. 计算机最基本的硬件设备B. CD-ROMC. 音频输入、输出和处理设备D. 多媒体通信传输设备参考答案: D 所属章节:[计算机多媒体技术]6.下列选项中,不属于计算机多媒体的媒体类型的是______。

A. 程序B. 图像C. 音频D. 视频参考答案: A 所属章节:[计算机多媒体技术]7.下列各项中,不属于常用的多媒体信息压缩标准的是______。

A. JPEG标准B. MP3压缩C. LWZ压缩D. MPEG标准参考答案: C 所属章节:[计算机多媒体技术]8.下列四种文件格式中,属于音频文件的格式是______A. WAV格式B. JPG格式C. DAT格式D. MIC格式参考答案: A 所属章节:[计算机多媒体技术]9.下列四个选项中,最常用的三维动画制作软件工具是______。

第9章 多媒体通信应用系统

第9章 多媒体通信应用系统


高质量的音频信息; 高质量的实时视频编解码图像; 友好的人机交互界面; 多种网络接口(ISDN、DDN、PSTN、 Internet、卫星等接口); 明亮、庄重、优雅的会议室布局和设计 也是开好电视会议的一个方面。
多种多样的会议电视应用

会议电视的应用已从单纯的电视会议向 综合业务发展,从单一的电信领域向其 它领域渗透,从机构会议室型向个人桌 面型、家庭型发展和延伸。特别是基于 IP的H.323系统的推广应用,更加剧了会 议电视应用领域的转变和扩张。对于多 种多样的会议电视应用,可归纳为以下 几个主要方面:
ZXMVC8900智能视讯服务器 ZXMVC8900(图9-7所示)是基于H.323 和H.320系列协议的智能视讯服务器,位 于会议电视系统的核心部位,能为不同 网络类型、不同带宽和不同终端类型的 用户提供视频、音频及数据的高效通信。

ZXMVC8900智能视讯服务器
图9-7 ZXMVC8900外形图(正面)
第九章 多媒体通信 应用系统

1、 概述

2、 多媒体视频会议系统
3、 视频点播系统(VOD) 4、 多媒体远程监控系统
5、 多媒体通信技术的发展趋势
1、概述
根据ITU-T对多媒体通信业务的定义,其业务类型共有6种:

多媒体会议型业务——具有多点、双向通信的特点,如多媒体会 议系统等。 多媒体会话型业务——具有点到点通信、双向信息交换的特点, 如可视电话、数据交换业务。 多媒体分配型业务——具有点对多点通信、单向信息传输的特点, 如广播式视听会议系统。 多媒体检索型业务——具有点对点通信、单向信息传输的特点, 如多媒体图书馆和多媒体数据库等。 多媒体消息型业务——具有点到点通信、单向信息传输的特点, 如多媒体文件传送。 多媒体采集型业务——具有多点到多点、单向信息传输的特点, 如远程监控系统等。

第九章 多媒体应用基础 习题

第九章 多媒体应用基础 习题

第九章多媒体应用基础习题1【单选题】媒体有两种含义,即表示信息的载体和()。

•A、表达信息的实体•B、存储信息的实体•C、传输信息的实体•D、显示信息的实体正确答案: B2【单选题】()是指用户接触信息的感觉形式,如视觉、听觉和触觉等。

•A、感觉媒体•B、表示媒体•C、显示媒体•D、传输媒体正确答案: A3【单选题】多媒体技术是将()融合在一起的一种新技术。

•A、计算机技术、音频技术、视频技术•B、计算机技术、电子技术、通信技术•C、计算机技术、视听技术、通信技术•D、音频技术、视频技术、网络技术正确答案: C4【单选题】多媒体技术的主要特性有()。

①多样性②集成性③交互性④实时性•A、①、②、③•B、①、②、④•C、②、③、④•D、全部正确答案: D5【单选题】将模拟声音信号转变为数字频频信号的声音数字化过程是()。

•A、采样→编码→量化•B、量化→编码→采样•C、编码→采样→量化•D、采样→量化→编码正确答案: D6【单选题】多媒体的层次结构有5层,()是直接用来控制和管理多媒体硬件,并完成设备的各种操作。

•A、多媒体应用软件•B、多媒体开发工具•C、多媒体操作系统•D、多媒体驱动程序正确答案: D7【单选题】计算机主机与显示器之间的接口是()。

•A、网卡•B、音频卡•C、显示卡•D、视频压缩卡正确答案: C8【单选题】多媒体软件可分为( )。

•A、多媒体系统软件、多媒体应用软件•B、多媒体系统软件、多媒体操作系统、多媒体编程语言•C、多媒体系统软件、多媒体支持软件、多媒体应用软件•D、多媒体系统软件、多媒体支持软件、多媒体著作工具正确答案: C9【单选题】一幅320×240的真彩色图像,未压缩的图像数据量是()。

•A、225KB•B、230.4KB•C、900KB•D、921.6KB正确答案: A10【单选题】超文本数据模型是一个复杂的非线性网络结构,其要素包括()。

•A、结点、链•B、链、网络•C、结点、链、HTML•D、结点、链、网络正确答案: D11【单选题】下列说法不正确的是()。

第9章 Part2. 编码与时分复用讲解

第9章 Part2. 编码与时分复用讲解
9.8 时分复用和复接
9.6.1 预测编码简介
预测编码的目的:降低编码的比特率
预测编码的原理:
根据前几个抽样值计算一个预测值,将预测值与实际 值做差并编码传输该预测误差。相邻抽样值与当前抽样值 相关性越强,预测误差越小,因此可降低比特率。
m(t) mk 抽样 + ek 量化 rk 编码
1. 同一个信号,若量化值越多,则信号量噪比越大;同时 编码位数增多,编码复杂度增加、数据量增多。
2. 一般采用8位的PCM码就能保证通话质量。
9.5.2 自然二进制码和折叠二进制码
1. 13折线法中采用的折叠码排列方法: 共有8位。第1位c1表示量化值的极性正负。后面的7位分 为段落码和段内码两部分。
2.
3. 4.
第2至4位(c2 c3 c4)是段落码,可以表示8种斜率的段落。
剩余4位(c5 ~ c8)为段内码,可以表示每一段落内的16种量 化电平。段内码代表的16个量化电平是均匀划分的。 7位码总共能表示27 = 128种量化值。
9.5.2 自然二进制码和折叠二进制码
13折线法中的折叠码中的段落码:
4)量化误差:1270 - (1280+1216)/2 = 1270 – 1248 = 22
9.5.3 电话信号的编译码器
非均匀译码器(不包括加低通滤波的部分)
c2 ~ c8
记忆电路
7/11变换
恒流源
极性控制
译码输出
c1
9.5.4 PCM系统中噪声的影响
PCM中的两类噪声:量化噪声、加性噪声。 加性噪声的影响 原理:加性噪声导致收端发生误判,码组中出现错码
* ' ' qk mk mk mk ek (mk rk ) ek rk

计算机多媒体技术答案

计算机多媒体技术答案

答案第9章计算机多媒体技术(单选题)完成下列题目,这些题目与期末考试题或将来的统考题类似,请同学们认真做一遍。

注意:上传你所做的答案后就可以下载我的参考答案。

一.多媒体技术的概念、多媒体计算机系统的基本构成1、以下关于多媒体技术的描述中,正确的是___C_。

A.多媒体技术中的"媒体"概念特指音频和视频B.多媒体技术就是能用来观看的数字电影技术C.多媒体技术是指将多种媒体进行有机组合而成的一种新的媒体应用系统D.多媒体技术中的"媒体"概念不包括文本[解析]略2、多媒体技术能处理的对象包括字符、数值、声音和_____A_。

A.图像数据B.电压数据C.磁盘数据D.电流数据[解析]又问:下列选项中,不属于计算机多媒体的媒体类型的是什么?(A.图像 B.音频 C.程序 D.视频)答:选C。

3、以下四组对多媒体计算机能处理的信息类型的描述中,最全面的一组是_____B_。

A.文字,数字,图形及音频信息B.文字,数字,图形,图像,音频,视频及动画信息C.文字,数字,图形及图像信息D.文字,图形,图像及动画信息[解析]略4、多媒体和电视的区别在于_____D_。

A.有无声音B.有无图像C.有无动画D.有无交互性----- 对![解析]略5、根据多媒体的特性,_____D_属于多媒体的范畴。

A.交互式视频游戏B.录像带C.彩色画报D.彩色电视机----- 电视没有交互性,因此不属于多媒体[解析]略6、与传统媒体相比,多媒体的特点有_____C_。

A.数字化、结合性、交互性、分时性B.现代化、结合性、交互性、实时性C.数字化、集成性、交互性、实时性----选此项D.现代化、集成性、交互性、分时性[解析]略7、下列选项中,对多媒体技术最全面的描述是_____B_。

A.多媒体技术只具有同步、集成特性。

B.能够同时获取、处理、编辑、存储和展示两个以上不同类型信息媒体的技术C.利用幻灯片教学技术D.只能够获取单一信息媒体的技术8、音频和视频信息在计算机内的表示形式是____C__。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第9章MPEG声音与前面章节介绍的波形声音压缩编码(如ADPCM)和参数编码(如LPC)不同,MPEG-1和MPEG-2的声音数据压缩编码不是依据波形本身的相关性和模拟人的发音器官的特性,而是利用人的听觉系统的特性来达到压缩声音数据的目的,这种压缩编码称为感知声音编码(perceptual audio coding)。

进入20世纪80年代之后,尤其最近几年,人类在利用自身的听觉系统的特性来压缩声音数据方面取得了很大的进展,先后制定了MPEG-1 Audio, MPEG-2 Audio和MPEG-2 AAC等标准。

本章涉及的许多具体算法已经超出本教材的要求。

对于要求深入钻研的读者,请参考本章提供的参考文件或者浏览网址。

9.1 听觉系统的感知特性许多科学工作者一直在研究听觉系统对声音的感知特性,下面介绍已经用在MPEG Audio压缩编码算法中的三个特性:响度、音高和掩蔽效应。

9.1.1. 对响度的感知声音的响度就是声音的强弱。

在物理上,声音的响度使用客观测量单位来度量,即dyn/cm2(达因/平方厘米)(声压)或W/cm2(瓦特/平方厘米)(声强)。

在心理上,主观感觉的声音强弱使用响度级“方(phon)”或者“宋(sone)”来度量。

这两种感知声音强弱的计量单位是完全不同的两种概念,但是它们之间又有一定的联系。

当声音弱到人的耳朵刚刚可以听见时,我们称此时的声音强度为“听阈”。

例如,1 kHz 纯音的声强达到10-16w/cm2(定义成零dB声强级)时,人耳刚能听到,此时的主观响度级定为零方。

实验表明,听阈是随频率变化的。

测出的“听阈—频率”曲线如图9-01所示。

图中最靠下面的一根曲线叫做“零方等响度级”曲线,也称“绝对听阈”曲线,即在安静环境中,能被人耳听到的纯音的最小值。

另一种极端的情况是声音强到使人耳感到疼痛。

实验表明,如果频率为1 kHz的纯音的声强级达到120 dB左右时,人的耳朵就感到疼痛,这个阈值称为“痛阈”。

对不同的频率进行测量,可以得到“痛阈—频率”曲线,如图9-01中最靠上面所示的一根曲线。

这条曲线也就是120方等响度级曲线。

在“听阈—频率”曲线和“痛阈—频率”曲线之间的区域就是人耳的听觉范围。

这个范围内的等响度级曲线也是用同样的方法测量出来的。

由图9-01可以看出,1 kHz的10 dB的声音和200 Hz的30 dB的声音,在人耳听起来具有相同的响度。

图9-01 “听阈—频率”曲线图9-01说明人耳对不同频率的敏感程度差别很大,其中对2 kHz~4 kHz范围的信号最为敏感,幅度很低的信号都能被人耳听到。

而在低频区和高频区,能被人耳听到的信号幅度要高得多。

9.1.2. 对音高的感知客观上用频率来表示声音的音高,其单位是Hz。

而主观感觉的音高单位则是“美(Mel)”,主观音高与客观音高的关系是其中的单位为Hz,这也是两个既不相同又有联系的单位。

人耳对响度的感觉有一个范围,即从听阈到痛阈。

同样,人耳对频率的感觉也有一个范围。

人耳可以听到的最低频率约20 Hz,最高频率约18000 Hz。

正如测量响度时是以1 kHz纯音为基准一样,在测量音高时则以40 dB声强为基准,并且同样由主观感觉来确定。

测量主观音高时,让实验者听两个声强级为40 dB的纯音,固定其中一个纯音的频率,调节另一个纯音的频率,直到他感到后者的音高为前者的两倍,就标定这两个声音的音高差为两倍。

实验表明,音高与频率之间也不是线性关系。

测出的“音高—频率”曲线如图9-02所示。

图9-02 “音高—频率”曲线9.1.3. 掩蔽效应一种频率的声音阻碍听觉系统感受另一种频率的声音的现象称为掩蔽效应。

前者称为掩蔽声音(masking tone),后者称为被掩蔽声音(masked tone)。

掩蔽可分成频域掩蔽和时域掩蔽。

1. 频域掩蔽一个强纯音会掩蔽在其附近同时发声的弱纯音,这种特性称为频域掩蔽,也称同时掩蔽(simultaneous masking)。

如图9-03所示,一个声强为60 dB、频率为1000 Hz的纯音,另外还有一个1100 Hz的纯音,前者比后者高18 dB,在这种情况下我们的耳朵就只能听到那个1000 Hz的强音。

如果有一个1000 Hz的纯音和一个声强比它低18 dB的2000 Hz的纯音,那么我们的耳朵将会同时听到这两个声音。

要想让2000 Hz的纯音也听不到,则需要把它降到比1000 Hz的纯音低45 dB。

一般来说,弱纯音离强纯音越近就越容易被掩蔽。

图9-03 声强为60 dB、频率为1000 Hz纯音的掩蔽效应在图9-04中的一组曲线分别表示频率为250 Hz、1 kHz、4 kHz和8 kHz纯音的掩蔽效应,它们的声强均为60 dB。

从图中可以看到:①在250 Hz、1 kHz、4 kHz和8 kHz纯音附近,对其他纯音的掩蔽效果最明显,②低频纯音可以有效地掩蔽高频纯音,但高频纯音对低频纯音的掩蔽作用则不明显。

图9-04 不同纯音的掩蔽效应曲线由于声音频率与掩蔽曲线不是线性关系,为从感知上来统一度量声音频率,引入了“临界频带(critical band)”的概念。

通常认为,在20 Hz到16 kHz范围内有24个临界频带,如表9-01所示。

临界频带的单位叫Bark(巴克),∙ 1 Bark = 一个临界频带的宽度∙(频率)< 500 Hz的情况下, 1 Bark ≈/100∙(频率) > 500 Hz的情况下, 1Bark ≈ 9 + 4log(/1000)以上我们讨论了响度、音高和掩蔽效应,尤其是人的主观感觉。

其中掩蔽效应尤为重要,它是心理声学模型的基础。

表9-01 临界频带[16]2. 时域掩蔽除了同时发出的声音之间有掩蔽现象之外,在时间上相邻的声音之间也有掩蔽现象,并且称为时域掩蔽。

时域掩蔽又分为超前掩蔽(pre-masking)和滞后掩蔽(post-masking),如图9-05所示。

产生时域掩蔽的主要原因是人的大脑处理信息需要花费一定的时间。

一般来说,超前掩蔽很短,只有大约5~20 ms,而滞后掩蔽可以持续50~200 ms。

这个区别也是很容易理解的。

图9-05时域掩蔽9.2 MPEG Audio与感知特性MPEG Audio标准在本书中是指MPEG-1 Audio、MPEG-2 Audio和MPEG-2 AAC,它们处理10 Hz~20000 Hz范围里的声音数据,数据压缩的的主要依据是人耳朵的听觉特性,使用“心理声学模型(psychoacoustic model)”来达到压缩声音数据的目的。

心理声学模型中一个基本的概念就是听觉系统中存在一个听觉阈值电平,低于这个电平的声音信号就听不到,因此就可以把这部分信号去掉。

听觉阈值的大小随声音频率的改变而改变,各个人的听觉阈值也不同。

大多数人的听觉系统对2 kHz~5 kHz之间的声音最敏感。

一个人是否能听到声音取决于声音的频率,以及声音的幅度是否高于这种频率下的听觉阈值。

心理声学模型中的另一个概念是听觉掩饰特性,意思是听觉阈值电平是自适应的,即听觉阈值电平会随听到的不同频率的声音而发生变化。

例如,同时有两种频率的声音存在,一种是1000 Hz的声音,另一种是1100 Hz的声音,但它的强度比前者低18分贝,在这种情况下,1100 Hz的声音就听不到。

也许你有这样的体验,在一安静房间里的普通谈话可以听得很清楚,但在播放摇滚乐的环境下同样的普通谈话就听不清楚了。

声音压缩算法也同样可以确立这种特性的模型来取消更多的冗余数据。

9.3 MPEG-1 Audio9.3.1 声音编码声音的数据量由两方面决定:采样频率和样本精度。

对单声道信号而言,每秒钟的数据量(位数)=采样频率 样本精度。

要减小数据量,就需要降低采样频率或者降低样本精度。

但是人耳可听到的频率范围大约是20 Hz~20 kHz。

根据奈奎斯特理论,要想不失真地重构信号,采样频率不能低于40 kHz。

再考虑到实际中使用的滤波器都不可能是理想滤波器,以及考虑各国所用的交流电源的频率,为保证声音频带的宽度,所以采样频率一般不能低于44.1 kHz。

这样,压缩就必须从降低样本精度这个角度出发,即减少每位样本所需要的位数。

第3章介绍了线性预测编码(l inear p redictive c oding,LPC)的方法,这种方法主要是针对话音的编码,这种编码方法称为音源特定编码法(source specific methods)。

MPEG-1和MPEG-2的声音压缩采用了另一种方法,称为子带编码(s ub-b and c oding,SBC)方法,这也是一种功能很强而且很有效的声音信号编码方法。

与音源特定编码法不同,SBC不局限于只对话音进行编码,也不局限于哪一种声源。

这种方法的具体思想是首先把时域中的声音数据变换到频域,对频域内的子带分量分别进行量化和编码,然后根据心理声学模型确定样本的精度,从而达到压缩数据量的目的。

MPEG声音数据压缩的基础是量化。

虽然量化会带来失真,但MPEG标准要求量化失真对于人耳来说是感觉不到的。

在MPEG标准的制定过程中,MPEG-Audio委员会作了大量的主观测试实验。

实验表明,采样频率为48 kHz、样本精度为16比特的声音数据压缩到256 kb/s时,即在6:1的压缩率下,即使是专业测试员也很难分辨出是原始声音还是编码压缩后的声音。

MPEG Audio是一个子带编码系统,声音数据压缩算法的根据是心理声学模型,心理声学模型中一个最基本的概念是听觉系统中存在一个听觉阈值电平,低于这个电平的声音信号就听不到。

听觉阈值的大小随声音频率的改变而改变,各个人的听觉阈值也不同。

大多数人的听觉系统对2 kHz~5 kHz之间的声音最敏感。

一个人是否能听到声音取决于声音的频率,以及声音的幅度是否高于这种频率下的听觉阈值。

心理声学模型中的另一个概念是听觉掩饰特性,意思是听觉阈值电平是自适应的,即听觉阈值电平会随听到的频率不同的声音而发生变化。

例如,在一般环境下房间里的普通谈话可以听得很清楚,但在摇滚乐环境下同样的普通谈话就听不清楚了。

声音压缩算法也同样可以确立这种特性的模型,根据这个模型可取消冗余的声音数据。

MPEG Audio的压缩算法框图如图9-06所示。

图9-06 MPEG Audio压缩算法框图Dolby AC-3同样利用人的听觉系统特性来压缩声音数据,它的压缩编码算法框图如图9-07所示。

有兴趣的读者请浏览网址:/stan&rps.html (浏览日期:1999年2月3日)图9-07 Dolby AC-3压缩编码算法框图9.3.2 声音的性能目前,除了Dolby公司的数字声音数据压缩编码算法AC-3(A udio C ode N umber 3)之外,其他的声音压缩算法主要是针对话音。

相关文档
最新文档