多媒体技术教程-2

合集下载

多媒体技术应用教程2

9
2.1.1 人类听觉特性
3．响度和响度级响度（Loudness）人耳感受声音强弱的主观感觉响度（Loudness）是人耳感受声音强弱的主观感觉程度，这种感觉与音强、频率和波形都有关系，程度，这种感觉与音强、频率和波形都有关系，其度量单位为宋（Sone），），定义一个声压级为其度量单位为宋（Sone），定义一个声压级为 40dB，频率为1kHz的纯音的响度为1Sone 1kHz的纯音的响度为1Sone。 40dB，频率为1kHz的纯音的响度为1Sone。响度级（ Level）响度级（Loudness Level）是指某响度与基准响度相比的等级，其度量单位为方（Phon），定义1kHz ），定义比的等级，其度量单位为方（Phon），定义1kHz 纯音的响度级为1Phon 1Phon。纯音的响度级为1Phon。
17
2.1.2 数字音频音频信号是时间和幅度都连续变化的一维模拟信号时间和幅度都连续变化的一维模拟信号，音频信号是时间和幅度都连续变化的一维模拟信号，要想在计算机中对它进行处理，要想在计算机中对它进行处理，就要将它变成时间和幅度都是离散的数字信号，所以数字音频是间和幅度都是离散的数字信号，所以数字音频是指音频信号经过离散化处理后再用一系列的数字来表示的信号，其特点是保真度好，动态范围大。来表示的信号，其特点是保真度好，动态范围大。数字音频可分为波形声音语音和音乐。波形声音、数字音频可分为波形声音、语音和音乐。波形声音实际上包含了所有的声音形式，实际上包含了所有的声音形式，因此数字音频有时也泛称为声音。时也泛称为声音。
7
听阈图2-1 听阈-频率曲线
8
2.1.1 人类听觉特性
2．音调音调（Pitch）在物理学中是指声音的高低声音的高低，音调（Pitch）在物理学中是指声音的高低，实际上就是指人耳对不同频率声音的一种主观感受。就是指人耳对不同频率声音的一种主观感受。音调主要由声音的频率决定，调主要由声音的频率决定，同时也与声音强度有频率高的声音，人感觉其音调也较高，关。频率高的声音，人感觉其音调也较高，反之人感知音调低的声音其频率也低。，人感知音调低的声音其频率也低。对音调可以进行定量的判断，其度量单位为美（对音调可以进行定量的判断，其度量单位为美 Mel），定义一个声压级为40dB 频率为1kHz ），定义一个声压级为40dB， 1kHz的 Mel），定义一个声压级为40dB，频率为1kHz的纯音的音调为1000Mel 1000Mel。纯音的音调为1000Mel。

《多媒体技术》第二讲多媒体数据压缩技术(第1—2节)课堂笔记及练习题

多媒体技术第二讲多媒体数据压缩技术（第1—2节）课堂笔记及练习题主题：第二讲多媒体数据压缩技术（第1—2节）学习时间： 4月4日--4月10日内容：第二讲多媒体数据压缩技术第一节多媒体数据和信息转换一、多媒体间的信息转换为了便于交流信息，需要对不同的媒体信息进行转换。

下表是部分媒体之间说明：＊易＊＊较困难＊＊＊很困难二、多媒体数据文件格式多媒体文件的格式很多，下表介绍常用文件格式的特点和应用场合。

三、多媒体数据的信息冗余多媒体计算机系统主要采用数字化方式，对声音、文字、图形、图像、视频等媒体进行处理。

数字化处理的主要问题是巨大的数据量。

一般来说，多媒体数据中存在以下种类的数据冗余：1）空间冗余：一些相关性的成像结构在数字化图像中就表现为空间冗余。

2）时间冗余：两幅相邻的图像之间有较大的相关性，这反映为时间冗余。

3）信息熵冗余（编码冗余）：信息熵是指一组数据所携带的信息量。

如果图像中平均每个像素使用的比特数大于该图像的信息熵，则图像中存在冗余，这种冗余称为信息熵冗余。

4）结构冗余：有些图像从大域上看存在着非常强的纹理结构，例如布纹图像和草席图像，我们说它们在结构上存在冗余。

5）知识冗余：有许多图像的理解与某些基础知识有较大的相关性。

这类规律性的结构可由先验知识和背景知识得到，我们称此类冗余为知识冗余。

6）视觉冗余：人类视觉系统对于图像场的任何变化，并不是都能感知的。

这类冗余我们称为视觉冗余。

7）其他冗余：例如由图像的空间非定常特性所带来的冗余。

以上所讲的是多媒体数据的信息冗余。

设法去掉信号数据中的冗余，就是数据压缩。

第二节常用的数据压缩技术一、数据压缩编码方法1）根据解码后数据与原始数据是否完全一致来进行分类：① 可逆编码(无失真编码)，如Huffman编码、算术编码、行程长度编码等。

② 不可逆编码(有失真编码)，常用的有变换编码和预测编码。

2）根据压缩的原理进行划分：① 预测编码：它是利用空间中相邻数据的相关性，利用过去和现在出现过的点的数据情况来预测未来点的数据。

《多媒体技术教程(第三版)》课后习题答案

《多媒体技术教程(第三版)》课后习题答案《多媒体技术教程》（第三版）习题解答第1章绪论1．多媒体信息系统和多媒体计算机有什么不同？在概念上应如何看待两者之间的关系？多媒体信息系统是新一代高度集成的、功能强大的、智能化的计算机信息系统，它是提供多媒体信息、辅助人们对环境进行控制和决策的系统，是基于计算机、通信网络等现代化的工具和手段，服务于管理领域的信息处理系统。

而多媒体计算机指的是硬件设施，多媒体计算机是多媒体信息系统得以应用的平台。

2．试归纳叙述多媒体关键特性以及这些特性之间的关系。

多媒体的关键特性主要包括信息载体的多样性、交互性和集成性这三个方面，这既是多媒体的主要特征，也是在多媒体研究中必须解决的主要问题。

信息载体的多样性是相对于计算机而言的，指的就是信息媒体的多样化，有人称之为信息多维化；多媒体的第二个关键特性是交互性，多媒体系统将向用户提供交互式使用、加工和控制信息的手段，为应用开辟更加广阔的领域，也为用户提供更加自然的信息存取手段；多媒体的集成性主要表现在两个方面，一是多媒体信息媒体的集成，二是处理这些媒体的设备与设施的集成。

信息载体的多样性是集成性的基础，没有多种信息媒体，也就无法进行多媒体信息的集成化处理；而处理多媒体的设备与设施的集成性是实现交互性的前提，没有系统、网络、软硬件设施的集成，就无法为用户交互式使用、加工和控制信息提供平台。

3．为什么说多媒体缩短了人类信息交流的路径？人类与计算机进行信息交流的目的是什么？与以往的方法相比，计算机在数据处理方面有了很大的改善。

计算机所提供的功能强大的数据组织和构造技术，如传统数据结构中的数组、向量、队列、堆栈、树和堆等，为动态地加工和处理数据提供了基础。

高效的算法和高速的网络通信，大大地加强了用文字和数据表示概念的能力并加速了它的传递过程。

但人类并不是仅仅依赖文本这一类单一的数据形式来传递所有的信息和接受概念的，图像、声音等多媒体信息都是人类获取和传递信息极为重要的渠道。

多媒体技术教程课后习题答案

第1章多媒体技术概要1.1 多媒体是什么？多媒体是融合两种或者两种以上媒体的一种人-机交互式信息交流和传播媒体。

使用的媒体包括文字、图形、图像、声音、动画和视像(video ）。

1。

4 无损压缩是什么?无损压缩是用压缩后的数据进行重构（也称还原或解压缩)，重构后的数据与原来的数据完全相同的数据压缩技术.无损压缩用于要求重构的数据与原始数据完全一致的应用，如磁盘文件压缩就是一个应用实例.根据当前的技术水平,无损压缩算法可把普通文件的数据压缩到原来的1/2～1/4。

常用的无损压缩算法包括哈夫曼编码和LZW 等算法.1。

5 有损压缩是什么？有损压缩是用压缩后的数据进行重构，重构后的数据与原来的数据有所不同，但不影响人对原始资料表达的信息造成误解的数据压缩技术。

有损压缩适用于重构数据不一定非要和原始数据完全相同的应用。

例如,图像、视像和声音数据就可采用有损压缩，因为它们包含的数据往往多于我们的视觉系统和听觉系统所能感受的信息,丢掉一些数据而不至于对图像、视像或声音所表达的意思产生误解。

1。

9 H.261~H.264和G.711~G 。

731是哪个组织制定的标准？国际电信联盟（ITU ）.1.10 MPEG —1，MPEG-2和MPEG —4是哪个组织制定的标准？ISO/IEC ，即国际标准化组织(ISO)/ 国际电工技术委员会(IEC)。

第2章无损数据压缩2。

1假设{,,}a b c 是由3个事件组成的集合，计算该集合的决策量。

（分别用Sh ，Nat 和Hart作单位）。

H 0 = (log 23) Sh = 1.580 Sh= (log e 3) Nat = 1.098 Nat= (log 103) Hart = 0.477 Hart2.2 现有一幅用256级灰度表示的图像，如果每级灰度出现的概率均为()1/256i p x =，0,,255i =，计算这幅图像数据的熵.22111()()log ()256(log )256256n i i i H X p x p x ==-=-⨯⨯∑=8 (位），也就是每级灰度的代码就要用8比特,不能再少了。

多媒体技术课后答案

《多媒体技术及应用》习题参考答案第1章多媒体技术概论1．什么是多媒体？答：使用计算机交互式综合技术和数字通信网络技术处理多种表示媒体——文本、图形、图像和声音，使多种信息建立逻辑连接，集成为一个交互式系统。

2．多媒体技术中的主要多媒体元素有哪些？答：图形、图像、文本、动画、音频、视频等。

3．什么是多媒体技术？什么是多媒体计算机？简述多媒体技术的主要特点。

答：多媒体技术可以定义为：计算机综合处理文本、图形、图像、音频与视频等多种媒体信息，使多种信息建立逻辑连接，集成为一个系统并且具有交互性。

多媒体计算机是指具有多媒体处理功能的计算机。

多媒体技术的主要特点有：集成性、实时性、交互性、媒体的多样性等。

4．多媒体计算机标准的意义是什么？答：对于技术开发人员而言是用来指导多媒体个人计算机及其软件的设计规范；对于用户而言，是把现有PC机升为MPC的指导原则；对于经销商而言，可作为多媒体的性能及兼容性的尺度。

5．简述多媒体系统的组成。

答：一般多媒体系统由多媒体硬件系统、多媒体软件系统两个部分组成。

硬件是多媒体系统的物质基础，是软件的载体，软件是多媒体系统的核心，两者相辅相成，缺一不可。

6．试从实例出发，谈谈多媒体技术的应用对人类社会的影响。

略7．谈谈你如何看待多媒体技术的发展前景。

略8．选择题。

（1）音频卡是按（）分类的。

（A）采样频率（B）声道数（C）采样量化位数（D）压缩方式（2）一个用途广泛的音频卡应能够支持多种声源输入，下列（）是音频卡支持的声源。

①话筒②线输入③CD Audio ④MIDI（A）仅①（B）①②（C）①②③（D）全部（3）（）是MPC 对视频处理能力的基本要求。

①播放已压缩好的较低质量的视频图象②实时采集视频图象③实时压缩视频图象④播放已压缩好的高质量分辨率的视频图象（A）仅①（B）①②（C）①②③（D）全部（4）（）是MMX 技术的特点。

①打包的数据类型②与IA 结构安全兼容③64 位的MMX 寄存储器组④增强的指令系统（A）①③④（B）②③④（C）①②③（D）全部（5）下列关于触摸屏的叙述（）是正确的。

多媒体技术基础知识复习专题二[复制]

多媒体技术基础知识复习专题二［复制］第三章多媒体信息的类型及其特征；第四章图形图像的采集与加工1.常见的各种媒体信息有：文本、图形、图像、声音、动画、视频等文本是现实生活中使用得最多的一种信息存储和传递方式，文字表达的信息给人充分的想象空间，它主要用于对知识的描述性表示。

图像是多媒体作品中最重要的信息表现形式之一，它是决定一个多媒体作品视觉效果的关键因素。

声音能直接、清晰地表达意义，引起使用者的注意。

动画可以使我们要表现的内容更加生动，还可以反抽象的、难以理解的内容形象化。

视频影像具有时序性与丰富的信息内涵，常用于丰富的信息内涵，常用于交代事物的发展过程。

2.各种媒体在计算机中的表示：文本：文本字符编码一般为ASCII码，简体汉字GB2312-80,一个汉字占两个字节存储空间。

思考：计算机中汉字存储占2字节空间，一张软盘容量为1.44MB,请问理论上一张软盘可以存储多少个汉字1,44MB*1024*1024/2=754974位图图像：是由像素构成的，适用于逼真照片或要求精细细节的图像。

位图放大缩小后会丢失其中的细节并会呈现锯齿状。

图像分辨率是指图像的水平方向和垂直方向的像素个数。

一般来说，分辨率愈高，图像愈细腻，图像文件也越大。

由于一幅位图的分辨率是确定的，所以对其进行放大时，会出现马赛克现象图像量化位数是指图像中每个像素点记录颜色所用二进制数的位数，它规定了彩色图像中可出现的最多颜色数，或者灰度图像中的最大灰度等级数。

往往把量化位数说成是图像深度或像素深度。

表示一个像素的位数越多，能表达的颜色数目就越多。

二进制位代表图像颜色的数量8位图有：28=256种颜色，16位图有：2^=65536种颜色，32位图有：232=4294967296种颜色位图量化：文件的字节数=图像X方向的像素数xY方向的像素数x图像量化位数/8。

例1：一幅像素为640x480的256色(8位)图像文件大小:640x480x8^8=300KB例2：一幅1024x768的RGB8：8：8真彩色图像文件大小1024x768x24/舐2.4MB单位换算:1GB=1O24MB1MB=1O24KB1MB=1024KB1KB=1O24BIB位bit静态图像压缩标准：JPEG(JointPhotographicExpertsGroup)常见的位图文件：*.bmp,*.JPG,*.psd,*.gif矢量图形：是以指令集合的形式来描述的。

多媒体技术及应用数字音频技术02

特点：在低速的广域网上实时传输音频
4. WMA文件
WMA(Windows Media Audio)是 Windows Media格式中的一个子集(音频格式)。
特点：压缩到MP3一半
多媒体技术及应用数字音频技术02
2-11
2.1 数字音频基础
5. MIDI和RMI文件 MIDI(乐器数字接口)是由一组音乐、乐谱或乐器符号的数字集合。特点：播放效果与硬件相关，数据量很小，音质不高、音色单调等 6.VOC文件创新公司开发的声音文件格式，由文件头块和音频数据块组成。
音乐是符号化的声音。
多媒体技术及应用数字音频技术02
2.1 数字音频基础
二、声音的数字化 1.声音信号的类型模拟信号(自然界、物理) 数字信号(计算机) 2.声音数字化过程
模拟信号
采样
量化
编码
数字信号
模拟信号
A/D ADC D/A DAC
数字信号
多媒体技术及应用数字音频技术02
2.1 数字音频基础
霍夫曼编码、算术编码、行程编码 ②有损压缩
波形编码--PCM、DPCM、ADPCM 子带编码、矢量量化
参数编码--LPC 混合编码--MPLPC、CELP
多媒体技术及应用数字音频技术02
2.2 数字音频压缩标准
二、音频压缩技术标准
分类
电话语音质量
调幅广播质量高保真立体声
标准 G.711 G.721 G.723 G.728
多媒体技术及应用数字音频技术02
2020/11/14
多媒体技术及应用数字音频技术02
第二章数字音频技术
2.1 数字音频基础 2.2 数字音频压缩标准 2.3 声卡与电声设备 2.4 MIDI与音乐合成 2.5 音频编辑软件 2.6 语音识别技术本章小结

slide2

-- load an MPEG file extFileName of MediaPlayer "theMpegPath" = "c:\windows\media\home33.mpg"; -- play extPlayCount of MediaPlayer "theMpegPath" = 1; -- put the MediaPlayer in frames mode (not time mode) extDisplayMode of MediaPlayer "theMpegPath" = 1; -- if want to start and end at specific frames: extSelectionStart of MediaPlayer "theMpegPath" = 103; extSelectionEnd of MediaPlayer "theMpegPath" = 1997; -- start playback get extPlay() of MediaPlayer "theMpegPath";
(c) A color contrast program: If the text color is some triple (R,G,B), a legible color for the background is that color subtracted from the maximum (here assuming max=1): (R, G, B) ⇒ (1 − R, 1 − G, 1 − B) (2.1)
4
Li & Drew c Prentice Hall 2003

《计算机应用基础》多媒体技术基础二

一、数字音频信息处理1．声音信号的基本知识①模拟信号声音信号是典型的连续信号，不仅在时间上是连续的，而且在幅度上也是连续的。

在时间上“连续”是指在一个指定的时间范围里声音信号的幅值有无穷多个，在幅度上“连续”是指幅度的数值有无穷多个。

我们把在时间和幅度上都是连续的信号称为模拟信号。

声音信号两个基本参数是频率和幅度。

信号的频率是指信号每秒钟变化的次数，用Hz（赫兹）表示。

人的听觉器官能感知的声音频率大约在20～20000Hz之间。

图7-2-1 声音的采样和量化②数字信号在某些特定时刻对这种模拟信号进行测量叫做采样，由这些特定时刻采样得到的信号称为离散时间信号。

采样得到的幅值是无穷多个实数值中的一个，因此，幅度还是连续的。

如果把信号幅度取值的数目加以限定，这种由有限个数值组成的信号就称为离散幅度信号。

我们把时间和幅度都用离散的数字表示的信号就称为数字信号。

2．声音信号数字化声音进入计算机的第一步就是数字化，数字化实际上就是采样和量化。

如前所述，连续时间的离散化通过采样来实现，就是每隔一定时间间隔对模拟波形上取一个幅度值，把时间上的连续信号变成时间上的离散信号。

该时间间隔为采样周期，其倒数为采样频率，即每秒钟的采样次数，采样频率超高，数字化音频的质量也超高，越能反映声音的真实性，数据量了越大。

实际中常采用40.1kHz作为高质量声音的采样标准。

连续幅度的离散化通过量化来实现，量化是将每个采样点得到的幅度值以数字存储，量化位数（也即采样精度）表示存放采样点振幅值的二进制数，它决定了模拟信号数字化以后的动态范围。

通常量化位数有8位、16位等，分别表示28、216个等级。

在相同的采样频率下，量化位数越大，则采样精度越高，声音的质量也越好，信息的存储量也越大。

将采样与量化后的数字数据以一定的格式记录下来就是编码。

编码的方式很多，常用的编码方式是脉冲编码调制（Pulse Code Modulation，PCM），主要优点是搞干扰能力强，失真小，传输特性稳定。

高中信息技术《多媒体技术应用》课件选修22024新版

动画与视频是多媒体作品中最具表现力的元素之一，可以生动地展示动态过程和场景，提高作品的吸引力和趣味性。
文本图形与图像
声音动画与视频
文本是多媒体作品中最基本的元素之一，可以提供详细的信息和描述，是其他媒体元素的基础。
声音是多媒体作品中的关键元素之一，可以提供丰富的听觉体验，增强作品的表现力和感染力。
多媒体技术发展
多媒体技术经历了从单一媒体到多媒体、从单机到网络、从专业到普及的发展历程，目前已经成为信息社会的重要基础设施。
多媒体技术应用领域
教育与培训
娱乐与游戏
多媒体技术广泛应用于远程教育、在线学习、课堂教学、职业培训等领域，提供了丰富的教学资源和交互式的学习环境。
多媒体技术为娱乐和游戏产业提供了强大的技术支持，包括音乐、电影、电视、游戏等方面。
高中信息技术《多媒体技术应用》课件选修2
目录
• 多媒体技术应用概述 • 图像处理技术 • 音频处理技术 • 视频处理技术 • 动画设计技术 • 多媒体技术应用实践
01
多媒体技术应用概述
Chapter
多媒体技术定义与发展
多媒体技术定义
多媒体技术是指利用计算机对文本、图形、图像、声音、动画、视频等多种信息综合处理、建立逻辑关系和人机交互作用的技术。
02
图像处理技术
Chapter
图像类型与格式
图像类型
包括位图图像和矢量图像两种类型。位图图像由像素点组成，放大后会出现锯齿状失真；矢量图像由数学公式描述，可无限放大而不失真。
图像格式
常见的图像格式有JPEG、PNG、GIF、BMP等。JPEG格式适合存储照片和复杂图像，支持有损压缩；PNG格式支持透明背景和无损压缩，适合存储图标和简单图像；GIF格式支持动画和透明背景，适合存储动态图像；BMP 格式是Windows系统下的标准图像格式，不支持压缩。

多媒体技术CAI教程2

多媒体技术教程第二章多媒体OLE 编程技术与程序的多维运行模式编著者：杨安祺编著单位：陕西科技大学2.4 多媒体电子讲演稿powerpoint 的OLE 编程技术应用2.3 多媒体OLE 编程技术所产生的软件性能分析 2.2 多维性运行模式的分级编程 2.1 多媒体OLE 编程技术第二章多媒体OLE 编程技术与程序的多维运行模式2.5 本章小节练习题目录第二章多媒体OLE编程技术与程序的多维运行模式OLE是Object Linking and Embedding的缩写，中文含义是对象的链接与嵌入。

由于计算机硬件设备的不断更新，计算机视窗操作系统多任务环境的不断发展，为我们用多媒体OLE编程技术提供了强大的支持环境。

一大批优秀的多媒体编辑、集成软件应运而生。

本章将结合OLE技术，重点讲述电子讲稿POWERPOINT编程方法。

2.1多媒体OLE编程技术多媒体OLE技术就是实现不同软件之间无缝集成，编程人员把以前编好、测试过的一些模块以对象的方式链接与嵌入到正在编写的程序中。

这样就把许多复杂的编程过程变的简单容易了。

在视窗化编程环境下，许多多媒体集成软件都采用以OLE技术为基础的编程方法。

这种编程方法的第一步，是根据任务的要求，设计出大的流程框架。

第二步，再对每一个流程框架，链接或者嵌入外部对象，编制一套或者数套演播方案，并逐一进行调试，演播方案通常称为场景设计。

第三步，在设计完每个流程框架后，进行总体的调试。

观察各运行模式工作是否协调，混成效果是否满意。

第四步，完成总体调试后，对设计内容进行打包，压缩，编码等项工作，然后封装软件，或者形成运行文件，刻录光盘，交付给用户使用。

2.2多维性运行模式的分级编程多媒体技术具有处理信息范围的空间扩展和放大能力，利用多媒体技术能将输入的信息加以变换加工，增加输出信息的表现能力，使显示效果有声有色、生动逼真。

其本身就是一个信息空间的多维性运行。

这就给流程框架提供了一个分级编程的方式，这种分级编程方式，也可以称为跨平台开发。

多媒体技术基础--单元2

– 第二节报到手续
• 报到手续 • 户籍关系的迁转
– 第三节改派手续
• 毕业生办理改派 • 有效证件丢后的补办程序
2019/12/29
17
第四篇求职过程
– 第四节人事代理
• 人事代理和人事代理机构 • 人事代理的服务内容 • 毕业生的人事代理程序 • 毕业生办理人事代理后可享受的待遇 • 人事代理应注意的事项
2019/12/29
30
– 第三节岗位适应
• 一、正确认识岗位适应的过程 • 二、掌握岗位适应的技巧 • 三、建立和谐人际关系，尽快融入集体 • 四、养成良好个人品德和职业道德 • 五、抓紧时间学习，提升自身工作技能 • 六、仔细观察，决定自己发展方向
– 思考题：
2019/12/29
23Biblioteka 第五篇职业适应与发展第十一章职业发展
2019/12/29
5
第二篇职业发展规划
– 第三节性格与职业
• 性格自我测定 • 性格与职业组合搭配
– 第四节兴趣与职业
• 职业期望
– 案例：个人职业期望讨论。
第三章职业规划
– 第一节职业方向
• 职业生涯 • 如何确定职业方向 • 职业生涯规划对职业成功的意义 • 明确职业定位和方向
• 一、培养良好的身心素质 • 二、了解环境，进入角色
– 第二节知识素质
• 拓展知识视野，完善知识结构 • 锻炼培养适应择业需要的实践能力
– 第三节职业道德
• 职业道德的特点和基本规范 • 职业道德的行为养成
2019/12/29
9
第三篇提高就业能力
– 第四节专业技能
• 认识专业 • 学习专业知识 • 掌握专业技能

多媒体技术基础与实验教程2

作为新一代的高性能串行总线标准， 1394的主要性能作为新一代的高性能串行总线标准，IEEE 1394的主要性能特点如下：特点如下：数字接口热插拔即插即用总线结构速度快兼容性好接口设备对等（peer-to-peer）接口设备对等（peer-to-peer）物理体积小，制造成本低，物理体积小，制造成本低，易于安装非专利性
音频设备音频处理的基本设备是声卡，负责采集、加工、处理波表、音频处理的基本设备是声卡，负责采集、加工、处理波表、MIDI等等多种形式的音频素材。多种形式的音频素材。图像设备负责采集、加工、处理各种格式的图像素材。处理图像，负责采集、加工、处理各种格式的图像素材。处理图像，一般不需要特殊的配置，仅需要软件即可。特殊的配置，仅需要软件即可。视频设备负责采集、编辑计算机动画和视频素材。负责采集、编辑计算机动画和视频素材。存储设备多媒体信息数据量很大，长期保存在硬盘也不现实，多媒体信息数据量很大，长期保存在硬盘也不现实，而且多媒体软件的发行需要一种高容量、移动方便的存储介质，即光盘。的发行需要一种高容量、移动方便的存储介质，即光盘。
2.1 多媒体系统的组成
一台计算机如果具备了处理多媒体信息的硬件和适当的软件系统，就可以说这台计算机具有多媒体功能。系统，就可以说这台计算机具有多媒体功能。具有多媒体功能的计算机有大型、中型、小型和微型等计算机系统，计算机有大型、中型、小型和微型等计算机系统，其中我们接触到的使用最广的是微型计算机系统，即多媒体个人计算机MPC MPC。到的使用最广的是微型计算机系统，即多媒体个人计算机MPC。 MPC是具有多媒体处理功能的个人计算机， MPC是具有多媒体处理功能的个人计算机，可对各种媒体进行是具有多媒体处理功能的个人计算机数字化处理，包括硬件和软件两个部分。数字化处理，包括硬件和软件两个部分。

多媒体技术应用选修2知识点

信息技术学测考试复习资料第一章认识多媒体技术1.多媒体技术的定义多媒体技术是计算机交互式综合处理多种媒体信息──文本、图形、图像和声音，使多种信息建立逻辑连接，集成为一个系统并具有交互性的技术。

2.多媒体技术的特征多媒体技术主要有如下特征：数字化、集成性、多样性、交互性、非线性、实时性和协同性。

(1) 数字化各种媒体信息处理为数字信息后，计算机就能对数字化的多媒体信息进行存储、加工、控制、编辑、交换、查询和检索。

所以多媒体信息必须是数字信息。

(2）集成性集成性是指以计算机为中心综合处理多种信息媒体，它包括信息媒体的集成和处理这些媒体的设备的集成。

信息媒体的集成如文本、图像、声音、视频等的集成，这些媒体在多任务系统下能够很好地协同工作，有较好的同步关系。

多媒体设备的集成包括硬件和软件两个方面。

(3）多样性多样性指两个方面，一方面指多样性的信息，信息载体也随之多样化。

多样化的信息载体包括：磁盘介质、磁光盘介质和光盘介质等物理介质载体，以及人类可以感受的语音、图形、图像、视频、动画等媒体。

早期的计算机只能处理数值、文字等单一的信息媒体，而多媒体计算机则可以综合处理文字、图形、图像、声音、动画和视频等多种形式的信息媒体。

另一方面是指多媒体计算机在处理输入的信息时，不仅仅是简单获取和再现信息，如声像信号的输入与输出，若二者完全一样，那只能称之为记录和重放，从效果上来说并不是很好，如果能根据人的构思、创意，进行交换、组合和加工来处理文字、图形及动画等媒体，就能大大丰富和增强信息的表现力，具有充分自由的发展空间，达到更生动、更活泼、更自然的效果。

(4) 交互性交互是指通过各种媒体信息，使参与的各方都可以对媒体信息进行编辑、控制和传递。

多媒体技术的最大特点是交互性，通过交互，可以实现人对信息的主动选择和控制，而交互性是多媒体作品与一般影视作品的主要区别，如传统电视系统的媒体信息是单向流通的，电视台播放什么内容，用户就只能接收什么内容。

多媒体技术原理及应用二

多媒体技术原理及应⽤⼆多媒体信息存储特点:多媒体信息存在和表现有多种形式.多媒体信息量⼤.光盘系统特点:(1)与硬盘相⽐,具有可拆卸性;容量相当;驱动器较贵,但盘⽚便宜;读写速度慢.(2)与磁带相⽐,具有容量⼤,随机存取性强的优点.(3)激光头与介质⽆接触,不受环境影响⽽退磁,信息保存时间长,可达30年以上.光盘按读写功能的分类:CD-ROM只读光盘WORM⼀次写多次读光盘(write once read many)Rewritable可重写光盘DVD(digital video disc)光盘⼯作原理:只读光盘读原理,只读光盘上的信息沿着盘⾯螺旋形状的信息轨道以凹坑和凸区的形式记录的.凹凸交界的正负跳变沿均代表数字"1",两个边缘之间代表数字"0"数字信息记录的优点是抗⼲扰能⼒强,由于盘⽚损坏或变脏⽽造成的读出错误也容易得到纠正.按照改变性质来实现信息存储的原理来分,光盘记录⽅式可分为两⼤类:磁光式和相变式.磁光式写操作⽅法:居⾥点记录和补偿点记录.相变式写过程是把记录介质的信息点从晶态转变为⾮晶态.CD-DA是CD的最基本标准. Red Book,特定的地址标记,其单位为"分","秒","扇区",1分=60秒,1秒=75扇区.光盘总长度为74分.错误的检测和校正采⽤的是 CIRC(cross interleave Reed-Solomon code)CD-ROW ,Yellow Book,采⽤常线速(const linear velocity,CLV)伺服⽅式.MTBF(mean time between failures)可录CD(recordalbe compact disc),Orange BookCD-I,Green BookVideo CD ,White Book错误检测码:error detection code ,EDC错误校正码:error correction code,ECC信息扇区:message sector光盘符号由3个记录构成:⽂件结构卷描述符(file structure volume descriptor)引导记录(boot record)终结记录(terminator record)视盘有两种信息记录格式:常线速(const linear velocity,CLV)常⾓速(costant angular velocity,CAV)DVD光盘:容量最⾼的双层双⾯盘可达17GB,单⾯单层4.7GB.存储133分钟的MPEG-2视频.⾳频卡的主要功能:数字化声⾳处理混⾳器合成器variable length coder可变长编码器block storage unit元块存储microcode宏码⽬前,⼤多数扫描仪采⽤的光电转换部件是CCD(电荷耦合器件)扫描仪分为:平板式,⼿持式,滚动式.监视器:monitor适配器:adaptor触摸屏包括三个部分:传感器,控制部件,驱动程序触摸屏按⼯作原理可分为:红外线触摸屏,电阻式触摸屏,电容式触摸屏,表⾯声波技术和底座式⽮量压⼒触摸屏.多媒体个⼈机(multimedia personal computer,MPC)基本的硬件结构:(1)⼀个功能强⼤,速度快的中央处理器CPU(2)⼤容量的存储器空间(3)⾼分辨率显⽰接⼝与设备(4)可处理⾳响的接⼝与设备(5)可存放⼤量数据的配置等CD-I系统是家⽤交互式多媒体系统.管理程序主要有:光盘⽂件管理模块CDFM(compact disc file manager)⽤户通信管理模块UCM(user communication manager)⾮易失RAM⽂件管理模块NRF(nonvolatile RAM file manager)流式⽂件管理模块PFM系统状态描述符CSD(configuration status descriptor)⽂件保护模块FPM(file protection mechanism)VCD有三个核⼼部分组成:CD驱动器或称CD加载器MPEG解码器微控制器DVD播放系统的组成:DVD盘读出机构DVD-DSP数字声⾳/视频解码器微处理器多媒体应⽤软件的开发过程(1)明确使⽤对象,了解⽤户需求(2)选择开发⽅法(3)准备多媒体数据(4)完成系统集成常⽤的识别输⼊⽅法是OCR扫描识别.计算机处理的⾳频种类包括波形⾳频(waveform audio)和MIDI⾳频.除了⼈类说话的声⾳和⾳乐,我们称其他的⾳频信号为噪声.⼈类听⼒所接受的频率:20HZ-20KHZCD标准的44100HZ采样率(sampling rate)MIDI也定义⾳频的形态与存储的⽅法,MIDI的⾳频是以消息的⽅式⽽⾮波形的⽅式组成.遥控键盘remote keyboardMIDI⾳频⽂件是⼀串的时序命令(time-stamped commands)它记录下⾳乐的⾏为.如按下钢琴键,踩踏板.⽬前国际上对视频的处理标准主要有:NTSC(National Television Standard Committee)美国研制的NTSC制式是⽬前最久和最⼴泛使⽤的电视制式,每秒30帧PAL(Phase Alternating Line)中国和英国采⽤的制式,每秒25帧SECAM(Sequential Color and Memory)法国和俄罗斯采⽤的.在多媒体数据中,⽆法从客观世界直接摄取的可视信息,就可有图形技术来制作,这些数据主要包括⽂字,图形,动画.动画是图形对象赋予运动属性后制作的连续画⾯效果.图形⽂件的格式通过图形原语和它们的属性来描述.计算机动画研究内容:运动控制⽅法运动学⽅法动⼒学⽅法随机⽅法⾏为规则⽅法⾃动运动控制中间画⾯的⽣成技术:关键帧⽅法,算法⽣成,基于物理的⽣成多媒体开发和创作环境具有功能:提供多媒体程序编程的环境超⽂本,超媒体和多媒体数据管理的功能⽀持多媒体数据的输⼊和输出应⽤连接功能多媒体数据制作功能友好的⽤户界⾯多媒体编著⼯具或称创作⼯具是⼀种⾼级的软件程序或命令集合.按照节⽬组织和安排数据的⽅式分成5类:以卡或页为基础的编著⼯具 ToolBook以图符为基础,基于事件的编著⼯具 Authorware以时间为基础的编著⼯具 action!以传统程序语⾔为基础的编著⼯具 C,Basic其它专⽤编著⼯具要对多媒体数据进⾏有效的管理,就需要建⽴⼀个多媒体数据管理环境,包括:存储环境,传输环境,软件环境多媒体数据的存储环境:可更换的硬盘,磁带备份介质,光盘档案⼈质,磁盘阵列.MDBMS系统提供的数据类型:text,binary ,image.MDBMS影响:(1)数据量⼤且媒体之间差异也⼤,从⽽影响数据库中的组织和存储⽅法(2)媒体各类的增多增加了数据处理的难度(3)多媒体不仅改变了数据库的接⼝,使其声⽂图并茂,⽽且也改变了数据库的操作形式,其中最重要的是查询机制和查询⽅法.(4)传统的事务⼀般都短⼩精悍,在多媒体数据库管理系统中也应尽可能使⽤事务.(5)多媒体数据库管理还有考虑版本控制问题.MDBMS的组织结构⼀般分为三种:集成型,主从型,协作型.模型扩充主要技术策略:使关系数据库管理技术和操作系统中⽂件系统功能相结合,实现对⾮格式化数据的管理.将关系元组中格式化数据和⾮格式化数据装在⼀起形成⼀个完整的元组,放在数据页⾯或数据页⾯组中.将元组中⾮格式化数据分成两部分.⼀部分是格式化数据本⾝,另⼀部分是对⾮格式化数据的引⽤.动态注释:dynamic memo格式注释:formatted memo图形:graphic⾯向对象在⽀持多媒体应⽤⽅⾯具有⾃⼰独特的优点:⾯向对象模型⽀持"聚合"与"概括"的概念,从⽽更好地处理多媒体数据等复杂对象的结构定义.⾯向对象模型⽀持抽象数据类型和⽤户定义的⽅法,便于数据库系统⽀持定义新的数据类型的操作.⾯向对象系统的数据抽象,功能抽象与消息传递的特点使对象在系统中是独⽴的,具有良好的封闭性,封闭了多媒体数据之间的类型及其他⽅⾯的巨⼤差异,并且容易实现并进⾏处理,也便于系统模式的扩充和修改.⾯向对象系统的对象类,类层次和继承性的特点,因⽽避免了关系数据库中讨论的各种异常.⾯向对象系统的查询语⾔通常是沿着系统提供内部固有联系进⾏的,避免了⼤量的查询优化⼯作.总之,⾯向对象的数据模型允许现实世界的对象以更接近于⽤户思维的⽅式来描述,⽽且具有描述和处理聚集层次,概括层次的能⼒.能⽀持抽象数据类型和⾏为,可扩充性和可共享性好,适宜于表⽰和处理多媒体信息,也适宜于多媒体数据库中各种媒体数据的存取与不同操作的实现.基于内容检索技术的特点:从媒体内容中提取信息线索,直接对媒体进⾏分析,抽取特征(如基于表达式)提取特征⽅法多种多样.⼈机交互基于内容的检索采⽤⼀种近似的匹配技术.实现基于内容的检索系统主要有两种途径:⼀是基于传统的数据库检索⽅法.采⽤⼈⼯⽅法将多媒体信息内容表达为属性(关键词)集合,再在传统的数据库管理系统框架内处理⼆是基于信号处理理论.采⽤特征抽取和模式识别的⽅法来克服基于数据库⽅法的的局限性.特征匹配是基于内容检索的关键.MPEG-7:正式标准名称:多媒体内容描述接⼝(multimedia content description interface)描述模式:description scheme,DS描述定义语⾔:description definition language ,DDL是MPEG-7的核⼼MPEG坚持"制定最少的最有⽤的"原则.超⽂本(hypertext)结构采⽤⼀种⾮线的⽹状结构结构组织块状信息.超⽂本是由信息结点和表⽰信息结点间相关性的链构成的⼀个具有⼀定逻辑结构和语义的⽹络.结点为基本单元.第⼆代超⽂本系统与多媒体技术结合起来,为强调系统处理多媒体信息的能⼒⽽称为超媒体(hypermedia)系统,即超媒体=多媒体+超⽂本.超⽂本抽象机(hypertext abstract machine)HAM模型把超⽂本系统分为三个层次:⽤户界⾯层,超⽂本抽象机层,数据库层.例⽰:instantiation表现规范:presentation specification锚号:anchor id锚值:anchor value超⽂本主要成分:结点,链,宏结点.结点(节点)是超⽂本表达信息的⼀个基本单位.宏⽂本macrotext微⽂本microtext⽂献模型的基本任务:能够表⽰多媒体⽂献的内容层次性能够表⽰多媒体⽂献的版⾯布局能够表⽰多媒体⽂献的时间布局能够将内容与布局对应起来ODA(the office/open document architecture)HyTime全称为"Hypermedia/time-based structuring language"时基超媒体结构化语⾔Web系统是⽬前最流⾏的运⾏于Internet上的超⽂本系统.可扩展标记语⾔XML:extensible markup language主要有三个要素:⽂档定义(DTD/XML Schema),XSL和Xlink.XML提供了数据定义机制,⽬前存在两种⽅式:DTD和Schema动态⽹页⽣成技术:⽬前常⽤的有:ASP(active server pages)JSP(Java server pages)PHP(personal hypertext preprocessor)HTTP:hypertext transfer protocol超⽂本传输协议.缓存系统的体系结构:层次缓存结构.分布式缓存结构,混合的缓存结构缓存⽅式:预装preload技术,动态置换,部分缓存.LRU,least recently usedLFU,least frequently usedFIFO,first in first outLLF,lowest latency first所谓数据模型就是在计算机数据世界中建⽴的计算机所能接受的对现实世界中所要研究对象的抽象描述.具有两层含义:提供⼀种计算机可接受的信息表⽰和处理⽅法能够指出数据的构造,即能够表⽰数据及其属性特征,同时指出数据间的联系.对于多媒体系统的数据模型来说,其主要任务是:能够表⽰不同媒体的数据构造及其属性特征.所谓形式化描述就是⽤数学概念或类数学概念来精确地定义和描述信息系统的基本特性(属性和结构等)的⼀种⽅法.⽤集合论和⼀阶逻辑来抽象超⽂本模型.多媒体信息元:以⾃上⽽下的观点来看,多媒体信息元是具有⼀定语义的,组成信息系统应⽤的信息⼦块.以⾃下⽽上的观点来看,多媒体信息元是⼀个或多个媒体数据元经过⼀定的添加与包装⽽合成的超数据元.信息元的⼤⼩即是各种多媒体应⽤的公共需求,即信息元必须满⾜的特性.MHEG(Multimedia and Hypermedia Information Coding Expert Group)超⽂本信息元标准.采⽤⾯向对象的⽅法来分析设计模型.MH对象分成:输出内容对象 output content⼀般输⼊对象 generic input投射器对象 projector基本对象 basic合成对象composite条件与动作按钮button动作按钮action button暂停-继续按钮stay-on button切换按钮switch button菜单选择menu selection多项选择multiple selection字符串character string位置location数值numericla value时间合成的三种同步表⽰⽅法:层次化同步,基于时间轴的同步,基于参考点的同步.多媒体通信的特点:多媒体数据量⼤,存储容量⼤,传输带宽要求⾼.多媒体实时性.多媒体时空约束多媒体交互性分布式处理和协同⼯作多媒体通信实现途径:话路+视频⽹络+视频有线电视+交互功能多媒体通信的关键技术声⾳,视频,动画等的传输技术数据压缩和解压缩技术解决多媒体实时同步问题解决协议和标准化问题在模拟通信⽹上传输静态图像的电话称为可视电话⼀般分为四个组成部分:语⾳处理部分图像输⼊部分图像输出部分图像信号处理部分专⽤控制器是电视电话的核⼼.电话⽹是按模拟声⾳信号⽽设计的,传送带宽只有300---3400HZ,传输图像有困难,从⽬前情况来看,只能传送静态图像.帧中继(frame relay ,FR)是⼀种HDLC规程的宽带数据业务标准多媒体信息传输对⽹络性能的要求:吞吐量,是指⽹络传输⼆进制信息的速率,⼜称⽐特率或带宽.实时传输的活动图像是对⽹络吞吐量要求最⾼的媒体.传输延时(transmission delay)定义为从信源发出第⼀个⽐特到信宿接收到第⼀个⽐特之间的时间差,它包含信号在物理介质中的传播延时和数据在⽹中的处理延时.另⼀个常⽤的参数是端到端的延时.⽹络传输延时的变化称为⽹络的延时抖动(delay jitter):度量延时抖动的⽅法中常⽤的⼀种是⽤在⼀段时间内最长和最短的传输延时之差来表⽰.错误率:度量⽅式:误码率BER(bit error rate),包错误率PER(packet error rate),包丢失率FLR(packet loss rate)QoS:quality of service分布式多媒体系统的基本特征:多媒体集成性,资源分散性,运⾏实时性,操作交互性,系统透明性.分布式多媒体系统的层次结构:多媒体接⼝层:系统与各种媒体通信输⼊输出的接⼝,处于最低层.多媒体传输层流管理层多媒体表⽰层应⽤层.声⾳点播:audio on demand视频点播:video on demandIP电话:IP telephony分组实时视频会议:group realtime video conferencing从多媒体信息传输来讲,Internet提供两种类型的服务:⼀是可靠的⾯向连接服务,使⽤TCP协议,对信息包时延要求不⾼.⼆是不可靠的⽆连接服务,使⽤UDP协议,不保证丢失包,也不保证时延满⾜要求.⽬前,多媒体⽹络应该解决下⾯问题:提⾼⽹络带宽,减少延时,减少抖动.两个解决⽅法:扩⼤链路带宽,改进Internet协议.⽹络传输的⽅法根据传输⽬标的多少可分为:单播unicast,组播multicast,⼴播broadcast在Internet上要传输多媒体信息最常⽤的是单播技术.组播或称多播是指⽹上⼀点到⽹上多个指定点(同⼀个⼯作组类成员)传输信息.它是⼀种较好的节省带宽减少服务器负担的传输⽅法.Internet的IP地址分为五类:A,B,C,D,E.为⽀持组播功能,发送端和接收端及其之间的⽹络设施都必须具有多播功能.组播路由选择算法:泛洪法(flooding),⽀撑树(spanning tree),反向路径⼴播(reverse path broadcasting ,RPB),修剪的反向路径⼴播(truncated reverse path broadcasting ,TRPB),Steiner树.基于核⼼树的组播(core-based tree,CBT)组播路由选择协议:距离⽮量组播路由协议(Distance Vector Multicast Routing Protocol,DVMRP)组播开放最短路径优先路由协议(Multicast Open Shortest Path First Routing,MOSRF)协议独⽴的组播路由协议(protocol independent multicast,PIM),采⽤两种协议,PIM-DM(dense mode)和PIM-SM(sparse mode)底层传输系统 SDH,synchronous digital hierarchy多协议标识交换 MPLS,multi-protocol label switching标识交换路径 LSP,label-switched path标识交换路由器 LSR,label-switched router密集波分复⽤ DWDM,dense wave-division multiplexing电⼦布告栏系统 BBS,bulletin board system群决策⽀持系统 GDSS,group decision support systems影⽚点播 MOD,movies on demand远程购物 teleshopping远程学习 distance learning家庭银⾏ home banking远程医疗telemedicine电视会议video conferencing内容制作content production事务服务transaction services。

第2部分多媒体技术基础

图中的符号表示频带降低1/2，HH表示频率最高的子带，LL表示频率最低的子带。这个过程可以重复，直到符合应用要求为止。这样的滤波器组称为分解滤波器树(decomposition filter trees)
(8) 20世纪80年代
Mallat, Meyer等人提出multiresolution theory
离散小波变换分析图
DWT变换方法
执行离散小波变换的有效方法是使用滤波器
该方法是Mallat在1988年开发的，叫做Mallat算法这种方法实际上是一种信号的分解方法，在数字信号
处理中称为双通道子带编码
用滤波器执行离散小波变换的概念如图所示
S表示原始的输入信号，通过两个互补的滤波器产生A 和D两个信号
小波变换与应用
一、小波变换 1.小波 2.小波变换 3. 离散小波变换
二、Haar小波变换 1.哈尔函数 2.求均值和差值 3. 哈尔变换的特性 4.一维哈尔小波变换
5. 二维哈尔小波变换
三、阅读和练习作业
一、Wavelet Transform
小波分析是近十几年才发展起来并迅速应用到图像处理和语音分析等众多领域的一种数学工具。它是继110多年前的傅里叶(Joseph Fourier) 分析之后的一个重大突破，无论是对古老的自然学科还是对新兴的高新技术应用学科都产生了强烈冲击。小波理论是应用数学的一个新领域。要深入理解小波理论需要用到比较多的数学知识。本教学提纲企图从工程应用角度出发，用比较直观的方法来介绍小波变换和它的应用，为读者深入研究小波理论和应用提供一些背景材料
a = scale variable －缩放因子
k = time shift
－时间平移
h* = wavelet function －小波函数

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

2．声音的符号化
波形声音可以把音乐、语音都进行数据化并且表示出来，但是并没有把它看成音乐和语音。
对于声音的符号化（也可以称为抽象化）表示包括两种类型：一种是音乐，一种是语音。
2.2.2 音频的数字化和符号化
（1）音乐的符号化－MIDI
MIDI(Music Instrument Digital Interface)是指乐器数字接口的国际标准。
声音是时间函数，通过傅里叶变换可做出其频谱图。人耳对频谱成分的波峰和波谷是非常敏感的。在语言中，元音很少有频谱变速变化的区域。基频改变，人耳是很敏感的。例如：快进的录像，音调会发生变化。
音色非常复杂，目前尚在研究中。音色的处理将使我们能识别音源，音色也代表和声音有关的主观质量。
2.2.1 声音心理学
例如：字符A的ASCII码值为065；字符B的ASCII码值为066；字符C的ASCII码值为067；
2.1.2汉字
1.汉字的输入编码（1）数字编码数字编码输入的优点是无重码，缺点难以记
忆。（2）拼音码以汉语拼音为基础的输入法，汉字输入法重
码率很高，同音字的选择影响了输入速度的提高。（3）字型编码五笔
采样位数
存放一个采样点所需的比特数。一般的采样位数为8位或16位，即把声音采集为256等份或 65536等分。
2.2.2 音频的数字化和符号化
声道数
有单声道、双声道和多声道。如多种语言音频混存时，需要多声道
数据量
(采样频率×每点采样位数×声道数)
数据量＝ 8
(字节/秒)
2.2.2 音频的数字化和符号化
–媒体结合是多层次的 –媒体结合有利于信息接受和理解
隐喻
–交互的概念模型，也称心智模型
威海北洋职业技术学校《多媒体技术教程》
2.2 听觉媒体技术
2.2.1 声音心理学
1.声音的量纲
声音的振动是一种正弦波，声音的变化必须确定三件事：频率（变化的速度）、幅度（产生的压力）、相位（何时开始）。
–计算机设计动画方法
• 造型动画 • 帧动画
2.1.1 常见的媒体元素
动画
–帧动画
2.1.1 常见的媒体元素
动画
–帧动画
2.1.2 媒体的种类
视觉
视觉
（静止）
图像抽象化
图形
抽象化文字
（动态）
图像
图形其它表示为视觉的媒体
符号语言文字动态影像视频真实感三维动画二维动画三维动画
• 采样精度
–每次采样信息量
• 8位、16位数据量计算：
• 通道数
(采样频率×采样精度×通道数 ×时间 )/8 字节
–声音产生的波形数
• 单声道、立体声道、5.1声道
2.1.1 常见的媒体元素
动画
–动画的概念
运动的图画，实质是一幅幅静态图像的连续播放。动画的连续播放既指时间上的连续，也指图像内容上的连续，即播放的相邻两幅图像之间内容相差不大。
–分类
2.语音
–人的说话声虽是一种特殊的媒体，但也是一种波形，所以和波形声音的文件格式相同。
3.音乐
–符号化了的声音，乐谱可转变为符号媒体形式。
2.2.1 数字音频
音频
–数字声音波形质量的主要技术参数
• 采样频率
–等于波形被等分的份数，份数越多，质量越好
• 11.025KHZ、 22.05KHZ、44.1KHZ
2.2.1 声音心理学
听觉空间
人耳可听到来自各个方向的声音，并用不同的因素来判定声源的位置。声源的位置不论对于增进人们的感受还是增进对声音的理解，都是非常重要的。通过声音的精确再现，就可以构造出听觉空间。
方位的线索是各种声音到达两耳的精确时间和强度。
2.2.1 声音心理学
听觉的频谱特性
在计算机中，所有的信息都以数字来表示。声音信号也是由一系列的数字来表示的，称为数字音频。数字音频的特点就是保真度好，动态范围大。
数字声音是一个数据序列。它是由外界声音经过采样、量化和编码后得到的。
2.2.2 音频的数字化和符号化
对声音进行采样用奈奎斯特采样定理来决定采样的频率。根据该定理，只要采样频率高于信号中最高频率的两倍，就可以从采样中完全恢复原始信号的波形。因为人耳所能听到的频率范围为20Hz到20KHz，所以实际的采样过程中，为了达到好的效果，就采用44.1KHz作为高质量声音的采样频率。如果达不到这么高的频率，声音恢复的效果就会差一些，例如电话声音的质量等。一般来说，声音恢复和采样频率、信道带宽都有关。
2.2.1 声音心理学
两者之间确有关系：例如声音的响度取决于强度和频率两个因素，如果频率不变，强声显得比弱声要响些。但如果强度不变，过高频率的声音和过低频率的声音似乎比中频的声音听起来都要弱一些。由此可见，响度依赖于频率，原因是人耳能反应的频率范围是有上限和下限的。
心理变量
2.2.1 声音的量纲
率上的强度是不同的。先设一个音为标准音，给予固定的频率、强度和持续时间，例如1000Hz、 40分贝、持续0.5秒；再给一个音也持续0.5秒，但频率不同，通过调整使其响度听起来一样，得到的这样一组曲线称之为等响曲线。等响曲线描述的是响度与频率和强度的关系。从声音心理学考虑，对同一响度的声音在频率上和强度上可以有很大的差别，这对声音表现有重要意义。
相位
从声音的波形来看，声音的起点和方向也要反映声音的特性，这就是声音的相位。当两个声音相同相位完全相反时，它们将相互抵消；当两个声音相同而且相位也相同时，声音就会得到加强。
相位的确定对于多声道声音系统的设计非常重要，其可以应用在回声的消除、会议系统的声音设计上。
2.2.1 声音心理学
2.2.1 声音心理学
临界频带
在频率的某一临界区里，各种声音是相互作用的，合成声音的响度由这些频率共同决定。如果超出临界区，声音的响度不再相互作用，声音的响度随频率的改变而改变。这个临界区就是临界频带，其宽度视其中心频率而定。对于临界频带的确定，使得对声音响度的处理能够有的放矢。
2.2.1 声音心理学
MIDI消息，是指乐谱的数字描述。
任何电子乐器，只要有处理MIDI消息的微处理器和合适的硬件接口，就构成了一个MIDI设备。当一组MIDI消息通过音乐合成芯片处理时，合成器能解释这些符号并且产生音乐。
MIDI的关键是作为媒体能够记录这些音乐的符号，相应的设备能够产生和解释这些符号。它给出了一种得到音乐声音的方法。
另外一方面，人们可以感觉到声音的强弱，可以感觉到歌唱家音调的高低。
因此，声音的量纲分为声音的物理量纲和心理量纲。
2.2.1 声音心理学
物理量纲可以用精确的值来描述，但对某一具体声音得来的心理印象却不容易说明白，因为心理印象要由被测者的经验而定。
声音的心理属性和物理属性不可等同，首先，这些关系不是线性的；其次这些关系不是孤立的；第三这些关系不是不变的。
2.汉字内码
汉字内码用于汉字信息的存储、交换、检索等操作的机内代码，一般采用两个字节表示。
3.汉字字模码
字模码是用点阵表示的汉字字形代码，它是汉字的输出形式
2.2 音频
音频
–分类
1.波形声音
–包含了所有的声音形式，它可以把任何声音都进行采样量化，并恰当地恢复出来。
2.2音频
音频
首要的物理变量
次要的物理变量
响度音调音色音量密度谐和（流畅或粗糙）噪声骚扰声
声强声波频率声波复合频率和强度频率和强度谐波结构
强度强度
声波频率声强－－
－音乐技巧
频率组合，各种时间参量
频率组合，无意义
2.2.1 声音心理学
2.听觉特性
等响曲线由于响度与频率和强度有关，所以在不同频
威海北洋职业技术学校《多媒体技术教程》
第二章多媒体信息的表示
威海北洋职业技术学校《多媒体技术教程》
【学习目标】
1.掌握：位图、矢量图的定义。 2.理解：音频信号的数字化处理，矢量图与位图、图像与图形的比较。 3.了解：超文本与超媒体。【学习要点】
多媒体信息（文字、音频、视觉媒体、动画）在计算机中是如何表示的。
语音指构成人类语音信号的各种声音。在采集和存储上可以与波形声音一样，但由于语音是由一连串的音素组成。“一句话”中包含许多音节以及上下文过渡过程的连接体等特殊的信息，并且语音本身与语言有关，所以要把它作为一个独立的媒体来看待。
2.2.2 音频的数字化和符号化
声音的采样以及量化图
2.2.2 音频的数字化和符号化
与数字音频相关的重要特性：
采样频率
采样频率与声音的质量关系最为紧密。采样频率越高，声音质量越接近原始声音，所需的存储量便越多。标准的采样频率有三个：44.1KHz， 22.05kHz，和11.025kHz。
2.2.2 音频的数字化和符号化
MIDI的特点：
与波形声音相比，MIDI不是声音数据而是指令，所以数据量要少得多。30分钟的音乐，用MIDI文件记录只需200KB，用16位CD品质的未压缩WAV 文件记录需317MB
MIDI可以与其他波形声音配合使用，形成伴乐的效果。而两个波形声音一般是不能同时使用的
对MIDI的编辑也很灵活，用户可以自由地改变音调、音色等属性，直到自己想要的效果
MIDI在音质上还不能与真正的乐器完全相似。无法模拟自然界中其它非乐曲类声音
2.2.2 音频的数字化和符号化
（2）语音的符号化
语音与文字是对应的。波形声音可以记录表示语音，它是不是语音取决于听者对声音的理解。对语音的符号化实际上就是对语音的识别，将语音转变为字符，反之也可以将文字合成语音。