多媒体技术第二章

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第2章媒体及媒体技术

2.1.1

常见的媒体元素主要有∶文本、图形、图像、声音、动画和视频图像等。

媒体元素:多媒体的媒体元素是指多媒体应用中可显示给用户的媒体形式。常见的媒体元素主要有文本、图形、图像、声音、动画和视频图像等。

文本:文本是用字符代码及字符格式表示出来的数据。(计算机在进行文字处理时,依据的就是字符代码的识别,它是文本处理程序的基础,也是多媒体应用程序的基础)图形:图形一般指用计算机绘制的几何画面,如直线、圆、矩形、任意曲线和图表等。

图形格式:图形的格式是一组描述点、线、面等几何图形的大小、形状及其位置、维数的指令集合。

图像处理一般考虑三个因素:分辨率、图像灰度、图像的文件大小。

矢量图:在图形文件中只记录生成图的算法和图上的某些特征点,因此也称矢量图。

图形的用途:图形主要用于表示线框型的图画、工程制图和美术字等。绝大多数CAD 和3D造型软件使用矢量图形来做为基本图形存储格式。

用字节为单位表示图像文件的大小,描述方法为:高×宽×灰度位数/8

掩蔽:声音的响度不仅取决与自身的强度和频率,而且也依赖于同时出现的其他声音。声音的掩蔽特性常常用于声音的压缩。

MIDI:与波形声音相比,MIDI数据不是声音而是指令,所以它的数据量要比波形声音少得多。

电视主要有三种制式:即NTSC(525/60)PAL(625/50) 和SECAM(625/50)括号中的数字为电视显示的线行数和频率;视频文件的存储格式有:A VI、MPG MOV等。

在视频中有三个重要的技术参数:帧速数据量图像质量。

数字音频可以分为波形声音、语音和音乐。

计算机中音频技术主要包括声音的采集、数字化、压缩/解压缩以及声音的播放。

影响数字声音波形质量的主要因素有三个:采样频率、采样精度和通道数。

通道数一般分为单声道和立体声道,单声道产生一个波形,立体声道产生两个波形。

媒体的种类:可以分为视觉类媒体、听觉类媒体、触觉类媒体、嗅觉类媒体和味觉类媒体。

媒体的性质和特点:媒体数据具有一下性质:第一,媒体是有格式的;第二,不同媒体表达信息的特点和程度各不相同;第三,媒体之间可以相互转换,但可能会丢失部分原始信息,或增加一些伪信息;第四,媒体之间的关系也具有丰富的信息。

人的听觉频率范围是:20Hz~20KHz

听觉的主要特性:①等响曲线②掩盖(常用于声音的压缩)③临界频带④相位⑤自然声音的时变现象(声音的音调分成3个区域:起始区、稳定状态区和延迟区)⑥听觉空间⑦听觉的频谱特性⑧声音的心里模拟

求音频信号数据量公式:

如果对声音不进行压缩,声音的数据量可以通过这个公式计算:声音的数据量=[(采样频率×每个采样位数×声道数)/8]×时间(秒) 例如:1分钟的单声道的声音,采样频率为11.025kHz,采样位数为8,则声音的数据量为:[(11.025×8×1)/8] ×60=0.66MByte(MB) (软考试题):若语音信号的带宽通常为300~3400Hz,量化精度为8b,单声道输出,计算每秒钟及每小时的数据量?解:据题意,数字化时的取样频率为8kHz,根据上述公式每秒钟的数据量为:[(采样频率×每个采样位数×声道数)/8]×时间(秒)=【(8kHz×8b×1)

/8】×1s=64Kb/s=8KB/s;一小时数字语音的数据量大约为:

【(8kHz×8b×1)/8】×3600s=28MB 视觉的主要特性:①亮度②视觉的时间特性③彩色(表示彩色需要考虑3种心理属性:色调、饱和度(浓度)和亮度)④注视点和视野范围

力反馈与触觉反馈:人体对力反馈和触觉反馈的获得主要靠人体的力感接收机制和自感接收机制来完成。力感接收机制是对外部的感受,靠的是皮肤对外部压力的感觉;自感接收机制是人体本身对物体的感知。

人们对声音的感觉主要有音量、音调和音色3个指标。

最基本的声音数字化方法是取样—量化法,它分成3个步骤:采样、量化和编码。

相关文档
最新文档