《多媒体技术》期末复习提要之名词解释部分

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2012教技班】《多媒体技术》期末复习提要之名词解释部分

【临界频带】在频率的某一临界区里,各种声音是相互作用的,合成声音的响度由这些频率共同决定。如果超出临界区,声音的响度不再相互作用,声音的响度随频率的改变而改变。这个临界区就是临界频带,其宽度视其中心频率而定。对于临界频带的确定,使得对声音响度的处理能够有的放矢。

【声音掩蔽】人们在安静的环境中听一个声音,即使这个声音压的很低也可以听到,说明人耳对这个声音的声域可以很低,但若果同时存在另一个声音,就会则要提高所听声音的听域,这种由某个声音的存在而使人耳对别的声音听觉灵敏度降低的现象称为“掩蔽效应”。

【语音识别】就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。它主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。

【模式识别】是对表征事物或现象的各种形式的信息进行处理和分析,以对事物或现象进行描述,辨认,分析和解释的过程,是人工智能的组成部分。

【统计编码】即基于对待压缩数据中各符号出现频度的统计,采用变长编码的方法,使出现频率越高的符号拥有越短的编码长度,从而得到更短的总编码长度。

【子带编码】即subband coding,使用一组带通滤波器(band-pass filter , BPF肥输入音频信号的频带分成若干个连续的频段,每个频段称为子带。对每个子带中的音频信号采用单独的编码方案去编码。在信道上传送时,将每个子带的代码复合起来。

【预测编码】是根据离散信号之间存在着一定关联性的特点,利用前面一个或多个信号预测下一个信号进行,然后对实际值和预测值的差(预测误差)进行编码。如果预测比较准确,误差就会很小。在同等精度要求的条件下,就可以用比较少的比特进行编码,达到压缩数据的目的。

【音源编码】从话音波形信号中提取生成话音的参数,使用这些参数通过话音生成模型重构出话音。

【变换编码】不是直接对空域图像信号进行编码,而是首先将空域图像信号映射变换到另一个正交矢量空间(变换域或频域),产生一批变换系数,然后对这些变换系数进行编码处理。变换编码是一种间接编码方法,其中关键问题是在时域或空域描述时,数据之间相关性大,数据冗余度大,经过变换在变换域中描述,数据相关性大大减少,数据冗余量减少,参数独立,数据量少,这样再进行量化,编码就能得到较大的压缩比。

【熵编码】是一种泛指那些不考虑被压缩信息的性质的编码和压缩技术。它是基于平均信息量的技术把所有的数据当作比特序列,而不根据压缩信息的类型优化压缩。也就是说,平均信息量编码忽略被压缩信息的语义内容。

【采样定理】在进行模拟/数字信号的转换过程中,当采样频率fs.max 大于信号中最高频率fmax

的2 倍时(fs.max>=2fmax) ,采样之后的数字信号完整地保留了原始信号中的信息,一般实际应用中保证采样频率为信号最高频率的5〜10倍。

【亚采样】由于人眼对色度信号的敏感程度比对亮度信号的敏感程度低,另外人眼对图像细节的分辨能力有一定的限度,利用这些特性可以对亮度信号和色差信号分别采用不同的采用频率进行采样。节省存

储空间。如果对色差信号使用的采样频率比对亮度信号使用的采样频率低,这种采样就称为图像子采样(subsampling) 。

【人工智能】它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。

【智能家居】即Smart Home, SH. 智慧家居是以住宅为平台,利用综合布线技术、网络通信技术、智能家居-系统设计方案安全防范技术、自动控制技术、音视频技术将家居生活有关的设施集成,构建高效的住宅设施与家庭日程事务的管理系统,提升家居安全性、便利性、舒适性、艺术性,并实现环保节能的居住环境。

【三基色原理】在白色背景下,以红绿蓝作为原色来混合出其他颜色。由于人眼对RGB 这3 种颜色最敏

感,因此选这3 种颜色作为原色,这就是色度学的三基色原理。

【三维虚拟声空间】所谓三维虚拟声空间( Three Dimensional Virtual Acoustic, 3DVA),是指用一定的声

音设备人为地产生出来的具有空间位置信息的声音空间。三维听觉的使用明显地依赖于用户对听觉空间中各种信息源的定位能力。

【多媒体技术】以数字化为基础,能够对多种媒体信息进行采集、编码、存储、传输、处理和表现,综合处理多种媒体信

息并使之建立起有机的逻辑联系,集成为一个系统并能具有良好交互性的技术。包括多媒体数据模型、多媒体数据压缩技

术、多媒体内容处理与检索技术、多媒体表现与同步技术、多媒体人机交互接口技术、多媒体通信与分布处理技术等等。

【智能超媒体】即将专家系统的特征引入到传统的超媒体中。一方面超媒体的节点虽具有丰富的表现能力,但链的动态跟

踪能力还很弱,专家系统特征的引入,不仅使链具有计算与推理等动态跟踪与定位能力,而且使节点中的多媒体信息能够智

能化地表现给用户;另一方面,超媒体中的专家系统特征又比普通的专家系统高一个层次,因为它能够利用丰富的多媒体信

息增强推理解释,具有更易于用户理解的知识交互界面。智能化使得超媒体的节点和链都更加丰富与完善。

【虚拟现实】Virtual Reality,简称VR,又译作灵境、幻真。是近年来出现的高新技术,也称灵境技术或人工环境。虚拟现实是利用电脑模拟产生一个三维空间的虚拟世界,提供使用者关于视觉、听觉、触觉

等感官的模拟,让使用者如同身历其境一般,可以及时、没有限制地观察三度空间内的事物。

【增强现实】即Augmented Reality ,简称AR ,是在虚拟现实的基础上发展起来的新技术,也被称之为混合现实。是通过计算机系统提供的信息增加用户对现实世界感知的技术,将虚拟的信息应用到真实世界,并将计算机生成的虚拟物体、场

景或系统提示信息叠加到真实场景中,从而实现对现实的增强。

【流媒体技术】也称流式媒体技术.所谓流媒体技术就是把连续的影像和声音信息经过压缩处理后放上网站服务器,让用户一边下载一边观看、收听,而不要等整个压缩文件下载到自己的计算机上才可以观看的网络传输技术。

【MPC即Multimedia PC,是指能综合处理多媒体信息,包括文字、音频信息和视频信息等,并能在多

相关文档
最新文档