多媒体技术的应用现状new
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
学院:
班级:
姓名:
学号:
授课教师:
多媒体技术的应用
多媒体技术是当今信息技术领域发展最快、最活跃的技术,是新一代电子技术发展和竞争的焦点。多媒体技术融计算机、声音、文本、图像、动画、视频和通信等多种功能于一体,借助日益普及的高速信息网,可实现计算机的全球联网和信息资源共享,因此被广泛应用在咨询服务、图书、教育、通信、军事、金融、医疗等诸多行业,并正潜移默化地改变着我们生活的面貌。
多媒体包括
(1)文本:由语言文字和符号字符组成的数据文件。
(2)图像:通过描述画面中各个像素的亮度和颜色等组成的数据文件。也叫点位图或位图图像。
(3)图形:矢量图形的简称。即生成一幅图形由数学方法组成的数据文件。一般可将图形看作是图像的抽象。
(4)动画:将静态的图像、图形及连环图画等按一定时间顺序显示而形成连续的动态画面。
(5)音频:声音信号,即相应于人类听觉可感知范围内的频率。
(6)视频:可视信号,即计算机屏幕上显示出来的动态信息,如动态图形、动态图像、动画等。而多媒体技术,是指采用计算机技术,将各种媒体以数字化的方式集成在一起,从而使计算机具有了能同时获取、处理、编辑、存储和展示多体信息的能力。
1多媒体技术涉及的内容
多媒体技术是使用计算机交互式综合技术和数字通信网络技术处理多种表示媒体——文本、图形、图像、视频和声音,使多种信息建立逻辑连接,集成为一个交互式系统。
它主要涉及如下几个部分:
1.1多媒体数据压缩,图像处理:它包括HCI与交互介面设计、多模态转换、压缩与编码和虚拟现实等。
1.2音频信息处理:它包括音乐合成、特定人与非特定人的语音识别、文字——语音的相互转换等。
1.3多媒体数据库和基于内容检索:它包括多媒体数据库和基于多媒体数据库的检索等。
1.4多媒体著作工具:它包括多媒体同步、超媒体和超文本等。
1.5多媒体通信与分布式多媒体:它包括CSCW、会议系统、VOD和系统设计等。
1.6多媒体应用:CAI与远程教学、GIS与数字地球、多媒体远程监控等。
2多媒体技术的应用现状
多媒体技术的开发和应用,使人类社会工作和生活的方方面面都沐浴着它所带来的阳光,新技术所带来的新感觉、新体验是以往任何时候都无法想象的。
2.1多媒体数据压缩,图像处理的应用
多媒体计算机技术是面向三维图形、环绕立体声和彩色全屏幕运动画面的处理技术。而数字计算机面临的是数值、文字、语言、音乐、图形、动画、图像、视频等多种媒体的问题,它承载着由模拟量转化成数字量信息的吞吐、存储和传
输。数字化了的视频和音频信号的数量之大是非常惊人的,它给存储器的存储容量、通信干线的信道传输率以及计算机的速度都增加了极大的压力,解决这一问题,单纯用扩大存储器容量、增加通信干线的传输率的办法是不现实的。
数据压缩技术为图像、视频和音频信号的压缩,文件存储和分布式利用,提高通信干线的传输效率等应用提供了一个行之有效的方法,同时使计算机实时处理音频、视频信息,以保证播放出高质量的视频、音频节目成为可能。
国际标准化协会,国际电子学委员会,国际电信协会等国际组织,于二十世纪90年代领导制定了三个重要的有关视频图像压缩编码的国际标准,JPEG标准;H.261标准;MPEG标准。
2.2音频信息处理的应用
在多媒体技术中,存储声音信息的文件格式主要有:WAV文件、VOC文件、MIDI文件、AIF文件、SON文件及RMI文件等。
2.2.1音频信息录制编辑
把音乐和语音加到多媒体应用中,是我们研究音频处理技术的目的,下面是我们常用的音频信息录制编辑软件。
WaveEdit工具的REC命令;SoundBlaster卡的VEdit2软件;MicrosoftSoundSystem卡的QuickRecorder软件;Cooledit软件;WaveEdit工具;CreativeWaveStudio。
2.2.2语音识别
语音的识别长久以来一直是人们的美好梦想,让计算机听懂人说话是发展人机语音通信和新一代智能计算机的主要目标。随着计算机的普及、越来越多的人在使用计算机,如何给不熟悉计算机的人提供一个友好的人机交互手段,是人们感兴趣的问题,而语音识别技术就是其中最自然的一种交流手段。
自从20世纪80年代中期以来,新技术的不断出现使语音识别有了实质性的进展。特别是隐马尔可夫模型(HMM)的研究和广泛应用,推动了语音识别的迅速发展,陆续出现了许多基于HMM模型的语音识别软什系统。
当前,语音识别领域的研究正方兴未艾。在这方面的新算法、新思想和新的应用系统不断涌现。同时,语音识别领域也正处在一个非常关键的时期,世界各国的研究人员正在向语音识别的最高层次应用——非特定人、大词汇量、连续语音的听写机系统的研究和实用化系统进行冲刺,可以乐观地说,人们所期望的语音识别技术实用化的梦想很快就会变成现实。
2.2.3文语转换
目前,世界上已研制出汉、英、日、法、德等语种的文语转换系统,并在许多领域得到了广泛应用。
DECTalk文语转换系统:这是DEC公司在MIT的KLATT教授研制的语音合成器的基础上开发的语音生成系统,用于英语文语转换。
AT&TBell文语转换系统:这是美国AT&T贝尔实验室研制的文语转换系统,它最初用于英语的文语转换,现在正扩展到其它语种。
Sonic文语转换系统:这是清华大学计算机系基于波形编辑的汉语文语转换系统。该系统利用汉语词库进行分词,并且根据语音学研究的成果建立了语音规则,对汉语中的某些常见语音现象进行了处理。系统采用PSOLA算法修改超音段语音特征,提高了言语输出的质量。
2.3多媒体数据库和基于内容检索的应用