视音频编解码技术及应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
视音频编解码技术及应用
工科类
信息工程学院本科论文
题目:视音频编解码技术及应用
别系:信息工程学院
专业:信息工程
届次: 2012届
学号: 2012041183
姓名:焦杰
指导教师:杨宇老师
2014年9月28日
音频编解码器的简短历史可追溯到20世纪80年代中期,德国Fraunhofer 研究所首先开始从事高质量、低码率的音频编码研究。他们的项目作为面向市场的尤里卡(Eureka)研究计划(EU一147)的一个部分得到了欧盟的财政资助。1989 年,Fraunhofer在德国获得了MP3的专利权。后来,MP3递交给了国际标准化组织(ISO),于1992年成为正式的MPEG一1标准的一部分。1995年1月,Fraunhofer在美国也申请了MP3专利,并于1996年l1月获批。使用MP3格式压缩的个人计算机用户能将一张普通的音乐CD (激光唱碟)的内容压缩到它原来大小的1/10,而在音质上只有很小的损伤。这样,12个d,n,t的音乐可存储在一张可录制的激光唱碟上,而且可用一台MP3格式的CD播放器或一台普通的个人计算机来播放。现今,市场上提供的移动设备从笔记本电脑、掌上型电脑到手机应有尽有,而且高速无线网络正在日益发展。与此同时,宽带语音和高保真音频压缩编码技术在商业应用驱动下得到了迅速的发展。电话语音、宽带语音和宽带音频信号不仅在带宽和动态范围上有所不同,而且在收听者对所提供的音质期待上也不相同。宽带的使用不仅改善了语音的可懂度和自然度,也增加了面对面直接交流的感觉,更容易识别说话人。目前,移动通信领域不断推出新的业务,包括流媒体、多媒体短信、广播和下载等。流媒体业务包括听新闻、听音乐、运动比赛的监听、商业广告、交互式游戏等。广播业务类似于流业务,此外还包括因特网的网上广播。与下载的音频文件不同,流式音频文件无需存储在用户的硬盘上,但通过用户的音频播放器可像传统的收音机那样进行广播。多媒体短信业务也与流业务类似,但由于受文件大小的限制,只包括商业单位与个人以及个人与个人之间的短信发送和接收。下载业务包括网络上的音乐、书籍和连环图画的下载。
上述应用对音频编解码器提出的要求主要包括:
(1)处理通用内容的能力;(2)在最低码率下保证有足够好且始终如一的音质;(3)在最低码率下要获得最好的音质;(4)可变码率要求下的高质量操作。
对于低资源设备(具有低的存储和计算资源),必须对音频编解码器进行优化。目前,开发和标准化编解码器的工作主要由3GPP (The 3rd Generation Part —nership Project,第三代移动通信伙伴项目)负责。
3 音频编解码器的发展趋势及比较
移动通信平台的硬件正在经历迅速的发展,因此,在未来的移动设备中期待出现新的软件和应用。随着中央处理单元(CPU)处理能力的不断增强以及存储器价格的下降,可以推断出在不久的将来移动设备将会是怎样的。无线信道也处在不断的发展之中,连接移动设备的带宽正在不断的增加,是否还需要像HE —AAC那样能提供有效压缩的编解码器。
3.1 新式移动电话的特征
硬件研究的主要目标是移动电话,因为移动电话的数量远远超过个人数字助理(PDA)的数量。移动电话也是一个很好的低端移动设备平台的代表,因为对移动电话的主要设计要求是其尺寸和重量。3G移动电话操作系统的主要制造商
Symbian公司最近推出的Symbian操作系统OS 8,已用于像Nokia 6630这样的基于60系列、SDK2.0平台的3G移动电话上,能支持AMR,AMR—WB,MP3,AAC 和RealAudio等音频编解码器口01。如Nokia 7710这样较高档的手机甚至能支持立体声的音频编解码器。因此,在中、高档移动电话手机中,对音频和多媒体应用的硬件瓶颈已被打破。然而,在低档的移动电话手机中,主要由于考虑到低价格的要求,对于音频的应用目前仍然存在一些硬件限制,但在不久的将来,相信这些硬件限制将不会存在。
3.2 移动通信网络的特征
目前用于移动电话系统的基本GPRS(GeneralPacket Radio Services,通用分组无线业务)网络支持的通信速率为30-50 Kb/s。EDGE (Enhanced Datarates for GSM Evolution,增强数据速率的GSM演进方案)或EGPRS(Enhanced GPRS,增强型GPRS)技术将终端用户的速率增加到了120~150 Kb/s,甚至更高。如果手机中使用了最新的音频编解码器,则EGPRS的速率对于流式音频应用是足够的。EGPRS可应用于大部分的中档手机甚至一些低档手机,但目前只能在大城市和市郊可用。UMTS(Universal Mobil Telecommu.nication System,通用移动通信系统)提供的数据速率为384 Kb/s(TDD 模式)-2 Mb/s(TDD 模式),但到目前为止,UM 只应用于高档手机且仅在市区可用⋯。
3.3 音频编解码器的比较
比较音频流质量的方法有许多种,其中一个方法是让听众来判断质量。通常将EBU(European Broad—casting Union,欧洲广播联盟) 采用的一种测试MI JSHR A MIJhi Stimulus test with Hidden Referenceand Anchors作为评判的参考_l21。它是由EBU 项目组B/AIM 开发并提议的一种先进的测试方法,现已提交
给ITU进行标准化。MUSHRA是一种主观测试方法,参加测试的一组听众来自欧盟的不同国家,他们使用各种不同类型的音频信号作为编码器的输入,将解码器的输出与一个参考信号进行比较,并按100分制进行评分。如果给出的平均分在8l~100之间,则认为是“优”,6l~80则认为是“好”,41~60则认为“一般”,21~40则认为“差”,0~20则认为“坏”。不同类型的音乐,例如古典音乐、民间音乐、爵士乐和流行音乐都要测试。演播室和直播环境中的男、女声广播节目也被测试。EBU公布的测试结果是:在码率为48 Kb/s的立体声情况下,HE—AAC的性能最好,音质几乎接近立体声的CD音质,获得了80分的最高分,其它依次是MP3 Pro (76分),MPEG一4 AAC,Real Audio 8,Win—dows Media Audio 8和MP3。测试证实了SBR增强编解码器MP3 Pro和HE—AAC 的优越性能。EBU还没有报告AMR—WB+编解码器的MUSHRA测试结果。对于分组交换流(PSS)、多媒体短信业务(MMS),3GPP已候选了2种码率范围的编解码方案:(1)当码率低于24 Kb/s时,AMR—WB+,HE—AAC以及EAAC+将作为候选方案;(2)当码率高于24 Kb/s时,HE-AAC和EAAC+将作为候选方案。3GPP对AMR —WB+编解码器在48 Kb/s码率下进