语音信号的去噪方法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据压缩是信源编码的目的和手段。从广义上讲,数据压缩就是减少分配给指定消息集合或数据采样集合的信号空间大小。该信号空间可以是物理容积,也可以是时间间隔或带宽。数据压缩的主要目的是为了降低码速率或减少存储空间。数据压缩可以分为可逆压缩(冗余度压缩)和不可逆压缩(有损压缩或熵压缩)两大类。熵压缩将导致信息失真,它是不可逆的。若把数据看作信息和冗余度的叠加,冗余度压缩的工作机理就是去除或者减少数据的冗余度,它是一个可逆过程。量化是有损数据压缩中的常用技术,基本上可以分为三种,即标量量化、矢量量化和序列量化。最基本的标量量化每次只量化一个采样,并对所有采样都采用具有相同特性的量化器进行量化,而且每个采样的量化都和其他采样无关。矢量量化和序列量化则利用相邻采样之间的相关性。矢量量化(vector quantization,VQ)在量化时用输出组集合(码书)中最匹配的一组输出值(码字)来代替一组输入采样值(输入矢量),其理论基础是香农的速率失真理论,其基本原理是用码书中与输入矢量最匹配的码字的索引代替输入矢量进行传输和存储,而解码时只需简单的查表操作。矢量量化作为一种有效的有损压缩技术,其突出优点是压缩比大且解码算法简单。矢量量化压缩技术的应用领域非常广阔,如军事部门和气象部门的卫星(或航天飞机)遥感照片的压缩编码和实时传输、雷达图像和军用地图的存储与传输、数字电视和DVD的视频压缩、医学图像的压缩与存储、网络化测试数据的压缩和传输、语音编码、图像识别和语音识别等等。
1、采样过程:就是按一定的频率,即每个一小段时间,测得模拟信号的模拟量值。
2、量化过程:通过采样时测的的模拟电压值,要进行分级量化,按整个电压变化的最大幅度划分成几个区段,把落在某区段的采样到的样品值归成一类,并给出相应的量化值。
3、“采样频率”是指将模拟声音波形数字化后每秒钟所抽取的声波幅度的样本次数,其单位为kHz(千赫兹)。采样频率高低决定了声音失真程度的大小,为保证声音不失真,采样频率应该在40kHz左右。采样频率一般有三种,44.1kHz是最常见的采样率标准(每秒取样44100次,用于CD品质的音乐);22.05kHz(适用于语音和中等品质的音乐);11.25kHz(低品质)。对于高于48KHz的采样频率人耳已无法辨别出来了,所以在电脑上没有多少使用价值。
5、“采样频率”和“量化级”是数字化声音的两个最基本要素,相当于视频中的屏幕大小(例如800*600)和颜色分辨率(例如24bit)。
由于计算机技术和网络技术的迅猛发展,多媒体技术扮演着日益重要的角色,作为多媒体技术之一的语音技术,表现出了极大的潜力和优势。 在小波分析出现之前,信号处理的主要工具是Fourier分析。Fourier分析在处理平稳随机信号方面有着不可替代的作用,而大量的现实存在的信号是非平稳时变的信号,这样Fourier分析显得能力不足。小波分析的出现,是传统信号处理方法的发展。多年的理论与实践证明,小波分析在处理时变信号方面有着得天独厚的优势。 作为时变信号的语音信号,当然不可避免的成为小波分析处理的热点。在本文中,作者通过对小波分析和语音处理的研究,并在大量的上机实践的基础上对小波分析在语音处理中的应用做了一些有益的探索。本论文所做的工作如下: * 小波分析在语音基音周期检测的应用。 * 小波分析在语音波形编码中的应用。 * 小波分析在语音混合编码中的应用。 研究结果表明,小波分析对语音基音周期的检测是非常有效的,对语音压缩基本可达到满意的程度。 本论文的所有程序是在Matlab5.2上实现的。
5kHz的采样率仅能达到人们讲话的声音质量。
11kHz的采样率是播放小段声音的最低标准,是CD音质的四分之一。
22kHz采样
44kHz的采样率是标准的CD音质,可以达到很好的听觉效果。
4、量化数据位数(也称量化级、样本尺寸):量化位数是每个采样点能够表示的数据范围,常用的有8位、12位、16位等,8位字长量化(低品质)和16位字长量化(高品质),16 bit 是最常见的采样精度。
矢量量化,基于其优良的率失真特性,已经广泛的应用在信号和图像处理领域,例如模式识别、语音和图像压缩编码。决定矢量量化器性能的关键技术是矢量量化的码书设计和矢量量化的编码算法。在获得高质量码书和完成编码方面,实现复杂度都将随着矢量维数的增加面快速增长,这成为了矢量量化技术在信号处理领域特别是实时信号处理领域应用的一个严重的障碍,也成为了近几十年来研究最多的方面。随着各种新的非线性信号处理方法在码书设计中的使用,以及大量快速搜索方法的出现,矢量量化技术也在快速的发展着。 本论文以矢量量化应用最多的领域,即图像信号处理领域为研究对象,在有效利用图像信号的特性的基础上,对于矢量量化码书形成算法和快速编码算法作了创新性和探索性研究。主要内容为: 1.分析和研究了现有的几种初始码书算法的问题,在理论上提出了一种基于训练矢量的统计特征量的分类平均初始码书算法。实现对于较平滑图像信号矢量量化的码书质量的有效提高。 2.详细研究了几种典型的矢量量化码书形成算法,探讨了这些算法在形成码书的过程中,可能存在的不足。在矢量量化的码书形成算法中,首次提出适度性原则,保证码子是胞腔内绝大多数训练矢量的代表,去掉或减少小部分非典型训练矢量对码子的影响,使代表更加具有广泛性,形成附加的优化条件:子区域误差近似相等。实现对于频率敏感竞争学习(FSCL)算法,频率敏感自组织特征映射(FSOFM)算法的改进。并探讨了这两种改进算法在小波变换域的一种实现方案,最后给出了一种结合小波变换和非线性插补矢量量化(NLIVQ)的编码方案。适度性原则的引入,在提高码书质量的同时,也减少了形成码书所需要的计算量,进而降低了码书设计的复杂度。 3.详细研究了几种典型的,和全搜索等价的,基于不等式排查的快速编码算法。对这些算法的编码效率进行了分析,具体地针对基于各种低维特征量(均值,方差,范数)的排查不等式的排查效率,进行了比较。提出了基于子矢量范数的排查不等式,基于均值和子矢量范数的排查不等式,以及基于均值和子矢量方差的排查不等式等三种改进算法。通过这些基于低维特征量的排查不等式和部分失真排除方法的有效结合,实现了更高效的快速编码算法。 4.利用基于等误差自组织特征映射(EDSOFM)算法形成的码书,在基于图像内容的检索的领域,构造了基于矢量量化编码索引直方图的彩色图像描述子。利用基于子矢量范数排查不等式构造的快速搜索算法,实现了对于彩色图像检索库的快速检索。
随着计算机和大规模集成电路的飞速发展,数字信号分析和处理技术得到很大发展,并已经广泛应用于通信、雷达和自动化等领域。数字信号的突出优点是便于传输、存储、交换、加密和处理等。一个模拟信号f(t),只要它的频带有限并允许一定的失真,往往可以经过采样变成时间离散但幅值连续的采样信号f(n)。对于数字系统来说,f(n)还需经过量化变成时间和幅值均离散的数字信号x(n)。通信系统有两大类:一类是传输模拟信号f(t)的模拟通信系统;另一类是传输数字信号x(n)的数字通信系统。在任何数据传输系统中,人们总是希望只传输所需要的信息并以最小失真或者零失真来接收这些信息。人们常用有效性(传输效率)和可靠性(抗干扰能力)来描述传输系统的性能。与模拟通信系统相比,数字通信系统具有抗干扰能力强,保密性好,可靠性高,便于传输、存储、交换和处理等优点。在数字通信中,码速率高不仅影响传输效率,而且增加了存储和处理的负担。因此,在数字通信中通常对数字信号x(n)进行信源编码。
本书的第一章和第九章由孙圣和教授执笔,第二至第八章主要由陆哲明副教授执笔,全书由孙圣和教授最终定稿。在本书的撰写过程中得到了自动化测试与控制研究所的教师、博士生和硕士生的帮助,在此表示衷心的感谢。
书中述及的研究工作得到中国航天科技集团公司航天科技创新基金和哈尔滨工业大学科学研究基金资助;本书的出版得到中国科学院科学出版基金和哈尔滨工业大学专著出版基金的资助。
限于水平,书中难免有错误与不妥之处,恳请读者批评指正。
本书系统地介绍了矢量量化技术理论近20年来的发展历程、目前的研究现状和未来的发展趋势,重点介绍了基本矢量量化的三大关键技术,即码书设计、码字搜索和码字索引分配,并开辟了矢量量化技术的新应用方向--数字水印处理。本书共分9章。前两章从标量量化技术的介绍入手,引出矢量量化的概念、原理、关键技术和特点,介绍20年来学者们提出的各种矢量量化器的基本结构和基本原理。第三章介绍经典的码书设计算法、基于神经网络的矢量量化码书设计算法、基于全 局寻优技术的码书设计算法和基于模糊理论的矢量量化码书设计算法。第四章介绍各种快速码字搜索算法,包括基于不等式判据的、基于变换域的、基于金字塔结构的和自适应搜索范围及顺序的等等。第五章介绍20世纪90年代以来研究的各种码字索引分配算法和BPSK调制原理及相应的能量分配码字索引传输算法。第六至第八章分别介绍矢量量化在图像编码、语音编码和语音识别、版权保护领域--数字水印方面的应用。第九章展望了矢量量化的未来发展趋势。
矢量量化技术涉及多种学科领域的理论和技术,如信息论、编码理论、通信原理、保密技术、信号处理、优化理论、模糊集合论、矩阵分析、神经网络、小波变换、视觉模型、拓扑学、随机概率理论、预测技术和模式识别等等。本书为从事信号压缩的研究人员介绍各种矢量量化器的结构以及矢量量化三大关键技术的研究现状和作者的一些研究成果,目的是推出一本全新的矢量量化著作,使研究人员能够全面了解矢量量化技术,从而推动国内对矢量量化技术的深入研究,为我国的航天事业、军事领域、多媒体产业和网络化测试的发展提供强有力的理论保障。
本书借鉴了胡征、杨有为编著的《矢量量化原理与应用》(1988年)一书的部分内容,参考了A.Gersho等著的"Vector Quantization and Signal Compression"(1992年)一书的部分内容,包含了近几年来各学者提出的算法(参考了160余篇文献),其中作者的研究成果(已发表的近50篇论文)占绝大部分。与《矢量量化原理与应用》一书相比,本书增加了大量内容,包括各种矢量量化器和码书设计算法、码字搜索算法、码字索引分配算法,以及在数字水印方面的应用等等。与"Vector Quantization and Signal Compression"一书相比,本书的重点放在码书设计算法、码字搜索算法、码字索引分配算法上,且增加了大量的应用实例。本书的最大特点是,首次引入码字索引分配问题和在数字水印方面的应用问题,理论性较强。
相关文档
最新文档