语音信号的时域特征分析

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

中北大学

课程设计说明书

学生：宝哲学号： 24

学生：瓮泽勇学号： 42

学生：侯战祎学号： 47

学院：信息商务学院

专业：电子信息工程

题目：信息处理实践:语音信号的时域特征分析指导教师：徐美芳职称: 讲师

2013 年 6 月 28 日

中北大学

课程设计任务书

2012-2013 学年第二学期

学院：信息商务学院

专业：电子信息工程

学生：宝哲学号： 24

学生：瓮泽勇学号： 42

学生：侯战祎学号： 47

课程设计题目：信息处理实践:语音信号的时域特征分析起迄日期： 2013年6 月7日～2013年6月 28 日

课程设计地点：学院楼201实验室、510实验室、608实验室指导教师：徐美芳

系主任：王浩全

下达任务书日期: 2013 年 6 月 7 日

课程设计任务书

语音信号的采集与分析

摘要

语音信号的采集与分析技术是一门涉及面很广的交叉科学，它的应用和发展与语音学、声音测量学、电子测量技术以及数字信号处理等学科紧密联系。其中语音采集和分析仪器的小型化、智能化、数字化以及多功能化的发展越来越快，分析速度较以往也有了大幅度的高。本文简要介绍了语音信号采集与分析的发展史以及语音信号的特征、采集与分析方法，并通过PC机录制自己的一段声音，运用Matlab进行仿真分析，最后加入噪声进行滤波处理，比较滤波前后的变化。

关键词：语音信号，采集与分析， Matlab

0 引言

通过语音传递倍息是人类最重要、最有效、最常用和最方便的交换信息的形式。语言是人类持有的功能．声音是人类常用的工具，是相互传递信息的最主要的手段。因此，语音信号是人们构成思想疏通和感情交流的最主要的途径。并且，由于语言和语音与人的智力活动密切相关，与社会文化和进步紧密相连，所以它具有最大的信息容量和最高的智能水平。现

在，人类已开始进入了信息化时代，用现代手段研究语音信号，使人们能更加有效地产生、传输、存储、获取和应用语音信息，这对于促进社会的发展具有十分重要的意义。

让计算机能听懂人类的语言，是人类自计算机诞生以来梦寐以求的想法。随着计算机越来越向便携化方向发展，随着计算环境的日趋复杂化，人们越来越迫切要求摆脱键盘的束缚而代之以语音输人这样便于使用的、自然的、人性化的输人方式。作为高科鼓应用领域的研究热点，语音信号采集与分析从理论的研究到产品的开发已经走过了几十个春秋并且取得了长足的进步。它正在直接与办公、交通、金融、公安、商业、旅游等行业的语音咨询与管理．工业生产部门的语声控制，、电信系统的自动拨号、辅助控制与查询以及医疗卫生和福利事业的生活支援系统等各种实际应用领域相接轨，并且有望成为下一代操作系统和应用程序的用户界面。可见，语音信号采集与分析的研究将是一项极具市场价值和挑战性的工作。我们今天进行这一领域的研究与开拓就是要让语音信号处理技术走人人们的日常生活当中，并不断朝更高目标而努力。

语音信号采集与分析之所以能够那样长期地、深深地吸引广大科学工作者去不断地对其进行研究和探讨，除了它的实用性之外，另一个重要原因是，它始终与当时信息科学中最活跃的前沿学科保持密切的联系．并且一起发展。语音信号采集与分析是以语音语言学和数字信号处理为基础而形成的一门涉及面很广的综合性学科，与心理、生理学、计算机科学、通信与信息科学以及模式识别和人工智能等学科都有着非常密切的关系。对语音信号采集与分析的研究一直是数字信号处理技术发展的重要推动力量。因为许多处理的新方法的提出，首先是在语音信号处理中获得成功，然后再推广到其他领域。

1.语音信号的介绍

1.1 语音信号的特点

通过对大量语音信号的观察和分析发现，语音信号主要有下面两个特点：

①在频域，语音信号的频谱分量主要集中在300～3400Hz的围。利用这个特点，可以用一个防混迭的带通滤波器将此围的语音信号频率分量取出，然后按8kHz的采样率对语音信号进行采样，就可以得到离散的语音信号。

②在时域，语音信号具有“短时性”的特点，即在总体上，语音信号的特征是随着时间而变化的，但在一段较短的时间间隔，语音信号保持平稳。在浊音段表现出周期信号的特征，在清音段表现出随机噪声的特征。

下面是一段语音信号的时域波形图(图2-1)和频域图(图2-2)，由这两个图可以看出语

音信号的两个特点。

Frequency(Hz)

Time(s)x 104图2-1语音信号时域波形图图2-2语音信号频域波形图

Figure 2-1Speech signal time-domain waveform Figure 2-2 Frequency-domain speech signal waveform

1.2语音信号的采集

在将语音信号进行数字化前，必须先进行防混叠预滤波，预滤波的目的有两个：①抑制输入信导各领域分量中频率超出fs/2的所有分量(fs为采样频率)，以防止混叠干扰。②抑制50Hz的电源工频干扰。这样，预滤波器必须是一个带通滤波器，设其上、下截止颜率分别是fH和fL，则对于绝人多数语音编译码器，fH=3400Hz、fL＝60~100Hz、采样率为fs＝8kHz；而对丁语音识别而言，当用于用户时，指标与语音编译码器相同。当使用要求较高或很高的场合时fH＝4500Hz或8000Hz、fL＝60Hz、fs＝10kHz或20kHz。

为了将原始模拟语音信号变为数字信号，必须经过采样和量化两个步骤，从而得到时间和幅度上均为离散的数字语音信号。采样也称抽样，是信号在时间上的离散化，即按照一定时间间隔△t在模拟信号x(t)上逐点采取其瞬时值。采样时必须要注意满足奈奎斯特定理，即采样频率fs必须以高于受测信号的最高频率两倍以上的速度进行取样，才能正确地重建波它是通过采样脉冲和模拟信号相乘来实现的。下图时一段语音信号在采样频率44.1KHz 情况下的频谱图。