语音信号的滤波处理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
语音信号的滤波处理
胡勇200921011003
一、概述
语音信号的滤波处理是数字信号处理领域目前发展最为迅速的信息科学研究领域的核心技术之一,通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。
简单的语音信号滤波处理的基本流程如下框图:
二、语音信号预处理
(一)信号采样
利用麦克风录制一段语音1,在MATLAB中,利用函数wavread.m将其转化为数字向量,并使用函数sound.m进行处理前声音回放,以便比对。
(二)频率确定
人的语音信号频率一般集中在200 Hz到4.5 kHz之间,通过将信号从时域到频域的变换,以确定语音信号频率实际范围,来决定滤波器的设计类型。
若噪声为加性的,采用简单的频谱分析即可确定语音信号频率范围;但若噪声为乘性的或卷积性的,则需利用倒谱进行分析,此时采用同态滤波器(homomorphic filtering),即广义线性滤波器的基本思路来去噪。
如Figure 1频谱图所示,该语音信号中人的语音频率主要集中在0—700Hz 之间,而相对的大于700Hz的几个凸起则为噪声;在倒谱图中,除开始和结束
1语音文件可从/u/ish?uid=1713628781处获得,信号采样频率为11025Hz,采样大小8Bit,单声道.
有一定的卷积性噪声影响外,其他时间可以确定为加性噪声的影响。
三、滤波器设计
数字滤波器(Digital Filter)根据幅频特性所表示的通过或阻止信号频率范围的不同,滤波器可分为四种,即低通(LP, Low Pass)、高通(HP, High Pass)、带通(BP, Band Pass)和带阻(BS ,Band Stop)滤波器。一般而言,大多数噪声都存在于高频部分。
本文拟采用Butterworth滤波器,Chebyshev I型滤波器,窗函数,Chebyshev 一致逼近法等设计的滤波器进行除噪处理。
(一) Butterworth滤波器
信号频率集中在0—700Hz之间,于是将低通滤波器技术要求,定为通带截止频率为700Hz,阻带下限截止频率为1000Hz,通带衰减为0.25dB,阻带衰减为
50dB。设计的Butterworth滤波器阶数为N=20,频谱响应,相频响应,信号处理后波形如Figure 2所示。
从图中波形图可以看到,滤波后语音的波形开始显现出来,利用sound.m函数可以听到相应的效果。
(二) Chebyshev I型滤波器
与Butterworth滤波器相同的技术参数,Chebyshev I型滤波器处理原语音信号的频谱响应,相频响应,处理后波形图如Figure 3所示。
从图中,其处理后的语音信号效果与Butterworth滤波器大致相同,但也有区别:其一,对比二者幅频响应曲线图,Chebyshev I型滤波器在通带内呈波纹状,即为均匀衰减,而Butterworth滤波器则为单调下降衰减;其二,相同效果下,Chebyshev I型滤波器的阶数为N=9,而Butterworth滤波器阶数却为N=20,更为复杂点。
(三) 窗函数法
采用Hamming 窗函数设计的N=50阶滤波器得到频谱响应,相频响应以及处理后波形图如Figure 4所示。
和之前两者相比,效果方面没什么大的区别,关键在相频响应曲线呈波形状,而之前两种滤波器的相频响应曲线不规则。
(四) 切比雪夫逼近法
Chebyshev 逼近法设计的滤波器是在频率特性上对理想频率特性)(jw d e H 的逼近,常用的函数逼近方法有:①插值法;②最小平方逼近法;③最佳一致逼近,Chebyshev 逼近法基于③。针对原语音信号,设计的低通滤波阶次为N=30,其频谱响应,相频响应,处理后波形如Figure 5所示。
四、效果显示
文中涉及的Matlab 程序见附录,在每一个滤波器后都会有4秒钟时间听到语音处理后的声音,与最开始的语音对比,前三种滤波器设计的除噪效果很好,将
原语音中“嘀——”的一声去掉了。但是由于处理过程中将语音的振幅降低了,所以听起来有点低沉,至于最后一种滤波器,还存在一定的噪声。
五、结语
当实际处理一个信号时,滤波器类型的选取主要取决于滤波时,要强调的侧重面及信号的特点。文中涉及的四种滤波器,前两种属于IIR(Infinite Impulse Response)数字滤波器,后两种属于FIR( Finite Impulse Response)。
IIR滤波器最大优点是可取得非常好的通带与阻带衰减,计算量较少(阶次低),如果强调最大限度去除噪声而没有别的限制,最佳选择是IIR滤波器,其缺点是不具有线性相位,由于转移函数中存在极点,所以IIR滤波器中还存在稳定性问题。
FIR滤波器最大优点是可取得线性相位且不存在稳定性问题(全零点),如果强调要不产生相位失真且计算速度允许,那么最好选择为FIR滤波器,它也有缺点,即为了获得较好的通带和阻带衰减,滤波器的阶次N往往较大(是同指标的IIR滤波器的5—10倍),所以计算量较大,不易实时实现。
六、参考文献
[1] 胡广书.数字信号处理理论.算法与实现(第二版).清华大学出版社.2008
[2] 飞思科技.Matlab7辅助信号处理技术与应用.电子工业出版社.2005
[3] 郑国振.语音信号分析与处理系统设计.中国海洋大学青岛学院毕业论文.2010
[4] 刘涛.几种滤波技术的比较研究.青岛农业大学毕业论文.2009.6
[5] 张文等.基于Matlab的语音信号滤波设计与实现.山西电子技术.200802
[6] 康素成.数字信号处理实验指导.盐城师范物理科学与电子技术学院.2009
七、附录
文中涉及的Matlab程序
%Speech_Signal_Processing.m用于简单语音信号的滤波处理
%-----第一阶段:信号读入------%
clc;clear;
[data,fs]=wavread('city3'); %语音文件的读入,fs为采样频率,此信号为单声道
sound(data,fs); %原信号的播放效果
pause(4);
%-----第二阶段:频率确定------%
figure(1); %绘制原信号的频谱图和倒谱图
N=length(data);T=(0:N-1)/fs;
Y=fft(data,N); %对原信号做FFT变换
Pyy=Y.*conj(Y)/N;
F=fs*(0:N/2)/N;
subplot(211);plot(F,Pyy(1:N/2+1)); %绘制频谱图
title('原信号频谱图');axis([0,4500,0,2]);
xlabel('频率(Hz)');ylabel('幅度');
data_hat=rceps(data); %产生原信号的实倒谱
subplot(212);plot(T,data_hat); %绘制倒谱图
title('原信号倒谱图');
xlabel('倒频(s)');ylabel('幅度');
%-----第三阶段:滤波器设计----%
%(1)Butterworth滤波器
figure(2); %绘制巴特沃斯滤波器频响、相位曲线及信号滤后曲线disp('1、Butterworth Filtering');
%低通滤波器技术要求,经上分析,拟定
%通带截止频率为700Hz,阻带下限截止频率为1000Hz
%通带衰减为0.25dB,阻带衰减为50dB
Wp=2*pi*700/fs;Ws=2*pi*1000/fs;Rp=0.25;Rs=50;
Omip=Wp/pi;Omis=Ws/pi; %归一化技术要求
[N,Wn]=buttord(Omip,Omis,Rp,Rs); %确定滤波器的阶数
disp(['The order of Butterworth Filtering is ',num2str(N)]);
[b,a]=butter(N,Wn); %确定Butterworth滤波器转移函数系数向量[H,w]=freqz(b,a,512); %512点复频响应
subplot(221); %绘制幅频响应曲线
plot(w/pi,abs(H));title('幅频响应');
xlabel('w(/pi)');ylabel('|H(jw)|');axis([0,1,0,1.1]);
%set(gca,'XTickMode','manual','XTick',[0,Omip,Omis,1]);
%set(gca,'YTickMode','manual','YTick',[0,10^(-Rs/20),10^(-Rp/20),1]);
%grid;