语音信号处理与识别

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

信号系统课程设计报告

欧阳光亮2012029020025

语音信号处理与识别

目的：理解时域和频域尺度变换基本概念，掌握信号时频域分析方法，正确理解采样定理，准确理解滤波器的概念。

内容：

（1）使用Matlab中wavrecord命令录制一段3秒的语音信号，使用wavplay命令播放，录制命令和播放命令中的采样频率设置成相同和不同两种情况，对观察到的现象进行分析并结合课本中的知识对该现象进行解释；

（2）使用不同的采样频率录制一段3秒的语音信号，画出信号的时域波形和频谱；找到语音信号的主要频谱成分所在的带宽；观察并分析不同采样频率对波形和频谱的影响；寻找声音信号不出现明显失真的最低采样频率；（3）录制一段男生的语音信号和一段女生的语音信号，对两段音频信号进行混合，设计滤波器将混合的语音信号分开成单独的男声和女声信号，如果分离效果不好，对原因进行解释。

Matlab命令：wavrecord, wavplay, wavwrite, wavread, save, load, fft, fftshift, filter, plot, subplot, figure.

过程:

(1)相同：

fs1=16000; %取样频率

fs2=16000; %播放频率

duration=5; %录音时间

fprintf('Press any key to start %g seconds of recording...\n',duration);

pause;

fprintf('Recording...\n');

y=wavrecord(duration*fs1,fs1); %duration*fs 是总的采样点数

fprintf('Finished recording.\n');

fprintf('Press any key to play the recording...\n');

pause;

wavplay(y,fs2);

wavwrite(y,fs1,'E:\matlab\record3.wav

不同：

fs1=16000; %取样频率

fs2=8000; %播放频率

duration=5; %录音时间

fprintf('Press any key to start %g seconds of recording...\n',duration); pause;

fprintf('Recording...\n');

y=wavrecord(duration*fs1,fs1); %duration*fs 是总的采样点数fprintf('Finished recording.\n');

fprintf('Press any key to play the recording...\n');

pause;

wavplay(y,fs2);

wavwrite(y,fs1,'E:\matlab\record3.wav');

现象：第二次播放时，声音明显失真。

理由：采样频率和播放频率不一样时声音信号会失真。

（2）

fs1=16000; %取样频率

fs2=16000; %播放频率

duration=5; %录音时间

fprintf('Press any key to start %g seconds of recording...\n',duration); pause;

fprintf('Recording...\n');

y=wavrecord(duration*fs1,fs1); %duration*fs 是总的采样点数fprintf('Finished recording.\n');

fprintf('Press any key to play the recording...\n');

pause;

wavplay(y,fs2);

wavwrite(y,fs1,'E:\matlab\record3.wav');

wav=wavread('E:\matlab\record3.wav'); Fs=16000; n=length(wav); f=(0:n-1)*16000/n; mag=abs(fft(wav)); subplot(2,1,1); plot(wav); subplot(2,1,2); plot(f,mag)

x 10

x/t

y /幅度

x/f

y /幅度

fs1=8000; %取样频率 fs2=8000; %播放频率 duration=5; %录音时间

fprintf('Press any key to start %g seconds of recording...\n',duration);

pause;

fprintf('Recording...\n');

y=wavrecord(duration*fs1,fs1); %duration*fs 是总的采样点数

fprintf('Finished recording.\n');

fprintf('Press any key to play the recording...\n');

pause;

wavplay(y,fs2);

wavwrite(y,fs1,'E:\matlab\record3.wav');

wav=wavread('E:\matlab\record3.wav'); Fs=8000;

n=length(wav); f=(0:n-1)*16000/n; mag=abs(fft(wav)); subplot(2,1,1); plot(wav); subplot(2,1,2); plot(f,mag)

wavplay(wav,8000)

x 10

x/s

y /幅度

x/hz

由图可知：语音信号的主要频谱成分所在的带宽为（0—1200hz ），带宽为1200hz 。

当采样频率较小时，频谱图上显示带宽较大，波形较稀松。

最低采样频率应为，声音信号的最高频率的两倍，由图可知为2400hz 。（3)女声：

wav1=wavread('E:\matlab\record1.wav'); wav2=wavread('E:\matlab\record2.wav'); wav=wav1+wav2; fp1=800; fp2=1500; fp=[fp1,fp2];