数字信号处理--变声器报告

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数字信号处理--变声器报告

1项目目标:把自己(男)的声音分别变成小孩的声音、女人的声音和老人的声音。

2变声原理:语音科学家将人类发声过程视作一个由声门源输送的气流经以声道、口、鼻腔组成的滤波器调制而成的。人类语

音可分为有声语音和无声语音,前者是由声带振动激励的

脉冲信号经声腔调制变成不同的音,它是人类语言中元音

的基础,声带振动的频率称为基频。无声语音则是声带保

持开启状态,禁止振动引发的。一般来说,由声门振动决

定的基频跟说话人的性别特征有关,如下表,而无声语音

则没有体现这个特征。说话人的个性化音色和语音的另外

一个声学参数——共振峰频率的分布有关。儿童由于声道

短,其共振峰频率高于成年人,成年女性的声道一般短于

成年男性,所以女性的共振峰频率一般高于男性。

表男声、女声和童声基频、共振峰频率关系表

由上可知,在进行性别变声时,主要考虑基频和共振峰频率的变化。当基频伸展,共振峰频率也同时伸展时,可由男声变成女声,女声变成童声;反之,基频收缩,共振峰频率也同时收缩时,则由童声变女声,女声变男声。为了获得自然度、真实感较好的变声效果,基

频和共振峰频率通常必须各自独立地伸缩变化如图1。

V1 男声变童声

V2 男声变女声

图1 基频和共振峰频率分布的变化

共振峰频率的改变是基于重采样实现的,从重采样原理知道,这也同时引发了基频的变化,为保证基频变化和共振峰频率变化的独立、互不相关,在基频移动时必须考虑抵消重采样带来的偏移,理论上只要基频检测足够精确,确实可以保证基频改变和共振峰频率改变间的互不相关。

3设计方案:1录入自己(小孩、女人、老人)的一段声音 2用MATLAB 做fft得到其频谱 3做fft频谱分析 4搬移和改变基

频、语速,实现变声

4程序流图

5程序清单:

元语音信号

[s,fs,nbits] = wavread(‘wo.wav’); % 载入语音s s = s/max(s); %归一化

L = length(s); % 读入语音长度

S=fft(s,L);

pigure

ubplot(2,1,1);plot(s);title(‘原语音信号波形’);

ubplot(2,1,2);plot(abs(S));title(‘原语音信号频谱’);

变声:

小孩的声音

clear all,close all, clc;

% 定义常数

FL =80; % 帧长

WL = 240; % 窗长

P = 10; % 预测系数个数

[s,fs,nbits] = wavread('wo.wav'); % 载入语音s

s = s/max(s); %归一化

L = length(s); % 读入语音长度

FN = floor(L/FL)-2; % 计算帧长

% 预测和重建滤波器

exc = zeros(L,1); % 激励信号

zi_pre = zeros(P,1); % 预测滤波器的状态

s_rec = zeros(L,1); % 重建语音

zi_rec = zeros(P,1);

% 变调不变速滤波器

exc_syn_t = zeros(L,1); % 合成的激励信号

s_syn_t = zeros(L,1); % 合成语音

last_syn_t = 0; %存储上一个(或多个)段的最后一个脉冲的下标zi_syn_t = zeros(P,1); % 合成滤波器的状态

hw = hamming(WL); % 汉明窗

% 依次处理每帧语音

for n = 3:FN

% 计算预测系数

s_w = s(n*FL-WL+1:n*FL).*hw; %汉明窗加权后的语音

[A E] = lpc(s_w, P); %用线性预测法计算P个预测系数

% A是预测系数,E会被用来计算合成激励的能量

s_f = s((n-1)*FL+1:n*FL); % 本帧语音,下面就要对它做处理

% (4) 用filter函数s_f计算激励,注意保持滤波器状态

[exc1,zi_pre] = filter(A,1,s_f,zi_pre);

exc((n-1)*FL+1:n*FL) = exc1; %计算得到的激励

% (5) 用filter函数和exc重建语音,注意保持滤波器状态

[s_rec1,zi_rec] = filter(1,A,exc1,zi_rec);

s_rec((n-1)*FL+1:n*FL) = s_rec1; %计算得到的重建语音

% 注意下面只有在得到exc后才会计算正确

s_Pitch = exc(n*FL-222:n*FL);

PT = findpitch(s_Pitch); % 计算基音周期PT

G = sqrt(E*PT); % 计算合成激励的能量G

% (13) 将基音周期减小一半,将共振峰频率增加7000Hz,重新合成语音

PT1 =floor(PT/2); %减小基音周期

poles = roots(A);

deltaOMG = 700*2*pi/8000;

for p=1:10 %增加共振峰频率,实轴上方的极点逆时针转,下方顺时针转if imag(poles(p))>0 poles(p) = poles(p)*exp(j*deltaOMG);

elseif imag(poles(p))<0 poles(p) = poles(p)*exp(-j*deltaOMG);

end

end

A1=poly(poles);

tempn_syn_t = [1:n*FL-last_syn_t]';

exc_syn1_t = zeros(length(tempn_syn_t),1);

exc_syn1_t(mod(tempn_syn_t,PT1)==0) = G; %某一段算出的脉冲

exc_syn1_t = exc_syn1_t((n-1)*FL-last_syn_t+1:n*FL-last_syn_t);

相关文档
最新文档