变声器的原理分类实现及应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
变声器的原理、分类、实现及应用
2009130309 徐佩
变声器的原理:变声器是通过改变输入声音频率,进而改变声音的音色、音调,使输出声音在感官上与原声音不同。变声器是借助对声音音色和音调的双重复合改变,
实现输出声音的改变的。通过自己发音,共振峰频率的改变是基本重采样实
现的,从重采样原理知道,这也同时引发了基频的变化,为保证基频变化和
共振频率变化的独立、互不相关,在基频移动是必须考虑抵消重采样带来的
偏移,理论上只要基频检测足够精确,确保可以保证基频改变和共振峰频率
改变间的互不相关,通过搬移和改变基频、语速,实现变声。
变声器的分类:根据变声器材质不同,变声器分为变声器硬件和变声器软件。变声器硬件,即通过硬件实现变声的工具变声原理。无论是硬件变声器,还是软件变声
器,其原理都是,通过改变输入声音频率,进而改变声音的音色、音调,
使输出声音在感官上与原声音不同。我们每个人的声音不同,源于我们
的每个人的音色和音调不同,我们所说的男中音、男高音,就是音调的
不同,而即便音调一致,我们依然能区分出两个不同人的声音,或不同
乐器的声音,这就是音色的不同。变声器,正是借助对声音音色和音调
的双重复合改变,实现输出声音的改变。其功能要点如下:
1.无限制式多格式录音:可以对来自麦克风、系统等众多设备的声音进
行实时的录制,支持多设备选择性录音,录音不需要临时文件,并可一
次性保存为WAV/WMA/MP3等众多流行格式。在录音过程中还允许对声音
进行男女变声处理!
2.音乐重混音录制功能:允许您选择一首歌曲(音频或视频),然后对
其进行各种特效处理,比如保持原唱的同时进行节奏快慢处理,或者进
行男女声变换处理。在混录过程中也允许您随时调节各特效参数,就像
一个专业混音师那样!通过这些混录功能,您可以制作出和原音乐风格
不同的轻快歌曲或类似迪斯科类型的快速歌曲,也可以是更轻柔的背景
歌曲!然后您新创作的歌曲将可以保存为新的音频文件。
3.文件混音功能:支持对一首歌曲(音频或视频)进行裁剪并对结尾部分施
加淡出效果,或增大原音乐音量,同时还允许将其和其他音乐进行混音处理,
并允许保存为WAV/WMA/MP3等众多流行格式。
变声器的实现:插值以后重新抽样。基本过程是这样的:已知当前帧帧长FL (采样)点,采样频率Fs ,目标变换帧频率Fs’ ,则目标变换帧帧长FL’=FL*Fs’/Fs 。
记R ate = Fs’/Fs ,那么FL’=FL * Rate ,其中Rate 为基频变化率。变换
开始时,先求得FL 和FL’ 的最小公倍数AL ,再将原音频帧插值为AL
点,最后将插值后的语音段重新抽样,得到长FL’ 点的变声后的数据。
专用变音集成电路
1、特点:宽电压范围3.0-5.0V*无需外部存储器*低功耗*使用可变电阻
或者开关来调整声音效果*可选择高音低音放大音机器人声音可以应用于玩
具变声,电话系统或其他声音领域*有静音功能
2、概述:RTS0072B是一种单片CMOS大规模集成电路设计的语音转换IC,
它可以将声音移调或转变成另外一个声音,通过将输入的正常速率的声音信
号进行非正常速度的编码转换,这是通过输入音频信号抽样后转换成数字信
号,并重组数信号以产生不同的声音。
3、管脚图和内部功能图:
Ra:麦克风调节控制,(40K – 20K) VR2: 音量控制 Rb: 最小音量設
定(22-120Ω) 上图为增加了LM386放大的应用电路,下图为三极管放大的应
用电路
变声器的应用:变声器是通过改变输入音频的音色、音调,并将变声后的音频输出的工具。
语音转换是指改变一个说话人的语音个性特征,使之具有另外一个说话人的
语音个性特征。语音转换拥有很广泛的应用空间,例如:
1、在文语转换系统中应用。
2、可以在电影配音中应用。
3、语音转换的思想可以用于恢复受损语音,帮助声道受损的说话人
的语音提高可懂度。
4、可用于在保密通信中进行语音个性化的伪装。
5、作为语音识别的前端预处理,减少说话人差异的影响。语音的个性特征可
以分为以下三类:
●音段特征:描述的是语音的音色特征。特征参数主要包括基音频率、
共振峰位置、共振峰带宽、基音频率、能量等。
●超音段特征:描述的是语音的韵律特征。特征参数主要包括因素的时
长、基音频率的变化(音调)、能量等。
●语言特征:包括习惯用语、方言、口音等。基音是指发浊音时声带振
动所引起的周期性,而基音周期是指声带振动频率的倒数。基音周期是语音信号最重要的参数之一,它描述了语音激励源的一个重要特征。不同的人以及同一个人在不同的年龄时期有不同的基音周期。人唱歌时,其基音频率范围大约是:童声高音频率范围为 260-880Hz ,低音频率范围为 196-700Hz ,女声高音频率范围为 220-1.1KHz, 低音频率范围为200-700Hz ,男声高音频率范围为160-523Hz 低音频率范围为80-358Hz 。此外,基音的变化模式称为声调,它携带着非常重要的具有辨意作用的信息。本文先就如何实时地通过基音频率的变化来实现语声变声,进行讨论,一个并在 Matlab平台上仿真并验证了算法。然后对处理后的语音添加场景效果等,在 DSP 上实现了一个集变声与特效处理一体的实时话音变换设备。