一种改进的2_4kb_s混合激励线性预测声码器方案
2.4kbps混合激励线性预测编码方法研究

22 非周期 脉 冲 .
24 自适应谱增强 . 为了使合成语音的频谱能够 在共振峰所处的 频带内与原始的语音信 号匹配得更好,引入 自 适
一 Ⅳ 应谱增强技术。这是因为从时域看 ,合成语音两
混合脉冲和噪声激励可 以消除 L C 声码器 P 的嗡嗡卢,但无法消除一些孤立的、短暂的音调, 会产生一些类似电流声的单音噪声。这是 由于在 清/ 浊的过渡段声门脉冲不是很稳定,从而导致激 励 没有严格 的周期性 。在 过 去的 L C方法 中 ,这 P
周 期能量没 有得 到恢 复 ,主观 听觉 上会 感 觉合 成 语音 有 明显的 “ 嗡 ”声:反过 来 ,如 果将含 有 嗡 浊 音 的激 励源按 噪 声激励源 合 成 ,听 起 来就会 感
觉语 音嘶哑 。
2 8
ME P算法采用多带混合激励模型。语音被 L 分为 5 个固定的频带 0 0 H 、5O 0 0 z  ̄5 0 z O ~10 H 、
1 0 " 2 0 Hz 0 0 3 0 Hz 0 0 4 0 Hz 0 0 - 0 0 、2 0 0 0 、3 0  ̄ 0 0 ,
在 每 个 子 带 上 分 别 对 语 音 进 行 浊 音 强度 (oc Vi e segh的 计 算 ,依据 其 浊 音 强 度 和 基 音 搜 索 的 t nt) r
结 果来 判断 该子 带 语音 是 清音 、浊音 还 是抖 动浊
音 。合成 时 , 据 各 子 带 的属 性稀I 强 度 对通 根 浊音 过 该 子带滤 波 器 的噪 声 、周 期 脉冲 和 非周 期脉冲
维普资讯
马震等:24 b s . kp 混合激励线性预测编码方法研 究
专业无线通信如何加密?

领先的无线对讲系统解决方案提供商专业无线通信为什么要加密?对专业无线,保密可靠度要求不高的情况下,可采用频带倒置的扰频模块来完成加密,此种加密通信无需向国家保密主管部门办理相关手续就可以使用。
如果要获得保密级别高的通信,只有采用数字加密技术处理。
而数字加密首先就是要解决语言的如何数字化问题。
1、语言的数字化语言的数字化,也就是话音的数字编码。
在话音数字编码中,若想获得好音质,其数字编码速率要高,在PCM话音数字编码中其速率在64Kb/s,最少也要32Kb/s。
但是这样的速率是无法在专业无线通信有限的频带宽度内传输。
专业无线通信中话音数字编码,既要有较好音质,又不能编码速率太高,这就是专业无线通信话音数字化的难点。
话音数字编码主要有三种方法,简要介绍如下:(1)波形编码它是将话音信号的模拟波形,进行取样数字化处理的编码方法。
主要有脉冲编码调制(PCM)和增量编码调制(M)两种。
为了获得较好的音质,数字取样的波形不能太低,否则波形量化后失真大,影响到话音质量。
PCM编码速率在64Kb/s~32Kb/s之间。
M编码速率也在64Kb/s~32Kb/s之间。
在专业无线通信的话音编码经常采用CVSD(可变余率增量调制编码),其速率在16Kb/s领先的无线对讲系统解决方案提供商可获得较好的话音音质。
由CVSD编码数字传输中无需同步,电路较为简单,在单路的专业无线通信系统中常被采用。
(2)声源编码声源编码又称参量编码,它是提取话音信号中的特征作为参数(如:基音、其振峰等),然后对特征参数进行数字化处理。
由于仅对提取的特征参数进行量化,所以其话音数字编码速率可以低,可以把话音压缩到2Kb/s,仍可保持一定的可懂度,但其自然度就很差了。
例如2Kb/s的线性预测编码(LPC)的声码器,就在一些特定条件下使用。
(3)混合编码它是将有较好音质的波形编码,与有较低编码速率的声源编码融合在一起组合成的话音数字编码方式。
混合编码速率通常在80Kb/s~16Kb/s之间,可获得较发的话音音质,即使是同为4Kb/s速率,其音质也优于声源编码。
多媒体技术与应用(简答题)

多媒体技术与应用简答题1、Authorware主界面由标题栏、菜单栏、工具栏、和组成。
正确答案:【图标栏|设计窗】2、多媒体触摸屏分为四种,分别为电阻式、红外线式、和。
正确答案:【电容感应式|表面声波式】3、帧中第一个字节进入网络的瞬间、到此字节离开网络的瞬间所经历的时间称为。
正确答案:【延迟】4、传送等待时间正确答案:【传送等待时间是指帧中的第一个字节进入网络|到最后一个字节离开网络所需要的时间)。
】5、码激励线性预测声码器正确答案:【是|1985年提出的,一种以码本作为激励源的线性预测编码技术|它的语音合成质量高,抗噪声好,在低速率语音方面有广泛应用。
】6、矢量图正确答案:【用一组指令集合来描述图形的内容,这些指令用来描述构成该图形的所有直线、圆、圆弧、矩形、曲线等图元的位置、维数和形状等。
要点:文件数据量小。
】7、超文本正确答案:【超文本定义为由信息结点和表示结点间相关性的链构成的一个具有一定逻辑结构和语义的网络。
超文本的主要成分是结点和表示结点间关系的链构成的信息网络。
】8、什么是虚拟现实技术?正确答案:【虚拟现实是一项与多媒体密切相关的边缘技术,它通过综合应用图像处理、模拟与仿真、传感、显示系统等技术和设备,以模拟仿真的方式|给用户提供一个真实反映操作对象变化与相互作用的三维图像环境|从而构成一个虚拟世界,并通过特殊的输入输出设备给用户一个与该虚拟世界相互作用的三维交互式用户界面。
】9、简述多媒体作品开发的一般过程。
正确答案:【包括需求分析|规划设计|素材的采集和加工、作品的集成、测试、发布和评价。
】10、列举常见的图像文件格式正确答案:【BMP|JPG|GIF|TIFF,PSD,PNG 】11、地球站,是指设在地球表面上的。
正确答案:【无线电通信站】12、H.323终端都必须支持语音通信,和数据通信可选。
正确答案:【视频】13、音乐检索是以音乐为中心的检索,利用音乐的音符和等特性来检索。
改进的混合激励线性预测编码算法

改进的混合激励线性预测编码算法朱宗明;姜占才【期刊名称】《新型工业化》【年(卷),期】2015(000)009【摘要】针对混合激励线性预测编码中子带声音强度的硬判决导致激励源欠精细问题,将子带声音强度视为5维的模糊特征矢量,用改进的LBG算法设计码本并用5bit对其作矢量量化;以精细量化的子带声音强度调制带通滤波器,以此获取精细的混合激励信号,最终达到改善合成语音质量的目标。
仿真实验表明:改进算法能有效地改善合成语音的自然度。
%As modulating signal of ifve passband band-pass iflter, subband voiced intensity vector which determines the quality of synthetic speech directly, is the key to acquire accurate mixed excitation signal. In the scheme of mixed excitation linear prediction coding (MELP), for the defects of excitation source which lacks accurate caused by hard decision that subband sound intensity is either 0 or 1, subband voiced intensity is seen as 5-dimension obscure eigenvector;subband voiced intensity codebook is designed using modiifed LBG algorithm and subband voiced intensity is quantized using 5-bit vector;ifve passband band-pass iflter is modulated using accurate and quantized subband voiced intensity, thus acquiring accurate mixed excitation signal;ifnally the quality of synthetic speech is improved. Simulation experiments show that modiifed algorithm not only canimprove the naturalness of synthetic speech, but also has stronger robustness for background noise.【总页数】6页(P8-13)【作者】朱宗明;姜占才【作者单位】中国人民解放军69220部队,阿克苏843000;青海师范大学物理系,西宁810008【正文语种】中文【相关文献】1.改进的繁殖码激励线性预测编码器 [J], 鲍长春;赵国谦;戴逸松2.2.4kbps混合激励线性预测编码方法研究 [J], 马震;陈延萍3.一种改进的4.8Kbit/s码激励线性预测编码方案 [J], 俞捷;诸庆麟4.多脉冲激励线性预测编码算法研究 [J], 李心愿;何培宇;徐自励;邓方5.关于短延时码本激励线性预测编码方案的改进 [J], 赵俊;温启荣因版权原因,仅展示原文概要,查看原文内容请购买。
混合激励线性预测语音编码标准中线谱频率量化的研究

混合激励线性预测语音编码标准中线谱频率量化的研究肖东;莫福源;陈庚;马力【摘要】线谱频率(Line Spectral Frequency,LSF)是线性预测频谱系数(Linear Predication Coefficient,LPC)有效的编码形式.语音线性预测模型中,LPC反映了声道调制的模型,是影响语音听觉感知重要的参数之一.在混合激励线性预测语音编码(Mixed Excitation Linear Prediction,MELP)标准中,对LSF采用4级码本进行分级式矢量量化.首先,为减少其量化冗余度以降低编码速率,本文提出了一种改进的选择算法,生成了一个2级码本替换之.其次,为提高合成语音质量,依据LSF矢量量化的精度与合成语音质量的关系的实验结果,提出根据人耳听觉感知特性进行LSF量化和评价的方法,并予以实验证明.【期刊名称】《应用声学》【年(卷),期】2012(031)002【总页数】9页(P109-117)【关键词】混合激励线性预测语音编码;线谱频率;码本;矢量量化【作者】肖东;莫福源;陈庚;马力【作者单位】中国科学院水声环境特性重点实验室北京 100190;中国科学院声学研究所北京 100190;中国科学院研究生院北京 100190;中国科学院声学研究所北京 100190;中国科学院水声环境特性重点实验室北京 100190;中国科学院声学研究所北京 100190;中国科学院水声环境特性重点实验室北京 100190;中国科学院声学研究所北京 100190【正文语种】中文【中图分类】TN912.32;O4221 引言在某些通信环境下,如水声通信和短波通信中,因带宽限制,语音通信只能采用低速率的参数编码方案。
目前,众多的低速率参数语音编码标准中,混合激励线性预测语音编码(Mixed Excitation Linear Prediction,MELP)是最成功的,被美国国防部选作联邦语音声码器标准。
低速语音编码

低速率语音编码的实现与仿真摘要:近年来,随着通信与计算机网络的飞速发展,低速率语音编码以其低速率且良好的编码质量等特点,在数字通信中越来越受到重视。
低速率语音编码方案主要是基于LPC-10,混合激励线性预测(MELP),多带激励编码(MBE),正弦变换编码(SCI)等。
它们大都能够工作在2.4kbps速率下。
本文对LPC-10进行了研究,以LPC模型为原型,通过联合帧、矢量量化及参数内插等技术,实现了一种低速率语音编码算法。
归一化互相关函数基音检测算法(NCCFPDA)的引入,提高了清浊音判决的准确率;线谱对(LSP)参数的量化特性,降低了误差率,提高了算法的稳健性;固定矢量量化码本(LSPVQ码本)提高了量化精度并降低了传输码率;联合帧的应用,较好的平衡了低码率与语音质量严重恶化的矛盾,而与参数内插技术的结合更加降低了传输码率。
通过该算法获得了比较满意的合成语音,并在MATLAB中得到实现,验证了算法的可行性。
关键词:语音编码,基音检测,LSP,MATLAB目录第一章绪论 (4)1.1引言 (4)1.2低速率语音编码研究现状 (4)1.3常用低速率语音编码算法 (5)1.3本文主要研究内容及章节安排 (6)第二章 LPC-10编码算法 (7)2.1LPC-10编码算法的理论依据 (7)2.1.1 语音信号的产生模型 (7)2.1.2语音信号的线性预测分析[8] (7)2.2LPC-10编解码算法的分析[9] (8)2.2.1 LPC-10编码算法分析 (8)2.2.2 计算声道滤波参数RC (9)2.2.3 计算增益RMS (10)2.2.4 提取基音周期和检测清/浊音 (10)2.2.5 参数编码与解码 (10)2.2.6 LPC-10解码算法分析 (10)2.3LPC-10声码器存在的问题[9] (11)第三章 900BIT/S极低速率编码算法 (12)3.1算法概述 (12)3.2编码原理 (13)3.2.1预处理 (13)3.2.2线性预测分析 (14)3.2.3 NCCFPDA算法[12] (16)3.2.4 矢量量化[9] (19)3.2.5参数编码 (20)3.3解码原理 (20)3.3.1参数解码 (21)3.3.2合成语音 (21)3.4本章小节 (22)第四章低速率语音编解码算法的仿真实现 (23)4.1仿真实验平台 (23)4.2编解码器的工作流程 (23)4.2语音编码仿真结果 (24)第五章结论与展望 (25)5.1结论 (25)5.2展望 (25)参考文献 (26)第一章绪论1.1引言语音通信是一种非常重要且普遍的通信方式。
一种甚低码率声码器的设计

一种甚低码率声码器的设计李强;张玲;朱兰;明艳【期刊名称】《重庆邮电大学学报(自然科学版)》【年(卷),期】2018(030)006【摘要】在混合激励线性预测(mixed excitation linear prediction,MELP)模型的基础上,以超帧为单位,采用多帧联合编码技术,分模式对子帧的语音特征参数进行联合量化,实现了一种码率为600 bit/s的声码器.为了进一步减小量化误差,设计出了一种基于高斯混合模型的预测分类分裂矢量量化器(predictive switched split vector quantiza-tion based on Gauss mixture model,GMM-PSSVQ),该量化器对超帧中某些子帧的线谱频率进行量化,并利用帧间预测和线性插值等方法提高编码效率.采用谱失真对设计的矢量量化器进行性能评估,并分别与多级矢量量化和预测分裂矢量量化算法进行性能比较;通过客观感知语音质量评估和主观判断韵字测试对实现的声码器进行性能测试.测试结果表明,设计的矢量量化器平均谱失真最低,实现的声码器合成语音具有较高的清晰度和可懂度.【总页数】7页(P776-782)【作者】李强;张玲;朱兰;明艳【作者单位】重庆邮电大学信号与信息处理重庆市重点实验室,重庆400065;重庆邮电大学信号与信息处理重庆市重点实验室,重庆400065;重庆邮电大学信号与信息处理重庆市重点实验室,重庆400065;重庆邮电大学信号与信息处理重庆市重点实验室,重庆400065【正文语种】中文【中图分类】TP919.81;TP39【相关文献】1.甚低码率网络数字视频服务器的设计 [J], 程德强;钱建生;黄书慧2.一种基于Q4401声码器的基带信号处理器的设计与实现 [J], 傅世友3.一种600b/s甚低速率声码器的研究 [J], 陈亮;张雄伟4.一种低码率声码器系统的设计及实现 [J], 刘嘉勇;方勇;朱立东;葛艳5.一种低码率声码器的算法研究及DSP实现 [J], 朱立东因版权原因,仅展示原文概要,查看原文内容请购买。
一种改进的线性预测语音编码技术及实现

一种改进的线性预测语音编码技术及实现
纪友芳;刘桂斌
【期刊名称】《计算机工程与应用》
【年(卷),期】2009(45)15
【摘要】线性预测编码是实现语音编码的一项重要技术,介绍了线性预测编码技术的实现,提出一种改进型的声激励线性预测语音编码方法.最后,将简单LPC语音编码与声激励LPC语音编码进行比较.实验结果表明,该方法能够很好地实现语音编码,声音效果也比简单LPC更理想.
【总页数】3页(P163-165)
【作者】纪友芳;刘桂斌
【作者单位】中国石油大学,华东,计算机与通信工程学院,山东,东营,257061;中国石油大学,华东,计算机与通信工程学院,山东,东营,257061
【正文语种】中文
【中图分类】TN912.3
【相关文献】
1.一种基于FPGA实现的改进语音端点检测算法 [J], 欧阳玲;宋克
2.一种改进的4.8kb/s码激励线性预测语音编码 [J], 鲍长春
3.一种用局部非线性预测模式实现的语音编码算法 [J], 马霓;韦岗
4.一种孤立词语音识别的实现方法及改进 [J], 刘丽媛;严家明
5.一种改进的DHMM语音识别算法的DSP实现 [J], 王维强
因版权原因,仅展示原文概要,查看原文内容请购买。
混合激励线性预测低速率语音编码研究

t nc dn ( P - 0 , x d e ct in l ep e i i ( L ) m l— a d e ct in M E , n sia t n fr o ig i o i L C 1 ) mi x i t i rdc o ME P , ut b n x i t ( B ) i od l r s m c r n o g e ao n tn i ao su a o d
Ab t a tI r e o s t f e n so e d g tlc mmu ia in a d oh rc mme c a p lc t n , e s e c o r s sr c :n o d rt a i y d ma d ft ii o s h a nc t n te o o r ila p ia i s t p e h c mp e - o h s n tc n lg a e n d v lp d r p d yT e e a e s v r l i B C p e al g i e e ty a ss c s l e p e i - i e h o o y h sb e e eo e a i l .h r r e ea n L RS r v i n n r c n e r , h a i r d c o ma i u n
一种改进的2.4kb/s混合激励线性预测声码器方案

懂 度和 自然度 方面 都有 一定 的提 高。
关键词 ;清浊 音判 决 ;ME P L ;声码 器 ;多级 矢量 量化 ( VQ) MS 中图分类 号 ;T 1. N9 23 文 献标识 码 :A
1
引 言
在 美 国 联 邦 政 府 选 择 新 一 代 24 bs 语 音 编 码 标 准 以代 替 原来 的 L C 1e 模 型 的过 程 中 ,A.. .k / P 一0 V
l I 。
2 改 的型 进模
21 能 量~ 微 分过 零 率 比 ( . )参 数 实 验表 明 ,不 自然 合 成 音 多 发 生 在 元 音 语 音 段 的开 始 、结 束 或
两 个 元 音 发音 之 间 的 结合 部 分 ,也 就 是 人 的发 音 状 态 处 于 过 渡 态 的 时期 。在 元音 段 的 开 始或 结束 时期 ,语 音 能 量 通 常 比较 低 。两 个 元 音 之 间 , 有 一段 基 音 周 期 不 是 很 规 则 的 时期 。不 规 则 的基 音 成 分 或
低 码 率 下 保 证 了 良好 的 合成 语 音 质 量 。
但是 ,经过大量 的听觉测试 ,发现用 ME P方案合成的语音还是存在一些 问题 。特别是在语音 的 L 过 渡 区段 ,人 工 合 成 音 的 迹 象 比较 明显 ,语 音 听起 来 显 得 有 些 生硬 。为 了使 合 成 语 音 听起 来 更加 自然 ,
Vo |2 NO 3 l 1 .
J e 20 un 07
一
种 改进 的 24 bs混合激 励 线性 预测声 码器 方案 .k /
马欣 , 刘 常澍 , 李 文 元 , 张毓 忠
( 天津 大 学 电子 信 息 工 程 学 院 , 天津 3 0 7 ) 002
一种改进的规则脉冲激励-长时预测语音编码方案

一种改进的规则脉冲激励-长时预测语音编码方案
赵胜辉;匡镜明;刘波涛
【期刊名称】《北京理工大学学报》
【年(卷),期】1995(15)2
【摘要】在对规则脉冲激励-长时预测语音编码方案(比特率为13kbit/s)研究的基础上,提出了7.4kbit/s的改进方案,使编码速率大大降低.改进方案在长时预测分析中用部分搜索法代替了原来的全搜索,并采用矢量量化技术对预测残差信号进行量化.其硬件实现在TMS320C30EVM上完成,所用DSP芯片为单片TMS320C30.实验结果表明,合成语音质量与原方案十分接近.
【总页数】6页(P199-204)
【关键词】语音编码;规则冲激励;长时预测;矢量量化
【作者】赵胜辉;匡镜明;刘波涛
【作者单位】北京理工大学电子工程系
【正文语种】中文
【中图分类】TN912.32
【相关文献】
1.一种改进的语音二项式正弦脉冲激励方案 [J], 邓立新;张玲华;郑宝玉
2.一种改进的语音信号非线性自适应预测编码方案 [J], 欧阳缮;陈云宇;方惠均
3.一种改进的
4.8Kbit/s码激励线性预测编码方案 [J], 俞捷;诸庆麟
4.一种新的规则脉冲激励语音合成模型 [J], 刘福文;倪维桢
5.矢量量化法用于改进的多带激励声码器一种极低比特率语音编码方案 [J], 刘波涛;匡镜明
因版权原因,仅展示原文概要,查看原文内容请购买。
声码器

声码器是什么 语音模型 声码器技术 声码器实现 发展方向
声码器是什么
语音(声音)编解码器 Encoder、Decoder、Vocoder 声-语音信号,8K采样,13PCM 码-码本,码字 器-处理器:编码器,解码器
语音器官
喉:声带,声门 声道:一个具有某种谐振特性的腔体,具 体基音周期 嘴 整个系统是一个线性时变系统
混合编码器
融合了波形编码和声源编码技术 两种应用较多的方案:
多脉冲激励线性预测编码器(MPLPC):设置有N MPLPC N 个激励脉冲样本的序列,选择其中的M个样本激励 使与原始语音误差最小 码激励线性预测编码(CELPC):N个激励脉冲样 值为一组,构成N维矢量的码字,K个码字形成一个 码本(codebook)。选择与原话音误差最小的激励 码字,并将其在码本中的位置编码传送,而不需要 传输N个激励样值本身
EFR声码器性能
用代数码激励线性预测(ACELP)算法 编码速率为12.2kbit/s 信道编码后速率为22.8kbit/s 具有VAD和DTX功能 MOS评分比RPE-LTP高0.7左右
QCELP声码器
采用Qualcomm码激励线性预测 使用与脉冲激励线性预测编码相同的原 理,将激励脉冲的幅度和位置用一个矢 量码表代替 一个矢量被选定且被量化,形成码表对 数子帧,同时生成音调特性参数子帧和 线性预测滤波器参数子帧
RPE-LTP声码器
GSM系统中采用的规则脉冲激励长期预测编码 方案,属于混合编码中多脉冲激励线性预测编 码 主要特征:设置若干个脉冲位置固定、幅度变 化的脉冲序列作为RPE激励序列 20ms分为4个子帧,在RPE激励序列对应的40 个样值脉冲中,按3:1等间隔抽取13个样点, 非抽取的样点设为0,选择一个使与语音信号 误差最小的一个RPE序列,将其参数编码传输
一种改进的与声码器结合的声学回声消除器

【 关键词】声学 回声消除;最 小均 方算 法;线性预测 ;声码器 【 中图分类号 】T 9 2 N 1 【 文献标识码 】A
An I p o e o si c o Ca c l r Co m r v d Ac u t E h n el mb n d wi C— s d S e c d r c e i e t LP h Ba e p e h Co e
改 进 的算 法 和结 构 , 服 了去 相 关 、 复相 关 过程 所 造 克 恢 成 的不 利 影 响 。
杂度低 。但 N MS算法的性能依赖于输入信号 自相关 L 矩阵 的特征值扩展 和附加噪 声信号 的能量l1 当输 1, —即 入信号是语音 ,背景噪声是有色噪声等相关性很强 的 信号时 , 法的收敛速度会 明显降低 , 算 从而严重影 响回
声 消 除 的质 量 。因此 , 种 改 进 方 法 也 相 应 被 提 出 _ , 各 3 1 即 对 输 入 信 号 进 行 去 相 关 进 而 减 弱 信 号 的相 关 性 , 这 些方 法 能够 显 著 提 高 算 法 的收 敛 速 度 ,但 同时 带 来 一
2 去 相 关 回声 消 除算 法 进 展 回顾
r s a c i g r s lsi rs ne .B d ig a u i a y a a t e f t r h e a ie efc s c u e y t e d e reain e e r h n e u t s p e e td y a d n n a xl r d p i l ,te n g t f t a s d b h e or l t i v i e v e o i e n t iv r e ae a od d i h i a a h o u e i lto s s o h s ag rt f t ra d i n e s r v i e n t e s n lp t .C mp t rsmu ain h w ti lo i m a i h r e h eu n l s g h h s a h g e c o r tr l s n a c me t v l e c mp r d wi h r vo s e u t. o s e h n e n a u o a e t t e p e iu rs l h s
一种基于MELP的1_2kb_s语音编码算法

一种基于M EL P的1.2kb s语音编码算法辽宁工程技术大学电子与信息工程学院 王 鹏 李本喜[摘 要]混合激励线性预测M EL P编码方法结合混合激励、多带激励以及原型波形内插等编码方法的优点,成为低码率语音编码的研究热点,该方法可以很好的模拟自然语言,在低速率上合成出较高质量的语音,本文以该算法作为基本模型,对参数的内插、高效的矢量量化、多帧联合几项关键技术进行了详细的分析,给出了实现1.2kbp s语音编码的算法,并对算法进行了仿真,从仿真结果可以得出该算法具有可行性。
[关键词]多级矢量量化 联合帧 参数内插 混合激励——12—301—(上接第101页)地说:热量和水量在本质上是不同的。
必须指出的是:水泵自低位水源吸取的水量等于压送到高度水位的水量;而制冷机向高温物体排送的热量却等于它向低温物体吸取的热量加上输入机械功所相当的热量之和。
2.5类比法在《医学影像设备学》教学中的应用大千世界之万物,无不由分子组成。
组成分子的原子,则由原子核和围绕原子核旋转的电子组成。
在磁场中旋转振荡的原子核有一个特点,即可以吸收与其旋转振荡频率相同的电磁波,使原子核的能量增加,当原子核恢复原状时,就会把多余的能量以电磁波的形式放出来。
简而言之:所谓的核磁共振,就是指具有磁矩的原子核在恒定磁场中由电磁波引起共振跃迁的现象。
在讲述时学生很难理解,总不明白,此时如果把这一现象比作拉小提琴时弦弓与琴弦的共振一样,学生就容易理解和掌握。
3、类比在学习新知识中的迁移作用3.1定义式具有相同形式的物理量间的类比例如:电流I =Q t 、电场强度E =F q 、功率P =W t 等诸如此类的物理量是用比值法定义的。
在讲授时运用类比,既有利于新概念的引入,又可以加深学生对旧概念的认识;既有利于教学难点的突破,又能总结出这一类物理量的共性。
3.2相似的物理过程的类比《模拟电子线路》中的L C 振荡电路和《医用物理学》中的弹簧振子是两个相似的物理过程,两者的类比可使学生在已有的简谐振动表象基础上学习电磁振荡知识,而且通过类比建立起两类不同性质的过程间的联系,即力学过程,电磁过程间的联系,从而加深学生对物理统一性的认识。
基于MELP的变速率语音编码器算法

基于MELP的变速率语音编码器算法
张博;朱杰
【期刊名称】《电子测量技术》
【年(卷),期】2009()2
【摘要】描述了一种新的基于MELP算法的变速率语音编码器。
其中,考察每一语音帧与其前一帧在以下4个方面的相关性:清浊音判定、基音周期、增益与线谱对频率,依相关性不同采用不同的量化方法以减少各帧之间的编码冗余。
主观测试表明本编码器的语音质量与美国联邦标准的2.4KB/SMELP编码器近似。
【总页数】3页(P12-14)
【关键词】变速率语音编码器;混合激励线性预测;矢量量化
【作者】张博;朱杰
【作者单位】上海交通大学电子工程系
【正文语种】中文
【中图分类】TN912.32
【相关文献】
1.2.4kbps MELP低速率语音编码算法的DSP实现 [J], 曾芳;赵继勇;刘亚峰
2.2.4kbps MELP低速率语音编码算法的DSP实现 [J], 曹芳;赵继勇;刘亚峰
3.基于MELP的变速率分类型语音编码算法 [J], 肖玉娟;赵利
4.改进的MELP低速率语音编码器 [J], 冯晓荣;刘晓明;田雨
5.MELP低速率语音编码器在DSP上的改进与优化 [J], 田雨;刘晓明;冯晓荣
因版权原因,仅展示原文概要,查看原文内容请购买。
4.8kbps多带激励语音编码器的模拟实现

4.8kbps多带激励语音编码器的模拟实现
王都生;樊昌信
【期刊名称】《西安电子科技大学学报》
【年(卷),期】1995(22)3
【摘要】文章阐述了多带激励(MBE)语音产生模型与以往单一激励语音产生模型的区别及其优越性。
研究了以MBE模型为基础进行语音分析合成的基本原理和实现的算法。
提出了4.8kbpsMBE语音编码方案,并在计算机上进行了模拟实现。
实验结果表明,所模拟的4.8kbpsMBE语音编码器系统是成功的。
其合成语音在可懂度与自然度方面,与以往的线性预测(LPC)、码激励线性预测(CELP)语音编码系统相比都有了明显的改善。
【总页数】8页(P227-234)
【关键词】多带激励;编码器;语音编码器;计算机模拟
【作者】王都生;樊昌信
【作者单位】西安电子科技大学信息科学研究所
【正文语种】中文
【中图分类】TN912.32
【相关文献】
1.多带激励语音编码器仿真实现 [J], 汤敏;曾毓敏;谭锡林
2.2.4 kbit/s多带混合激励线性预测语音编码器的模拟 [J], 王都生;铁满霞;樊昌信
3.800/920/1200 bps改进型多带激励语音编码器的DSP实现 [J], 王都生
4.4.8kbps低延迟MBE语音编码器研究 [J], 霍亮;吴家安
5.4.8kbps多带激励音编码器的模拟实现 [J], 王都生;樊昌信
因版权原因,仅展示原文概要,查看原文内容请购买。
用谐波激励线性预测技术实现的4kb/s声码器

用谐波激励线性预测技术实现的4kb/s声码器
秦龙;左鹏
【期刊名称】《电信快报》
【年(卷),期】2000(000)005
【摘要】4kb/s低速率话音编码是近年秋话音信号处理研究的重要课题,也
是ITUT下一步标准化的目标,本文讨论了由Comsat公司提出的采用谐波激励线性预测(HE-LPC,HarmonicExcitationLPC)技术实现4kb/s速率低速声码原理。
【总页数】2页(P39-40)
【作者】秦龙;左鹏
【作者单位】不详;不详
【正文语种】中文
【中图分类】TN912.32
【相关文献】
1.多脉冲激励线性预测声码器的仿真实验分析 [J], 汤婕
2.1200/2400bps改进型多激励声码器的实时实现 [J], 王都生;樊昌信
3.一种多脉冲激励线性预测声码器的仿真实现 [J], 邹晓玉;蒋保臣
4.一种改进的2.4kb/s混合激励线性预测声码器方案 [J], 马欣;刘常澍;李文元;张
毓忠
5.一种低复杂度2.4kb/s正弦激励线性预测声码器方案 [J], 穆军雷;崔慧娟;唐昆
因版权原因,仅展示原文概要,查看原文内容请购买。
4.2Kb/s码激励线性预测语音编码方案的实时实现

4.2Kb/s码激励线性预测语音编码方案的实时实现
鲍长春;戴逸松
【期刊名称】《电子科学学刊》
【年(卷),期】1997(019)001
【摘要】本文表述了一个4.2Kb/s码激励线性预测语音编码方案在单个DSP上的实时实现;提出了一个减少自适应码本搜索复杂性的算法;讨论了A参数转变为LSP 参数的求解方法;描述了该编码方案在具有一片TMS320C30的商用开发系统上的实时实现过程。
【总页数】6页(P50-55)
【作者】鲍长春;戴逸松
【作者单位】西安电子科技大学信息所;吉林工业大学电子系
【正文语种】中文
【中图分类】TN912.3
【相关文献】
1.变阶码激励线性预测语音编码 [J], 马震;陈延萍
2.码激励线性预测语音编码器中的非均匀和部分搜索域代数码书 [J], 白燕宁;鲍长春
3.一种改进的
4.8Kbit/s码激励线性预测编码方案 [J], 俞捷;诸庆麟
4.子波激励线性预测(WELP)的语音编码方案 [J], 刘家康;柯有安;林茂庸;匡镜明
5.实时实现低延迟码激励线性预测编码 [J], 倪维桢;惠光辉;田文顺;王德隽
因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2007 年 6 月 JOURNAL OF CIRCUITS AND SYSTEMS June 2007 文章编号:1007-0249 (2007) 03-0117-04一种改进的2.4kb/s 混合激励线性预测声码器方案*马欣, 刘常澍, 李文元, 张毓忠(天津大学 电子信息工程学院,天津 300072 )摘要:本文针对标准的2.4kb/s MELP 声码器的不足之处提出了两项改进措施,一是提出了一种新的参数“能量—微分过零率比”,用来对语音的过渡段和弱能量浊音段的清浊音判决进行调整;二是对线谱对的多级矢量量化(MSVQ )提出了一种多径搜索算法。
实验和主观听觉测试表明,在同样2.4kb/s 的码率下,改进MELP 声码器的合成语音在可懂度和自然度方面都有一定的提高。
关键词:清浊音判决;MELP ;声码器;多级矢量量化(MSVQ )中图分类号:TN912.3 文献标识码:A1 引言在美国联邦政府选择新一代 2.4kb/s 语音编码标准以代替原来的LPC-10e 模型的过程中,A.V. MaCree 等提出了一种混合激励线性预测(MELP ,Mixed Exitation Linear Prediction )声码器方案[1]。
该方案以传统的LPC 线性预测声码器为内核,加入了混合激励、准周期脉冲、自适应频谱增强技术、脉冲波形发散和表示残差基音谐波的傅立叶幅度等五项改进技术。
这些改进使得MELP 在2.4kb/s 的低码率下保证了良好的合成语音质量。
但是,经过大量的听觉测试,发现用MELP 方案合成的语音还是存在一些问题。
特别是在语音的过渡区段,人工合成音的迹象比较明显,语音听起来显得有些生硬。
为了使合成语音听起来更加自然,本文对MELP 算法模型提出了以下两项改进措施:(1)提出了一种新的表征语音特征的参数——短时能量—微分过零率比,以解决语音过渡期和弱能量浊音帧的清浊音误判问题;(2)提出了一种线谱频率多级矢量量化的多径搜索算法,解决了有些情况下编码矢量与输入矢量之间总体失真度偏大的问题。
实验和主观听觉测试结果表明,这两项措施是有效的。
改进后的MELP 模型在同样的2.4kb/s 码率下,合成语音在可懂度和自然度上都有一定的提高。
2 改进的模型 2.1能量—微分过零率比(edzc R )参数实验表明,不自然合成音多发生在元音语音段的开始、结束或两个元音发音之间的结合部分,也就是人的发音状态处于过渡态的时期。
在元音段的开始或结束时期,语音能量通常比较低。
两个元音之间,有一段基音周期不是很规则的时期。
不规则的基音成分或弱能量段使得基音相关性弱,难以准确判定其清浊音性质。
标准MELP 模型对这个问题的解决方法,是采用自相关系数检测法对5个子带进行清浊音初判后,再计算残差信号的峰度(peakiness ),对相应子带的清浊音判决进行调整。
因为峰度是和语音段的能量相关的,通常浊音段的能量要比清音段或无声段高,所以通过残差信号峰度可以减少部分情况下的清浊音误判。
但是峰度调整对于有些情况处理得还是不够理想。
这是因为元音(浊音)开始段和结束段的能量水平通常也比较低,与清音段的能量水平差别并不显著。
所以有时候能量较弱的浊音段还是会被误 * 收稿日期:2004-09-22 修订日期:2004-11-24图 1 原始声音信号、采用标准MELP 算法的合成语音和采用能量—微分过零率比R edzc 改进的MELP 合成语音判为清音,例如图1(b)所示的情况。
针对这个问题,N. Abu-Shikhah 和Weiran Lin 采用了能量—过零率比ezc R 这一参数[2,3],根据能量和过零率两个特征综合进行清浊音判决。
定义为ZCE R rms ezc = (1) 其中,ZC 为每帧样值的过零数;rms E 为该帧的能量,定义如下: ∑==N n rms n s N E 12)(1(2)其中,s (n )为语音信号,N 为每帧样值数。
能量—过零率比参数ezc R 采用了信号的过零率ZC 来表征信号所含的频率成份,过零次数ZC 多就认为高频成分多,具有清音特征;过零次数ZC 少就认为低频成分多,具有浊音特征。
再综合能量特征rms E 进行判决,浊音帧能量rms E 高而过零数ZC 小,从而能量—过零率比ezc R 大;清音帧能量rms E 低而过零数ZC 大,从而能量—过零率比ezc R 小。
这一方法尽管较好地解决了低能量的浊音段被误判为清音的问题,但同时又引入了有的清音帧被误判为浊音的问题。
如图2(a)所示,在有些情况下,清音帧虽然高频成分多,但其过零率并不高。
也就是说,过零次数少并不一定表明是浊音。
若采用能量—过零率比就有可能把该清音段误判为浊音,如图2(b)所示。
为了解决这个问题,本文提出了一种新的参数—能量—微分过零率比edzc R ,用于较低能量段及过渡元音段的清浊判决调整。
能量—微分过零率比,记为edzc R ,定义如下:)('t s rms edzc ZC E R = (3) 其中,rms E 为该帧的能量,定义如(2)式;)('t s ZC 是语音信号s (t )的微分信号在一帧内的过零次数。
能量—微分过零率比是通过语音信号s (t )幅度的上升/下降转折次数来表征信号的频率成分。
含高频成分多的清音帧,其幅度转折次数多;而含低频成分多的浊音帧,其幅度转折次数少。
事实上,这也是一帧内所有波峰和波谷数目的总和。
而这个数目等于s (t )的微分信号s ’(t )的过零次数。
对于类似图2(a)的清音,虽然其过零率较低,但是其幅度转折率即)('t s ZC 还是比较高的。
再加上该清音段的能量rms E 较小,所以得到的edzc R 相对很小,该段语音应被判为清音。
这更接近于实际情况。
图2(c)为采用能量—微分过零率比的MELP 合成语音波形。
能量—微分过零率比edzc R 对于处理弱能量语音帧的清浊音判决调整也同样有效,如图1(c)所示。
2.2 MSVQ 的多径搜索算法标准MELP 采用了4级多级矢量量化法(MSVQ )对线谱频率进行编码,如图3所示。
在第一级,在码本A 中搜索与输入矢量X 距离最近的矢量1A C ,X 与1A C 的差记为1A C X −;在第二级,用码本B 中搜索与1A C X −距离最近的矢量,找到1A C X −的最佳逼近矢量1BC ;逐级类推,一直找到最后一级最佳逼近矢量1D C 。
则输入矢量X 的编码矢量为:1111D C B A C C C C X +++=′ (4)这种逐级搜索最佳编码矢量算法在每一级所获得的矢量失真度最小,但是最后所获得的编码矢量图 2 原始语音、采用能量—过零率比参数R ezc 的MELP 合成语音和采用能量—微分过零率比参数R edzc 的MELP 合成语音图3 4级矢量量化模型第3期 马欣等:一种改进的2.4kb/s 混合激励线性预测声码器方案 119 总失真度不一定是最小的。
其原因为,在对矢量码本进行搜索时,码本中与输入矢量X 距离相近的编码矢量常常非止一个。
若按照逐级单路径搜索的方法,只能在这若干个编码矢量中选择一个与X 距离最小的一个作为编码矢量。
这在非多级码本的情况下,固然是一个好办法。
但对于多级码本的情况,就有可能将最佳的那个搜索路径在第一级或前面某一级被忽略。
采用多径搜索方法,可以很大程度上避免最佳搜索路径被遗漏,得到更精确的输入矢量X 的编码矢量。
本文提出一种多级码本搜索的多径搜索方法,如图4所示。
多径搜索的过程为:在第一级矢量量化时,按照感知加权测度,找出与输入矢量X 感知加权距离最近的P 个编码矢量(根据经验,可选P =2或3),并分别计算出这P 个编码矢量与X 的编码误差i A C X −(i =1,2,…,P )。
在第二级对这P个编码误差进行逼近搜索,得到P ×P 种逼近途径。
在这P ×P 个逼近途径中,再以总体感知加权失真度最小的原则选取P 个途径,作为下一级码本搜索的起点。
如此循环直到最后一级,就会在多级(本文模型为4级)码本中找到P 个总体编码误差最小的搜索路径。
再从这P 个路径中,找出具有最小误差的路径,即可得到最佳的编码矢量。
当然,采用多径搜索算法增加了对码本的搜索次数,从而增加了运算量。
原标准算法需要对码本做128+64+64+64=320次搜索。
在多径搜索算法中,要对码本做128+(64+64+64)×P 次搜索。
若取P =2,那么码本搜索的运算量约为标准码本搜索算法运算量的1.5倍。
若取P =3,则搜索运算量约为2倍。
搜索运算量与路径P 的取值之间是线性正比关系。
为了控制搜索运算量的增加,P 不宜取得过大。
3 主观听觉测试结果本文对标准MELP 声码器模型和改进的MELP 声码器模型,都在Microsoft Visual C++环境下,用C 语言进行了模拟。
为了验证改进的MELP 声码器的合成语音质量,组织了一个非专业的5个人的测试小组,分别进行了可懂度测试和MOS (主观平均分)分值测试。
测试矢量采用无噪声背景的汉语播音员语音,男声、女声各2组。
首先给被测试者听一遍未被编码处理过的原始语音作为参考基准,然后随机地从原始语音、2.4kbpsMELP 合成语音和改进2.4kbps MELP 合成语音中各选取一种,放给被测试者听,让他们在不知道音源的情况下对听到的语音质量打分。
这样做可以避免打分时的倾向性。
表1给出了可懂度测试结果。
表2给出了MOS 分测试结果。
结果表明,本文对MELP 模型的改进使合成语音在可懂度和自然度上都有一定的提高。
4 结论本文对标准的2.4kb/s MELP 声码器模型提出了两项改进措施:(1)能量—微分过零率比参数计算使得对语音过渡段和弱能量浊音段的清浊音判决更加准确;(2)线谱对多级矢量量化的多径搜索方法表1 可懂度测试结果 平均分 声源 男声女声原始语音 97.3 97.6标准2.4kbps MELP 合成语音 94.9 95.2改进2.4kbps MELP 合成语音 95.6 95.9表2 MOS 测试结果 声源 MOS 分值原始语音 5 标准2.4kbps MELP 合成语音 3.5 改进2.4kbps MELP 合成语音 3.6图4 多级矢量量化的多径搜索方法(P =3)120 电路与系统学报第12卷使编码矢量对输入矢量的逼近更加精确。
实验和主观听觉测试结果表明这两项措施是有效的。
改进后的MELP模型在同样的2.4kb/s比特率下合成的语音在可懂度和自然度上都有一定的提高。
参考文献:[1] Alan V McCree, Kwan Truong, E Bryan George, Thomas P Barnwell. A 2.4kbit/s MELP coder candidate for the new U.S. Federal [A]. inProceeding for ICASSP [C]. 1996. 107-112.[2] N Abu-Shikhah, M Deriche. A novel pitch estimation technique using the teager energy function [A]. Proc. ISSPA’99 Signal Process. Appl. 1[C]. 1999-08. 135-138.[3] Weiran Lin, Soo Ngee Koh, Xiao Lin. An 8.0-/8.4-kbps wideband speech coder based on mixed excitation linear prediction [J]. SignalProcessing, 2001, 81: 1437-1448.[4] Alan V McCree, Thomas P Barnwell III. A mixed excitation LPC Vocoder model for low Bit rate speech coding [J]. IEEE Trans. on Speechand Audio Processing, 1995-07, 3: 242-250.[5] 胡剑凌, 徐盛, 陈健. 基于谱特征的清浊音判决[J]. 数据采集与处理, 2002-03. 20-24.[6] 铁满霞, 王都生, 樊昌信. 基于线性预测系数自适应前后向量化的可变速率MELP语音编码[J]. 电子与信息学报, 2001-09. 919-923.[7] Selma Ozaydin, Buyurman Baykal. Matrix Quantization And Mixed Excitation Based Linear Predictive Speech Coding At Very Low Bit Rates[J]. Speech Communication, 2003, 41: 381-392.[8] 魏洪涛. 语音信号混合激励线性预测编码的研究与实现[D]. 硕士论文, 天津大学, 2001-01.作者简介:马欣(1971-),女,天津大学博士研究生,主要研究方向为数字声音处理,音频编码;刘常澍(1946-),男,天津大学教授,主要研究方向为电路与系统;李文元(1946-),男,天津大学副教授,主要研究方向为数字音视频处理;张毓忠(1935-),男,天津大学教授,主要研究方向为数字信号处理,音频压缩编码。