短时域语音端点检测中谱熵算法的改进
低信噪比环境下改进的语音端点检测算法
低信噪比环境下改进的语音端点检测算法董胡【摘要】Endpoint detection has a very important role in speech recognition,its accuracy will directly affect the accuracy of speech recog-nition system. In order to improve the accuracy of speech endpoint detection under low SNR environment,an endpoint detection algorithm based on spectral subtraction of multitaper spectrum estimation and spectral entropy is proposed. Firstly,it uses improved spectral subtrac-tion of multitaper spectrum estimation to denoise speech signal in order to improve signal to noise ratio,and then it utilizes energy-entro-py-ratio algorithm to make endpoint detection for speech signal denoised. Simulation experiment results show that compared with com-mon endpoint detection algorithm,this algorithm has good endpoint detection accuracy and certain robustness in low SNR environment. It proves the effectiveness of the proposed algorithm.%端点检测在语音识别中具有非常重要的作用,其准确性将直接影响语音识别系统的正确率。
一种基于改进谱熵的语音端点检测方法
combination of short time average magnitude.The simulation results show that this method has better robustness and
precision than conventional spectral entropy algorithm and average magnitude algorithm,which proves the effectiveness
Abstract In view of the problem that conventional spectral entropy speech endpoint detection algorithm’s detection effect is poor under the non-stationary noise,a new feature parameter-sub-band amplitude spectrum entropy was pro-
2 改 进 谱 熵
量小,在高信噪比环境下可以获得较好的检测效果,但对复 杂 背景噪声环境下的端点检测误判率升高[7]。2)基于语音 信 号 频 域 特 征 的 算 法 ,如 倒 谱 特 征 法[8]、谱 熵 法[9]和 频 带 方 差[10] 等。这些算法在纯净语音环境下可以取得良好的检测效果, 但 在 非 平 稳 噪 声 环 境 下 检 测 效 果 骤 降 ,尤 其 是 当 噪 声 与 语 音 信 号 频 域 分 布 类 似 时 ,这 些 算 法 甚 至 不 能 正 常 工 作 。 [11]
语音端点检测的目的是在一段信号流中快速区分出语音 提出了一种新的基于子带谱熵幅度积参数的语音端点检测方
基于LMS自适应的改进端点检测算法
基于LMS 自适应的改进端点检测算法刁鸿鹄,毛强,章小兵(安徽工业大学电气与信息工程学院,安徽 马鞍山 243032)摘要:语音识别技术早已不再局限于实验室中,但部分关键技术仍需进一步优化与改进,以适应社会和用户不断增加的需求。
从语音识别的技术理论入手,着重研究端点检测技术,拟在此基础上针对现有算法进行改进,提升其在低信噪比环境下的识别准确率。
提出了一种在对语音进行LMS 自适应降噪后,采用倒谱距离熵比的新型端点检测算法,并在MATLAB 平台上进行相应测试。
结果表明该算法相比于传统方法,检测正确率确有提升。
关键词:语音识别;自适应滤噪;倒谱距离;能熵比中图分类号:TN912.3 文献标志码:A 文章编号:1671-0436(2021)01-0031-10收稿日期:2020-09-28作者简介:刁鸿鹄(1996— ),男,安徽马鞍山人,硕士研究生,*****************,主要研究方向为语音识别与测控技术。
第 34 卷第 1 期2021 年 2 月常州工学院学报Journal of Changzhou Institute of TechnologyV ol. 34 No. 1Feb.2021doi:10.3969/j.issn.1671-0436.2021.01.0080 引言语音端点检测技术是对输入语音进行有话段起止端点的标记。
它是语音识别系统中一个关键环节。
端点检测的成功与否直接影响了语音识别系统的准确率。
现实生活中,因无法保证采集环境处于安静状态,故语音输入信号不可避免地带有各种噪声。
因此,研究在低信噪比环境下具有良好识别率的语音端点检测技术有实际意义,对提升系统在恶劣环境下的工作稳定性大有益处。
Improved Endpoint Detection Algorithm Based on LMS AdaptiveDIAO Honghu ,MAO Qiang ,ZHANG Xiaobing(School of Electrical and Information Engineering, Anhui University of Technology, Maanshan 243032)Abstract: Speech recognition technology is no longer limited to the laboratory. However, some key technologies still need to be further optimized and improved to adapt to the increasing demands of society and users. Starting from the technical theory of speech recognition and focusing on the endpoint detection technology, based on which, it is planned to improve the existing algorithm and enhance its recognition accuracy in a low signal-to-noise ratio environment. A new endpoint detection algorithm using cepstral distance-entropy ratio after LMS adaptive noise reduction is proposed, and the corresponding test is performed on the MATLAB platform. The results show that compared with traditional methods, the detection accuracy of this algorithm is indeed improved.Key words: speech recognition ;adaptive noise filtering ;cepstrum distance ;energy-entropy ratio322021年常州工学院学报1 自适应滤波减噪自适应信号的主要特征是在无预设值的条件下,实时调用运行数据,根据算法不断递归,更新参数,逐步逼近最优结果[1]。
一种基于自适应谱熵的端点检测改进方法
关键词 : 语音端点检测 ; 自适应子带谱熵 ; 语音识别 ; 鲁棒性
中图 分 类 号 :N 1 . T 92 3 文 献标 识 码 : A
An I pr v d pe c dp i t De e to e ho Ba e n m o e S e h En o n t c i n M t d s d o
第 7 第1期 2卷 2
文章编号 :0 6—94 ( 00)2—07 0 10 38 2 1 1 3 3— 3
计
算
机 仿
真
21年l月 0 0 2 端 点 检 测 改 进 方 法
王 琳 , 李成 荣
( .中国科学院 自动化研究所 , 1 北京 10 9 0 10;
2 hn s c d m f c n e , e ig1 0 4 , hn ) .C i eA a e yo S i c s B in 0 0 9 C ia e e j
A S R T:hsppr r oe oe sec e co e o sdwt w r i a—t B T AC T i a e po ss nvl pehd t tnm t due i l e g l o—ni t S R . p a ei h h o sn o er i N ) s a o(
目前运用于语 音端点 检测 的特征 参数 主要包括短 时能
1 引言
随着 语 音 技 术 的发 展 , 用 的 领 域 越 来 越 广 , 些 年 , 应 近 用
量, 短时平均幅度 , 时平 均过零率 , 短 倒谱 系数 以及短时能谱 值 等。但在 噪音环境下 , 这些 端点检测方法 变得不理想 。语 音信号的能量小 时 , 被噪 声所掩 盖 , 易 因此难 于用能量 特征 参数进 行语 音端 点检测 。S e 等人提 出 了基 于信息 熵 的 hn 端 点检 测方法 , 信息熵 只与 能量 的随机性有 关 , 和能量 幅值
基于谱熵梅尔积的语音端点检测方法
基于谱熵梅尔积的语音端点检测方法
基于谱熵梅尔积的语音端点检测方法是一种改进的语音端点检测算法,它结合了谱熵和梅尔频率倒谱系数的特点,提高了语音端点检测的准确率。
首先,该方法通过提取带噪语音信号的梅尔频率倒谱系数中的第一维参数MFCC0,将其与谱熵的乘积作为最终区分语音段和背景噪声段的融合特征参数。
梅尔频率倒谱系数能够有效地描述语音信号的短时特性,而谱熵则可以反映语音信号的平坦程度,用于区分语音段和噪声段。
其次,该方法结合模糊C均值聚类算法和贝叶斯信息准则(BIC)算法对MFPH特征参数门限值进行自适应估计。
模糊C均值聚类算法可以将特征参数进行聚类,使得相似的特征参数归为一类,从而更好地进行语音端点检测。
贝叶斯信息准则(BIC)算法则可以用于估计最佳的聚类数目,提高聚类的准确性和稳定性。
最后,该方法采用双门限法进行语音端点检测。
在确定了特征参数门限值后,通过比较语音信号的特征参数与门限值的大小关系,可以判断语音信号的起始点和结束点,从而实现语音端点检测。
实验结果表明,与传统方法相比,基于谱熵梅尔积的语音端点检测方法在低信噪比环境下具有更高的准确率。
这主要是因为该方法综合考虑了语音信号的短时特性和频谱平坦度,能够更准确地描述语音信号的特点,从而提高了语音端点检测的准确率。
噪声环境下语音信号端点检测算法的研究与改进
得!
似基于能量的端点检测 $
! 实验结果
!" " 再将上式两边对 #$% 求导后 & 化简得 ! !’ " 令方程两边 #$% 各次幂的系数相等 & 则可以得 ()* 倒谱系数 +(),-. 与线性预测系数 !/,/0%&1&222&3.的关系 # 具体工作过程是 # 本文对提出的方法在计算机上进行了实验 & 用声卡采集各声音信号样本 & 端点检 测 过 程 基 于 9CB;CD 实 现 <4= $ 语音端点检测方法是在白噪声条件下进行测试% 语音信号经 5 @@@E# 采样和 %>D/BF 量化后 % 与不同电平的白噪声混合作为测试 样本 $ 所有测试试验中 % 在所有实验中 & 语音信号被分为 1’@ 采样 的帧 & 相邻帧有 4@ G 重叠 2 每帧采用 %1 阶 ()* 美尔倒谱系数 $ 仿 真实验使用 > 个人的语音作为实验数据 $ 每个 人 分 别 录 %1 段 语 音 % 选取其中 ’ 段语音作为训练数据 %5 段语音作为识别数据 $ 测 试结果如表 % 所示 $ 在下表中可以明显的看出当使用 ()* 美尔倒 谱特征参数时 % 在低信噪比下可以明显提高系统识别的准确率 $ 表 " 仿真实验的测试结果
!4 " 式 中 & 3 为 ()* 阶 数 & 一 般 305 !%1 时 & 能 较 好 地 表 征 声 道 特 性 & - 为 ()** 阶数 $ 12" 基于 ()* 美尔倒谱特征的检测算法 这种算法是对传统的倒谱特征检测算法的改进 % 其 运 算 过 程 为 # 首 先 将 经 过 678 转 换 & 采 样 后 的 语 音 信 号 经 适 当 的 数 字 滤 波 器分成高 & 低频带 1 个信号 % 频带间允许重叠 ’ 然后将滤波 形 成 的 1 个信号分别进行预处理 % 包括预加重 & 分帧 & 加窗 ’ 再进行特征参 数的提取 $ ()* 倒谱特征取合适的阶数可较 好 地 表 征 声 道 特 性 % 但 它 是 按实际频率尺度的倒谱系数 $ 可根据人耳听觉特性将上述的倒谱 系数进一步按符合人听觉特性的美尔 !9:; " 尺 度 进 行 非 线 性 变 换 % 从而求出 ()* 美尔倒谱系数 <’= $ 具体算法如下 ! !> " 式中 & *- 表示倒谱系数 &9*?,-. 表示美 尔 倒 谱 系 数 & - 为 迭 代 次数 & ? 为倒谱阶数 & 一般 -0? $ 迭代时 - 从无穷大递减至 @ 取值 $ 12’ 采用改进的判决门限 采用短时能量作门限时 % 当测试信号帧的短时 能 量 超 过 噪 声 能量门限并持续一段时间 & 则第一次超过能量门限的点被判定为 语音段的起点 ’ 而当测试信号帧的能量低于另一个噪声 能 量 门 限 并持续一定时间 % 就可测定语音段的终止点 $ 但在噪声环境下 & 短 时能量与其它特征参数都不能很好地区分语音段与非语音段 $ 采用倒谱距离作为门限时 % 假定前几帧信号是 背 景 噪 声 % 计 算这些帧的倒谱系数矢量 % 利用前几帧倒谱矢量的平均 值 可 估 计 背景噪声的倒谱矢量 % 计算所有测试帧与背景噪声之间 的 倒 谱 距 离可得到倒谱距离轨迹 $ 论文选用 9:; 倒谱距离作为判决门限 & 定义为下式 ! !A " 式 中 & ) 为 倒 谱 阶 数 & +B,/. 为 待 测 倒 谱 向 量 & * 为 参 考 样 本 的 倒谱向量 $ 将倒谱距离作为门限 & 判断语音起止点 & 其判断步骤类
一种对单兵通讯模块中短时能量语音端点检测的改进方法
四 川 兵 工 学 报
21 0 1年 3月
【 自动化 技 术 】
一
种 对 单 兵 通 讯 模 块 中 短 时 能 量 语 音 端 点 测 的 改 进 方 法 检
吕 卫 强
(f I … t l『 _ 、 八研 究 所 『 部 ,四 J 绵 … J 『 I I 『 I l 6 10 ) 2 0 0 际 他 川 _ 发 脱 陔 力 i-i I l ‘ , 低 )6
l 处川! 领域
、
出 , 也 什 I 对
愉 测 址 ‘ 的 法 J 川 ,Ⅱ 、 n 越l 模 块 i 使 J 的 t 『 , 】 址 I‘ 【I能 l , J i 过 2个 特 术 削 断 频 址 足 谮 他 J _该 钎: l} 1 法 一 J 噪 比 的环 境 1J i 得 较 好 I【以 欠 j 的『 半, 俑 低 噪 比 系 统 .弭 法 的 性 能 会 大 幅 度 降 低 。 } l 为 r解 决 这 一 题 , 义 提 … r一 个 针 对 算 法 的 改 进 算 小
中 图分 类 号 : 1 T 94
’
r
愉洲 钟 法 也称 } ’、 J 分 类 算 法 。 该 方 法 在 : 噪 = 女意 义 , t 通 模 块 f 的语 端 兵 f l
不足 f J 分 ‘
人 的 青 分 { 干 浊 2币I浊 旨 为 声 带 发 l l ¨ f l : f 离, l i 度 J 特 - 州期 P l : , 用 短 时 能 量 可 采 的 动 , 凭 审 气 在 口 腔 中 仪
特 f 炎 义熵 , i I !
l G J J " i 语 音信 。
文献标识码 : A 文章 编 号 :0 6— 7 7 2 1 ) 3— 0 9— 2 1 0 0 0 ( 0 0 0 5 0 1
一种改进的小波能量熵语音端点检测算法
一种改进的小波能量熵语音端点检测算法李乐;王玉英;李小霞【摘要】语音端点检测是语音信号处理的一个重要环节,在低信噪比下,端点检测的准确度和鲁棒性较低.为此,提出一种小波能量熵与基音周期相结合的混合端点检测算法.该算法通过分析语音信号的小波能量和小波能量熵,构造不同语者的小波能量熵端点检测参数,针对不同语者的发音特性运用小波能量熵和基音周期检测语音端点.实验结果表明,在不同噪声背景下,当信噪比为5 dB时,该算法的端点检测平均准确率达到84.375%,相对于小波能量和小波能量熵算法均有明显提高.%Speech endpoint detection is an important step in the processing of speech signal.The accuracy and robustness of endpoint detection are low at low Signal to Noise Ratio (SNR).In order to solve this problem,this paper proposes a new endpoint detection algorithm based on wavelet energy entropy and pitch period.It analyzes the speech signal wavelet energy and wavelet entropy to build wavelet energy entropy endpoint detection parameters for different speaker,and utilizes the pronunciation characteristics of different speakers to detect the speech endpoint by wavelet energy entropy and pitch period.Experimental result shows that at different noise background the average detection accuracy is 84.375% in 5 dB SNR which is more accurate than the wavelet energy algorithm and wavelet energy entropy algorithm.【期刊名称】《计算机工程》【年(卷),期】2017(043)005【总页数】7页(P268-274)【关键词】端点检测;信噪比;小波能量熵;基音周期;性别识别【作者】李乐;王玉英;李小霞【作者单位】西安建筑科技大学理学院,西安710055;西安建筑科技大学理学院,西安710055;西安建筑科技大学理学院,西安710055【正文语种】中文【中图分类】TN912.34语音端点检测是从混有噪声的语音信号中检测出语音信号的起始点和终止点。
基于谱减法和短时零熵法的语音端点检测
基于谱减法和短时零熵法的语音端点检测吴鹏;章小兵;丁武【摘要】针对低信噪比环境下基于能零比的端点检测方法准确率低的问题,提出了一种结合谱减法和短时零熵法的端点检测方法.首先通过功率谱减法对带噪语音进行降噪处理,然后结合短时平均过零率特征与谱熵特征,构造出一种新的语音参数,即短时零熵,最后运用双门限算法进行端点检测.实验结果表明该方法在复杂噪声环境下具有良好的端点检测性能,降低了检测的误判率.【期刊名称】《电声技术》【年(卷),期】2018(042)003【总页数】5页(P55-59)【关键词】短时零熵;谱减法;双门限算法;端点检测【作者】吴鹏;章小兵;丁武【作者单位】安徽工业大学电气与信息工程学院,安徽马鞍山 24300;安徽工业大学电气与信息工程学院,安徽马鞍山 24300;安徽工业大学电气与信息工程学院,安徽马鞍山 24300【正文语种】中文【中图分类】TN912.31 引言端点检测是语音进行合成、编码和识别必不可少的环节,它的目的是从嘈杂的语音中区分出语音段和非语音段,进而得到语音的起止点[1]。
针对语音的不同的特性可以提出不同的端点检测算法,其检测结果的正确与否将直接影响系统的识别准确度和处理效率,因此对语音识别有着重要意义。
传统的语音处理方法从语音的不同特征出发能够分为时域分析与频域分析,一方面由于时域处理不能直接有效的获取语音信号的频率特性;而采用频域处理,语音特征几乎不随时间发生改变,无法体现出语音信号的动态时变性。
另一方面,通过时域或频域的多特征进行端点检测在背景噪声较小的情况下具有较好的检测性性能,能够有效的分辨出语音与噪声,但随着信噪比的降低,受到噪声的干扰,检测的准确率大打折扣,容易出现误判现象。
所以单纯的应用时域或频域分析已不能满足识别的准确性和实时性的要求,针对这一问题,提出一种基于时域和频域的多特征端点检测方法,同时由谱减法进行降噪处理,结合各自的优势,提高了检测的可靠性。
基于EMD与功率谱熵的语音端点检测
基于EMD与功率谱熵的语音端点检测王辉;袁淑丹【摘要】为了提高低信噪比下语音端点检测的准确性,提出一种基于经验模态分解与功率谱熵的语音端点检测方法.对带噪语音信号进行经验模态分解获得一系列语音本征模函数,选取功率谱熵作为语音端点检测的特征,并计算特定阶本征模函数的功率谱熵实现语音的端点检测.通过EMD分解可以有效地消除白噪声的影响,仿真结果表明,在低噪比情况下结合经验模态分解和功率谱熵的方法能够有效实现语音端点检测.【期刊名称】《电声技术》【年(卷),期】2013(037)011【总页数】5页(P40-44)【关键词】语音端点检测;经验模态分解;本征模函数;功率谱熵【作者】王辉;袁淑丹【作者单位】贺州学院机械与电子工程学院,广西贺州542899;贺州学院计算机科学与信息工程学院,广西贺州542899【正文语种】中文【中图分类】TN912.31 引言语音端点检测是语音信号预处理过程中一个非常重要的环节,在语音增强、语音识别、语音合成等语音信号处理过程中,特别是在低信噪比下准确检测语音端点已经成为改善系统性能非常重要的一个方面。
传统的语音端点检测方法一般选取短时能量、过零率等特征,这种传统的方法在高信噪比下可以获得好的检测结果,但在低信噪比下很难有效地检测语音端点。
鉴于此,人们提出了基于倒谱特征、基于分形、基于熵等一系列新的方法[1]。
特别是基于熵的方法是近年来的一个研究热点,一些文献中也提出了基于熵的改进算法[2-3],这些方法在一定程度上提高了端点检测的精度,但在低信噪比下检测结果仍然不够理想。
为此,本文提出一种基于经验模态分解(EMD)与功率谱熵的语音端点检测方法。
由于对白噪声进行EMD分解可以看成是一个倍频程的滤波器组[4],对带噪语音信号进行EMD分解可以实现初步降噪,并获得一系列的本征模函数(IMF),进而计算相应IMF分量的功率谱熵以确定语音的端点。
数值仿真结果表明,在低信噪比情况下以IMF3分量为对象结合功率谱熵能够有效地检测语音端点。
一种基于短时倒谱速变率的语音信号平滑端点检测方法
一种基于短时倒谱速变率的语音信号平滑端点检测方法王帛;冯新喜【摘要】短波通信以其天波传播特性,在通信领域具有其他通信手段无法替代的地位.为解决短波通信中信噪比较低,噪声信号严重影响语音处理效果的问题,提出了一种基于短时倒谱速变率的平滑端点检测方法,通过检测噪声信号的倒谱特征,初步确定语音信号端点,然后加入平滑优化处理以及Holdon设计,降低由于倒谱突变造成的误判.实测信号仿真实验证明,该方法在不过多加重系统负担的前提下,取得了良好的效果.【期刊名称】《现代电子技术》【年(卷),期】2010(033)023【总页数】4页(P92-94,98)【关键词】倒谱速变率;平滑优化;Holdon设计;端点检测【作者】王帛;冯新喜【作者单位】空军工程大学,电讯工程学院,陕西,西安,710077;空军工程大学,电讯工程学院,陕西,西安,710077【正文语种】中文【中图分类】TN912-340 引言在语音识别过程中,确定语音段的起止点是一个极其重要的环节。
正确确定语音段端点不仅有助于降低语音处理的错误率,还能有效降低系统在噪声段的不必要消耗,减少运算量。
端点检测的目的在于区分有声段和噪音段,在实际应用中,语音信号通常会夹杂大量噪声,影响语音识别效果,这种情况在短波通信中尤为严重。
短波通信具有信噪比低、噪声复杂等特点,因此,对端点检测提出了很高的要求。
传统端点检测算法通常使用短时能量和过零率作为判别依据。
在这些算法中,主要利用的是在噪声环境中突然加入语音信号,短时能量会产生激增以及过零率会突然改变[1]。
这种方法虽然在低噪声环境中具有较好的检测效果,但是一旦应用到实际中,由于其抗噪性较差,通常无法满足需求。
近年来,端点检测的主要热点集中在各种谱估计方面。
相对传统检测方法而言,谱估计具有更强的抗噪性,其固有特性使其在实际应用中可以达到更好的效果。
本文利用倒谱变换对短波信号进行处理,同时加入平滑优化以及冲激噪声规避设计,有效解决了信号处理中的端点检测问题。
基于短时谱估计的语音增强改进算法
基于短时谱估计的语音增强改进算法李真;吴文锦;任慧【摘要】语音在传输过程中受到来自周围环境、传输媒介等的干扰是不可避免的,这些干扰会严重影响语音接收时的质量,导致收到的语音信号不再是原始的纯净语音信号,而是带有各种干扰噪声的语音信号,这不仅影响语音的收听质量,也给后续的语音处理带来了一定的影响.因此对语音进行增强不可或缺.大部分传统的语音增强算法仅仅只通过改变语音的幅度,再叠加上原始的语音相位或者仅调整语音的相位再和未改变的幅度叠加来实现语音信号重建从而增强语音.本文提出了一个通过既改变语音信号的幅度又改变其相位的语音增强算法.通过使用客观语音质量测评(PESQ)和语谱图对用不同方法增强后的语音进行比较,验证了用本文方法得到的增强语音质量更佳.【期刊名称】《中国传媒大学学报(自然科学版)》【年(卷),期】2016(023)004【总页数】5页(P65-69)【关键词】语音增强;幅度谱;相位补偿【作者】李真;吴文锦;任慧【作者单位】中国传媒大学理工学部,北京100024;视听技术与智能控制系统文化部重点实验室,北京100024;现代演艺技术北京市重点实验室,北京100024【正文语种】中文【中图分类】TN919语音通信是人类最重要、最有效、最便捷的通信方式,语音信号承载着不同的信息和情感,是人类互相交流和表达的重要媒介。
然而,语音在传输过程中不可避免的会受到不同因素(环境、传输媒介、设备内部结构等)的干扰,使得接收到的语音变成带噪的语音,大大降低了语音质量。
为了获得纯净的语音信号,就需要进行语音增强。
对于已有的语音增强算法,根据接收端所使用的麦克风数目可分为单通道语音增强算法和多通道语音增强算法,本文研究单通道语音增强算法。
在单通道语音增强研究领域中目前的研究热点在于如何去除含噪语音信号中的噪声部分,尽力恢复原始的纯净语音信号,大致可分为基于短时谱估计、基于信号子空间[1][2]、基于语音生成模型[3][4]等语音增强算法。
一种基于谱熵的语音端点检测方法
一种基于谱熵的语音端点检测方法李战明;尚丰【摘要】在低信噪比环境下,为了提高语音端点检测的效果,提出了一种适应于低信噪比环境的语音端点检测方法。
基于子带谱熵法,引入正参数对基本的谱熵法进行算法改进,得到改进后的子带谱熵法,通过增加预判环节选择合适的正参数,加犬语音信号与噪声信号的区分度,进一步改善在低信噪比环境下算法的效果,得到新的语音端点检测算法。
仿真实验表明,新的算法不仅快速高效,具有较强鲁棒性,而且适合在低信噪比环境中较准确的检测出语音端点。
【期刊名称】《电子技术与软件工程》【年(卷),期】2015(000)001【总页数】3页(P200-202)【关键词】语音端点检测;子带谱熵;参数可变鲁棒性【作者】李战明;尚丰【作者单位】兰州理工大学,甘肃省兰州市730050;;【正文语种】中文【中图分类】TN912.31 引言随着语音识别、语音增强等技术的飞速发展,端点检测越来越重要。
端点检测的目的是在复杂环境下识别出噪音信号与语音、噪音混合信号,确定语音信号的开始与结束端点,以便进一步的语音信号处理。
在助听器、手机等硬件环境下,由于实时性与准确性要求较高,计算量即不能过大以免硬件不能满足要求,又要求语音信号处理快速、准确。
准确的端点检测可以大幅度减少计算量,提高系统的语音处理效率。
现阶段运用的端点检测算法有短时能量与短时过零率双门限法、自相关函数法、方差法、谱距离法、能零比与能熵比等。
在噪音环境下这些方法的效果并不是很理想,语音信号的能量并不大,所以单纯用能量参数并不能很好的将语音信号检测出来。
Shen提出了一种基于信息熵的端点检测方法,信息熵只与语音信号的统计学特性有关,与单纯的能量幅值大小无关,所以这种方法能够较好地将语音信号与噪音信号检测出来,并且计算量不大,适用于助听器、手机等硬件环境。
但是对于周期性能量较为集中的噪音而言,误判率较高。
为了消除每帧信号FFT变换后的谱线幅值受噪音影响,把每条谱线的谱熵值改为子带的谱熵,从而改善在周期性噪音环境中端点检测的效果。
基于谱熵噪声估计的改进减谱法
—164—基于谱熵噪声估计的改进减谱法李振静1,王国胤1,2,杨 勇1,2,罗 飞1(1. 重庆邮电大学计算机科学与技术研究所,重庆 400065;2. 西南交通大学信息科学与技术学院,成都 610031)摘 要:为优化基本减谱法在低信噪比下的性能,必须对噪声进行更为准确的估计。
提出一种基于谱熵噪声估计的改进减谱法,通过谱熵值估计每一帧语音的噪声,利用减谱法减去噪声以达到降噪的目的。
实验结果表明,该方法与传统消噪方法相比,在不同噪声环境下均能取得较好的去噪效果。
关键词:谱熵;减谱法;语音识别Improved Spectral Subtraction Method Based onSpectral Entropy Noise EstimationLI Zhen-jing 1, WANG Guo-yin 1,2, YANG Yong 1,2, LUO Fei 1(1. Institute of Computer Science and Technology, Chongqing University of Posts and Telecommunications, Chongqing 400065;2. School of Information Science and Technology, Southwest Jiaotong University, Chengdu 610031)【Abstract 】In order to improve the performance of traditional spectral subtraction in low SNR environment, more accurate noise estimation is needed. This paper proposes a novel spectral subtraction based on noise estimation of spectral entropy. It estimates the noise of each frame according to its spectral entropy, and subtractes it to enhance the frame. Experimental results show that in comparison with other classical methods, the proposed method can obtain better performance in different noisy environment. 【Key words 】spectral entropy; spectral subtraction method; speech recognition计 算 机 工 程Computer Engineering第35卷 第18期Vol.35 No.18 2009年9月September 2009·人工智能及识别技术· 文章编号:1000—3428(2009)18—0164—03文献标识码:A中图分类号:TP3911 概述目前语音识别在安静环境下已能达到较高的识别率,但在噪声环境下识别效果仍不理想。
一种改进的语音端点检测方法
一种改进的语音端点检测方法
刘培;谢维波;赵东世
【期刊名称】《计算机时代》
【年(卷),期】2010(000)012
【摘要】为了提高低信噪比下语音端点检测的性能,提出了一种改进形式的谱减法与改进的功率谱熵法相结合的语音端点检测算法.该算法首先利用改进的谱减法有效地降低背景噪声,然后再用短时平均幅度加权的方法改进功率谱熵,从而判定去噪后语音的端点位置.仿真结果表明,该方法具有良好的检测能力,在低信噪比环境下能比较准确地检测到语音的端点.
【总页数】4页(P4-7)
【作者】刘培;谢维波;赵东世
【作者单位】华侨大学信息科学与工程学院,福建,泉州,362021;华侨大学厦门软件园嵌入式技术开放实验室;华侨大学计算机科学与技术学院;华侨大学厦门软件园嵌入式技术开放实验室;华侨大学信息科学与工程学院,福建,泉州,362021;华侨大学厦门软件园嵌入式技术开放实验室
【正文语种】中文
【相关文献】
1.一种基于倒谱均值减的语音端点检测改进方法 [J], 王帛;冯新喜;余侃民;朱必浩
2.一种改进的多特征值语音端点检测方法研究 [J], 李申
3.一种改进的语音端点检测方法研究 [J], 王彪
4.一种基于改进信息熵的语音端点检测方法研究 [J], 宣章健;蔡晓霞;褚鼎立
5.一种基于改进谱熵的语音端点检测方法 [J], 李艳;成凌飞;张培玲
因版权原因,仅展示原文概要,查看原文内容请购买。
语音信号的谱熵
语音信号的谱熵一、引言语音信号是人们交流的主要方式之一,其处理和分析在语音识别、语音合成、语音增强等领域具有广泛的应用。
谱熵是描述语音信号复杂度的一种重要参数,对于语音信号的处理和分析具有重要的意义。
本文将详细介绍语音信号的谱熵的定义、计算方法、影响因素、应用场景、与其他参数的关系、实验研究和结果、未来研究方向以及结论。
二、谱熵的定义谱熵是描述信号复杂度的一种参数,它表示信号在频域上的分布情况。
对于离散时间序列,谱熵可以通过计算频域上不同频率成分的概率分布来得到。
对于语音信号,其频域上的分布通常是不均匀的,因此谱熵可以用来描述语音信号的复杂度和特性。
三、计算方法计算语音信号的谱熵的方法有很多种,其中一种常用的方法是基于傅里叶变换的方法。
具体步骤如下:1.对语音信号进行傅里叶变换,得到其频域表示。
2.计算每个频率成分的概率分布,可以采用直方图或频谱图等方法。
3.根据概率分布计算谱熵,可以采用基于信息论的方法或基于统计的方法。
四、影响因素语音信号的谱熵受到多种因素的影响,包括说话人的年龄、性别、语速、口音等。
其中,说话人的年龄和性别对谱熵的影响较大,而语速和口音对谱熵的影响较小。
此外,语音信号的时长和采样率也会影响其谱熵。
一般来说,语音信号越长,其谱熵就越大;采样率越高,其谱熵就越大。
五、应用场景1.语音识别:在语音识别中,谱熵可以用来描述语音信号的复杂度和特性,从而帮助提高语音识别的准确性和鲁棒性。
2.语音合成:在语音合成中,谱熵可以用来描述语音信号的韵律和语调等特性,从而帮助提高语音合成的自然度和逼真度。
3.语音增强:在语音增强中,谱熵可以用来描述语音信号的噪声和干扰等特性,从而帮助提高语音增强的效果和质量。
4.情感分析:在情感分析中,谱熵可以用来描述语音信号的情感特征和情感变化等特性,从而帮助提高情感分析的准确性和鲁棒性。
5.其他领域:除了上述应用场景外,谱熵还可以应用于其他领域,例如音频处理、音频分析、音频编码等。
改进谱减法结合端点检测的语音降噪
改进谱减法结合端点检测的语音降噪作者:王羔则来源:《价值工程》2020年第25期摘要:基本谱减法在在低信噪比下滤波性能不佳,會有大量的噪声残留,本文提出一种基于能量阈值的自适应谱减滤波算法,并进一步引入基于Teager能量算子的语音端点检测,实现低信噪比下的语音降噪。
Abstract: The basic spectral subtraction method has poor filtering performance at low SNR,resulting in a large amount of residual noise. This paper proposes an adaptive spectral subtraction filtering algorithm based on energy threshold. the speech endpoint detection based on Teager energy operator is further introduced to realize speech noise reduction under low SNR.关键词:语音降噪;能量阈值;TeagerKey words: speech denoising;the energy threshold;Teager中图分类号:TN912 ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; 文献标识码:A ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ;文章编号:1006-4311(2020)25-0222-030 ;引言语音通信是人们生活中最直接、最有效、最常用的通信方式之一,研究含有噪声的语音信号具有巨大的经济意义。
语音降噪是指在带噪语音信号中滤除噪声的过程,常见的语音降噪算法有谱减法[1]、最小均方差法[2]、维纳滤波法。
在高信噪比条件这三种算法均能取得明显的滤波效果,但是在低信噪比下,以上算法均无法有效的实现语音降噪。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 引 言
在 自动 语 音 识 别 系统 和语 音 编 码 中 . 何 在 背 景 噪 声 中准 如
波 器 5 】
日 ) - z =l a () 1
确 地 检测 出语 音 信 号 的 端 点 . 提 高 识别 精 度 和编 码 效 率 的关 是 键 。 端 点 即语 音 信 号 的 有 效起 始 点 和终 止 点 , 括 因素 、 节 、 包 音
a g r h , e if r t n o lx t a g rt m i u e .h s l t n n i ae t e mp v d ag r h l o t m t n omai c mpe i i h o y lo h i s s dT e i ai i d c ts h i r e lo t m g t mo e mu o o i es r e iin c u ae d tc in i os i a s f ce t a c r t ee t n n i sg l o y n Ke wo d : e d o n e e t n s e t l e t p if r t n c mp e i y rs n p i t d t ci , p c a n r y, o ma i o lxt o r o n o y
I r v n p c r l En r p g rt m o d o n mp o i g S e t a t o y Al o ih f r En p i t De e to n S o t Ti e Do a n t c in i h r m m i
Ho h u u Qin S e g o Y o C a g u Z o go a hn y u a h n ( l t nc D pr e tHu a oma U i r t, h n sa 4 0 8 ) Ee r i e at n, n n N r l nv s y C agh 10 1 co m ei
f r d t ci n a e a y f r P An t e ag r m ,p cr l n r p i d p e i h d tc in B i r v n t e nr p o e e t r e s C. oh r lo t o o i h s e t e to y, a o td n t e ee t . y mp o i g h e t y a s o o
Ab t a t En p i t d t cin i t e k y t e fl wi g p o e s i p e h e o n t n I h r t — o i , loih sr c : d on e e t s h e o t ol n rc s n s e c r c g i o . s o t i o h o i n me d ma n a g r ms t
维普资讯
短 时域语音端点检测 中谱熵算法 的改进
侯周 国 钱盛友 姚 畅
( 南师 范大 学 电子 系, 湖 长沙 4 0 8 ) 10 1
摘 要 语 音 识 别 中 . 点检 测 关 系到后 面 的 学 习 ̄ e 效 果 。 时域 检 测 的 算 法 简单 , 算量 少 。 文 对基 于谱 熵 的 算 端 Li 别 , 短 计 论
一
式 中 O为 预 加 重 系数 , 般取 值接 近 1 本文 取 09 。 t 一 , . 7 通 过 预 加重 滤 波 之 后 , 进 行 分 帧 加 窗 。 因 为 语音 信 号 是 再
个 短 时平 稳信 号 , 以 把 信 号 分 为 短 时 帧 . 所 以便 作 为 平 稳 信
( 状 和 长度 )对 于 短 时 分 析 参数 的特 性 有 很 大 的影 响 。加 窗 形 ,
词 素 、 、 等 的起 始 点 和 终 止 点【1端点 检 测 就 是 把 联 系信 号 字 词 1。 . 2 中感 兴 趣 的部 分 与 其 他 无 关 的 信 息分 离 开 音 识 别 按 语音 类 语 型可 分 为 孤 立 词语 音 识 别 和 连 续 语 音识 别 。在 语 音 系统 中 , 对 端 点 的检 测 方 法很 多 ,在 实 验 室 背 景 下 的孤 立 字 识 别 系统 中 . 常采 用 基 于 能 量 和过 零 率 的方 法 . 种 背 景 环 境 中可 以 认 为 是 这 无 噪 的 。随 着 识别 技 术 走 向实 用 . 音 识 别 系 统 需 对 连 续 语 音 语 进行 端 点 检 测 , 且 系统 的 工 作 环境 存 在 各 种 干 扰 噪 声 。 由于 而 背 景 噪声 和轻 音 的 时域 波形 非 常 相 似 . 噪声 的 幅值 或 能量 等 当 于 或 大 于语 音 中轻 音 部 分 相应 的值 时 . 利用 传 统 的 能量 和过 零 率 的 检测 方 法 已很 难 准 确地 检 测 出语 音 的 端 点 当系 统 工 作 在 非 平 稳 噪 声环 境 中时 . 需 对 端 点 检 测 方 法 加 以 改 进 本 文 对 更
法做 了改 进 , 用信 息 复 杂度 计 算 , 到 了短 时域 的 能 量一 采 得 过零 率和 谱 熵 以及 改进 方 法的 结果 的 对 比 , 真 结 果 表 明 在低 仿
信噪 比的 条 件 下 , 进 的 方 法 有较 高的 检 测 准 确 率 。 改
关键 词 端 点 检 测 谱 熵 信 息复 杂 程度 文 章编 号 1 0 — 3 1 ( 01 0 5 — 2 中 图分 类 号 T 3 1 P 9