一种改进的二阶M—KWS关键词识别方法
二阶HMM算法改进及在miRNA靶基因预测中的应用
i .T i p prs de b i a oi mso tes odod rh dnMakvm dl H c s h a e t i a c l r h f h e n —re i e ro o e ( MM2,m rvs h s u s s g t c d ) i poe e t
D : 0 99js . 5-2 7 0 0 304 OI1. 6/.s 0 589 . 1. .1 3 in 2 2 0
二阶HM M 算法改进及在mi RNA靶基 因预测 中的应用
高 松, 秦殿 刚, 冯铁男, 马成荣, 王 翼飞
上海 大学 数 学系,上海 2 0 4 044
f r r — a k r l o ih o wa d b c wa d a g rt m n u W e c r i i g a g rt m f t e m o e . W e p o i e t e p o fu i g a d Ba m- lh t a n n o ih o h d 1 l r v d h r o sn n r l a i n a d r u so ,ma i g t e e i r t e u e s o d a d i l me t d i r g a mi g n o ma i t o n e r i n z c k n h m a e o b nd r t o n mp e n e n p o r m s n ,a d e s i g n me i a t b l y n urn u rc ls a i t .Th i e HM M 2 i p l o mi sa p i t RNA a g t p e ito so o tpr c s i g f t r t d e t r e r c i n f s — o e s n le swih d p i g o e u t. o d r s ls
基于限制模型规模和声学置信度的关键词检出方法
由于 Vi ri t b 算法在搜索过程 中需要记 录很多相关信息 , e 因此 可 以加入一种称 为令牌 的数据 结构 , 用来 传递 和存储这 些信
息。
若采用 HMM 模 型来 表示语 音 , 其从 状态 i 到 问的转
移概率用 P 表示 , 对语音帧序列 O1 ……(r 每个状态 和待 ), 测语音帧序列 的第 t 匹配 的相似度 值 用 d 表 示 。定义 一 帧
Ke w ̄ t K e wo d s o t g y s y r p ti ,Ke wo d v rf a i n,Co f e c a u e n y r e ic t i o n i n e me s r ,To e a sn d k n p s ig,P u i g s r t g r nn tae y
frrd cn h as lr r t ,ak y r e i cto t o a e n a o si c n ie c e s r Se po e o e u ig tefleaam ae e wo dv r iain meh db s do c u t o fd n em a u ei x lrd,a d f c n am ut d C dn p r a h i as el e . S c n l ,t eifu n e fd c dn fetb h e m r nn n x— li eo ig a p o c s lor ai d eo dy h nl e c so e o ig efc y t eb a p u ig a d ma i — z mUT a t em o e p u ig ae su id fo t ea p c fi rvn h eo ig ag rtm ,wh n t e r o ie l ci d i r nn r t de rm h s eto mp o ig t ed c dn lo ih I v e h ya ec mbn d wiht ev rfcto to ,t eb te x ei e tr s lsa eg t t h e i ain meh d h etre p r n e ut r o. i m
一种基于HMM算法改进的语音识别系统
一种基于HMM 算法改进的语音识别系统随着科技的不断发展,人们对更快、更准、更智能化的语音识别系统越来越期待。
语音识别系统是一种将人类的语音转换成文字的方式,被广泛的应用于语音助手、汽车导航、智能家居等许多领域。
在实际的应用中,语音识别系统往往会受到许多干扰和噪音的影响,影响系统的准确率和可用性。
为了提高语音识别系统的稳定性和精准度,本文提出了一种基于HMM 算法改进的语音识别系统。
一、HMM 算法的基本原理和应用1、HMM 模型概述隐马尔可夫模型(Hidden Markov Model,HMM)是一种统计模型,主要用于对观察序列进行建模,它是一种基于时间序列的模型,利用一些可见的、已经观测到的状态推断出一些不可见的、隐藏的状态。
由于HMM 模型在许多领域都有着广泛的应用,如语音识别、自然语言处理、图像识别等,因此,本文主要针对HMM 模型在语音识别中的应用进行研究和改进。
2、HMM 模型的应用在语音识别中,人们常常使用HMM 模型来进行声学特征的处理,将采集到的语音信号经过分割、预处理、特征提取等步骤后,再利用HMM 模型进行声学模型训练,将语音信号与语音模型相匹配,从而得到语音识别结果。
二、HMM 算法改进对于HMM 算法的改进,本文主要从两个方面进行优化:一是改进初始概率的计算方法,二是改进HMM 模型的训练策略。
1、改进初始概率的计算方法HMM 模型的初始概率是指第一个状态的概率,其中第一个状态可能是任何一个状态。
由于HMM 模型是一个概率模型,因此初始概率的正确性与准确性至关重要。
传统的初始概率计算方法通常根据统计数据和预测比例来进行计算。
然而,在传统的初始概率计算方法中,往往会存在误差和偏差,因此我们需要采用一种更为准确的计算方法。
为了改进初始概率的计算方法,我们可以利用前向算法和后向算法进行计算,即将观察到的语音信号进行分割和分析,从而得出每个观察值在每个时间点上的概率分布。
然后再将概率分布加权求和得到初始概率。
一种改进的DNN-HMM的语音识别方法
摘要 针对深度神经网络与隐马尔可夫模型 (DNN-HMM) 结合的声学模型在语音识别过程中建模能力有
限等问题,提出了一种改进的 DNN-HMM 模型语音识别算法。首先根据深度置信网络 (DBN) 结合深度玻
尔兹曼机 (DBM),建立深度神经网络声学模型,然后提取梅尔频率倒谱系数 (MFCC) 和对数域的 Mel 滤波
372
2019 年 5 月
rate by 0.48% and 0.82% respectively, and an appropriate increase in the filter bank group can reduce the error rate. In brief, the sentence error rate and the word error rate are reduced to 21.06% and 3.12% respectively. Key words Speech recognition, Deep neural network, Acoustic model, Acoustic feature
0.48% 和 0.82%,并且适量增加滤波器组可以降低错误率。总之,研究取得句错误率与词错误率分别降低到
21.06% 和 3.12% 的好成绩。
关键词 语音识别,深度神经网络,声学模型,声学特征
二阶结构方程模型samrtpls
二阶结构方程模型samrtpls二阶结构方程模型(Second-Order Structural Equation Modeling,简称SEM)是一种用于分析复杂数据关系的统计方法。
它包含两个层次的模型:测量模型和结构模型。
在二阶SEM中,测量模型描述了潜在变量(也称为构念)与观测变量之间的关系,而结构模型则描述了潜在变量之间的因果关系。
SmartPLS(Structural Equation Modeling Software with Partial Least Squares Path Modeling)是一款用于执行二阶SEM的软件。
它采用了部分最小二乘法(Partial Least Squares,PLS)路径建模技术,具有以下特点:1. 适用于大数据分析:SmartPLS可以处理大型数据集,具有高效的数据处理能力。
2. 强大的模型拟合能力:SmartPLS可以应用于多种研究领域,如社会科学、自然科学、工程学等,支持多种模型类型,如线性、非线性、混合型等。
3. 图形化界面:SmartPLS提供了直观的图形化界面,使研究者可以轻松地构建、修改和分析模型。
4. 结果分析:SmartPLS输出结果包括路径系数、标准误差、p值、效果大小等,有助于研究者对模型进行评估和解释。
5. 兼容性:SmartPLS可以导出为多种格式,如PDF、Excel、CSV等,方便与其他软件(如SPSS、R、Python等)结合使用。
在使用SmartPLS进行二阶结构方程模型分析时,研究者需要遵循以下步骤:1. 数据收集:收集相关数据,确保数据质量。
2. 数据导入:将数据导入SmartPLS软件。
3. 构建模型:根据研究目的和理论依据,构建测量和结构模型。
4. 模型拟合:使用SmartPLS进行模型拟合,评估模型质量。
5. 结果分析:分析模型结果,如路径系数、效果大小等。
6. 模型检验:检验模型是否符合研究目的和理论预期。
连续语音关键字识别的方法
旃 赫 l √ 0 _ / 0 00
Ky o p tg f S rKy o e gi n t ewr S tn K ) ewr 1c ni 0 d o i W o dZo  ̄ o
求 ,因 此 又 有 不 同 , 由于 这 些 差 别 两
K y o d so t g; e w r e o n i ; o t u u pe h e w r p ti K y od rc g io C n i o s S ec n tn n
R cg io ; H eo n i tn MM; ky r & fl m dl e wod i r oe l e
l 53
维普资讯
中国科技信息 20 年第 2 期 06 o
C I CEC N EHO O Y I O M T N Ot20 HN S I EA D TC N LG N R A I c. 6 A N F O 0
状态语法网络 中,而 KWS贝没有这个 1 征 ,供 模 型 进 行 训 练 。 4 将每个关键词作为识别单元 。有的以 要求 。 多数 KWS将语音看作是关键词和 “ 子词” 即关键词的一部分 ) ( 作为识 别 ( 4)发音态度 :CsR 使用者 明 非关键词的组合 .非关键词由 M 个垃 r 单 元 。 白他们正在与机器打交道 ,他们一般 l圾 ( r g ) Ga ba e 模型( 有些文献也称为 有些系统将所有音素聚类 为 N 个 持合作态度;Kws使用者往往毫无察 }“ ie ” F l r 。即 “ l 填充”模型) 来表示。这 音素类 。为每类 建立一个垃圾 模 型 ; 觉 。 f 种 系统的关 键 词和非 关 键词模 型 可能 对 有的将 训练 语音中的非关键 词 ,包括 ( 5)环境 问题 :C sR 系统 由于 应不同的识别单元。这类系统中。有些 非关键词语音和非语音(o — sec ) n n peh , 用户的配合往往在较好的环境中使用 , 『 而 K WS环境则有可能有很大的噪声。
基于模式图的关键字查询改进方法[发明专利]
专利名称:基于模式图的关键字查询改进方法专利类型:发明专利
发明人:禹晓辉,高磊,彭朝晖,闫中敏,杨敏
申请号:CN201210492445.7
申请日:20121127
公开号:CN102955860A
公开日:
20130306
专利内容由知识产权出版社提供
摘要:本发明公开了一种基于模式图的关键字查询改进方法,它包括以下步骤:步骤1.IR引擎模块借助于索引从数据库表导出需要的元组集,候选模块生成器把导出的元组集中的非空元组集和数据库模式图作为输入,生成一组候选网络,并把候选网络作为输出;步骤2.查询日志挖掘模块使用已有的树挖掘算法来对用户的查询日志进行挖掘,以获取用户偏好的频繁模式树;步骤3.利用树编辑距离来定义步骤1生成的候选网络与步骤2挖掘得到的频繁模式树的相似度,生成频繁模式树的相似度;步骤4.跟据步骤1生成的候选网络与步骤3生成的频繁子树的相似度对生成的候选网络进行排序并优先求解排位靠前的候选网络,以此来改进查询的质量和效率。
申请人:山东大学,山东英佰德信息科技有限公司
地址:250061 山东省济南市历城区山大南路27号
国籍:CN
代理机构:济南圣达知识产权代理有限公司
代理人:郑华清
更多信息请下载全文后查看。
AI技术如何进行语音识别与处理
AI技术如何进行语音识别与处理一、语音识别技术的发展与应用随着人工智能(AI)技术的迅速发展,语音识别与处理成为了一个备受关注的热点领域。
传统的人机交互方式主要基于键盘、鼠标等输入设备,而语音识别技术则将人们从繁琐的操作中解放出来,实现更加自然、便捷的交互方式。
本文将探讨AI技术如何进行语音识别与处理。
二、语音识别的原理及算法1. 声纹识别算法声纹是一个人与生俱来的特征,通过分析声音频谱和共振特征,可以对声音进行个体辨认。
声纹识别技术广泛应用于安全验证领域,比如指纹锁和语音指令解锁手机等。
2. 关键词检测算法关键词检测(Keyword Spotting, KWS)是一种在大规模数据集中快速搜索和定位关键词的算法。
它被广泛应用于智能助手等场景中,利用神经网络模型来判断输入是否包含预置关键词。
3. 端到端框架端到端框架实现了从输入到输出的全流程处理,包括语音信号的采集、特征提取、建模和解码等一系列环节。
这种方法简化了系统架构,降低了开发门槛,因此在实际应用中得到广泛应用。
三、语音识别技术的挑战与解决方案1. 声音环境多样性在不同的声音环境下,语音识别系统受到噪声、回声等干扰因素的影响,容易导致错误识别。
为了提高鲁棒性,可以通过使用降噪算法、回声抵消技术以及深度神经网络等方法进行优化。
2. 个体差异每个人的发音方式、腔调习惯都有所不同,这给语音识别带来了一定的挑战。
解决方案包括使用说话人自适应技术和多任务学习方法,使系统能够根据个体差异进行模型参数调整和训练。
3. 多语种支持随着全球化进程加快,多语种支持成为一个重要的需求。
语音识别系统需具备对不同语言及其变体的理解和处理能力。
为此,可以采用多语言训练数据集,以及跨语种迁移学习等方法来提高多语种支持能力。
四、语音处理技术的应用领域1. 智能助手语音识别技术与自然语言处理技术相结合,可以实现智能助手的功能。
用户通过简单的口头指令,即可完成搜索、播放音乐、发送消息等操作,提高了人机交互的效率和便捷性。
用于改进的关键词检测的技术[发明专利]
专利名称:用于改进的关键词检测的技术专利类型:发明专利
发明人:P·曼加拉斯,J·G·鲍尔,G·斯特摩尔申请号:CN202111573180.9
申请日:20170817
公开号:CN114141241A
公开日:
20220304
专利内容由知识产权出版社提供
摘要:用于改进的关键词检测的技术被公开。
一种计算设备可以捕获来自该计算设备的用户的语音数据,并且对所捕获的语音数据执行自动语音识别。
自动语音识别算法被配置为既可以检测关键词,也可以提供对所捕获的语音数据的完整转录。
与相似的词相比,自动语音识别算法可以优先匹配关键词。
所识别的关键词可用于改进转录的语音数据的解析或用于改进辅助代理以与计算设备的用户保持对话。
申请人:英特尔公司
地址:美国加利福尼亚州
国籍:US
代理机构:上海专利商标事务所有限公司
更多信息请下载全文后查看。
基于二阶hmm的中医诊断古文词性标注
中国传统医学有着悠久的历史,其中一种比较流行的就是汉族中医诊断方法。
这种古老的诊断方法大多以古诗词为文本,其中包含很多古文词,如谷物、香椿等。
而汉语的古文词的词性标注对于有效的中医诊断至关重要。
为此,研究者基于二阶隐马尔可夫模型(HMM)开展了词性标注的研究。
HMM是一种概率时间序列模型,可以根据古文词的语义和词组结构上下文关系,建立词性标注的模型。
研究者们通过机器学习和深度学习方法,通过语义理解,建立古文词词性标注系统。
为了提高模型准确性,研究者们还将这种模型与其他语言模型,如LSTM(长短时记忆网络)等相结合,大大提高了词性标注的准确率。
研究者们采用上述模型标注了古文词,并验证了其对于中医诊断的效力。
实验结果表明,基于HMM非常有助于提高中医诊断古文词性标注的准确性。
该模型可以有效充分地利用古文词语义和语法特点,帮助医生准确地诊断患者,大大提高了中医诊断的准确性和可靠性。
总之,基于二阶HMM的古文词性标注已成功应用到中医诊断领域,取得了较为显著的成果,为广大患者带来更好的治疗效果。
一种改进的语音关键词特征提取方法
一种改进的语音关键词特征提取方法
王耀明
【期刊名称】《上海电机学院学报》
【年(卷),期】2008(011)004
【摘要】介绍了一种新的实验数据表明,改进后的提取方法较先前在提取效果上有显著改善.
【总页数】3页(P291-293)
【作者】王耀明
【作者单位】上海电机学院,电子信息学院,上海,200240
【正文语种】中文
【中图分类】TN912.34;TP391.42
【相关文献】
1.一种改进的特征提取方法在语音识别中的应用 [J], 陈树;于海波
2.一种改进的语音动态组合特征参数提取方法 [J], 钟浩;鲍鸿;张晶
3.一种改进的TFIDF网页关键词提取方法 [J], 李静月;李培峰;朱巧明
4.一种适于改进的LPC声码器的语音特征提取方法 [J], 陈雪勤
5.基于改进语音特征提取方法的语音识别 [J], 李建文;张晋平
因版权原因,仅展示原文概要,查看原文内容请购买。
一种改进型HMM说话人识别算法
一种改进型HMM说话人识别算法陶洁;张会林【摘要】针对Baum—Welch算法依赖于初始值的选取而容易陷入局部最优解的问题,基于全局优化的思想,提出了一种改进的HMM语音识别算法。
该算法将遗传算法应用到HMM模型训练中,得到了全局最优解。
实验结果表明,所提出的算法使用有效,识别率显著提高。
%In order to avoid Baum-Welch algorithm falling into local optimum, an improved algorithm based on global optimization about training HMM-genetic ~lgorithms is proposed. Experimental result shows that the improved algorithm is practical and effective, the recognition rate is improved significantly.【期刊名称】《微型机与应用》【年(卷),期】2012(031)021【总页数】3页(P31-32,35)【关键词】遗传算法;HMM模型;语音识别【作者】陶洁;张会林【作者单位】上海理工大学光电信息与计算机工程学院,上海200090;上海理工大学光电信息与计算机工程学院,上海200090【正文语种】中文【中图分类】TP391.4近年来,随着语音识别技术的不断发展,语音识别系统的性能不断提高,隐马尔可夫模型方法是当中的一个主要识别方法。
语音识别系统的识别率十分依赖于模型的训练,而经典的训练算法(Baum-Welch算法)有一个致命的弱点,即最终所得的解十分依赖于初始值的选取,所以总是局部最优解,影响了整个系统的识别率。
本文将遗传算法植入HMM模型参数的优化当中,使得整个语音识别系统的识别效果大大改善。
1 遗传算法遗传算法将自然界的生物进化原理引入待优化参数形成的编码串联群体中,按所选择的适应度函数通过遗传中的复制、交叉及变异对个体进行筛选,使得适应度高的个体被保留下来,组成新的群体。
关键词自动提取方法的研究与改进_黄磊
提出的 DI-TFIDF方法提取关键词的准确度要高于传统的 TFIDF 算法。 关 键 词 关 键 词 提 取 ,特 征 权 重 ,TFIDF,DI-TFIDF
中 图 法 分 类 号 TP391.1 文 献 标 识 码 A
Research and Improvement of TFIDF Text Feature Weighting Method
第 41 卷 第 6 期 2014 年 6 月
计算机科学 Computer Science
关键词自动提取方法的研究与改进
Vol.41 No.6 June 2014
黄 磊1,2 伍 雁 鹏2 朱 群 峰2
(湖 南 大 学 信 息 科 学 与 工 程 学 院 长 沙 410082)1 (邵 阳 学 院 信 息 工 程 系 邵 阳 422000)2
ments as an experiment based on the traditional TFIDF method and the DI-TFIDF method.Experimental results show
that our proposed DI-TFIDF method can extract the keywords in a higher accuracy than traditional TFIDF algorithm. Keywords Keywords extraction,Term-weighting,TFIDF,DI-TFIDF
帮助人们在搜 寻 所 需 的 信 息 时 能 够 迅 速 地 定 位 到 相 应 的 文 速地搜寻到相应的信息,有利于信息的传播和知识的推广,并
档。然而,大量的文档 中 并 没 有 标 注 出 关 键 词。 人 工 标 注 出 减轻人工标注关键词的负担,具有深刻的意义。
一种改进的二阶沃尔特拉滤波器LMS算法
一种改进的二阶沃尔特拉滤波器LMS算法
刘岚;胡钋;韩进能
【期刊名称】《通信学报》
【年(卷),期】2002(023)006
【摘要】本文给出了一种辨识二阶沃尔特拉系统的新的LMS算法,数值模拟表明,这种算法比快速卡尔曼滤波器的计算时间短,收敛速度快.
【总页数】7页(P122-128)
【作者】刘岚;胡钋;韩进能
【作者单位】武汉理工大学,信息工程学院,湖北,武汉,430070;武汉大学,电气信息工程学院,湖北,武汉,430072;武汉科技大学,城市建设学院,湖北,武汉,430074
【正文语种】中文
【中图分类】TN91
【相关文献】
1.一种基于改进LMS算法的自适应消噪滤波器 [J], 朱慧敏
2.一种基于改进LMS算法的自适应消噪滤波器 [J], 朱慧敏
3.自适应滤波器的一种新LMS算法--改进的最陡下降法 [J], 左全生
4.一种改进的变步长自适应滤波器LMS算法 [J], 徐凯;纪红;乐光新
5.二阶伏特拉滤波器RLS算法改进 [J], 陈凯亚;王敏锡
因版权原因,仅展示原文概要,查看原文内容请购买。
一种改进的Wu-Manber多关键字匹配算法
一种改进的Wu-Manber多关键字匹配算法莫德敏;刘耀军【摘要】针对Wu-Manber算法在处理公共子后缀模式情况下的不足,该文提出了一种基于非空公共子后缀模式的处理算法.该算法把有非空公共子后缀的模式汇集在一起,进一步减小了next链表的平均长度.在匹配过程中减少了字符比较的次数,从而提高算法的运行效率.该文对搜狗实验室给出的相关文档进行全文检索实验,并和原Wu-Manber算法、孙晓山等提出的改进算法进行比较.实验结果表明,该文提出的改进算法有效地减少了匹配过程中字符比较的次数,从而提高匹配的速度和效率.【期刊名称】《中文信息学报》【年(卷),期】2009(023)001【总页数】5页(P30-34)【关键词】计算机应用;中文信息处理;Wu-Manber算法;多关键字匹配;模式匹配;字符串匹配【作者】莫德敏;刘耀军【作者单位】太原科技大学,计算机科学与技术学院,山西,太原,030024;太原师范学院,计算机系,山西,太原,030012【正文语种】中文【中图分类】TP391多关键字匹配算法被广泛应用于信息检索、网络信息过滤、入侵检测系统和生物信息计算的基因序列比较等领域。
字符串匹配即在一个大的字符串T中搜索某个字符串P所有出现的位置。
其中T称为文本,P称为模式串。
多关键字匹配就是在文本T上搜索出模式串集合P={P1,P2,…,Pr}中所有模式串的所有出现的位置。
经典的多关键字匹配包括Aho-Corasick算法[1],Commentz-Walter算法[2],Set Horspool算法,Wu.Sun&V.Manber的Wu-Manber算法[3]和各种并行算法[4]等。
其中Wu-Manber算法采用了BM算法[5]的跳跃思想和hash散列的方法,在许多相关领域中得到了应用。
文献[6]对Wu-Manber 算法的跳跃距离进行了改进,文献[7]提出了一种后缀模式的处理方法,但在应用中出现文献[7]中提出的某一模式串是其他模式串的后缀的情况不多。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
E p r n ss o d t a e d t ci n p ro a c ft e i r v d s s m sg e t n a c d x ei me t h we t h e e t e r n eo mp o e y t i r a y e h n e . h t o f m h e l
第2 8卷 第 4期
21 0 2年 4 月
科 技 通 报
B L T N CI NC UL E I OF S E E AND T HNOL EC OGY
V0 .8 1 No4 2 .
Apr 2 2 . 01
一
种 改进 的二 阶M— WS K 关键词识别方法
熊 于菽 , 晟 伊 冯 晓荣 冉 ,
然 而 , M值 的粗略 或错误 估计 导致前 端处 理 的错 误 C 删 除和后 处理 的虚报率 过度 降低 ,使关键 词检 出率下 降。 为 了解决上述 问题 ,本文提 出了一种改进 的二 阶 M— WS K 模型 , 并对该模 型进 行 了分析与评估 。实验 结 果从识别效果和R C O 曲线分析方面证 明 ,经 过改进和 优化 的二 阶M— WS K 模型性能得到很大改善 。
XI ONG s u,RAN Sh n y , F Yu h e g i ENG a r n Xio o g
(.hn q gE g er gIstt o eh ooyo r es n C ogig4 0 3 ,hn 1 og i n i e n tue f c nlg f o si , hn qn 0 07C ia C n n i ni T Pf o 2C o gigU iesyC l g f o m nct nE g er gIstt C o gig4 0 3 ,hn) .hn qn nvrt o eeo m u iao n i e n tue hn qn 0 0 7C ia i l C i n i ni ,
键 词设 定 不 同 的权 值 , 果 导 致 较 高 的虚 报 率 [ 采 用 结 2 1 。 置 信 度 测 量 ( M) K 算 法 可 以进 行 有 效 地 改 进 。 C 对 WS
11ቤተ መጻሕፍቲ ባይዱ连 续 语 音 识 别 .
汉 语 语 音 中 , 当领 音 的 是 元 音 ( , 音 由辅 音 充 V)起 ( ) 当 , 音 可 以是 元 音 , 可 以 是 辅 音 。 根 据 汉 语 C充 收 也
关键词权值的正确估计问题 。 采用 消除内插算 法与关键词 确认模 型相结 合 , 解决 了参数估计 中的“ 概 零 率” 问题 , 提高了系统 的检出率。 实验表 明 , 该模型在保证误警率较小 的情况下 , 系统关键词识别效果得
到有效改善 。
关键词 : 上下文相关 最大后 验概率 ; 关键词权值 ; 消除内插 ; 关键 词检出
(. 1 重庆工程职业技术学院 ;. 2重庆大学 通信工程学院 , 重庆 40 3) 007
摘 要: 在关键词 检出系统中 , 关键词权值 的不 准确 性对 系统识别 率有很 大影 响。为了避免关键词权值
估 计 错 误 , 出 了基 于 上 下 文 相关 最 大 后 验 概 率 准 则 ( D P 的改 进 二 阶M— WS 型 , 效 地 解 决 了 提 C MA ) K 模 有
Ab t a t sr c :Ke wo d s ot g s s m ee t n p ro ma c e r d s d e t e w r ih i g i a c r c . mp o e y r p t n y t d tc i ef r n e d g a e u o k y o d weg t n c u a y An i rv d i e o n s c n r e — W S meh d b s d o e o d o d rM K t o a e n CDMAP w s p o o e . h o i ai n o e ee ne p lt n ag rt m t a r p s d T e c mbn t fd l td i tr oa i lo h wi o o i h k y r e o nt n e wo d r c g i o mo e c n f ce t s l e t e i d l a e i nl o v h i y “ e o r b b l y p o lm d r g t e p r me e e au t n z r p o a i t ” r b e i u n h a a t r v ai . i l o
Ke r s DMAP k y r e g t g d lt d i tr oa in k y r e e t n y wo d :C ; e wod w i h i ; e ee n e p lt ; e wo d d tci n o o
0 引 言
关键词确认技术 ,即从连续语音 中检测并确认 给 定 的若干个特定 词[ 可 以应 用在 电话接 听 , 1 】 , 口语识 别 等 多种应用场合 ,成为近年来一个颇受重视 的研究 领
中 图分 类 号 : N 1. T 92 4 3 文献 标 识 码 : A 文 章 编 号 : o — 19 2 1 }4 0 5 一 3 l 1 7 1 (0 2 0 — 0 7 o 0
An I p o e e o d Or e y r p ti g M o e m r v d S c n d r Ke wo d S o tn d l
域。
1 改进 二 阶M— W S 型 K 模
改进二 阶M— WS 型将传 统 的K 系统分 成两 K 模 WS 个阶段 : 第一阶段是连续语音 识别 , 第二个阶段是基 于 观察语音序 列 的关键 词模糊搜 索 ,原理 框 图如 图 1 所
示。
在传统K 算法 中 , WS 为了提高关 键词检 出率 , 关 将