Nuance语音识别技术及解决方案。
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
语音识别系统结构 2.语音识别应用 Nuance 公司是自然语音接口软件的佼佼者。使用自然语音接口软件,人们可以通过电话方 便安全地获取信息、 服务并进行交易。 每天, 千千万万的人通过拨打运行 Nuance 公司语音识别、 语言理解和声纹鉴别软件的电话,进行出游预订、股票交易、与其它通讯媒体、企业和互联网 系统进行交往等Biblioteka Baidu动。NUANCE 的应用:美国航空、Bell Atlantic、Charles Schwab、家庭购物 网络、Lloyds TSB、Sears、UPS 。 3.NUANCE 语音识别特点
公司电话簿特点 •系统支持电话接入方式 用户可通过电话修改个人密码,个人上班电话和非上班电话 •系统支持 WEB 接入方式 • 系统管理员可修改所有信息 • 各公司管理员可增加,删除,修改本公司的电话信息 (2)基于语音识别的点歌功能 功能描述 用户接入系统,提示用户说出歌名,并依靠语音识别技术,查找到该歌名,并播放给用户。 应用流程 用户拨打接入码,提示用户说出歌名或歌手名,并依靠语音识别技术,查找到该歌名或歌 手名,若为歌名查询数据库,得到该歌存储的路径,并播放给用户,若为歌手名,则读出该歌 手的专辑,并提醒用户选择,用户选择后,读出该专辑的歌名,并提醒用户选择,用户选择后, 给用户播放该歌曲。
(1)海量词汇、独立于讲话者的健壮识别功能 Nuance 系统能可靠地对多种语言进行大词汇量的识别,并可提供识别结果的置信度。该系 统对商业上使用的大量词汇提供最准确的语音识别技术。 利用 Nuance 系统开发的应用程序, 在 市场上具有最高的准确率。生产中的应用程序经测试,准确性超过 96%。 (2)基于主机的客户/服务机结构 Nuance 系统基于开放式客户/服务机结构, 特别为大型应用程序所需的健壮性和可伸缩性而 设计。呼叫者的讲话由客户端收集,而识别和鉴别处理的负载被平均分配到网络上的多个分开 的服务器上。 (3)N-Best 处理 对于有些应用程序,可能需要识别引擎产生可能的识别结果集,而不是一个最好的结果。 Nuance 系统的 N-best 识别处理方法便有这个功能,它提供了可能的识别结果列表,并按可能性 从高到低排列。 (4)语法概率 Nuance 系统允许对呼叫者所讲的特定词语或短语的在语法中的概率进行指定。当被讲的词 语或短语的概率可根据实际使用进行估计时,非常有用。对语法增加概率可提高识别的准确率 和速度。 (5)降低噪音 当进来的呼叫包含稳定的背景噪音时,Nuance 系统通过一种机制,使识别服务器更准确地 进行识别。识别服务器将进来的话语进行增强,以有效地将语气、嗡嗡声、哼叫声、嘘嘘声等 噪声过滤。如果相当数量的电话均含有稳定的背景噪声,比如在汽车上免提打电话时,这个机 制效果较理想。 4.基于识别的应用 语音短信本身业务、公司电话簿、个人电话簿、智能点歌、股票查询和交易、智能信息点 播、列车时刻查询 (1)基于语音识别的公司电话簿 公司电话薄应用描述 系统能支持多个接入号码,虚拟多个公司的总机。并依靠语音识别技术,智能转接到相应 的用户。 流程 用户拨打接入码,系统根据接入码找到相应的公司数据库,同时提醒用户说出相应的用户, 系统依据相应的用户查询数据库,并得到该用户的号码,并通知交换机将该号码接通。
u.uu17.net/有妖气
1.语音识别概述 语音识别技术,Automatic Speech Recognition,简称 ASR,是一种让机器听懂人类语言的 技术。语言是人类进行信息交流的最主要、最长用、最直接的方式。语音识别技术是实现人机 对话的一项重大突破,在国外近年来发展十分迅速,其应用也逐步得到推广。近几年逐渐普及 的 IVR(自动电话应答)处理了不少简单而又重复的咨询工作,节省了不少人力,但这种按键 式的语音自动应答却让客户花费很多时间按指引来完成简单的查询,令用户倍感不便。 语音识别无疑可以解决该方面的问题。语音识别系统的开发成功,充分发挥了计算机技术 和网络技术的优势,采用先进的人机对话方式,摆脱电话按键的束缚,人们只要象平常一样对 着电话简单的说出所需服务项目,即可轻松获取自动系统提供的所需信息。