口语对话系统的设计与实现
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
u语对话系统的设计与实现
第五章
采用嵌入式的语音识别以及语音合成。
全面的语音驱动,用户可以用语音控制所有的界面元素,包括菜单、按钮、下拉列表框等。
支持汉语、英语、法语,可以扩充到其它语言。
用户可以选择语音识别的语言以及界面语言。
(在如图5—4的设置对话框中可切换语言1
内容更加丰富,包括宾馆、娱乐以及餐饮等方面的信息查询(图5.5,图5-6),如:电话、地址、位置以及路线导航(电子地图):功能更加强大,包括常用的工具比如货币兑换、度量衡转换、世界时区时间查询和应急号码、多语种的日常用语与汉语之间的互译以及对应汉语的朗读(如图5.7,图5.81。
更加强大的电子地图功能,可以实现常用的地图操作比如放大、
缩小、漫游,位置查询。
路径查询,兴趣点查询,模拟导航,GPS,在地图上添加个性化标记等等(如图5-9,图5-10)。
图5-3北京城市导航主界面(可换背景)
图5—4设置对话框
图5-5查询餐饮信息
图5-6北京饭店的详细信息
))
)
)
)
@o
∽
@
佰
口语对话系统的设计与实现
第五章
图5—7常用英语日常用语图5-8英汉对照(可朗读)
图5-9电子地图查询15.2.3系统架构
图5-10电子地图查询2
城市导航系统采用如图5.11的系统架构,它可以分为几个部分1.用户界面
系统提供触笔输入以及语音输入两种方式,可视化的图形用户界面,以及合成语音。
2.语音识别(ASR)
识别当前窗口内的命令词或固定语句。
可动态切换语音识别的语言,以及动态切换词表。
3.语音合成(TTS)
可动态切换语音合成的语言。
4.语音中间件(VoiceMiddleware)
负责语音信息流的调度,封装了语音引擎和语音中间件的接口,并为上。