人性化的人机交互方式--自然语音
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
公司简介
语音处理
得意接线员
声纹识别
中文语言理解
未来CTI
问答
技术演示
19
Your Partner in the Century of Speech
得意语音,人性科技;心意相通,尽在言中
得意接线员系统构架:
完全不需变动用户原有电话交换机 架构及设定
程控交换机 外线
分机
得意接线员
公司简介 语音处理 得意接线员 声纹识别 中文语言理解 未来CTI 问答 技术演示
语音识别(ASR): “音字”的转换
共性特征提取 声学模型 语言模型
语言理解(NLU): “字意”的转换
规则提取
语义分析 对话管理
声纹识别(SpkID): 谁的声音?
个性特征提取 声纹辨认 声纹确认
公司简介
语音处理
得意接线员
声纹识别
中文语言理解
未来CTI
问答
技术演示
8
Your Partner in the Century of Speech
公司简介
语音处理
得意接线员
声纹识别
中文语言理解
未来CTI
问答
技术演示
语音和语言处理技术分类
Your Partner in the Century of Speech
Beijing d-Ear Technologies Co., Ltd.
11
Your Partner in the Century of Speech
公司简介
语音处理
得意接线员
声纹识别
中文语言理解
未来CTI
问答
技术演示
13
Your Partner in the Century of Speech
得意公司与竞争对手同类产品现行指标的比较
得意语音,人性科技;心意相通,尽在言中 性能指标
一、中文输入法开发工具
“得意”语音与语言 技术开发工具集
模型小:1MB左右 准确率高:95% 模型空间小:156字节 命令集合较大:可几百 准确率高:97% 对集外词可以拒识 抗噪音
非特定人,连续语音。 词表可随意定制。 句中关键词个数可以设定。 良好的拒识性能。 很低的漏识率和很低的误警率。 操作点易于调整。 实时响应。 适应各种不同的信道(如固定电话、手机和IP电话)。
公司简介
语音处理
得意接线员
声纹识别
中文语言理解
未来CTI
问答
技术演示
18
使汉语成为信息技术中的一种更有效的媒 介。
公司简介 语音处理 得意接线员 声纹识别 中文语言理解 未来CTI 问答 技术演示
6
Your Partner in the Century of Speech
清华大学智能技术与系统国家重点实验室
得意语音,人性科技;心意相通,尽在言中
与清华大学智能技术与系统国家重点实验室保持良好的 关系; 1994年第一次全国重点实验室评比中为A; 1997年第二次全国重点实验室评比中为A; 2002年第三次全国重点实验室评比中仍为A; 其旗下语音技术中心(CST)拥有23余年的语音和语言 处理技术的成果和经验,成果丰硕;
术语--漏识;误警或虚报;操作点
低漏识率
公司简介 语音处理 得意接线员 声纹识别 中文语言理解 未来CTI 问答
操作点 低误警率
技术演示
17
Your Partner in the Century of Speech
得意语音,人性科技;心意相通,尽在言中
得意关键词检出器(d-Ear Word-Spotter)的API V1.0, 从内核到接口是完全自主知识产权的,有如下的特征:
人性化的人机交互方式--自然语音
(于第四届中国国际呼叫中心和客户关系管理大会) Call Center & CRM China 2002 郑 方 2002年7月3日
Your Partner in the Century of Speech
Beijing d-Ear Technologies Co., Ltd.
中英文名字相互谐音,共成识别与理解
公司简介 语音处理 得意接线员 声纹识别 中文语言理解 未来CTI 问答 技术演示
4
Your Partner in the Century of Speech
得意公司的理念
得意语音,人性科技;心意相通,尽在言中
建立一个可持续地面向汉语语言处理的公 司和具有国际水平的企业。成为语音识别与 语言理解--尤其是中文语音识别和语言理 解--的国际性的技术提供商。 创建一种文化和氛围,以便员工可以充分 发挥他们的聪明才智,并在得意公司找到他 /她一生的事业。
公司简介
Your Partner in the Century of Speech
Beijing d-Ear Technologies Co., Ltd.
3
Your Partner in the Century of Speech
得意语音,人性科技;心意相通,尽在言中
北京得意音通技术有限责任公司 得意--得到意思 d-Ear --digital Ear
其他技术开发工具
模型大:几百兆字节 准确率低:90% 模型空间大:几KB 命令集合小:仅几十 准确率低:95% 对集外词无法拒识 不能抗噪
二、语音命令开发工具
三、关键词检出器©开发工具
每句关键词个数可设定 检出准确率高:>90% 文本无关、语言无关 可对音、调同时给出评价分数 可理解句子的真正语义,并有针对性地回 答问题
公司核心技术概述--六大应用方向【现阶段】
国防监听:辨认 刑侦:辨认 银行证券:确认 个性化:确认
得意语音,人性科技;心意相通,尽在言中
拼音输入法
声纹识别 d-Ear ID 得意身份证
中文整句输入法 d-Ear IME 得意输入法
笔划输入法 数字输入法
计算机辅助教学 智能玩具
语言学习 d-Ear Teacher 得意教师
连续语音中的关键词检出技术。应用于一些具有特定要求的场合, 人们并不需要识别出整个句子,更不需要理解整个句子,而只关 注那些包含特定词(称为“关键词”)的句子。根据一些应用的 特殊需要,关键词检出器有一些有别于其他语音识别器的地方。 包括:
有的应用需要限定或假设一个句子只能含有一个关键词(如自动分机接 驳),而有的应用则不希望有这样的限定(如电话监听)。 有的应用希望“宁错勿漏”( 如电话监听),而有的应用则希望“宁漏勿 错”(如自动分机接驳)。
问答 技术演示
公司简介
语音处理
得意接线员
9
Your Partner in the Century of Speech
技术关系图
得意语音,人性科技;心意相通,尽在言中
文本语料库
语言模型
特定领域规则集
得意命令
得意输入法
得意关键词检出器 得意教师
得意分析器 得意身份证
API ↓ 应用
声学模型
个性化特征
语音数据库
得意语音,人性科技;心意相通,尽在言中
人类嘴巴的模拟--语音合成技术
用以把文本转换成声音 完全人性化的、自然的语音合成需要语言理解技术的支持
公司简介
语音处理
得意接线员
声纹识别
中文语言理解
未来CTI
问答
技术演示
12
Your Partner in the Century of Speech
Your Partner in the Century of Speech
得意语音,人性科技;心意相通,尽在言中
今天将为大家介绍与CTI相关的得意公司的三个技术和 产品
得意接线员 得意身份证 得意语义理解
公司简介
语音处理
得意接线员
声纹识别
中文语言理解
未来CTI
问答
技术演示
得意接线员技术
得意语音,人性科技;心意相通,尽在言中
源自文库
人类耳朵的模拟--识别和理解技术
共性特征相关技术
语音识别=把声音变成文字 语言理解=把文字变成语义 其他相关技术
– 汉语整句输入法(利用中文语言模型) – 汉语语言学习(利用语音识别技术)
个性特征相关技术
声纹识别=从声音中提取出说话人信息
公司简介 语音处理 得意接线员 声纹识别 中文语言理解 未来CTI 问答 技术演示
21
Your Partner in the Century of Speech
得意语音,人性科技;心意相通,尽在言中
图形界面的用户词表编译器
公司或单位进行人员维 护(人员增减、电话号码 变化等)时使用 名字有多音字时,管理 员可以设定对此名字有 一种或多种读法 在发生重名时提示管理 员输入“确认信息”, 以便得意接线员与来电 者交互确认(一般地,确 认信息不是必需的) 编译器自动产生得意接 线员所需要的内部格式, 对管理员完全透明
Your Partner in the Century of Speech
Beijing d-Ear Technologies Co., Ltd.
16
Your Partner in the Century of Speech
d-Ear Word-Spotter (得意关键词检出器)
得意语音,人性科技;心意相通,尽在言中
20
Your Partner in the Century of Speech
得意语音,人性科技;心意相通,尽在言中
得意接线员(d-Ear Attendant)的API V1.0,除具有得 意关键词检出器的特点外,还有如下特点:
高检出率。检出准确率高达98%。
与硬件无关。得意接线员的识别引擎不需要引入额外的硬件即 可实时处理语音流。与电话卡无关的特性使得用户可以基于任 何电话卡构建自己的得意接线员。 图形化界面的词表编译器可以辅助用户高效、正确地管理和维 护用户词表。超强的模糊校验能够智能地报出由于用户词表疏 忽所带来的词表歧异问题。 简捷实用的例子程序。用户可以基于该例子程序了解得意接线 员的功能及其特性并在此基础上定制开发自己的得意接线员。
双方已经达成建立“清华-得意语音技术联合实验室” 的意向,以实现“产学研”的无缝链接。
公司简介
语音处理
得意接线员
声纹识别
中文语言理解
未来CTI
问答
技术演示
7
Your Partner in the Century of Speech
公司核心技术概述--三大技术方向
得意语音,人性科技;心意相通,尽在言中
每句关键词个数不可设定 检出准确率低:85% 必须说特定语言的特定文本 无 无真正意义上的理解,因此有时的回答答非 所问,只是问答相似,而不是有针对性的回 答
四、声纹识别开发工具 五、语言学习开发工具 六、语义分析器技术
公司简介
语音处理
得意接线员
声纹识别
中文语言理解
未来CTI
问答
技术演示
14
公司简介
语音处理
得意接线员
声纹识别
中文语言理解
未来CTI
问答
技术演示
22
Your Partner in the Century of Speech
得意语音,人性科技;心意相通,尽在言中
应用举例
右图是某公司人事部管理的人员名单;下面是应用对话示例:
姓名
别称
分机号码
其他信息
系统:请于哔声后说出要找的人的姓名,按#跨过该提示,按0进入人工服务…哔… 用户:你好,我找张总。 系统:转接张三,请稍后… 转接1001分机。 系统:请于… 用户:按# 系统:哔 用户:王…王五在吗? 系统:转接王五,请稍后…转接1003分机。 系统:请于… 用户:按# 系统:哔 用户:麻烦你给我转接李四先生。 系统:请问你找市场部的还是财务部的? 用户:市场部的李四。 系统:转接市场部李四,请稍后…转接1002。 系统:请于… 用户:按# 系统:哔 用户:请接张山。 系统:如果您是找张三,按1;按#可重说;按0可转人工服务 用户:按1。 系统:转接张三,请稍后…转接1001。
Your Partner in the Century of Speech
得意接线员(d-Ear Attendant)
得意语音,人性科技;心意相通,尽在言中
得意接线员(d-Ear Attendant)的API V1.0,是从得意 关键词检出器派生而来的,它是专为下面用途而定制的:
实现24小时无人值守的电话自动转接,从而可以降低成本并 且提高公司、企业形象。 外线转接不再需要查询分机号码表或依赖前台接线员,内线语 音拨号可以使内部员工之间畅通无阻地沟通与合作从而提高工 作效率。 注:二次开发人员完全可以利用得意关键词检出器API自己开发 类似的自动总机应用:单关键词;操作点偏向低误识率
语音命令与控制 d-Ear Command 得意命令
嵌入式命令导航 声控拨号 家电控制 智能玩具
网上智能信息检索 口语对话系统 呼叫中心
语言理解 d-Ear Parser 得意分析器
关键词检出 d-Ear Word-Spotter 得意关键词检出器
声纹识别 中文语言理解 未来CTI
随意语音命令导航 自动总机接驳 国防监听 呼叫中心
公司简介
语音处理
得意接线员
声纹识别
中文语言理解
未来CTI
问答
技术演示
5
Your Partner in the Century of Speech
得意公司的目标
得意语音,人性科技;心意相通,尽在言中
把语音技术融入数字世界的主流。 扩展语音技术,以便:使计算和通讯设备的使用更容易和更安全; 提高所有数字化产品的娱乐性和教育价值; 且 创造新的和有创造性的服务。