最新语音识别技术与声纹鉴定原理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Voice
Recognition Multi
Touch Graphic Users Interface
4
4
数字语音处理及MATLAB仿真 张雪英编著
应用领域
5
5
数字语音处理及MATLAB仿真 张雪英编著
身边的语音识别
Siri Google
now 车载导航 智能PDA
…… 6 6
数字语音处理及MATLAB仿真 张雪英编著
式中,系数常在0.9至1之间选取。
25
25
数字语音处理及MATLAB仿真 张雪英编著
2.端点检测
语音信号起止点的判别是任何一个语音识别系 统必不可少的组成部分。常用的端点检测方法有 下面两种。
26
7
7
数字语音处理及MATLAB仿真 张雪英编著
生活中,时常听到很熟悉的 旋律,却想不出歌曲的名字。 这个时候我们就可以直接利用 语音识别功能来查找相关歌曲, 常见的有微信摇一摇搜歌,以 及其他音乐播放软件的搜索功 能。
8
8
数字语音处理及MATLAB仿真 张雪英编著
由于在汽车的行驶过程中,驾驶员的手必须放在方向盘上, 因此在汽车上拨打电话,需要使用具有语音拨号功能的免提 电话通信方式。此外,对汽车的卫星导航定位系统(GPS) 的操作,汽车空调、照明以及音响等设备的操作,同样也可 以由语音来方便的控制。
9
9
数字语音处理及MATLAB仿真 张雪英编著
用语音可以控制电视机、DVD、空调、电扇、窗帘的操作, 而且一个遥控器就可以把家中的电器皆用语音控起来,这样, 可以让令人头疼的各种电器的操作变得简单易行。
10
10
数字语音处理及MATLAB仿真 张雪英编著
11
11
数字语音处理及MATLAB仿真 张雪英编著
23
23
数字语音处理及MATLAB仿真 张雪英编著
Leabharlann Baidu抗混叠滤波
根据采样定理,如果模拟信号的频谱的带宽 是有限的,那么用等于或高于2fm的取样频率进行 采样,所得到的信号能够完全唯一的代表原模拟 信号,或者说能够由取样信号恢复出原始信号。
因此,为了防止混叠失真和噪声干扰,必须 在采样前用一个锐截止模拟低通滤波器对语音信 号进行滤波。该滤波器称为反混叠滤波器或去伪 滤波器。
24
24
预加重
数字语音处理及MATLAB仿真 张雪英编著
语音从嘴唇辐射会有6dB/oct的衰减,因此 在对语音信号进行处理之前,希望能按6dB/oct的 比例对信号加以提升(或加重),以使得输出信号 的电平相近似。可采用以下差分方程定义的数字 滤波器:
y(n )x(n )a x(n 1 ) (10-1)
10.1 概述
语音识别以语音为研究对象,涉及到生理学、 心理学、语言学、计算机科学,以及信号处理等 诸多领域,最终目的是实现人与机器进行自然语 言通信,用语言操纵计算机。
语音识别系统可以分为孤立字(词)语音识别 系统、连接字语音识别系统以及连续语音识别系 统。
20
20
数字语音处理及MATLAB仿真 张雪英编著
语音识别系统分为两个方向:一是根据对说 话人的依赖程度可以分为特定人和非特定人语音 识别系统;二是根据词汇量大小,可以分为小词 汇量、中等词汇量、大词汇量,以及无限词汇量 语音识别系统。
不同的语音识别系统,尽管设计和实现的细 节不同,但所采用的基本技术是相似的。一个典 型的语音识别系统如下页图所示。主要包括预处 理、特征提取和训练识别网络。
语音搜索早先的模式是我们可以通过打电话的方式查一些专 项的资讯,比如天气预报或者打12315。随着服务的延伸呢,很 多的企业都尽力了自己的客户专线,实际上这个时候语音信息 的服务就由企业为他的用户提供,主要是产品或者服务的资讯 或者售后服务。常见的有Apple的Siri和Google的Google Now。
⒈对自然语言的识别和理解。首先必 须将连续的讲话分解为词、音素等单 位,其次要建立一个理解语义的规则。
⒉语音信息量大。语音模式不仅对不 同的说话人不同,对同一说话人也是 不同的,例如,一个说话人在随意说 话和认真说话时的语音信息是不同的。 一个人的说话方式随着时间变化。
17
17
数字语音处理及MATLAB仿真 张雪英编著
21
21
数字语音处理及MATLAB仿真 张雪英编著
输入 预处理
特征提取
训练识别 输出 网络
语音识别系统组成部分图示
22
22
数字语音处理及MATLAB仿真 张雪英编著
10.1.1 预处理
在语音识别系统中,语音信号预处理主要包 括抗混叠滤波、预加重及端点检测等。
1.抗混叠滤波与预加重
语音信号的频谱分量主要集中在300~3400Hz 范围内。因此需用一个防混叠的带通滤波器将此 范围内的语音信号的频谱分量取出,然后对语音 信号进行采样,得到离散的时域语音信号。
12
12
数字语音处理及MATLAB仿真 张雪英编著
发展前景
语音识别系统的出现,会让人 更加自由的沟通,让人在任何地方, 任何时间,对任何事都能够通过语音 交互的方式,方便地享受到更多的社 会信息资源和现代化服务。这必然会 成为语音识别技术研究和应 用的重要发展趋势。
13
13
数字语音处理及MATLAB仿真 张雪英编著
发展前景
但任何技术的成熟都会经历 一段很长时间的发展期,所以目 前依然有识别率、可靠性及成本 等问题亟待人们去克服。
14
14
数字语音处理及MATLAB仿真 张雪英编著
Video Display
15
15
数字语音处理及MATLAB仿真 张雪英编著
16
16
数字语音处理及MATLAB仿真 张雪英编著
主要问题
数字语音处理及MATLAB仿真 张雪英编著
2018年1月
Voice Recognition
01
技术简介
02
应用领域
03
发展前景
1
1
数字语音处理及MATLAB仿真 张雪英编著
2
2
数字语音处理及MATLAB仿真 张雪英编著
3
3
数字语音处理及MATLAB仿真 张雪英编著
人机交互方式
语音识别
多点触控 图形用户界面
主要问题
⒊语音的模糊性。说话者在讲话时, 不同的词可能听起来是相似的。这在
英语和汉语中常见。
4.环境噪声和干扰对语音识别有严重 影响,致使识别率低。
18
18
数字语音处理及MATLAB仿真 张雪英编著
语音识别
1 概述
HMM基本原理及在语音识别中
2
的应用
19
19
数字语音处理及MATLAB仿真 张雪英编著