数字语音处理及matlab实现第一章

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1 1.1 概述 2 1.2 语音信号处理的发展 3 1.3 语音信号处理的应用及新方向 4 1.4 语音信号处理过程的总体结构
5 1.5 MATLAB在数字语音信号处 理中的应用
7
数字语音处理及MATLAB仿真 张雪英编著
1.1 概述
语音信号处理是一门新兴的边缘学科,是语音 学与数字信号处理两个学科相结合的产物。它和认 知科学、心理学、语言学、计算机科学、模式识别 和人工智能等学科有着紧密的联系。 语音信号处理的目的: 得到某些语音特征参数以便高效地传输或存储; 通过某种处理运算以达到某种用途的要求。
1. 说话人识别技术的应用
安全加密、银行信息电话查询服务 公安机关破案和法庭取证方面 在声控应用中,识别输入的语音内容,并根据内容来执行相 应的动作,这包括了声控电话转换、声控语音拨号系统、声 控智能玩具、信息网络查询、家庭服务、宾馆服务、旅行社 服务系统、医疗服务、股票查询服务和工业控制等。
18
数字语音处理及MATLAB仿真 张雪英编著
12
数字语音处理及MATLAB仿真 张雪英编著
1.2.2 语音编码
语音编码的目的: 在保证一定语音质量的前提下,尽可能降低 编码比特率,以节省频率资源。
13
数字语音处理及MATLAB仿真 张雪英编著
1.2.2 语音编码
语音编码与文本到语音转换两个主要区别 一、前者是人与人之间的话音交流,要保留 说话人的声音特征。后者是文本到声音的转换即 计算机发声。它可以是标准播音员或其它声音。 二、前者不仅对压缩率和音质有要求,而且 要求较低的编、解码延迟。而后者对处理帧长没 有什么太严格的限制。
32
数字语音处理及MATLAB仿真 张雪英编著
2. 基础理论和算法方面
从以下方面进行: (1)语音产生的机理(发音)和感知机理(听) 涉及心理学、语音学、语言学、认知学、神经生 理学等。 (2)将语音作为一种信号来处理 常用方法: 数字滤波器(FIR、IIR);快速付里 叶变换(FFT); 线性预测编码(LPC);同态信号 处理等。 新的方法:神经网络、矢量量化、子波变换等
31
数字语音处理及MATLAB仿真 张雪英编著
(3)第三次变革发生在世纪之交。以新兴的计算 机因特网为基础的信息高速公路在全世界范围迅 速发展。如何在INTERNET网上有效地传输话音 成为产业界关注的焦点。IP电话将使因特网成为 第三个话音通信传输网。目前IP电话所用的话音 编码标准有G.723.1、G.728、G.729等。这些标准 各有长短。人们正在努力研究适合IP电话的新的 编码算法。低延迟、低码率、低复杂性、高音质 的话音编码算法将是未来IP电话网络的奠基石。
20
数字语音处理及MATLAB仿真 张雪英编著
3. 语音编码的应用
在移动通信、卫星通信、军事保密通信、信息 高速公路和IP电话通信中的应用。
在个人移动通信、语音存储、多媒体通信、数 字数据网(DDN)中的应用。
未来的ISDN、卫星通信、移动通信、微波接 力通信和信息高速公路以及保密电话等中的应用。
19
数字语音处理及MATLAB仿真 张雪英编著
2. 语音合成的应用
公交汽车上的自动报站、各种场合的自动报 时、自动报警、手机查询服务和各种文本校对中 的语音提示、在电信声讯服务:如股票、售后服 务、车站查询等信息;也可用于基于微型机的办 公、教学、娱乐等智能多媒体软件,例如语言学 习、教学软件、语音玩具、语音书籍等;也可与 语音合成技术与机器翻译技术结合,实现语音翻 译等。
16
数字语音处理及MATLAB仿真 张雪英编著
1.3 语音信号处理的应用及新方向
一:语音信号处理的应用
语音技术的应用领域 包括语音识别、说话人的鉴别和确认、语种的鉴 别和确认、关键词检测和确认、语音合成、语音 编码等。 但其中最具有挑战性和最富有应用前景的为语音 识别技术。
17
数字语音处理及MATLAB仿真 张雪英编著
课程性质
2
课程目的和任务
3
课程重点
4
课程难点
2
2
数字语音处理及MATLAB仿真 张雪英编著
课程性质
语音信号处理是通信、电子信息专业的选 修课程,主要用于现代通信和电子信息领域, 其主要前修专业基础课程为信号与系统和数字 信号处理。
3
数字语音处理及MATLAB仿真 张雪英编著
课程目的和任务
通过本课程的学习理解语音发声和听觉机理 及其数字模型;掌握语音信号处理的基本概念、 原理和方法,为以后的学习提供理论依据;掌握 语音信号的短时时域分析和频域分析方法,并且 能够用Matlab语言编程实现对实际语音信号进行 的处理;熟悉语音信号处理的应用领域,并了解 该领域的新理论、新技术和发展趋势,为今后的 进一步学习和工作打下坚实的基础。
MATLAB是一种功能强大、效率高、交互性 好的计算机高级语言。
近年来MATLAB已成为学习语音信号处理和 进行研究工作的仿真软件工具。
27
数字语音处理及MATLAB仿真 张雪英编著
MATLAB在数字语音信号中的几方面应用: (1)通过MATLAB可以对数字化的语音信号进 行时频域分析。 (2)通过MATLAB可以对数字化的语音信号进 行估计和判别。 (3)通过利用MATLAB编程对语音信号进行处 理 本书中的程序实例均用MATLAB语言编写,供 大家上机实践时参考。
23
数字语音处理及MATLAB仿真 张雪英编著
二、语音信号处理的新方向
(5)语种识别。是近年来新出现的研究方向,通过 分析处理一个语音片断来判别其所属语音的种类, 本质上属于语音识别的研究范畴。 (6)基于语音的情感处理研究。在人与人的交流中, 除了语音信息外,非语言信息也起着重要的作用。 为了使人机交流更自然、更人性化,基于语音的情 感处理研究也是非常必要的。
8
数字语音处理及MATLAB仿真 张雪英编著
语音信息的交换大致上可以分为三大类: (1)人与人之间的语言通信:
包括语音压缩与编码、语音增强等。 (2)第一类人机语言通信问题:
语音合成,机器讲话、人听话的研究。 (3)第二类人机语言通信问题:语音识别和理解
语音识别和理解:人讲话、机器听话的情况。
9
数字语音处理及MATLAB仿真 张雪英编著
5
数字语音处理及MATLAB仿真 张雪英编著
课程难点
语音信号的产生和激励、端点检测和基音周 期的估计、用数学公式来证明短时频谱是如何反 映整个语音信号的频谱的、LPC方程组解法、自 适应预测编码原理、LBG算法以及实验中的分帧 和基音周期检测。
6
数字语音处理及MATLAB仿真 张雪英编著
第1章 绪论
24
数字语音处理及MATLAB仿真 张雪英编著
1.4 语音信号处理过程的总体结构
信息加工和处理的一般流程如图1.1所示 信号源
观察与测量 信号表示 信号变换 信号提取与利用
图1.1 信号处理和加工的一般示意图
25
数字语音处理及MATLAB仿真 张雪英编著
语音处理过程的结构框图
语音输入 预处理
数字化
22
数字语音处理及MATLAB仿真 张雪英编著
二、语音信号处理的新方向
(3)VoIP技术。是通过TCP/IP网络,而不是传统的 电话网络来传输语音的新的通信方式,通常称之为 IP电话技术。在网络上对压缩的语音数据以数据包 的形式进行传输和识别。 (4)语音训练与校正技术。现在越来越多的人希望 掌握其他非母语语言,以便方便的进行交流。因此 语言学习机已成为当今外语学习者的有利工具。
数字语音处理及MATLAB仿真 张雪英编著
数字语音处理及MATLAB仿真
太原理工大学信息工程学院 张雪英编著 College of Information Engineering, Taiyuan
University of Technology
1
数字语音处理及MATLAB仿真 张雪英编著
课程总括
1
21
数字语音处理及MATLAB仿真 张雪英编著
二、语音信号处理的新方向
(1)基于语音的信息检索。网络技术及数字图书馆 技术的发展,基于语音识别的信息检索技术正成为 研究热点。 (2)基于语音识别的广播新闻的自动文摘技术的研 究。由于广播、电视中的发音较为标准规范,在识 别中避免了说话人发音上的不规范,有利于语音识 别系统性能的提高。
30
数字语音处理及MATLAB仿真 张雪英编著
(2)第二次重大变革产生于八十年代末。1988年 欧共体13个国家数字移动特别工作组(GSM)制定了 采用长时预测规则码激励的编码标准 (13k bps RPE-LTP)。
1989年美国蜂窝通信工业协会(CITA)宣布了 北美数字移动通信话音编码标准(8K bps矢量和激 励VSELP)。从而确立了全球范围第二个传输网移 动通信产业的崛起。
28
数字语音处理及MATLAB仿真 张雪英编著
数字语音信号处理研究内容
涉及三方面相互密切配合的任务和课题: 1. 应用 2语音处理及MATLAB仿真 张雪英编著
1. 应用方面
通信产业起源于1874年电话的发明。从那时 起,通信产业大致发生了三次重大变革。 ( 1 ) 第 一 次 变 革 产 生 于 七 十 年 代 初 。 1972年 CCITT 组 织 公 布 了 第 一 个 语 音 编 码 标 准 G.711 。 即对数PCM编码,由此开始,数字程控交换网络 逐步淘汰了传统的模拟交换传输方式。
特征提取
传输 解压缩 语音输出 压缩处理
合成 存储
语音识别 训练 参考模式库 识别 模式匹配
识别结果
图1.2 语音处理过程的结构框图
26
数字语音处理及MATLAB仿真 张雪英编著
1.5 MATLAB在数字语音信号处 理中的应用
数字语音信号处理是将数字信号处理与语音学 相结合,解决现代通信领域中人与人、人与机器之 间的信息交流的学科。
15
数字语音处理及MATLAB仿真 张雪英编著
语音识别研究领域包括:
(1)根据对说话人说话方式的要求,可以分 为孤立字语音识别系统,连接字语音识别系统以 及连续语音识别系统。
(2)根据对说话人的依赖程度可以分为特定 人和非特定人语音识别系统。
(3)根据词汇量大小,可以分为小词汇量、 中等词汇量、大词汇量以及无限词汇量语音识别 系统。
1. 说话人识别技术的应用
在电话与通信系统中,智能语音接口正在把 电话机从一个单纯的服务工具变成为一个服务的 “提供者”和生活“伙伴”。
目前,自动口语分析、用户交换机、电话机、 手机已经包含了语音识别拨号功能,还有语音记事 本、语音智能玩具等产品也包含了语音识别与语音 合成功能。人们可以通过电话网络用语音识别口语 对话系统查询有关的机票、旅游、银行信息。
1.2 语音信号处理的发展
1
语音合成
2
语语音音编编码码
3
语音识别
11
数字语音处理及MATLAB仿真 张雪英编著
1.2.1 语音合成
以语言信息压缩、存储为主要目的对语音信 号数字模型进行研究,同时研究音素、音节、词 组与句子的发音规则。最终恢复出自然流畅的语 音来。例如文语转换系统(Text-to-speech)。语音 分析与合成将赋予计算机说话的功能。也是进行 话音编码、语音识别研究的基础。
14
数字语音处理及MATLAB仿真 张雪英编著
1.2.3 语音识别
研究如何使计算机能够听懂人类的语言。以 汉语语音为例:汉语约有400个音节,加上声调约 1200个音调节,把这些语音信号的特征存储到计 算机内,并与计算机接收到的汉语发音进行比较, 找到特征相同的音节或音调节,这个过程就是语 音识别。将识别出的音节序列转换成文字,就是 语言理解。许多算法将理解过程溶入到识别中来 提高识别的准确性。因此可以将语音识别与理解 归入同一类应用。
1.2 语音信号处理的发展
1 1876年
贝尔电话 的发明
2 1939年
第一个 声码器
3 19世纪60年代
用声学方法对元音和 歌唱进行了研究
4 20世纪40年代 5 1948年
6
语谱图仪问世
语谱图
系统论述语言
语音,语音合成 产生的声学理论
7
突破进展
计算机
基础研究方面 技术应用领域
10
数字语音处理及MATLAB仿真 张雪英编著
4
数字语音处理及MATLAB仿真 张雪英编著
课程重点
语音信号的产生和语音信号数字模型。短时 能量、平均过零率、自相关的意义,以及这些特 征参量在语音信号中的应用,并且会用 MATLAB实现。短时频域分析的两种解释以及 实现、LPC的基本原理以及与语音模型的关系、 自适应量化的PCM,自适应预测编码原理以及 前馈和反馈的主要区别,另外增量调制中所造成 的失真以及失真补偿。矢量量化原理、LBG算法 以及实验。
相关文档
最新文档