语音信号处理第2章
语音信号处理PPT_第二章 语音信号处理基础知识
把从肺部呼出的直流气流变为音源,即变为交流的断续 流或乱流; 喉对音源起共振和反共振的作用,使它带有音色; 从嘴唇或鼻孔去空间辐射的作用;
肺把气流送入喉;喉将来自肺的气流调制为周期性脉冲或类 似随机噪声的激励声源,并送入声道;声道对频谱进行润色 后在嘴唇处的气压变化形成可以传播的声波。 肺相当于动力源,喉相当于调制器,声道相当于滤波器和扩 音器。
3.
韵母
38个韵母:8个单韵母,14个复韵母,16个鼻韵母。 单韵母是由单元音构成的,如:a、o、e、i、u、u。 复韵母是由复合元音构成的韵母,如:ai、ei、ao、ou等。 鼻韵母是由鼻辅音“n”或“ng”收尾的韵母,如:an、en、 uan、ang、eng、iang等。 韵母发音时声带是振动的,音强也较大,波形上可以看到大 的振幅,而且呈现周期性。 注意:元音不等同于韵母,元音、辅音是按音素的发音特征 来分的;而声母、韵母则是按音节结构来分的。
2.5.2 语音信号的语谱图
声纹:语谱图上其不同的黑白程度, 形成的不同的纹路。不同的人有不同的 声纹,利用声纹进行说话人识别。 横杆:与时间轴平行的几条深黑色 条纹,对应共振峰。语谱图中有无横杆 是判断是否是浊音的标志。 竖直条:与时间轴垂直的窄黑条, 每个竖直条相当于一个基音,条纹间隔 表示基音周期。 元音在语谱图上对应横杆(共振峰的存在) 噪声和清擦音表现为乱纹。
2.1 语音和语言 一、语音的定义
语音是由一连串的音组成语言的声音。
语言
语音
声音
对语言的研究分为两方面: 语言学:各个音的排列规则及其含义的研究。 语音学:各个音的物理特性和分类的研究。考虑的是语 音的产生、感知等过程。三个主要的分支:发音语音学、 声学语音学、听觉语音学。
【精选】语音信号处理复习课件
基音检测
自相关法 倒谱法
简化逆滤波法(SIFT)
共振峰估值
1. 带通滤波器法 2. DFT法
3. 倒谱法
4. LPC法
第9章思考题
1.基音检测的自相关法中的中心削波处理的思 路及实现过程? 2.用倒谱法实现基音检测和共振峰检测的原理 及实现框图?
•语音编码的概念、应用和分类等 •语音信号的压缩编码原理 • 语音通信中的语音质量 •脉冲编码调制(PCM)及其自适应
1.什么叫做隐马尔可夫过程?为什么说 语音信号可以看成隐马尔可夫过程?
2. HMM模型的结构主要有哪两种?它们 的特点是什么?
3.隐马尔可夫模型有哪些模型参数?请 叙述这些参数的含义和定义式。
根据某状态HMM模型,每一种路 径输出某某符号的概率计算。
语音检测分析——语音特征参数的提取和分析。
主要包括:基音检测和共振峰参数的估值。
u(n)
H(z)
s(n)
图6-1 信号s(n)的模型化
H(z)
G
p
,
语音信号处理第第二章教材
当说话时,声带在软骨的作用下相互靠
近但不完全闭合,声门变成一条窄缝,当气 流通过窄缝时压力减小,外界压力大,从而 两片声带完全闭合使得气流不能通过,当气 声带靠拢 流阻断时压力恢复正常,推开两片声带,声 门再次打开,气流再次流过。
❖ 同时掩蔽是指同时存在的一个弱信号和一个强信号 频率接近时,强信号会提高弱信号的听阈,当弱信 号的听阈被升高到一定程度时就会导致这个弱信号 变得不可闻。一般来说,对于同时掩蔽,掩蔽省愈 强,掩蔽作用愈大;掩蔽声与被掩蔽声的频率靠得 愈近,掩蔽效果愈显著。两者频率相同时掩蔽效果 最大。
❖ 对于不同时出现的A声和B声也存在掩蔽作用,成为 短时掩蔽。短时掩蔽又分为后向掩蔽和前向掩蔽。
❖ 人的听觉系统有两个重要特性,一个是耳蜗对于 声信号的时频分析特性;另一个是人耳听觉掩蔽 效应。
❖ 如果信号是一个多频率信号,则产生的行波将沿 着基底膜在不同的位置产生最大幅度。从这个意 义上讲,耳蜗就像一个频谱分析仪,将复杂的信 号分解成各种频率分量。
❖ 并非所有的声音都能被人耳听到,这取决于声音 的强度和其频率范围。一般人课感觉到20-20kHz、 强度为-5—130dB的声音信号。心理声学中的听觉 掩蔽效应是指,在一个强信号附近,弱信号将变 得不可闻,被掩蔽掉了。掩蔽效应分为同时掩蔽 和短时掩蔽。
Tp 基音周期
声带的开启和闭合称 为振动。这一振动过程周 而复始,形成了一串周期 性脉冲气流送入声道。这 个过程发出的音称为浊音。 如汉语发音的[a]、[i]、 [u]和[o]等。
发音的三种方式-excitation
❖ 浊音(voiced sounds)声带开启和闭合,在声门
2第二章 语音信号处理的基础知识 语音信号处理 课件
9/17/2020
32
当说话时,声带在软骨的作用下相互靠 近但不完全闭合,声门变成一条窄缝,当气 流通过窄缝时压力减小,外界压力大,从而 两片声带完全闭合使得气流不能通过,当气 声带靠拢 流阻断时压力恢复正常,推开两片声带,声 门再次打开,气流再次流过。
●音色: 又称为音质,是一种声音区别于另一种 声音的基本特性。
●音调:声音的高低,取决于声波的频率 ●音强:声音的强弱,它由声波的振动幅度所决 定 ●音长:发音时间的长短
9/17/2020
27
三、音节与音素
句子的最小单位为单词,单词的最小单位为音节。
音节:发音时,被明显感觉到的语音片段为音节。
音素:是发音的最小单位,一个音节由一个音素或几 个音素构成。分为元音和辅音。元音是构成音节的主 干,从长度和能量来看,在音节中占主要位置;辅音 只是出现在音节的前端或后端或前后两端,它们的时 长和能量较小。
9/17/2020
1
9/17/2020
2
9/17/2020
3
9/17/2020
6
第二章 语音信号处理的基础知识
§2.2 语音和语言 §2.3 汉语语音学 §2.4 语音生成系统和语音感知系统 §2.5 语音信号生成的数学模型 §2.6 语音信号的特性分析
http://www.fon.hum.uva.nl/praat/
L=17cm,声道的长度
n=1,2,3 … 称为第一共振峰F1=500Hz 、第二 共振峰F2=1500Hz 、第三共振峰 F3=2500Hz ,…
语音(Speech)=声音(Acoustic)+语言 (Language) 语音是由一连串的音组成语言的声音。
语音信号处理(第2版)赵力编著语音信号处理勾画要点
语音信号处理(第2版)赵力编著语音信号处理勾画要点语音信号处理(第2版)赵力编著重点考点第2章语音信号处理的基础知识1.语音(Speech)是声音(Acoustic)和语言(Language)的组合体。
可以这样定义语音:语音是由一连串的音组成语言的声音。
2.人的说话过程可以分为五个阶段:(1)想说阶段(2)说出阶段(3)传送阶段(4)理解阶段(5)接收阶段。
3.语音是人的发声器官发出的一种声波,它具有一定的音色,音调,音强和音长。
其中,音色也叫音质,是一种声音区别于另一种声音的基本特征。
音调是指声音的高低,它取决于声波的频率。
声音的强弱叫音强,它由声波的振动幅度决定。
声音的长短叫音长,它取决于发音时间的长短。
4.说话时一次发出的,具有一个响亮的中心,并被明显感觉到的语音片段叫音节(Syllable)。
一个音节可以由一个音素(Phoneme)构成,也可以由几个音素构成。
音素是语音发音的最小单位。
任何语言都有语音的元音(Vowel)和辅音(Consonant)两种音素。
5.元音的另一个重要声学特性是共振峰(Formant)。
共振峰参数是区别不同元音的重要参数,它一般包括共振峰频率(Formant Frequency)的位置和频带宽度(Formant Bandwidth)。
6.区分语音是男声还是女声、是成人声音还是儿童声音,更重要的因素是共振峰频率的高低。
7.浊音的声带振动基本频率称基音周期(或基音频率),F0表示。
8.人的听觉系统有两个重要特性,一个是耳蜗对于声信号的时频分析特性;另一个是人耳听觉掩蔽效应。
9.掩蔽效应分为同时掩蔽和短时掩蔽。
10.激励模型:一般分成浊音激励和清音激励。
浊音激励波是一个以基音周期为周期的斜三角脉冲串。
11.声道模型:一是把声道视为由多个等长的不同截面积的管子串联而成的系统。
按此观点推导出的叫“声管模型”。
另一个是把声道视为一个谐振腔,按此推导出的叫“共振峰模型”。
12.完整的语音信号的数字模型可以用三个子模型:激励模型、声道模型和辐射模型的串联来表示。
语音信号处理第2章-语音信号基础
信息科学与工程学院
东南大学
2.2 语音和语言
语音研究分为两类:
语言学:包括构成语言的语素、词、短语和句 子等的不同层次的单位,以及词法、句法、文 脉等语法和语义内容等。语言学是语音信号处 理的基础。 语音学:考虑的是语音产生、语音感知等的过 程以及语音中各个音的特征和分类等问题。语 音学发展成为三个主要分支:发音语音学、声 学语音学、听觉语音学。
信息科学与工程学院 东南大学
2.4 语音生成系统和语音感知系统
同时掩蔽
信息科学与工程学院
东南大学
2.4 语音生成系统和语音感知系统
短时掩蔽
信息科学与工程学院
东南大学
2.5 语音信号生成的数学模型
语音信号是非平稳随机过程 短时分析:短段时间内表示语音信号时, 采用线性时不变模型。
信息科学与工程学院
东南大学
2.3 汉语语音学
汉语音节的一般结构
汉语的每个汉字是一个音节,音节一般由声母 、韵母和声调三部分组成。 更为细致的将一个音节划分为9个部分,其中1 ~4段属于声母(辅音),6~9段属于韵母( 元音)。第5段是二者的过渡段。 第7段(主要元音段)是每个音节是具有的。 汉语中一般有五个声调,即阴平、阳平、上声 、去声以及轻声。
0.4
-0.2 -0.3
20 40 60 80 100 120 140 160
0
20
40
60
80
100
120
140
160
0.3
50
50
0
0
0.2
-50
-50
-100
0
0.5
1
1.5
2
2.5
语音信号处理-第02章 语音信号的产生、特征与人耳的听觉特性
语音信号处理Speech Signal Processing长春工业大学图像工程研究所 史东承教授dcshi@ 2010.8第二章 语音信号的产生、特征 与人耳的听觉特性§2.1 语音信号的产生鼻腔 软腭 口腔 鼻子嘴巴气管 声带人类发音器官示意图发音器官:产生语音的器官1)肺和气管:能源与能量传输; 2)咽喉:振动源,包括声带和声门; 3)声道(声门到嘴唇的呼气通道):谐振腔 (包括口腔、鼻腔等); 4)其他发音器官:包括嘴唇、齿、舌、面颊 等,使谐振腔改变形状。
1发音机理• 喉位于气管的上端,实际 上是气管末端一圈软骨构 成的一个框架,前方稍高 处的软骨称为甲状软骨, 前后方环成一圈的称为喉 部环形软骨,喉中两片肌 肉称为声带,声带之间的 空隙为声门。
• 当声带张开时,声门打 开,空气可自由呼出,正 常呼吸就处于这种情况; 当声带闭合,声门关闭。
当说话时,声带在软骨的作用下相互靠 近但不完全闭合,声门变成一条窄缝,当气 流通过窄缝时压力减小,外界压力大,从而 两片声带完全闭合使得气流不能通过,当气 声带靠拢 流阻断时压力恢复正常,推开两片声带,声 门再次打开,气流再次流过。
声带的开启和闭合称 为振动。
这一振动过程周 而复始,形成了一串周期 性脉冲气流送入声道。
这 个过程发出的音称为浊音。
如汉语发音的[a]、[i]、 [u]和[o]等。
Tp 基音周期男声发音“我的语音”的时域波形和语谱图2第二章 语音信号的产生、特征 与人耳的听觉特性§2.2 语音信号的分类 声学语音学,根据激励方式划分:(1)浊音(Voiced Speech),又称为有声语音基音(pitch): 声道打开,声带在先打开后关闭,气流经过使声带要发生张 驰振动,变为准周期振动气流。
浊音的激励源被等效为准周 期的脉冲信号。
(2)清音(Unvoiced Speech),又称为无声语音:声带不振 动,而在某处保持收缩,气流在声道里收缩后高速通过产生 湍流,再经过主声道(咽、口腔)的调整最终形成清音。
《语音信号处理》课程笔记
《语音信号处理》课程笔记第一章语音信号处理的基础知识1.1 语音信号处理的发展历程语音信号处理的研究起始于20世纪50年代,最初的研究主要集中在语音合成和语音识别上。
在早期,由于计算机技术和数字信号处理技术的限制,语音信号处理的研究进展缓慢。
随着技术的不断发展,尤其是快速傅里叶变换(FFT)的出现,使得语音信号的频域分析成为可能,从而推动了语音信号处理的发展。
到了20世纪80年代,随着全球通信技术的发展,语音信号处理在语音编码和传输等领域也得到了广泛应用。
近年来,随着人工智能技术的快速发展,语音信号处理在语音识别、语音合成、语音增强等领域取得了显著的成果。
1.2 语音信号处理的总体结构语音信号处理的总体结构可以分为以下几个部分:(1)语音信号的采集和预处理:包括语音信号的采样、量化、预加重等操作,目的是提高语音信号的质量,便于后续处理。
(2)特征参数提取:从预处理后的语音信号中提取出能够反映语音特性的参数,如基频、共振峰、倒谱等。
(3)模型训练和识别:利用提取出的特征参数,通过机器学习算法训练出相应的模型,并进行语音识别、说话人识别等任务。
(4)后处理:对识别结果进行进一步的处理,如语法分析、语义理解等,以提高识别的准确性。
1.3 语音的发声机理和听觉机理语音的发声机理主要包括声带的振动、声道的共鸣和辐射等过程。
声带振动产生的声波通过声道时,会受到声道形状的影响,从而产生不同的音调和音质。
听觉机理是指人类听觉系统对声波的感知和处理过程,包括外耳、中耳、内耳和听觉中枢等部分。
1.4 语音的感知和信号模型语音的感知是指人类听觉系统对语音信号的识别和理解过程。
语音信号模型是用来描述语音信号特点和变化规律的数学模型,包括时域模型、频域模型和倒谱模型等。
这些模型为语音信号处理提供了理论基础和工具。
第二章语音信号的时域分析和短时傅里叶分析2.1 语音信号的预处理语音信号的预处理主要包括采样、量化、预加重等操作,目的是提高语音信号的质量,便于后续处理。
语音信号处理 第3版 第2讲
声波的特性阻抗,单位,瑞利
2.3 语音基本概念与参数
响度:描述声音的响亮程度,表示人耳对声音的主观感受, 单位 宋,定义为声压级为40dB的1kHz纯音的响度为1宋
频率与音高:以Hz为单位所测得的物理量——频率,对 听者来说感知为心理量——音高,即用人的主观感觉来评 价所听到的声音时高调还是低调。
幅值因子
级联型共振峰模型
声道模型 并联型
对于非一般元音以及大部分辅音,必须考虑采用零极点模型。 此时,模型的传输函数如下:
R
br zr
V (z) r0 N 1 ak zk k 1
上式可分解为如下部分分式之和的形式:
M
V(z)
Ai
i11Biz1Ciz2
这就是并联型的共振峰模型。如图2-21所示(M=5)。
V ( z ) k M 1 1 1 2 e 2 B e k T c B k o T s c ( o 2 s ( F 2 k T F ) k z T ) 1 e e 2 2 B B k k T T z 2
声道模型 级联型
若10个极点,则可以表示为5个二阶极点的网络串联,即 声道可以模拟成下图所示的模型
调频收发技术中,通常采用预加重(发送端对输入信号高频 分量的提升)和去加重(解调后对高频分量的压低)技术解 决高频传输困难的问题。
2.5 语音信号处理的应用
语音增强 语音编码 语音合成与转换 语音隐藏 语音识别 声源定位 情感识别……
声道模型——声道部分的模型
目前最常用的有2种建模方法。
(1)是把声道视为由多个等长的不同截面积的管子串联而成的
系统,即“声管模型”。
(2)是把声道视为一个谐振腔,即“共振峰模型”。
共振峰模型,把声道视为一个谐振腔。共振峰就是这个腔体的
第二章语音信号处理基础
语音感知
语音感知-声音三要素 任何声音可用声强(或声压)的三个物理量表示: 即幅度、频率、相位。 对应人的感知,可用另外三要素描述:即响度、 音调和音色。
音色:亦称音质,反映声音属性。每个人声音具有 特殊的音色,人根据音色在主观感觉上区别具有 相同响度和音调的两个声音。 响度:测量声音强弱的物理量为声强,单位为W/m2 (瓦/米2);主观感受声音强弱的单位是宋: sone。
5)理解阶段:神经中枢→脉冲信息→辨认信息 (如何辨认,尚未知)。
5个阶段有心理、生理、物理以及人和社会的因 素。
语音的产生
发音器官模型
语音的产生
人类的发音器官
语音的产生
语音信号的产生过程
语音的产生
语音:由若干个音节(syllable)组成。 音节:可以由一个或若干个音素(phoneme)组成; 音素:是发音的最小单位,有两种音素,即辅音 和元音。
语音感知
临界带宽表
语音感知
上述的掩蔽效应可从听觉生理上找到依据,人耳 的基底膜具有与频谱分析仪相似的作用,频率群 的划分相应地将基底膜分成许多小部分,每一小 部分对应一个频率群。 掩蔽效应就在频率群内发生。
语音信号的特性
浊音的特性:基音频率 浊音的声带振动频率称为基本频率又称基音频率, 用F0表示,发音时,各个元音段的F0都随时间而 变,F0的变化产生了音调,F0随的变化轨迹称为 声调轨迹,声调反映了语音的韵律。 基音频率(简称基频)的范围为: 男性偏低一般为50Hz≤F0≤200Hz; 女性、小孩偏高一般为200Hz≤F0≤450Hz ; 基音频率的倒数称为基音周期(pitch period)。
汉语语音知识 汉语音节:一个音节(syllable)就是一个字的音, 字是独立的发音单位,由声母和韵母构成。 词:由音节构成。 句子:由词构成。 音素:声母是一个音素,而韵母则较复杂。 声调:音调在发一个音节中的变化。 汉语特点:音素少、音节少,64个音素、400多 个音节
语音信号处理第二章
和共振峰模式,它们是区别不同韵母的重要参数。
42
三、汉语音节的一般结构
声母、韵母和声调是汉语语音的三要素。 汉语语音最大的特点是它具有声调(音调)。 声调是1个音节在念法上的高低升降的变化,汉
语中有4个声调,即阴平(-)、阳平( ′)、
上声( )、和去声(‵)。
43
声调的变化就是浊音基音周期的变化,为了将 调值描写地具体一些,一般采用“五度标记法”, 用一条竖线表示声音的高低,从上而下用1、2、3、
50
内耳
★ 结构:半规管、前庭窗、耳蜗组成。
★ 作用:将振动转换成神经冲Fra bibliotek.51
人工耳蜗 人工耳蜗是一种电子装置,能帮助重度及极重
度耳聋患者重新恢复听觉。
人工耳蜗的工作原理 麦克风----言语处理器----传输线圈----皮下接收器---刺激听神经纤维
52
53
2.声音传入内耳的途径
由空气传导,称为气导,其过程为: 声波 耳廓 鼓膜 听骨 内耳 基底膜上
●音强:声音的强弱,它由声波的振动幅度A 所决定
●音长:发音时间的长短t
26
四、音节与音素
句子的最小单位为单词,单词的最小单位为音节。
音节:发音时,被明显感觉到的语音片段为音节, 一个音节由一个音素或几个音素构成。 音素:是发音的最小单位。分为元音和辅音。元音 是构成音节的主干,从长度和能量来看,在音节中占 主要位置,如[ma];辅音只是出现在音节的前端或后 端或前后两端,如:bee,desk.它们的时长和能量较小。
29
发元音的三个条件
(1)声带振动 (2)声道不发生极端的狭窄,维持稳定的形状 (3)和鼻腔不发生耦合,声音只是从口腔中辐射出 去。
语音信号处理课件 第02章基础知识
n 1,2,
我们们计算一下前三个 振峰:
F1 F2 c
1
c
c 340 500Hz 2 4 L 4 17 10 3c c 5c 1500Hz , F3 2500Hz 4L 3 4 L
2
谐振频率发生在500Hz的奇数倍
Speech Signal Processing
Speech Signal Processing
第02章基础知识—11
2、语音信号产生过程
口腔对声源频谱的调制——共振峰
Speech Signal Processing
第02章基础知识—12
共振峰是声道的重要声学特性。声道对于一个激励信号的响应, 可以用一个含有多对极点的线性系统来近似描述。每对极点都 对应一个共振峰频率。这个线性系统的频率响应特性称为共振 峰特性,它决定信号频谱的总轮廓,或称谱包络。 语音的频率特性主要是由共振峰决定的。而声道的共振峰特性 决定所发声音的频谱特性,即音色。 元音的音色和区别特征主要取决于声道的共振峰特性。共振峰 特性可以从语音信号频谱分析得到的幅频特性观察到。 在声学语音学中通常考虑F1和F2,但在语音识别技术中至少要 考虑三个共振峰,而在语音合成技术中考虑五个共振峰是最为 现实的。 声波的共振也称为共鸣。声道截面积随纵向位置而改变的函数, 称为声道截面积函数,它决定共振峰的特性。
注:喉部以上的部分统称为声道;气管和肺在声门以下
Speech Signal Processing
第02章基础知识—5
1、人类的语言器官
1. 人类的语言器官
图2-2 最重要的发音器官之一:声带
(a)闭合状态 (b)张开状态 甲状软骨 杓状软骨 环状软骨 声门 声带
第2章 语音信号处理的基础知识
短时掩蔽
强信号和弱信号不同时出现时也存在掩蔽作用,称为短时掩蔽。 强信号和弱信号不同时出现时也存在掩蔽作用,称为短时掩蔽。 不同时出现时也存在掩蔽作用 后向掩蔽 人耳的储能效应 前向掩蔽 被掩蔽声尚未被人所反映接收而掩蔽声已来临 被掩蔽声尚未被人所反映接收而掩蔽声已来临 尚未被人所反映接收而掩蔽声
第2章 语音信号处理的基础知识
第2章 语音信号处理的基础知识
2.3.1 语音发音系统
声道 从声门到嘴唇的呼气通道,由咽、口腔和鼻腔组成。 从声门到嘴唇的呼气通道,由咽、口腔和鼻腔组成。 共振峰 声道是一个横截面非均匀的通道, 声道是一个横截面非均匀的通道,各处的固有频率也 就不一样,声音是含有多种频率的复合声波, 就不一样,声音是含有多种频率的复合声波,当含有 的频率与声道的固有频率相同时,就会产生共振,则 的频率与声道的固有频率相同时,就会产生共振, 这时声波以最大的振幅振动( 这时声波以最大的振幅振动(幅度谱上表现为幅度高 于附近的幅度),此时的频率称为共振峰频率, ),此时的频率称为共振峰频率 于附近的幅度),此时的频率称为共振峰频率,简称 共振峰。 共振峰。
第2章 语音信号处理的基础知识
2.1 语音和语言
2. 语音的音节和音素
2第二章 语音信号处理的基础知识 语音信号处理 课件
6/17/2020
35
声道 气流从喉向上经过口腔或鼻腔后从嘴或鼻孔向
外辐射,期间的传输通道称为声道。气流流过声道 时犹如通过了一个具有某种谐振特性的腔体,放大 某些频率,在频谱上形成相应位置的峰起,称为共 振峰。
语音(Speech)=声音(Acoustic)+语言 (Language) 语音是由一连串的音组成语言的声音。
6/17/2020
10
6/17/2020
11
6/17/2020
12
6/17/2020
13
6/17/2020
14
6/17/2020
15
6/17/2020
16
6/17/2020
17
6/17/2020
22
3. 人类的说话过程分五个阶段
想说 说出 传送 接收 理解
人类的说话交流是通过联结说话人和听话人 的一连串心理、生理和物理的转换过程实现的。
ห้องสมุดไป่ตู้
6/17/2020
23
4. 语言(Language)
人与人之间的沟通工具,是从人们的话语中
概括总结出来的规律性的符号系统。包括构成语
言的语素、词、短语和句子等的不同层次的单位,
6/17/2020
29
6/17/2020
30
语音的产生
6/17/2020
31
发音机理
人的前方
甲状软骨
声门
声带
环形软骨
喉的生理结构
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.2 汉语语音学
汉语语音的特点:
汉语韵母的结构
❖ 普通话的38个韵母大致可以分为三类:8个单韵母, 如[a]、[i]、[u]等;14个复韵母,如[ai]、[ao]等; 16个鼻韵母如[an]、[uang]等。在这38个韵母中 有三个(-i、er、ê)是特殊韵母。
❖ 应该注意,元音并不等于韵母。元音、辅音是按音 素的发音特征分类的;而声母、韵母则是按音节结 构分类的。这是两种不同的概念,尽管它们之间有 一定的联系。
2.1 语音和语言
❖ 当声带振动发出的声音气流从喉腔、咽腔进入口腔从唇腔出去 时,这些声腔完全开放,气流顺利通过,这种音称为元音。
❖ 呼出的声流,由于通路的某一部分封闭起来或受到阻碍,气流 被阻不能畅通,而克服发音器官的这种阻碍而产生的音素称为 辅音。发辅音时由声带是否振动引起浊音和清音的区别,声带 振动的是浊音,声带不振动的是清音。
2.1 语音和语言
❖ 语言是从人们的话语中概括总结出来的规律性的符号 系统。包括构成语言的语素、词、短语和句子等的不 同层次的单位,以及词法、句法、文脉等语法和语义 内容等。语言学是语音信号处理的基础。
❖ 语音学(Phonetics)是研究言语过程的一门科学。它 考虑的是语音产生、语音感知等的过程以及语音中各 个音的特征和分类等问题。现代语音学发展成为三个 主要分支:发音语音学、声学语音学、听觉语音学。
2.1 语音和语言
❖ 决定元音音色的主要因素是舌头的形状及其在口腔中的位置 (简称舌位)、嘴唇的形状(简称口形)等。元音的另一个重要 声学特性是共振峰(Formant)。共振峰参数是区别不同元 音的重要参数,一般包括共振峰频率(Formant Frequency)的位置和频带宽度(Formant Bandwidth)。
个。 ❖ 汉语音节的一般结构,由9个部分组成。其中1~4段属于声
母(辅音),6~9段属于韵母(元音),第5段是二者的过 渡段。一个音节可能只包含里面的某几段,但是第7段(主要
元音段)是每个音节是具有的。
汉语音节的一般结构
汉语声母的结构
❖ 普通话中的22个声母可分为六大类:擦音、塞音、 塞擦音、边音、鼻音、零声母。除零声母之外,其 他所有的声母全部都是单辅音。
❖ 音系简单。音素少、音节少。音节的结构也比较简单。 ❖ 由于清辅音多,而且多是弱清音,而且开口呼的音节占全部
音节的一半以上,所以汉语语音听感上有清亮、高扬和舒服、 柔和的感觉。 ❖ 有鲜明的轻重音和儿化韵,所以字词分隔清楚,语言表达准 确而丰富。
汉语的拼音方法
❖ 汉语由音素构成声母或韵母。有时,将含有声调 (汉语通常认为有5个声调)的韵母称为调母。由 单个调母或由声母与调母拼音成为音节。汉语的一 个音节就是汉语一个字的音,即音节字。由音节字 构成词,最后再由词构成句子。国际上,都是用音 标来描述拼音过程的。汉语也不例外。汉语拼音的
汉语的声调
❖ 汉语是一种声调语言,相同声母和韵母构成的音节随声调的不 同而具有完全不同的意义,对应着不同的汉字。声调有辨意作 用;另外,汉语中存在着多音字现象,同一个字在不同的语气 或不同的词义下具有不同的声调,因而声调对于汉语语音的理 解极为重要,承担着重要的构字辨意作用。汉语普通话的声调 只有阴平、阳平、上声、去声以及“轻声”等五种声调。
2.1语音和语言 2.2汉语语音学 2.3语音生成系统和语音感知系统 2.4语音信号生成的数学模型 2.5语音信号的特性分析
2.1语音和语言
❖ 人们讲话时发出的话语叫语音,它是一种声音,具有称 为 声 学 特 征 的 物 理 特 性 。 语 音 ( Speech ) 是 声 音 (Acoustic)和语言(Language)的组合体。可以这 样定义语音:语音是一连串的音组成语言的声音。
❖ 声调的变化就是浊音基音周期(或基音频率)的变化,各个韵 母段中基音周期随时间的变化产生了声调,变化的轨迹称为声
调曲线。
❖ 一般地说,虽然就语音的基音频率而言是女声和童声高于男 声,但是实验表明:区分语音是男声还是女声、是成人声音 还是儿童声音,更重要的因素是共振峰频率的高低。
2.1 语音和语言
❖ 产生元音的条件,即①声道受到声带振动的激励引起共振;②在语音流 的持续过程中,声道不发生极端的狭窄,并维持较稳定的形状;③和鼻 腔不发生耦合,声音只从口腔辐射出去。这三个条件中,只要缺少其中 之一,则该语音就是辅音。辅音没有明确的共振峰结构。辅音发音时的 阻碍的位置叫调音点(Place of Articulation)、阻碍的方法叫调音方 式(Manner of Articulation )。
音标包括:声母表、韵母表和声调符号等。
汉语音节的一般结构
❖ 汉语音节一般由声母、韵母和声调三部分组成。汉语普通话 中有6000多个常用字,每个汉字是一个音节,如将同音字合 一处理,则汉语中共有1332个有调音节,其中可以单念的有 1268个。汉语中一般有五个声调,即阴平、阳平、上声、去 声以及轻声。如果不考虑声调,则汉语中无调音节共有407
2.1 语音和语言
❖ 语音是人的发声器官发出的一种声波,它具有一定的音色, 音调,音强和音长。其中,音色也叫音质,是一种声音区别 于另一种声音的基本特征。音调是指声音的高低,它取决于 声波的频率。声音的强弱叫音强,它由声波的振动幅度决定。 声音的长短叫音长,它取决于发音时间的长短。
❖ 说话时一次发出的,具有一个响亮的中心,并被明显感觉到 的语音片段叫音节(Syllable)。一个音节可以由一个音素 (Phoneme)构成,也可以由几个音素构成。音素是语音 发音的最小单位。任何语言都有语音的元音(Vowel)和辅 音(Consonant)两种音素。