语音信号数字处理

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
❖ 音强是指声音的强弱,它取决于发音体振动幅度的大小。 ❖ 物体振动的幅度叫振幅,振幅大,发出的声音强度就大,振
幅小,声音就弱。 ❖ 振幅的大小是由引起物体振动的外力的大小决定的。 ❖ 语音的强弱同发音时呼出气流量的大小和说话人用力的大小
有关。发音时用力大,冲击声带或其他发音部位的气流强, 语音就强。
整理课件
语音信号处理的概念
语音信号处理简称语音处理,是以语音学和数 字信号处理为基础而形成的一门综合性学科, 处理的目的是要得到一些语音参数以便高效 的传输或存储,或者通过处理的某种运算以 达到某种用途的要求,例如人工合成出语音, 辨识出说话者,识别讲话的内容等。
它包括语音编码、语音合成、语音识别和说话 人识别四大分支。
❖ 频率的高低是由物体自身的质量、松紧度、长短等项因素决定的, 大而沉、粗而厚、长而松的物体振动慢,音低;小而轻、细而薄、 短而紧的物体振动快,音高。
❖ 语音的高低则与声带的长短、厚薄、松紧有关。通常,儿童和一 般妇女的声带比成年男子的声带短而薄,所以声音高;而声音低 的人声带相对说长而厚,如成年男子,女中、低音声乐演员,老 人等。同一个人发出的声音有高低变化,则是靠控制声带的松紧 来调节的。
整理课件
语音的物理属性—音长
❖ 音长指声音的长短,也就是声波延续的长度,它取决于发音体振 动持续的时间。在语音中,再长的音实际上也很短,音长一般决 定于发音动作持续的时间。
❖ 在四要素中,音高音强音色总是随着音波在时间上的延续表现出 来的,音长的变化往往会影响到音质音高和音强,语音中就常会 出现这种情况。如普通话的轻声,读轻声的字,声韵母的音质、 声调的音高、音节的强度都可能与读它的本调时不同,但造成轻 的决定性因素是音长缩短,轻声字音节的长度只有重读音节长度 的一半左右,这使得声韵调原有的音高音强音质来不及完全表现, 因而出现变化。
声波示意(L. A. Rowe )
压缩
幅度
稀薄
整理课件
正弦波 时间
声波频率
❖ 声压变化可以是周期性的和非周期性 ❖ 频率概念
循环(cycle)- 压缩/稀薄过程 频率(frequency):每秒cycle数,单位
hertz (Hz)
周期 – cycle的持续时间 (1/frequency)
❖ 声音信号一般由许多频率不同的信号组 成,称为复合信号;而单一频率的信号 称为分量信号
整理课件
频率范围
❖ 频率小于20Hz 一般称为次声波(subsonic) ❖ 人的听觉器官能感知的声音频率范围约为
20Hz~20kHz的信号称为音频(Audio)信号
人发音器官发声频率约是80~3400Hz,但人说话 的信号频率约为300~3000Hz,即话音(speech)信 号
❖ 高于20kHz的信号称为超声波 (ultrasonic) ❖ 超声波及次声波一般不能引起人听觉器官的感
❖ 物体由于某种外力的作用发生振动,并引起周围空气或其他 媒介物质的振动,产生了振动波─ 声波,声波作用于耳鼓膜, 使之产生同样的振动,刺激听觉神经,人就感觉到了声音。
❖ 语音也是这样产生、传递与接收的。 ❖ 物理声学认为声波具有音高、音强、音长、音色四种要素,
语音同样是这四种要素的统一体。
整理课件
整理课件
语音的定义
❖ 语音是人类发音器官发出的、具有一定意义的、能起社会交际作 用的声音。能够代表一定的意义,这是语言的声音同自然界其他 一切声音的本质区别。
❖ 人体外的声音自不必说(如钟声、风声、动物叫声、机器声),就是 人的发音器官发出的声音,也并非都是语言。 如打喷嚏、打嗝儿、 打哈欠、咳嗽等等,虽然也传递出了某种信息─病了,饱了,困 了或是醒了,但声音的发出不是为了交际,而是人体本能的生理 反映;又如吹口哨、口技演员的表演、哭、笑等等,这些声音的 发出是有目的的,是一定的心理活动的表现,不是单纯的生理现 象,但声音同意义之间没有固定的结合关系,不能成为代表意义 的声音符号,只能表示情绪,展示技巧。以上这些声音都不是语 言。
整理课件
语音学
❖ 语音学是研究语音过程的科学,包括发音语音学、 声学语音学和听觉语音学三大分支。
❖ 发音语音学研究发音器官在发音过程中的运动和语 音的音位特征;
❖ 声学语音学研究语音的物理属性,如语音声波的频 率、振幅以及频谱特性等属性—物理属性
整理课件
典型声门脉冲波形
Tp
典型声门脉冲波形
• Tp为基音周期,倒数为基音频率,用fp表示,取 决于声带的尺寸和特性
• 男性说话者的fp大致分布在60-200Hz范围内
• 女性说话者和小孩的fp值在200-450Hz范围内
• 同一个人所发出的声音有高低变化,是靠控制声 带的松紧来调节的。
整理课件
语音的物理属性—音强
语音信号数字处理
张力 参考数目:《语音信号数字处理》杨行峻
《语音信号处理》 易克初
整理课件
绪论
❖ 数字语音处理的概念 ❖ 语音的基本特征 ❖ 数字语音处理的发展 ❖ 课程内容以及安排
整理课件
前言
❖ 耳聪目明 ❖ 听说读写 ❖ 语音和图像——重要的感知媒体 ❖ 对语音和图像的分析处理
——媒体计算的主要研究对象和内容 ❖ 语音:新一代自然人机交互的关键之一 ❖ 信号处理——模式识别——人工智能
整理课件
语音的定义
❖ 语言的声音同它所代表的意义是相互依存的统一体,一方面,发 音器官发出的声音必须同意义紧密结合、成为一定意义的代表, 才能成为语音;另一方面,意义必须借助声音才能成为可被人感 知、被人接受的东西,没有声音,意义便无法表达出来。
❖ 语音是一种具有多重属性的声音。首先,它同自然界其他声音一 样,是由物体振动产生声波而形成的一种自然现象,所以它具有 物理的属性方面的自然属性。语言又是人类的生理现象,发音是 人体器官的动作。因此,它同时具有生理属性。作为语言这一特 殊社会现象的物质基础,语音又具有社会属性,这是语音的本质 属性。我们在分析语音现象的时候,这三种属性都会涉及到。
觉,但可借助一些仪器设备进行观察和测量
整理课件
语音的物理属性—音高
❖ 音高指声音的高低,它取决于发音体振动的快慢。发音体振动越 快,发出的声音越高,反之声音则低。
❖ 物体每秒钟振动的次数叫频率,声学把频率作为测定物体振动快 慢与声音高低的标准。
❖ 说声音的频率高就是说发音体在单位时间里振动次数多,它振动 得快,发出的声音高,而频率低也就表示声音低。
相关文档
最新文档