基于DSP的语音识别(1)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

EL-DSP-EXPⅢ实验箱
仿真器接口 E_LAB接口2 TECH_V接口 电机控制接口 RS232 DA单元 CPLD单元
数字量输入输出单元
语音 单元
电源单元
液晶显示单元
语 音 接 口
AD单元 CPU单元 单脉冲 单元 模拟信号源
串口单元
CAN总线
单元 以太网 单元
IO单元
USB单元
E_LAB接口1 音频信号源 键盘单元
实验结果,分析与总结
实验结果: 通过对DSP、TMS320C55x、TLV320AIC23以及软件 CCS3.3的学习与熟悉,完成了对语音的简单识别 不足: 识别成功率略低,识别速度有待提高
基于 DSP的语音识别
指导老师:艾华 组员:郑昊、洪瀚澜、吴玉泽
实验目的

学习DSP(数字信号模拟器)的基本知识 学习安装并使用DSP 开发软件:CCS3.3 实现语音信号的识别
实验设备与实验平台
EL-DSP-EXPⅢ实验箱 DSP芯片:TMS32055XX 计算机 DSP 开发软件:CCS3.3
TLV320AIC23
Leabharlann Baidu

高性能的立体声音频Codec芯片 ,内置耳机输出放大器,支持MIC 和LINE IN两种输入方式(二选一 ),且对输入和输出都具有可编 程增益调节。 AIC23是一款非常理想的音频模拟 I/O器件,可以很好的应用在随声 听(如CD,MP3……)、录音机 等数字音频领域
TMS320C5509与TLV320AIC23在语音信号处理系 统中的接口设计
MFCC
DTW算法


动态时间规整法
时间规整函数w=(j)满足:



d[T(i),R(w(i)]表示第i帧测试矢量 T(i)与第j帧矢量R(j)距离测度 D处于最优时间规整情况下两矢量 之间的匹配路径
DTW算法

由于DTW不断地计算两矢量的距离以寻找最优的匹配路径,所 以得到的是两矢量匹配时累计距离最小的规整函数,这就保证 了它们之间存在最大的声学相似特性
实验步骤

CCS3.3的安装与工程的建立 试验箱与软件的连接并实现基本实验操作 语音的录入 语音滤波处理 语音特征参数提取 DTW算法进行语音匹配
TMS320C55系列

新一代低功耗、高性能数字信号 处理器,在无线通信、便携式个 人数字系统及高效率的多通道数 字压缩语音电话系统中得到广泛 应用

DSP芯片——C5509
McBSP1 SPI模式 对AIC23进行配置
McBSP0 I2C模式 控制音频数据的收发


音频编解码芯片——AIC23
CCS3.3
端点检测

目的:分辨语音信号和非语音信号,确定语音的开始与结束

加窗:hamming 减小语音帧的截断效应
短时能量:语音信号强度的度量参数 短时过零率:波形穿过横轴的次数



短时平均幅度: 度量语音信号幅度值的变化
A
C
B
倒谱分析
1)将原语音信号经过傅里叶变换得到频: X[k]=H[k]E[k]; 只考虑幅度就是:|X[k] |=|H[k]||E[k] |; 2)在两边取对数:log||X[k] ||= log ||H[k] ||+ log ||E[k] ||; 3)再在两边取逆傅里叶变换得到: x[k]=h[k]+e[k]。
相关文档
最新文档