麦克风阵列声源定位系统
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
The Syste m of Sound Source Localization by M icrophone Array Based on TM S320DM 642
LI Zh i jin , QI AO Jie
( Co lleg e of E lectronic & Infor m ation Eng ineering , N an jing U nivers ity of Infor m ation Science & T echno logy , N anjing 210044, China)
[ 5]
( 3) ( 4) ( 5)
= arccos z r = arcsin y r sin
= arccos = arcs in
- d13 ( 2 r + d 13 ) 2 r
2
- d 12 ( 2 r + d 12 ) 2 r sin
式中, dij为麦克风 i和 j 之间的延迟距离;
为正方形
麦克风阵列的边长。麦克风 i 和 j 之间的延迟距离 d ij 计算公式为
Abstract : Sound source locat ion syste m based on m icrophone array co llects the sound signal by m icrophone ar ray . TLV 320A IC23B converts analog sound signal to digita l signa. l TM S320DM 642 analyses the dig ita l sound sig na l and detects th e endpoints of th e sound sig na l to the m icrophone . The endpo in t detection is one o f th e i m portant factors to deter m ine the precisio n o f th is system. Because the d istance bet w een sound source and one m icrophone of the m icrophone array, the t i m e tij in dicates th e ti m e in terva l o f sound from m icrophone I to m i crophone J. T o get th e t i m e tij, th e TM S320DM 642 is used as co re control dev ice . TM S320DM 642 w orks out the sound source position acco rd ing to th e princ ip le o f sound source locat io n wh ich is reduced. T he system of sound location based on TM S320DM 642 is a high precision and real t i m e system, and m ay be used to v ideo session , robot speech recogn ition , hearin g a id , etc . K ey w ord s : sound source localization; m icrophone array; TM S320DM 642 ; endpo int detection 麦克风声源定位技术是利用麦克风拾取语音信 号 , 并用数字信号处理技术对其进行分析和处理, 继而 确定和跟踪声源的空间位置。传统的单个麦克风的拾 音范围很有限, 拾取信号的质量不高 , 因此提出了用麦 克风阵列进行语音处理的方法。麦克风阵列 具有去 噪、 声源定位和跟踪等功能 , 从而大大提高了语音信号 处理质量。随着麦克风阵列技术在语音增强、 噪音抑 制、 声源定位和回声抵消等语音技术方面的不断发展 和成熟 , 人们对麦克风阵列语音数据的品质要求越来 越高。为了达到实用的目的, 麦克风阵列语音数据采
1 语音端点检测
麦克风阵列声源定位, 首先要检测到麦克风阵列
36 接收的来自于声源的时间差。语音端点检测的主要任 务是对接收到的信号进行分析, 判断其中是否有语音 信号, 以确认麦克风阵列中语音 信号到达的时间 差。 在语音识别中, 有一半左右的错误率是由端点检测引 [ 1] 起的 。目前常 用的语 音检 测算 法有 : 短 时过零 点 法、 短时能量法及短时功率谱法等。一般在信噪比较 高的情况下采用短时能量和过零率混合使用的方法来 进行端点检测。在噪声较大的情况下 , 含噪语音信号 中的语音部分和噪音部分幅值相近 , 整个波形看上去 类似白噪声 , 使用过零率法和短时能量法都无法进行 端点检测 。在强噪声的情况下, 目前有两种比较新 的端 点 检 测 方 法: 用 短 时 能 量 变 换 率 进 行 端 点 检 [ 3] 测 LSTER 法和用过零率的变化率进行端点检测 的方法 H ZCRR 法。本文采用高过 零率的变化率 ( HZCRR, high zero crossing rate) 法, 其本质与过零率类 似, 是由过零率的方法衍生出来的。其表示方式为
, 式中, fs 为麦克风接收到的信
[ 2]
图 1 麦克风 阵列信号处理系统框图
[ sgn ( ZCR ( n ) - 1. 5avZCR ) + 1 ] ( 1 )
n= 0 N- 1
ZCR ( n )
n= 0
( 2)
式中, HZCRR 为一定 长度 的窗中 过零率 ( ZCR, zero crossing rate)高于 1 . 5 倍过零率平均值的帧数目比例; HZCRR ( n )为第 n 点的过零率比, 其端点检测原理在 于语音的起始点和结束点语音过零率变化明显, 因此 可以较好地分辨出语音的端点。
dij = c tij ( 6)
式中, tij为麦克风 i和 j 之间的延迟时间 ; c 为声音的传 播速度。 tij可由声音信号的时域互相关性确定。麦克 风 i接收到的信号记为 x i [ n ] , 则麦克风 j 和麦克风 i 的互相关函数记为
基于 TM S320DM 642麦克风阵列声源定位系统 在 8~ 96 kH z 采样范围内提供 16 位、 24 位和 32 位数 据采样 , ADC 和 DAC 的信噪比可以分别达到 90 dB 和 100 dB。同时, TLV320A IC23B 还具有很低的功耗, 回 放模式下功率仅为 23 mW, 省电模式下 更是小于 15 W。 TLV320A I C 23B 与微处理器的接口有 2 个: 一个 是控制口, 用于设置 TLV320A IC23B 的工作参数 ; 另一 个是 数据口 , 用 于传输 TLV320A IC23B 的 A /D、 D /A 数据。 3 . 2 . 1 TMS320DM 642与 TLV320A IC23B 连接 本 系 统 中 将 TM S320DM 642 的 M cASP 配 置 成 Burst F ram e SyncM ode 方式 , 与 4片 TLV320A I C 23B 的 数据口 相接, 使用 II C 总线与 TLV320A I C 23B 的控制 口相接 , 如图 3所示。
基于 TM S320DM 642麦克风阵列声源定位系统
35
基于 TM S320DM 642麦克风阵列声源定位系统
李致金, 乔 杰
210044) ( 南京信息工程大学 电子与信 息工程学院 , 江苏 南京
摘要: 麦克风声源定位是利用麦克风阵列拾取语音信号 , 并用数字信号处理技术对其进行分析和处理的 声源定位技术。 在麦克风阵列声源定位中 , 语音信号端点的拾取是重要的环节。 语音端点检测是对接 收到的信号利用端点检测算法分析, 以确认麦克风阵列中语音信号到达的端点; 并利用麦克风阵列中各 麦克风接收到的语音信号的端点的先后, 计算出麦克风阵列接收的来自于声源的时间差; 根据麦克风阵 列之间的时间差 , 应用所提出的声源定位的方法, 继而计算出声源的空间位置 。本系统定位精度较高、 实时性好, 可应用于许多场合, 如视频会议 、 机器人语音识别、 语音助听装置等。 关键词 : 声源定位; 麦克风阵列; TM S320DM 642 ; 端点检测 中图分类号 : TN 98 文献标识码: A 文章编号: 1000- 8829( 2011) 01- 0035- 04
r=
2 2 ( d 14 + d12 ) d42 - d 2 d2 13 14 - ( d12 + d 13 ) = 2 ( d 12 + d 34 ) 2 ( d 12 + d 13 - d 14 ) 2
图2
4 麦克风和声源示意图
3 系统硬Biblioteka Baidu设计
3 . 1 TM S320DM 642 简介 TM S320DM 642 是 T I公司生产的 C6000 系列中最 高性能的定点数字信号处理器。 DM 642 片上有 3 个 32 位 的定 时器 , 这 3 个 定时 器可 供用 户软 件编 程。 DM 642 的 M ultichanne lAudio Serial Port ( M c ASP )主要 应用在多通道的音频处理中, M cASP 数据的接收与发 送两个部分可以进行同步操作, 也可以完全独立地进 行工作。 [ 6] 3 . 2 4 通道音频输入 本系统采用 4 片 TLV320A IC23B 实现 4 路立体声 音频的输 入。 TLV320A IC23B 是 T I 推出的一款 高性 能的立体声音频 Codec器件, 内置耳机输出放大器, 支 持MI C 和 LI NE I N 两种输入方式 (二选一 ), 并且输入 输出都具有可编程的增益调节。 TLV320A IC23B 的模 数转换 ( ADC ) 和数模转换 ( DAC ) 部件高度集成在芯 片内部 , 采用了先进 的 Sigm a delta 过 采样技术 , 可以
H ZCRR ( n) = avZCR = 1 2 N 1 N
N- 1
测控技术 2011 年第 30 卷第 1 期
N
Rij =
= -N
x i [ n ] xj [ n -
]
( 7)
采样延迟为 :
ij
= argm ax [ R ij ( ) ] 。麦克风 j 和麦克风
- 1 ij
i延迟时间为: tij = f s 号采样频率。
收稿日期 : 2010- 04- 27 基金项目 : 南京信息工程大学基金资助项目 ( 20080326) 作者简介 : 李致金 ( 1972 ), 男 , 硕士 , 讲师 , 主要研究 方向图像 传输 、 语音信号处理 。
集系统必须具备各通道间同步、 实时采集、 信噪比高、 扩展 性 好 等 特 点。 TM S320DM 642 DSP 芯 片 是 在 TM S320C6000 DSP 平台 上的 高性 能 定点 运 算 DSP。 TM S320DM 642 采用 T I 公司开发的第 2 代高性能、 先 进 V elociT I技术的 VL I W 结构 ( Ve lo c i T I1 . 2) , 在音频 和视频应用方面性能优越, 成为数字多媒体产品应用 中极好的选择。采用 TM S320DM 642 DSP 芯片为核心 处理器件的麦克风阵列声源采集系统 , 配置以精简得 当的定位算法, 可使麦克风阵列应用于许多场合, 如视 频会议、 机器人语音识别、 车载系统环境、 大型场所会 议、 助听装置等。
2 麦克风阵列源定位原理
[ 4]
4 个麦克风组成麦克风阵列确定声源的位置 , 增 强语音信号 , 并自适应地删除语音信号中包含的噪声 信号, 系统框图如图 1 所示。声源位置和麦克风阵列 的相对位置如图 2 所示。麦克风 m 1 位于坐标轴的原 点 , 声源 S (x, y, z )与坐标原点的距离为 r。X Y 平面内 和 X 轴的夹角为 , 空间天顶角为 。计算公式如下