基于环形麦克风阵列的远场语音识别系统

合集下载

《基于麦克风阵列的声源定向系统的研究与实现》范文

《基于麦克风阵列的声源定向系统的研究与实现》范文

《基于麦克风阵列的声源定向系统的研究与实现》篇一一、引言随着人工智能技术的飞速发展,声源定向系统在众多领域中扮演着越来越重要的角色。

麦克风阵列技术作为一种有效的声源定位手段,已广泛应用于安防监控、智能家居、机器人等领域。

本文旨在研究和实现基于麦克风阵列的声源定向系统,以提高声源定位的准确性和实时性。

二、麦克风阵列技术概述麦克风阵列是指将多个麦克风按照一定的几何布局排列,通过分析麦克风接收到的声波信号的时差、相位差和振幅差等信息,实现声源定位的技术。

根据阵列中麦克风的数量、排列方式和信号处理方法的不同,麦克风阵列技术可分为多种类型。

本文将采用常见的均匀线阵列技术进行研究和实现。

三、声源定向系统设计(一)系统架构设计基于麦克风阵列的声源定向系统主要包括信号采集、信号预处理、声源定位和结果输出四个部分。

其中,信号采集部分负责获取多个麦克风的音频信号;信号预处理部分对音频信号进行滤波、增强等处理;声源定位部分根据处理后的信号计算声源位置;结果输出部分将声源位置信息以可视化方式呈现。

(二)麦克风阵列布局与选型麦克风阵列的布局和选型对声源定位的准确性具有重要影响。

本文采用均匀线阵列布局,将多个同型号的高灵敏度麦克风按照一定间隔排列。

同时,为了降低环境噪声的干扰,选用具有较好抗噪性能的麦克风。

(三)信号处理方法针对麦克风阵列接收到的音频信号,本文采用时延估计和到达角度估计两种方法进行声源定位。

时延估计是通过对不同麦克风接收到的信号进行时间差分析,从而确定声源的方向;到达角度估计则是根据信号的相位差或振幅差计算声源的到达角度。

此外,为了进一步提高定位精度,本文还采用了多普勒效应等高级算法进行优化。

四、系统实现与实验分析(一)系统实现根据上述设计,我们开发了基于麦克风阵列的声源定向系统。

系统采用C++编程语言实现,并利用OpenCV等开源库进行图像处理和可视化展示。

同时,为了方便用户使用,我们还开发了友好的图形界面。

汽车辅助驾驶系统中基于麦克风阵列的语音采集与识别

汽车辅助驾驶系统中基于麦克风阵列的语音采集与识别

max
1<i < N
δ
t
−1
(i)aij
\*MERGEFORM(AT3-16)
c)终结
P*
=
max
1≤i≤ N
δT aij
qT* = arg max δT (i)
1≤i≤ N
d)状态序列求取
\*MERGEFORMAT(3-17)
qt*= ϕ(t+1) (q*t+1), t= T −1,,1
\*MERGEFORMAห้องสมุดไป่ตู้T 3-18)
INFORMATION TECHNOLOGY 信息化建设
三、实验仿真
(一)麦克风阵列硬件 麦克风阵列 (Microphone Array),指的是多个麦克风的有 序排列,即由一定数目的声学传感器组成的排列,可用以对 声场空间特性进行采样和处理的系统。早在二十世纪七八十 年代,语音信号处理领域就已经开始研究麦克风阵列。由于 其准确性,从九十年代开始,基于麦克风阵列的语音信号处 理算法逐渐成为研究热点。发展到现如今的“声控时代”, 这项技术的重要性更加突出。 为了让本次实验数据更可靠,本文在录音的过程中,没 有使用电脑自带的录音软件,而是使用汽车辅助中所需要的 外接麦克风。本文中的仿真实验所用的外接麦克风是科大讯 飞 的 一 款 二 麦 阵 列 XFM10211。XFM10211 是 一 款 基 于 二 麦 克风阵列的语音硬件方案。采用二麦克风录音,再经过麦克 风阵列模块进行语音降噪、回声消除、语音唤醒后,输出数 字音频信号、模拟音频信号、唤醒触发信号等。其原理图如 图 3 所示:
著名瑞典工程师兼语音学家 G.Fant 提到: “语音研究 工作者应当努力工作在跨学科领域”[2]。因为语音识别的研 究涉及到声学语音、信号处理、模式识别、语言学、计算机 科学、心理学、信号处理等学科领域的综合技术。”因此, 语音识别的研究也是一个颇具挑战性的工作。查阅国内外文 献可知,语音识别技术发展到今天,中小词汇量非特定人语 音识别系统识别精度可达到 98%,对特定人语音识别系统的 识别精度更高。这些技术可以满足通常应用的要求。

麦克风阵列技术在语音识别中的应用研究

麦克风阵列技术在语音识别中的应用研究

麦克风阵列技术在语音识别中的应用研究一、绪论语音识别技术的发展已经越来越受到人们的关注与重视。

作为其中的重要组成部分之一,麦克风阵列技术也越来越受到人们的青睐。

麦克风阵列技术是一种可以通过组合多个麦克风进行信号增强的技术。

在语音识别技术中,麦克风阵列技术可以提高原始语音信号的质量,从而提高语音识别的准确率。

本文将介绍麦克风阵列技术的概念、原理、分类以及在语音识别中的应用研究。

二、麦克风阵列技术的概念与原理麦克风阵列技术是一种可以通过组合多个麦克风进行信号增强的技术。

其基本思想是将多个麦克风分别采集到的信号进行混合处理,以得到更稳定、更准确的信号。

麦克风阵列技术可以通过两种方式实现信号的增强:一是基于时间信号处理技术,即利用多个麦克风之间的时延差异来进行信号增强;二是基于空间信号处理技术,即利用多个麦克风之间的空间位置差异来进行信号增强。

在基于时间信号处理技术的麦克风阵列中,每个麦克风可以采集到的声波信号是略有差异的,这种差异表现为采集信号之间的时延。

通过对这些信号进行时移和加权平均,可以得到一个更准确、更稳定的声音信号。

在基于空间信号处理技术的麦克风阵列中,麦克风的位置和方向决定了采集到的信号。

这意味着如果一个麦克风采集到的信号在其他麦克风中可以被拾取到,那么这个信号被采集的概率就会相对较高。

因此,通过在一个空间范围内分布多个麦克风,可以有效地提高信号的质量。

三、麦克风阵列技术的分类麦克风阵列技术可以根据不同的特征分为不同的类型。

根据不同的麦克风布局方式可以分为线性阵列、圆形阵列等;根据不同的交叉观察方式可以分为平面阵列、立体阵列等;根据不同的处理方式可以分为数字阵列、模拟阵列等。

四、麦克风阵列技术在语音识别中的应用研究在语音识别技术中,麦克风阵列技术可以提高原始语音信号的质量,从而提高语音识别的准确率。

识别误差率的一个主要原因是语音信号的可变性,比如说说话的人、说话的环境、语速、语音轮廓、噪声等因素的影响,在进行识别过程中,需要更加准确的原始语音信号进行支持。

《2024年基于麦克风阵列的声源定向系统的研究与实现》范文

《2024年基于麦克风阵列的声源定向系统的研究与实现》范文

《基于麦克风阵列的声源定向系统的研究与实现》篇一一、引言声源定向技术是一种用于确定声波传播方向的技术。

随着现代科技的发展,麦克风阵列技术逐渐成为声源定向系统的重要手段。

本文将详细介绍基于麦克风阵列的声源定向系统的研究背景、目的及意义,并探讨其实现方法和应用前景。

二、麦克风阵列技术概述麦克风阵列是指将多个麦克风按照一定规则排列,通过分析声波在传播过程中到达不同麦克风的相位差和强度差,实现声源定向的技术。

麦克风阵列技术具有较高的定位精度和抗干扰能力,广泛应用于语音识别、机器人听觉、安全监控等领域。

三、声源定向系统研究(一)系统架构设计基于麦克风阵列的声源定向系统主要包括信号采集、预处理、特征提取、定位算法和输出五个部分。

信号采集阶段,麦克风阵列捕捉来自各个方向的声波信号;预处理阶段,对采集到的信号进行滤波、增益控制等处理;特征提取阶段,从预处理后的信号中提取出有用的信息,如时延、强度等;定位算法阶段,根据提取的特征信息,运用合适的算法进行声源定位;最后,输出阶段将定位结果以可视化的方式呈现出来。

(二)定位算法研究定位算法是声源定向系统的核心部分。

常见的定位算法包括基于时延估计的算法、基于到达角度的算法和基于声音强度比的算法等。

本文将重点研究基于时延估计的算法,通过分析声波在不同麦克风间的传播时延,实现声源定位。

同时,针对不同场景和需求,探讨其他定位算法的适用性和优化方法。

四、系统实现(一)硬件实现硬件部分主要包括麦克风阵列、信号处理器和显示器等。

麦克风阵列采用多个高灵敏度的麦克风,按照一定规则排列,以捕捉来自各个方向的声波信号。

信号处理器对采集到的信号进行预处理和特征提取,然后将处理后的数据传输至定位算法模块。

显示器用于呈现定位结果,方便用户观察和分析。

(二)软件实现软件部分主要包括信号处理、特征提取和定位算法等模块。

信号处理模块对采集到的声波信号进行滤波、增益控制等预处理操作。

特征提取模块从预处理后的信号中提取出有用的信息,如时延、强度等。

《2024年基于麦克风阵列的语音增强研究》范文

《2024年基于麦克风阵列的语音增强研究》范文

《基于麦克风阵列的语音增强研究》篇一一、引言随着人工智能技术的快速发展,语音识别和语音交互技术已成为人们日常生活和工作中不可或缺的一部分。

然而,在复杂多变的实际环境中,语音信号常常受到各种噪声的干扰,导致语音质量下降,进而影响语音识别的准确性和语音交互的体验。

因此,如何有效地进行语音增强,提高语音信号的信噪比(SNR),成为了一个重要的研究课题。

麦克风阵列技术因其能够通过多个麦克风的协同作用,实现空间滤波和声源定位,为语音增强提供了新的解决方案。

本文将就基于麦克风阵列的语音增强研究进行深入探讨。

二、麦克风阵列技术概述麦克风阵列是由多个麦克风按照一定几何结构排列组成,通过采集声波到达各个麦克风的相位差和幅度差,实现声源定位和语音信号处理。

麦克风阵列技术具有空间分辨率高、抗干扰能力强、适用于复杂环境等优点,在语音识别、语音交互、机器人听觉等领域有着广泛的应用。

三、基于麦克风阵列的语音增强方法基于麦克风阵列的语音增强方法主要包括波束形成、噪声抑制和语音分离等技术。

1. 波束形成波束形成是麦克风阵列技术中常用的一种方法,它通过加权求和各个麦克风的信号,形成指向性波束,从而提高目标语音的信噪比。

常见的波束形成方法包括延迟求和波束形成、相位变换波束形成等。

2. 噪声抑制噪声抑制是针对麦克风阵列接收到的语音信号中的噪声进行处理,以降低噪声对语音质量的影响。

常见的噪声抑制方法包括谱减法、非负矩阵分解等。

在麦克风阵列中,可以通过空间滤波和声源定位,更准确地识别并抑制噪声。

3. 语音分离语音分离是通过分析多个声源的信号特征,将不同声源的语音信号分离出来。

在麦克风阵列中,可以利用声源定位技术,确定各个声源的位置,然后通过信号处理技术将不同声源的语音信号分离出来。

四、实验与分析为了验证基于麦克风阵列的语音增强方法的有效性,我们进行了相关实验。

实验结果表明,通过波束形成、噪声抑制和语音分离等技术,可以有效提高语音信号的信噪比,改善语音质量。

麦克风阵列在语音识别中的应用

麦克风阵列在语音识别中的应用

麦克风阵列在语音识别中的应用
随着人工智能技术的不断发展,语音识别技术逐渐走进人们的生活。

而在语音识别技术中,麦克风阵列的应用起到了重要的作用。

本文将介绍麦克风阵列在语音识别中的应用,并从多个方面阐述其重要性。

一、麦克风阵列介绍
麦克风阵列是由多个麦克风组成的一种变体形式,它可以将多个麦克风的输入信号进行数字信号处理和分析,并从中提取出任意方向的声音信号。

麦克风阵列通常由四个或更多麦克风组成,这些麦克风通常围绕着一个中心点布置,以形成一个可控制的虚拟听取器。

二、麦克风阵列在语音识别中的应用
1. 声纹识别
麦克风阵列可以用于声纹识别中,通过对人声信号进行分析和处理,从而实现语音识别。

在声纹识别中,麦克风阵列可以提高识别准确性和抗干扰能力,从而更好地识别人的声音特征。

2. 环境噪声抑制
麦克风阵列可以有效地抑制周围环境中的噪声,比如电视声、交通噪声等,从而提高语音识别的精确性和准确性。

麦克风阵列能够精确分析和抑制噪声,使得语音信号更加清晰,使得语音识别更准确。

3. 清晰度提升
麦克风阵列可以通过将多个麦克风的输入信号组合起来,从而使得语音信号更加清晰,更容易被识别。

麦克风阵列可以通过深度学习等技术,将多个麦克风的输入信号进行分析和处理,从而提升语音识别的清晰度和准确性。

三、总结
麦克风阵列在语音识别技术中发挥着重要作用,能够提高识别准确性和抗干扰能力,从而更好地识别人的声音特征。

麦克风阵列还能有效地抑制环境噪声,提高语音识别的精确性和准确性,从而使得语音识别更加优秀。

随着人工智能技术的发展,麦克风阵列技术将会在语音识别中扮演更加重要的作用。

《2024年基于麦克风阵列的语音增强研究》范文

《2024年基于麦克风阵列的语音增强研究》范文

《基于麦克风阵列的语音增强研究》篇一一、引言随着智能设备的广泛应用,语音交互技术在日常生活与工作场景中逐渐成为关键的信息交互手段。

基于麦克风阵列的语音增强技术是语音处理领域中的一项重要技术,它能有效地改善声音质量、识别语音并抵抗外界噪音。

本文主要就基于麦克风阵列的语音增强技术进行深入的研究与探讨。

二、麦克风阵列的基本原理麦克风阵列是由多个麦克风组成的系统,通过捕捉声音在空间中的传播特性,对声音信号进行空间滤波和定位。

每个麦克风都能捕捉到声音信号,通过阵列处理算法,可以确定声音的来源方向和距离,从而对声音进行增强或抑制。

三、语音增强的需求与挑战随着语音交互技术的普及,语音增强的需求日益增长。

然而,实际环境中的声音信号常常被各种噪声干扰,影响了语音识别的准确度。

基于麦克风阵列的语音增强技术可以有效减少背景噪声的影响,提高语音质量。

但是,在实际应用中仍面临着诸多挑战,如多路径效应、反射干扰、噪音与语音的频谱重叠等。

四、基于麦克风阵列的语音增强技术研究针对上述挑战,研究者们已经开展了一系列关于基于麦克风阵列的语音增强技术研究。

这些研究主要围绕以下几个方面:1. 阵列信号处理算法:通过优化阵列信号处理算法,如波束形成、噪声抑制等,提高对声音信号的捕捉和识别能力。

2. 声源定位与追踪:利用麦克风阵列捕捉到的声音信号,结合声源定位算法,实现声源的实时定位与追踪。

3. 噪音抑制与回声消除:针对环境中的各种噪音和回声干扰,研究有效的抑制和消除方法,提高语音的清晰度。

4. 深度学习在语音增强中的应用:利用深度学习技术,如卷积神经网络、循环神经网络等,对麦克风阵列捕捉到的声音信号进行深度分析和处理,进一步提高语音增强的效果。

五、实验与结果分析为验证基于麦克风阵列的语音增强技术的效果,研究者们进行了大量的实验。

实验结果表明,通过优化阵列信号处理算法、声源定位与追踪、噪音抑制与回声消除等技术手段,可以有效提高语音识别的准确度。

《2024年基于麦克风阵列的声源定向系统的研究与实现》范文

《2024年基于麦克风阵列的声源定向系统的研究与实现》范文

《基于麦克风阵列的声源定向系统的研究与实现》篇一一、引言随着人工智能技术的飞速发展,声源定向系统在众多领域中扮演着越来越重要的角色。

基于麦克风阵列的声源定向系统,通过多麦克风的协同工作,能够实现对声源的精准定位和追踪。

本文将详细介绍基于麦克风阵列的声源定向系统的研究背景、意义、方法及实现过程。

二、研究背景与意义声源定向技术广泛应用于安防监控、智能家居、语音交互等领域。

传统的单麦克风系统在复杂环境下的声源定位能力有限,而基于麦克风阵列的声源定向系统能够通过多个麦克风的协同工作,提高声源定位的准确性和稳定性。

因此,研究基于麦克风阵列的声源定向系统具有重要的理论价值和应用意义。

三、相关技术综述1. 麦克风阵列技术:麦克风阵列是由多个麦克风按照一定几何排列组成的系统,能够通过对声音信号的空间分布进行分析,实现对声源的定位和追踪。

2. 声源定位算法:声源定位算法是声源定向系统的核心,主要包括基于时差法、基于到达角度法等。

这些算法通过分析声音信号在传播过程中的时间差、相位差等信息,实现对声源的定位。

四、系统设计与实现1. 系统架构设计:本系统采用分布式架构,包括数据采集层、信号处理层和应用层。

数据采集层负责收集多个麦克风的音频数据,信号处理层对音频数据进行处理和分析,应用层则根据定位结果进行相应的操作。

2. 麦克风阵列布置:根据实际需求和场景,选择合适的麦克风阵列布置方式,如线形阵列、平面阵列等。

布置时需考虑阵列元素间的距离、角度等因素,以优化声源定位效果。

3. 声源定位算法实现:本系统采用基于时差法的声源定位算法。

首先对多个麦克风的音频数据进行预处理,包括降噪、滤波等操作;然后通过计算声音信号在传播过程中的时间差,实现对声源的定位。

4. 系统测试与优化:对系统进行实际测试,分析定位结果的准确性和稳定性。

根据测试结果对系统进行优化,包括调整麦克风阵列布置、改进声源定位算法等。

五、实验结果与分析1. 实验设置:在室内和室外环境下进行实验,分别测试系统在不同噪声条件下的性能。

《2024年基于麦克风阵列的语音增强研究》范文

《2024年基于麦克风阵列的语音增强研究》范文

《基于麦克风阵列的语音增强研究》篇一一、引言随着科技的快速发展,语音技术得到了广泛的关注和应用。

麦克风阵列技术的引入,使得语音增强的研究变得尤为重要。

语音增强技术能够有效地提高语音信号的信噪比,从而提高语音识别的准确率。

本文将探讨基于麦克风阵列的语音增强技术的研究现状、方法及挑战。

二、麦克风阵列技术概述麦克风阵列是由多个麦克风组成的系统,通过收集声源的信号并进行分析,可以实现对声源的定位和语音信号的增强。

麦克风阵列技术具有较高的空间分辨率和抗干扰能力,能够有效地抑制噪声和干扰信号,提高语音识别的准确率。

三、基于麦克风阵列的语音增强方法1. 波束形成技术波束形成是麦克风阵列中常用的语音增强技术。

通过调整各个麦克风的权重和相位,使得阵列的输出在特定方向上形成波束,从而增强该方向的语音信号。

常见的波束形成方法包括延迟求和波束形成和最小方差无畸变响应波束形成等。

2. 盲源分离技术盲源分离技术是一种基于统计模型的语音增强方法。

该方法通过估计语音信号和噪声信号的统计特性,将混合信号分离成原始的语音信号和噪声信号。

基于麦克风阵列的盲源分离技术可以进一步提高语音增强的效果。

3. 深度学习技术深度学习技术在语音增强领域得到了广泛的应用。

通过训练深度神经网络模型,可以有效地提取语音信号中的特征信息,并抑制噪声和干扰信号。

基于麦克风阵列的深度学习语音增强方法可以提高语音识别的准确率,并具有良好的鲁棒性。

四、实验与结果分析为了验证基于麦克风阵列的语音增强方法的有效性,我们进行了实验研究。

实验中采用了不同的噪声环境,包括室内、室外、嘈杂环境等。

通过对比不同方法的实验结果,我们发现基于麦克风阵列的波束形成技术和深度学习技术能够有效地提高语音识别的准确率,并具有良好的抗干扰能力。

此外,我们还发现结合盲源分离技术和麦克风阵列技术可以进一步提高语音增强的效果。

五、挑战与展望尽管基于麦克风阵列的语音增强技术取得了显著的成果,但仍面临一些挑战和问题。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

人 的语 音 动 作 控 制 系统 中 。经 在 噪 声 环 境 下 的 非 特 定 的 不 同距 离 、 不 同 角度 、 消回声的语 音识别测试 , 结 果 表 明 在 噪 声 环 境 下, 该 系统 对远 距 离命 令 也 有较 高 的识 别 率 , 并且可以消除回声 , 适 用 于服 务 机 器 人 的应 用 环 境 , 也 适 合 其 他 有 噪 环 境 下远 场
语 音 识 别 系统 的 应 用 。
关 键 词 :远 场 语 音 识 别 ;环 形 麦 克 风 阵列 ;语 音 控 制
中 图分 类 号 : TN 9 1 2
文献标志码 : A
Fa r f i e l d S pe e c h Re c o g n i t i o n S y s t e m Ba s e d o n Ci r c u l a r Mi c r o ph o n e - a r r a y
Zhi Ya nl i ,Zha ng Yun we i
( Ku mmi n g Un i v e r s i t y o f S i n e n c e a n d T e c h n o l o g y, F a c u l t y o f I n f o r ma t i o n E n g i n e e r i n g a n d Au t o ma t i o n ,Ku n mi n g 6 5 0 5 0 4,C h i n a )
Ab s t r a c t :I n t h e f a r — f i e l d s pe e c h r e c ogn i t i o n p r oc e s s , wi t h t he i n c r e a s e o f d i s t a nc e of s pe e c h t r a ns mi s s i on, i t a r i s e s t he p r obl e m s, s uc h a s v oi c e a t t e n ua t i on, r e v e r b e r a t i o n, b a c kg r o un d n oi s e, hum a n i n t e r f e r e nc e a nd e c ho i nc r e a s e, e t c . The s e pr ob l e ms ma k e t he s pe e c h r e c o gni t i on d i s t a nc e a n d r a t e l o w .Ac c o r d i n g t o t h e s e pr ob l e m s, t hi s pa p e r p r e s e nt s a s o l u t i o n, whi c h i s a f ar — f i e l d s pe ec h r e c o gni t i on s ys t e m ba s e d o n c i r c ul a r mi c r op hon e — a r r a y .The d e s i gn ad o pt s Si no Vo i c e c ompa ny l o op l a y ou t p a ns y s p e e c h f r ont — e n d p r o c e s s i n g a s t he c or e,c om b i n e d wi t h t he c or r e s po nd i n g o f f — l i ne s pe e c h r e c o gn i t i on e ng i ne a n d s i n gl e c hi p mi c r oc om pu t e r .Th e de s i gn i s us e d i n t he c on t r o l s y s t e m of s e r v i c e r o bo t of s pe e c h m ov e me n t s . Un de r no n s p e c i f i c c on s i de r a t i o n o f t he no i s e e nv i r o nm e n t wi t h di f f e r e nt di s t a nc e a n d di f f e r e n t a n gl e s, f i r e e c h o s pe e c h r e c o gn i t i o n t e s t s a r e c a r r i e d ou t . T he r e s ul t s s ho we d t h a t und e r no i s e e n vi r on me nt ,t he s y s t e m f or r e mo t e c o mma nd a l s o ha s a hi ghe r r e c o gn i t i on r at e a nd c a n e c h o c a nc e l l a t i on,c a n b e us e d i n t he a ppl i c a t i on e nv i r o nm e n t of s e r v i c e r ob ot s,i s a l s o s u i t a b l e f or ot h e r e nvi r on me nt a l no i s e i n t he f a r f i e l d of s p e e c h r e c o gn i t i o n s y s t e m a pp l i c a t i on . Ke y wor d s:Fa r — f i e l d s pe e c h r e c og ni t i on;Ci r c ul ar mi c r op hon e - a r r a y; Sp e e c h c on t r ol
Mi c r o c o mp u t e r A p p l i c a t i o n s V o 1 . 3 3 , N o . 4 , 2 0 1 7
文章 编 号 : 1 0 0 7 — 7 5 7 X( 2 0 i 7 ) 0 4 — 0 0 6 2 — 0 3
开发 应 用
微 型电脑应用 2 0 1 7年 第 3 3卷 第 4期
基 于环 形 麦克 风 阵 列 的远 场 语 音识 别 系统
支艳 利 , 张 云 伟
( 昆明理工 大学 信 息工 程与 自动化 学 院 , 昆明 6 5 0ห้องสมุดไป่ตู้5 0 4 )
摘 要 : 语 音 在 远 场识 别 中 , 随 着语 音 传播 距 离的加 大 , 语音本 身的衰减 , 混响、 背景噪音 、 人 声干扰和 回声加 大等技 术难题 ,
会 引起 的 识 别 距 离近 、 识 别 率低 等 问题 。针 对 这 些 问题 , 提 出 了一种 基 于 环 形 麦 克 风 阵 列 的 远 场 语 音 识 别 系 统 。 该 设 计 采 用 S i n o Vo i c e 公 司 环形 布局 的 p a n s y板 作 为语 音 前 端 处 理 的 核 心 , 结合 其 相 应 的 离线语 音识 别 引 擎 以 及 单 片 机 , 运 用 于 服 务机 器
相关文档
最新文档