讯飞麦克风阵列声学测试方法
科大讯飞麦克风阵列模块 XFM10412 评估板使用说明说明书
科大讯飞麦克风阵列模块XFM10412评估板使用说明科大讯飞股份有限公司安徽省合肥市望江西路666号国家科技创新型试点市示范区科大讯飞语音产业基地一、简介科大讯飞模块XFM10412是一款基于4麦克风阵列的语音前端解决方案。
模块利用麦克风阵列的空域滤波特性,通过对唤醒人的角度定位,形成定向拾音波束,并对波束以外的噪声进行抑制,提升远场拾音质量、保证识别效果。
功能:180度声源定位、降噪、回声消除、语音唤醒二、包装清单编号类型数量1 评估板卡1块2 麦克板卡1块3 音频线1根4 USB电源线1根5 USB转串口数据线1根6 录音线1根7 评估板说明书1个三、实体图图1 四麦线性阵列评估板实体图四、硬件连接指南第一步:使用1根音频线把麦克板卡连接到评估板卡上;注意:麦克板卡对应连接到评估板卡上的J12。
第二步:USB转串口数据线的串口端连到评估板卡的UART1上,另一端USB端连接到PC的USB 接口上;第三步:使用USB电源线连接到评估板卡microUSB口(位号:P1)上进行供电;注意:不能使用电脑USB接口直接供电,请使用5V电压稳定电源供电,如:手机充电器等。
第四步:把耳机(自备)插入音频插座上;图2 硬件连接后的实物图五、快速体验为了让您快速体验,可以按照如下流程操作:第一步:打开PC上的SecureCRT工具,并配置串口参数在讯飞开放平台麦克风阵列页面下载的技术文档压缩包中,包含有此工具,可以下载后使用。
串口通信参数设置如下:波特率 115200;数据位 8;奇偶校验位无;停止位 1;流控无。
第二步:体验语音唤醒、声源定位、噪声抑制等说出唤醒词“灵犀灵犀”,这时评估板卡上的WakeUp指示灯点亮,在SecureCRT工具的界面上显示“WAKE UP! angle:xxx”,angle的数值表示语音唤醒位置的角度。
详见下图所示:图3 唤醒后的效果图图4 SecureCRT工具界面显示使用耳机可以直接听到处理后输出的音频。
人工智能麦克风阵列的实验结论
人工智能麦克风阵列的实验结论人工智能麦克风阵列的实验结论引言:人工智能(AI)麦克风阵列是一种使用人工智能技术来处理声音信号的系统。
它由多个麦克风组成,可以实现声音的定位、降噪和增强等功能。
在进行实验研究时,我们通过对不同情境下的声音信号进行采集和分析,得出了一些关于人工智能麦克风阵列的实验结论。
一、声音定位功能:通过实验研究发现,人工智能麦克风阵列可以准确地定位声源的位置。
在实验中,我们设置了不同位置的声源,并使用AI算法对采集到的声音信号进行处理。
结果显示,无论是单一声源还是多个同时存在的声源,该系统都能够精确地确定其位置。
二、降噪效果:人工智能麦克风阵列在降噪方面表现出色。
在实验中,我们模拟了各种噪声环境,并将其与目标语音信号混合在一起。
通过应用AI算法对采集到的混合信号进行处理,我们观察到噪声被有效地抑制,目标语音信号得到了明显的增强。
三、语音增强功能:实验结果表明,人工智能麦克风阵列能够有效地增强语音信号的质量。
在实验中,我们使用了一些低质量的录音样本,并将其输入到该系统中进行处理。
通过AI算法对这些样本进行去噪和修复,我们观察到语音信号的清晰度和可懂度得到了显著提高。
四、多麦克风协同处理:通过实验研究发现,人工智能麦克风阵列中的多个麦克风之间可以进行协同处理,以提高系统性能。
在实验中,我们将多个麦克风放置在不同位置,并使用AI算法对采集到的声音信号进行处理。
结果显示,在多麦克风协同处理的情况下,系统在定位、降噪和语音增强等方面表现更加出色。
五、适应性与稳定性:人工智能麦克风阵列在不同环境下都表现出良好的适应性和稳定性。
无论是室内还是室外环境,无论是静态还是动态环境,该系统都能够保持较高的性能水平。
这得益于其AI算法的智能调节和学习能力,使系统能够根据不同情境进行自适应处理。
结论:通过实验研究,我们得出以下结论:人工智能麦克风阵列具有精准的声音定位功能、出色的降噪效果、有效的语音增强功能、多麦克风协同处理的优势以及良好的适应性和稳定性。
AI智能语音麦克风矩阵电路检测方法
AI智能语音麦克风矩阵电路检测方法下载温馨提示:该文档是我店铺精心编制而成,希望大家下载以后,能够帮助大家解决实际的问题。
文档下载后可定制随意修改,请根据实际需要进行相应的调整和使用,谢谢!并且,本店铺为大家提供各种各样类型的实用资料,如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等,如想了解不同资料格式和写法,敬请关注!下面是小编为大家整理的AI智能语音麦克风矩阵电路检测方法(全文完整),供大家参考。
AI 智能语音麦克风矩阵电路的检测方法1.麦克风通道顺序测试对着MIC 收音孔,任意MIC 开始,逆时针依次对收音孔轻轻敲击,查看录音音频,正确的示例音频如图:此项只针对4 麦及以上麦克风阵列,2 麦克风阵列无顺序要求。
2.麦克风通道幅度一致性DUT 按照实际使用场景放置,外部声源(如有源扬声器系统)放置在距离DUT 拾音孔0.5m 处. 外部声源播放76dBC_sweep.wav,控制DUT 进行录音c) 使用Audacity 打开DUT 录制的raw 音频,查看多路麦克风录制信号多路麦克风信号包络形状基本一致,选取幅值相差较大的单频段(需是单频,打开频谱容易看出),“分析”——“对照”,若差值的绝对值≤3dB,则该频率的麦克风一致性满足要求。
以此类推,查看所有频点。
如果发现某一设备的MIC 一致性较差,可从调节MIC 的密封件的松紧或是否压紧来排查问题;若密封良好,但一致性仍无改善,则需要从元器件的差异性、焊接等因素来判断问题。
3.麦克风通道信噪比全/ 半消声室内,人工嘴100~8000Hz 频响校准,随后人工嘴播放100~8000Hz EQ 白噪声,调节MIC 处达到63dBC,设备录音10s,然后外部声源不播放,设备空录10s。
最后分析麦克风SNR,要求:200~1000Hz SNR≥20dB;1000Hz 以上SNR≥25dB。
4.麦克风通道同步性麦克风通道必须保证同步,可以用1kHz 单频电信号进行测试,比较容易看出相位差,如图: 注:电路板级同步性验证通过电信号输入的方式,该测试方案只针对模拟麦克风,数字麦克风、整机带结构的同步性验证在消声室内完成。
科大讯飞麦克风阵列模块 XFM10621 数据手册说明书
XFM10621数据手册科大讯飞科技股份有限公司安徽省合肥市望江西路666号国家科技创新型试点市示范区科大讯飞语音产业基地版本历史声明本手册由科大讯飞科技股份有限公司版权所有,未经许可,任何单位和个人都不得以电子的、机械的、磁性的、光学的、化学的、手工的等形式复制、传播、转录和保存该出版物,或翻译成其他语言版本。
一经发现,将追究其法律责任。
科大讯飞保证本手册提供信息的准确性和可靠性,但并不对文本中可能出现的文字错误或疏漏负责。
科大讯飞保留更改本手册的权利,如有修改,恕不相告。
请在订购时联系我们以获得产品最新信息。
对任何用户使用我们产品时侵犯第三方版权或其他权利的行为本公司概不负责。
另外,在科大讯飞未明确表示产品有该项用途时,对于产品使用在极端条件下导致一些失灵或损毁而造成的损失概不负责。
注意:本产品不具备抗静电放电的防护目录1产品概述 (1)2功能描述 (1)3系统结构图 (1)4模块尺寸图 (2)5硬件接口定义 (3)5.1引脚定义 (4)6电路设计参考 (6)6.1硬件连接参考 (6)6.2音频输出信号与上位机连接方法 (6)6.3参考信号接入方法 (7)6.4麦克风连线参考 (8)7串口通讯接口 (10)7.1扩展板串口与上位机连接方法 (10)7.2串口协议介绍 (10)7.2.1查询版本号 (10)7.2.2复位 (11)7.2.3指定增强波束 (11)8I2C通讯接口 (12)8.1总述 (12)8.2写操作 (12)8.3读操作 (12)8.4模块版本号查询 (13)8.4.1协议介绍 (13)8.4.2参考示例 (14)8.5唤醒角度查询 (14)8.5.1协议介绍 (14)8.5.2参考示例 (15)8.6复位 (15)8.6.1协议介绍 (15)8.6.2参考示例 (16)8.7设置拾音波束 (16)8.7.1协议介绍 (16)8.7.2参考示例 (17)9I2S音频输出接口 (17)9.1输出格式 (17)9.2引脚分布 (17)10参数列表 (18)10.1电气特性参数 (18)10.2极限值 (18)11防静电说明 (18)12附录 (19)12.1麦克风阵列拾音波束简介 (19)12.2回声消除简介 (19)12.3C LOCK S TRETCHING特性 (19)12.4订货信息 (19)1产品概述科大讯飞XFM10621模块是一款基于6麦克风阵列的语音前端解决方案。
声学实验技术中麦克风与声音采集的技巧与要领
声学实验技术中麦克风与声音采集的技巧与要领引言:麦克风在声学实验中起着重要的作用,它是将声波转化为电信号的关键设备。
然而,要获得高质量的声音采集结果,并不是一件容易的事情。
本文将介绍一些在声学实验中使用麦克风及声音采集的技巧与要领,以帮助我们获得准确和清晰的声音数据。
一、麦克风选择:在声学实验中,我们通常会遇到不同类型的麦克风,如动圈麦克风、电容麦克风和电磁麦克风等。
选择适合实验需求的麦克风是首要问题。
一般来说,动圈麦克风适用于高声压实验,电容麦克风适用于高灵敏度实验,而电磁麦克风则通常用于磁场测量实验。
根据实验的要求选择合适的麦克风,能够提高声音采集的质量和精度。
二、麦克风位置:麦克风的摆放位置也是影响声音采集的重要因素之一。
一般来说,距离声源越近,采集到的声音越清晰。
在设置麦克风位置时,应尽量避开反射物,以防止混响。
此外,应将麦克风放置在垂直于声源方向的位置,以获得准确的声音采集结果。
三、适当调整麦克风增益和频率响应:在进行声音采集前,可以通过调整麦克风增益和频率响应来获得更好的声音质量。
增益过低会导致采集到的声音过于微弱,而增益过高则会引起失真。
根据实验需求适当调整麦克风增益,确保采集到的声音既不会太弱也不会太大。
频率响应也是影响声音采集质量的重要指标。
不同类型的声音在频率上具有不同的特点,因此需要根据实验需求调整麦克风的频率响应,以确保采集到的声音数据准确无误。
四、采样率与位深选择:采样率与位深也是影响声音采集质量的重要参数。
采样率指的是每秒钟对声音进行采样的次数,位深则代表每个采样点的量化位数。
一般来说,采样率越高,声音采集的质量越好,但同时也会增加数据的存储量。
位深越高,声音的动态范围越广,但同时也会增加采集设备的复杂性和成本。
根据实验需求和设备条件选择适当的采样率和位深,以获得高质量的声音数据。
五、避免干扰源:在声学实验中,干扰源是影响声音采集的常见问题。
干扰源可能来自于电源线、电磁辐射等。
讯飞麦克风阵列声学测试方法
讯飞麦克风阵列声学测试方法Hessen was revised in January 2021讯飞麦克风阵列声学测试方法测试准备环境:混响环境(模拟家庭客厅环境)器材:两个高保真音箱:1个用于播放语音,1个用于播放噪声;音响支架2个:1个用于放置语音播放设备,1个用于放置噪音播放设备;笔记本电脑2个:1个用于播放语音信号和噪声信号,1个用于抓取日志或录音;分贝仪1个:用于噪声、语音信号强度测试,计算信噪比等;卷尺1个:用于测试与设备的距离;语料:唤醒语料:用于测试唤醒率;命令词语料:用于语音识别,测试识别率;本机功放播放音频:回声消除测试使用;家庭环境噪声音频:可播放中央台新闻节目,约30分钟;硬件:讯飞demo板1个裸板1个整机1个软件:IPTV主板软件:可抓日志,准备至少两个串口线。
可录音,可录15分钟以上。
准备两个U盘。
可手动打开/关闭唤醒模式。
可手动设置波束。
核心板固件:准备烧录工具。
唤醒词:跟唤醒词音频一致。
测试环境搭建麦克风阵列测试示意图如下:在安静环境下,放置阵列位于待测区域中间位置,唤醒源位于距阵列1m 处,噪声源位于距阵列处,唤醒源和阵列在一条直线上。
通过高保真音箱播放语料,通过分贝仪在阵列处测试信噪比,要求噪声源、唤醒源在阵列处的响度均为55dB 。
安静环境下和噪声环境下分别测试唤醒率和识别率。
调整唤醒源的位置,距阵列的距离分别为3m 和5m 。
要求唤醒源在阵列处的响度仍为55dB 。
安静环境下和噪声环境下分别进行唤醒率和识别率测试。
测试说明:测试环境因素影响非常大,唤醒源的位置角度调一调,响度校正时测试值的波动也很大。
每次测试都要有对比物,只有同一时间同一环境对比测试的结果才有意义。
唤醒源待测区域麦克风阵列一、声学效果测试1 分别对音箱6麦克整机与音箱裸麦、音箱裸麦与评估板裸麦进行唤醒、声源定位测试测试步骤:a)电脑上打开CoolEdit,准备播放唤醒词语音信号或噪声信号;b)音箱上电后,语音唤醒音箱,确认唤醒功能是否打开,以及唤醒词与语料是否一致。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
讯飞麦克风阵列声学测试
方法
This model paper was revised by the Standardization Office on December 10, 2020
讯飞麦克风阵列声学测试方法
测试准备
环境:
混响环境(模拟家庭客厅环境)
器材:
两个高保真音箱:1个用于播放语音,1个用于播放噪声;
音响支架2个:1个用于放置语音播放设备,1个用于放置噪音播放设备;
笔记本电脑2个:1个用于播放语音信号和噪声信号,1个用于抓取日志或录音;
分贝仪1个:用于噪声、语音信号强度测试,计算信噪比等;
卷尺1个:用于测试与设备的距离;
语料:
唤醒语料:用于测试唤醒率;
命令词语料:用于语音识别,测试识别率;
本机功放播放音频:回声消除测试使用;
家庭环境噪声音频:可播放中央台新闻节目,约30分钟;
硬件:
讯飞demo板1个
裸板1个
整机1个
软件:
IPTV主板软件:
可抓日志,准备至少两个串口线。
可录音,可录15分钟以上。
准备两个U盘。
可手动打开/关闭唤醒模式。
可手动设置波束。
核心板固件:准备烧录工具。
唤醒词:跟唤醒词音频一致。
测试环境搭建
麦克风阵列测试示意图如下:
在安静环境下,放置阵列位于待测区域中间位置,唤醒源位于距阵列1m 处,噪声源位于距阵列处,唤醒源和阵列在一条直线上。
通过高保真音箱播放语料,通过分贝仪在阵列处测试信噪比,要求噪声源、唤醒源在阵列处的响度均为55dB 。
安静环境下和噪声环境下分别测试唤醒率和识别率。
调整唤醒源的位置,距阵列的距离分别为3m 和5m 。
要求唤醒源在阵列处的响度仍为55dB 。
安静环境下和噪声环境下分别进行唤醒率和识别率测试。
测试说明:
测试环境因素影响非常大,唤醒源的位置角度调一调,响度校正时测试值的波动也很大。
每次测试都要有对比物,只有同一时间同一环境对比测试的结果才有意义。
一、声学效果测试
1 分别对音箱6麦克整机与音箱裸麦、音箱裸麦与评估板裸麦进行唤醒、声源定位测试 测试步骤:
唤醒源
待测区域
麦克风阵
a)电脑上打开CoolEdit,准备播放唤醒词语音信号或噪声信号;
b)音箱上电后,语音唤醒音箱,确认唤醒功能是否打开,以及唤醒词与语料是否一致。
可通过串口信息确认:
root@Hi3798MV200:/mnt/sdcard # logcat -v time |grep Hardware
01-01 08:23: D/Hardware( 2508): wakeAngle is 0
c)串口登陆IPTV主板,日志保存为文件并命名清楚,执行以下命令开始抓取唤醒日志:
logcat -c
logcat -v time |grep Hardware
01-01 08:23: D/Hardware( 2508): wakeAngle is 344
d)开始播放唤醒词语音。
语音播放结束后,保存好抓取的日志。
e)通过查找日志中字符串wakeAngle的个数可以得出唤醒率。
2 对音箱6麦克整机与音箱裸麦、音箱裸麦与评估板裸麦进行识别测试
测试步骤:
a)电脑上打开CoolEdit,准备播放唤醒词语音信号或噪声信号;
b)音箱上电后,加噪场景下需要手动把唤醒模式关闭,再设置波束定位0号MIC。
c)串口登陆IPTV主板,执行以下命令开始录音,语料播放结束停止并保存录音。
alsa_aplay -C -D hw:0,0 -r 16000 -c 1 -f S16_LE /mnt/sdcard/
d)采集到的录音数据需要发给讯飞,在服务器上进行语音识别。
二、回声消除效果测试
对音箱整机进行回声消除效果测试,在信噪比为(0dB,-5dB,-15dB,-25dB)环境下进行唤醒及识别测试。
信噪比0dB是指唤醒源55dB与自身噪声信号55dB之比。
也就是把音箱自身响度分为四挡:55、60、70、80dB。
调整音箱自身响度为55dB,进行唤醒及识别测试;
调整音箱自身响度为60dB,进行唤醒及识别测试;
调整音箱自身响度为70dB,进行唤醒及识别测试;
调整音箱自身响度为80dB,进行唤醒及识别测试;
测试说明:只在1m距离不加噪环境下测试。
三、测试雷区
1 录音文件有数据,音箱播放没有声音。
检查音箱是否静音;检查音箱是否唤醒;
2加噪声场景下测试识别率,录音文件后半部分,命令词听不清楚,噪声很大。
加噪场景下,音箱可能存在误唤醒,会将波束定位至噪音方向,导致命令词声音被抑制,噪声被增强。
所以,加噪场景下可以把唤醒模式关闭,再设置波束。
这样可以排除误唤醒的影响,只看降噪效果。
需要手动关闭唤醒功能,并设置波束定位至0号MIC。
注意,关闭唤醒功能掉电后失效。