麦克风阵列语音识别方案_木瓜电子
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
可配置7/8、11/12、15/16路麦克风阵列输入
麦克风组合阵型灵活多种
可组合圆型、方型、线型等不同的阵列形状
音频数据传输方式灵活多种
可选择WiFi、ETH和USB接云端进行语音识别
高性能单芯片处理
单芯片2000MIPS速度,处理算法,通讯接口、命令控制
软件功能
多通道回声消除
消除设备本身发出的音频回声干扰
远场条件下纯自然声音操控方式 语音唤醒、语音操作、语音交互
快速直达您想看的频道或节目 语音搜索电影、电视节目等内容
应用场景举例——智能电视
麦克风阵列效果
小牧,央视一台
回声消除
噪声抑制 小牧,央视一台
电视回声,环境噪声消除 语音唤醒,定位目标声音,提高指向性
远场拾音,增益目标声源 多目标声源定位和波束形成,聚焦和增益多声源
xCORE logical core
xCORE logical core
xCORE logical core
xCORE logical core xCORE logical core
OTP
USB 2.0
SRAM USB 2.0 RGMII
xTIME scheduler
xCORE logical core SRAM
智能电视
智能家居
安防控制
应用场景举例——智能电视
传统方案
复杂的TV频道选项系统 不智能的遥控器界面操作 需要长时间繁琐操作才能完成搜索 操作,基本个别产品使用语音遥控 器,也深受操作方式不自然、遥控 器电量消耗过快等因素的困扰
难用的节目内容搜索方式
应用场景举例——智能电视
麦克风阵列方案
小牧,我要看央视一台
OTP
FLASH
SRAM
与传统方案对比
其他的方案 我们的方案
PDM/IIS PDM/IIS PDM/IIS PDM/IIS PDM/IIS PDM/IIS PDM/IIS PDM/IIS
ARM ETH
+
IIS
DSP IIS
AMP + ADC
WIFI ETH USB
XMOS
传统MCU麦克风数量4个为极限
xTIME scheduler
32个1bit端口任意配置组合的串行时序 4bit,8bit,16bit,32bit端口配置并行端口
xCONNECT switch
PLL
xCONNECT switch
xCORE logical core
xCORE logical core
快速通讯
xCORE logical core xCORE logical 单芯片可以实现16个核心 每个核并行运行,16核累加速度为2000MIPS
I/O pins Hardware Response Ports
灵活引脚
Hardware Response Ports
xCORE logical core xCORE logical core xCORE logical core xCORE logical core
c
xCORE logical core xCORE logical core
JTAG RGMII
每个核心之间的通讯通过通道通讯 通道通讯可以单指令、高实时完成传输 512KB RAM,每个核共同使用 USB PHY,集成USB 2.0收发器 千兆以太网控制器 20个timer,用于延时、中断、时序
无法准确定位声源和接口单一 ARM+DSP加长开发流程和成本增加
实现可达16个PDM/I2S数字麦克风接口 麦克风阵列定位和跟踪说话人位置 多种DSP音频处理算法,远场拾音,噪音回音 消除,获取纯净声源 单芯片处理,可固化高性能音频处理算法, 减短软硬件设计周期、降低硬件成本
硬件功能
麦克风阵元数量灵活多种
应用场景举例——会议系统
方案对比
传统的多个节点麦克风
可以自动聚焦单个或者多个目标音源 消除噪音、回声和背景声等干扰声音 定位和增益发言人声音,转录成文字 声源分离和说话人识别,可身份识别
需要手动操作及繁冗的安装
使用不方便,发言人声音参杂
应用场景举例——家庭管家
声控玩游戏
声控播放
家庭管家 聊天 声音识别操控家电 用声音聊天、播放音乐、玩游戏 声控调温
多声源定位
给出多个目标说话人的方位信息
波束形成
将录音波束聚焦至目标说话人方位,抑制其他方位的声音
声源分离
对同时出现的多个声源进行分离,分别进行语音识别
多通道语音增强
将多路信息组合为一路信号,抑制环境噪声、增强语音信号
语音唤醒/打断
通过呼唤“名字”开启交互过程
应用场景
会议讨论系统 车载系统 游戏娱乐
IIS/ PDM IIS
本地离线方案
XMOS MCU
IIS/ PDM
IIS
多个数字或者模拟麦克风
多个数字或者模拟麦克风
灵活多种麦克风的阵元,精度更高
多种阵列阵型,灵活适应产品结构 单处理器解决,简洁的硬件和降成
可选云端联网,本地离线方式
主控资源介绍
xCORE logical core
麦克风阵列
语音识别
麦克风阵列具有优异的拾音性能
就知道是你的声音
在混响的环境 在5米远的距离
在嘈杂的人群
利用多路麦克风阵列,使用先进的声音处理算法技术 解决复杂声学下的远场拾音问题,让声音更加纯净
麦克风阵列方案框架
云端联网方案
云服务器 语音识别系统 FLASH ET H US Wi B Fi XMOS MCU
麦克风组合阵型灵活多种
可组合圆型、方型、线型等不同的阵列形状
音频数据传输方式灵活多种
可选择WiFi、ETH和USB接云端进行语音识别
高性能单芯片处理
单芯片2000MIPS速度,处理算法,通讯接口、命令控制
软件功能
多通道回声消除
消除设备本身发出的音频回声干扰
远场条件下纯自然声音操控方式 语音唤醒、语音操作、语音交互
快速直达您想看的频道或节目 语音搜索电影、电视节目等内容
应用场景举例——智能电视
麦克风阵列效果
小牧,央视一台
回声消除
噪声抑制 小牧,央视一台
电视回声,环境噪声消除 语音唤醒,定位目标声音,提高指向性
远场拾音,增益目标声源 多目标声源定位和波束形成,聚焦和增益多声源
xCORE logical core
xCORE logical core
xCORE logical core
xCORE logical core xCORE logical core
OTP
USB 2.0
SRAM USB 2.0 RGMII
xTIME scheduler
xCORE logical core SRAM
智能电视
智能家居
安防控制
应用场景举例——智能电视
传统方案
复杂的TV频道选项系统 不智能的遥控器界面操作 需要长时间繁琐操作才能完成搜索 操作,基本个别产品使用语音遥控 器,也深受操作方式不自然、遥控 器电量消耗过快等因素的困扰
难用的节目内容搜索方式
应用场景举例——智能电视
麦克风阵列方案
小牧,我要看央视一台
OTP
FLASH
SRAM
与传统方案对比
其他的方案 我们的方案
PDM/IIS PDM/IIS PDM/IIS PDM/IIS PDM/IIS PDM/IIS PDM/IIS PDM/IIS
ARM ETH
+
IIS
DSP IIS
AMP + ADC
WIFI ETH USB
XMOS
传统MCU麦克风数量4个为极限
xTIME scheduler
32个1bit端口任意配置组合的串行时序 4bit,8bit,16bit,32bit端口配置并行端口
xCONNECT switch
PLL
xCONNECT switch
xCORE logical core
xCORE logical core
快速通讯
xCORE logical core xCORE logical 单芯片可以实现16个核心 每个核并行运行,16核累加速度为2000MIPS
I/O pins Hardware Response Ports
灵活引脚
Hardware Response Ports
xCORE logical core xCORE logical core xCORE logical core xCORE logical core
c
xCORE logical core xCORE logical core
JTAG RGMII
每个核心之间的通讯通过通道通讯 通道通讯可以单指令、高实时完成传输 512KB RAM,每个核共同使用 USB PHY,集成USB 2.0收发器 千兆以太网控制器 20个timer,用于延时、中断、时序
无法准确定位声源和接口单一 ARM+DSP加长开发流程和成本增加
实现可达16个PDM/I2S数字麦克风接口 麦克风阵列定位和跟踪说话人位置 多种DSP音频处理算法,远场拾音,噪音回音 消除,获取纯净声源 单芯片处理,可固化高性能音频处理算法, 减短软硬件设计周期、降低硬件成本
硬件功能
麦克风阵元数量灵活多种
应用场景举例——会议系统
方案对比
传统的多个节点麦克风
可以自动聚焦单个或者多个目标音源 消除噪音、回声和背景声等干扰声音 定位和增益发言人声音,转录成文字 声源分离和说话人识别,可身份识别
需要手动操作及繁冗的安装
使用不方便,发言人声音参杂
应用场景举例——家庭管家
声控玩游戏
声控播放
家庭管家 聊天 声音识别操控家电 用声音聊天、播放音乐、玩游戏 声控调温
多声源定位
给出多个目标说话人的方位信息
波束形成
将录音波束聚焦至目标说话人方位,抑制其他方位的声音
声源分离
对同时出现的多个声源进行分离,分别进行语音识别
多通道语音增强
将多路信息组合为一路信号,抑制环境噪声、增强语音信号
语音唤醒/打断
通过呼唤“名字”开启交互过程
应用场景
会议讨论系统 车载系统 游戏娱乐
IIS/ PDM IIS
本地离线方案
XMOS MCU
IIS/ PDM
IIS
多个数字或者模拟麦克风
多个数字或者模拟麦克风
灵活多种麦克风的阵元,精度更高
多种阵列阵型,灵活适应产品结构 单处理器解决,简洁的硬件和降成
可选云端联网,本地离线方式
主控资源介绍
xCORE logical core
麦克风阵列
语音识别
麦克风阵列具有优异的拾音性能
就知道是你的声音
在混响的环境 在5米远的距离
在嘈杂的人群
利用多路麦克风阵列,使用先进的声音处理算法技术 解决复杂声学下的远场拾音问题,让声音更加纯净
麦克风阵列方案框架
云端联网方案
云服务器 语音识别系统 FLASH ET H US Wi B Fi XMOS MCU