基于深度学习的语音识别技术研究及其在空调上的应用

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Articles 论文
基于深度学习的语音识别技术研究及其在 空调上的应用
Research on speech recognition technology based on deep learning and its application in air conditioning
毛跃辉 MAOYuehui
本文针对人工智能领域开展语音识别技术研究,采 用前端双麦克风阵列技术,通过独有的低功耗唤醒和 识别双引擎技术、基于混合深度学习模型的语音识别算 法、融合自适应远场降噪技术等,抑制环境噪声并进行
人声增益、声源定位和波速形成,能远场唤醒,实现高准 确率远场识别、离线在线混合识别和强可靠性运作。
1语音识別原理Βιβλιοθήκη Baidu绍
率同时降低工作功耗;误唤醒测试:安静环境下,测试时 长168小时,误唤醒0次;噪声环境下,测试时长72小时, 误唤醒0次。
2.2语音识别关键技术设计研究 2.2.1关键技术点1:超低功耗独立唤醒引擎加高质
量识别双引擎技术研究 空调待机情况下,语音控制系统实时处于待唤醒状
54家电科技
Articles 论文
DOI:10.19784/j.cnki.issn 1672-0172.2019.04.004
如果您对本文内容感兴趣 请联系作者毛跃辉 happy200521 @163. com
随着人工智能技术的逐渐成熟,“语音识别”将是人 与机器最自然的交互方式,语音控制的空调产品化,将 有助于提升空调产品的竞争力,形成技术制高点,领先市 场竞品。
次的要求。表1为超低功耗唤醒引擎和普通唤醒引擎的性 能对比,超低功耗独立唤醒引擎技术同时有保持与普通
唤醒引擎几乎一样的唤醒率和误唤醒频次指标,通过在
相应机型上测试,成功唤醒率达93%以上;安静环境下, 测试时长168小时,误唤醒出现0次;噪声环境下,测试时 长72小时,误唤醒出现0次;其次,极低资源占用,最小应 用场景下(ROM+RAM) <150KBo
态,麦克风不断采集声音,识别引擎不断从连续音频中捕 获唤醒词,要求嵌入式系统本身处于运行甚至是高负荷 运行状态,为解决语音唤醒时空调低功耗问题,自主研发 “双引擎模式”,即独立的轻量化唤醒引擎加唤醒后高质 量识别引擎结合。超低功耗独立唤醒引擎技术应用,对 本地资源的要求远远低于普通的唤醒引擎,在确保其极 低的系统开销下,能够达到语音高唤醒率、低误唤醒频
语音识别主要作用就是把一段语音信号转换成相对 应的文本信息,该系统主要由声学特征提取、语言模型、 声学模型和解码器等组成。训练识别的过程是从原始波 形语音数据中提取声学特征,经过训练得到声学模型与 发声词典、语言模型组成网络,对新来的语音提取特征, 经过声学模型表示,通过解码得出识别结果,语音识别
基本原理如图1。
2空调语音识别系统主要性能指标及关键 技术设计
2.1空调语音系统主要性能指标 (1) 釆用深度定制的Linux系统,满足GB/T 2871-
2011嵌入式软件可靠性测试方法标准,达到工业级的稳 定性和可靠性要求;
(2) 釆用深度学习识别引擎技术,远场识别率达 95%以上,识别响应时间小:
(3) 采用超低功耗独立唤醒引擎技术,保证高唤醒
唤醒率计算方式为唤醒成功次数/总尝试次数,单 位为%;误唤醒衡量方式为给定时间内出现误唤醒的次 数,单位为次/小时。由图2可知,唤醒率与误唤醒频次存 在正比例关系,提高唤醒率的同时误唤醒频次也会相应 增高。采用该独立唤醒引擎,唤醒率和误唤醒频次保持了 非常好的平衡,在倾向于误唤醒频次处于极低水平的时 候(坐标图的左下角),唤醒率依然保持在较高水准(唤 醒率93%左右),该引擎虽然只有极低的资源消耗,但性 能可以满足实际应用高唤醒率的要求。
珠海格力电器股份有限公司 广东珠海519070 Gree Electric Appliances Inc. of Zhuhai Zhuhai 519070
摘要 针对人工智能领域开展语音识别技术研究及空调应用开发,釆用麦克风阵列技术,通过独 有的低功耗唤醒和识别双引擎技术、基于混合深度学习模型的语音识别算法、融合自适应 远场降噪技术等,抑制环境噪声并进行人声增益、声源定位和波速形成,实现高准确率远 场语音识别和强可靠性运作。 关键词
识别;双引擎模式;自送血降噪;空调误识别抑制:空调血甬
Abstract In view of the research and application development of speech recognition technology in the field of artificial intelligence, dual microphone array technology is adopted to suppress environmental noise and carry out human voice through unique low power wake-up and recognition dual engine technology, speech recognition algorithm based on mixed depth learning model, fusion adaptive far field noise reduction technique and so on. Gain, acoustic source localization and wave velocity formation are used to achieve high accuracy far-field speech recognition and strong reliability operation. Keywords Speech recognition; Dual engine mode; Adaptive noise reduction; Air conditioning false identification suppression; Air conditioning applications
相关文档
最新文档