语音识别技术在3D虚拟智能家居系统中的应用研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
语 音 本 身 的 特 征 变 化 非 常 丰 富 ,同 一 个 人 连 续 两 次 发 同 一 个 音 时 ,都 会 存 在 持 续 时 长 和 语 气 轻 重 的 不 同 变化,不同的人发出的语音更是千差 万 别。因 此 在 构 建 语 音 识 别 模 型 时,对 语 音 识 别 的 算 法 设 计 是 非 常 重 要的。
收 稿 日 期 :20190307 基金项目:2016年度山西省高等学校科技创新项目 (20161123) 作者简介:卫敏(1979-),女,山 西 沁 水 人,山 西 职 业 技 术 学 院 计 算 机 工 程 系 讲 师,硕 士,研 究 方 向:虚 拟 现 实。Email:
87704294@qq.com。
2 语音识别技术
21 原 理 语音识别技术简单来说就是将语音转换成对应文字的 一种 技术,它主 要由 声学 模 型 与 语 言 模 型 两 部 分
构成,前者用于解决语音的发声特性识别问题,后者 用 于 描 述 语 言 的 用 词 习 惯,并 对 其 进 行 区 分 。 [2] 其 功 能 模型的一般结构如图1所示。
1 3D 虚拟智能家居系统概述
本研究项目依托3D 虚拟平台尝试 开 发 了 一 个 智 能 家 居 的 交 互 模 拟 系 统,其 目 的 是 通 过 三 维 虚 拟 仿 真 技术对智能家居交互系统的演示效果进行模拟。虚拟智 能家 居系 统主 要提 供了 两种 交 互 方 式,一 种 是 通 过 移动终端的触摸屏操作实现人机交互,一种是通过语 音 识 别 进 行 人 机 交 互 。 [1] 采 用 设 备 操 作 的 方 式 进 行 人 机 交 互 ,用 户 需 要 花 费 时 间 在 设 备 上 进 行 浏 览 、选 择 和 点 击 等 操 作 ,如 果 界 面 设 计 功 能 较 多 的 话 ,人 们 还 需 要 再对界面进行学习和了解。而语音识别的交互方式极大 地简 化了 系统 的操 作步 骤,用 户 可 以 直 接 通 过 语 音 发 布 指 令 ,脱 离 了 对 设 备 操 作 的 依 赖 性 。
— 74 —
太 原 学 院 学 报 (自 然 科 学 版 )
第 37 卷
图 1 语 音 识 别 系 统 功 能 结 构 图 Fig.1 Functionalstructurediagramofspeechrecognitionsystem
22 语 音 识 别 算 法 语音识别技术中比较具有代表性的算法有动态特征值规整算法、隐马尔可夫算法和神经网络模型等 。 [3] 非 线 性 的 动 态 特 征 值 规 整 算 法 ,简 单 来 说 就 是 将 输 入 的 语 音 信 号 基 于 时 间 轴 进 行 弯 曲 调 整 ,目 的 是 要 将
基于统计模型的隐马尔可夫算法,其统计模型的构建,主要 由状 态序 列与 观 察 序 列 两 组 识 别 基 元 组 成。 为了能够适应各类突发情况,两组识别 基 元 可 实 现 连 续 和 离 散 两 种 状 态 下 的 特 征 参 数 分 析,并 在 识 别 过 程 中 ,持 续 将 新 的 识 别 结 果 加 入 到 统 计 模 型 当 中 进 行 学 习 。 随 着 统 计 模 型 的 不 断 扩 充 ,该 算 法 能 够 高 效 地 模 拟 出 人 类 通 过 大 脑 对 语 法 和 语 言 需 要 的 分 析 所 产 生 的 音 素 流 ,使 其 变 为 一 个 可 观 测 的 时 变 序 列 ,由 此 可 以 快 速 准 确 获 取 其 状 态 序 列 ,并 进 行 识 别 。 由 于 统 计 模 型 中 能 够 不 断 通 过 学 习 获 取 到 不 同 的 特 征 参 考 序 列 ,因 此 该 算 法 可 以 对 各 类 语 音 特 征 进 行 准 确 识 别 ,具 有 极 高 的 识 别 性 与 抗 噪 性 。
其特征值曲线与算法内置的特征模 板 尽 可 能 地 进 行 匹 配。 这 种 匹 配 不 仅 是 基 于 时 长 的,还 包 括 距 离 测 度。 将语音信号中获取的特征值与特征模 板 中 特 征 值 视 作 两 个 矢 量,不 断 进 行 最 小 距 离 的 测 算 (可 采 用 路 径 算 法 ),以 达 到 距 离 上 的 匹 配 ,最 终 获 取 的 最 小 距 离 所 对 应 的 语 音 即 为 识 别 结 果 。 由 于 语 音 时 长 的 不 均 匀 ,输 入 的语音特征与模型特征的比对就会出 现 较 大 误 差;采 用 该 算 法 能 够 较 好 地 解 决 这 一 问 题,但 其 算 法 过 于 简 单 ,未 引 入 统 计 模 型 对 特 征 值 进 行 连 续 的 记 忆 和 分 析 ,在 连 续 发 音 情 境 下 识 别 准 确 度 较 差 。
第37卷 第3期 Vol.37 No.3 2019年9月 太原学院学报(自然科学版) Sep.2019
语音识别技术在3D 虚拟智能 家居系统中的应用研究
卫 敏
(山西职业技术学院 计算机工程系Байду номын сангаас山西 太原 030006)
摘 要:针对语音识别技术在3D 虚拟智能家居系统中的应用展开研 究,以 隐 马 尔 可 夫 算 法 为 核心设计了孤立词语音识别策略和噪声预处理改进策略,并在此基础上 构 建 语 音 交 互 服 务 系 统,实 现了虚拟智能家居的语音交互功能。
关键词:3D 虚拟;智能家居;语音识别;隐马尔可夫算法 中 图 分 类 号 :TP31 文 献 标 识 码 :A 文 章 编 号 :2096191X(2019)03007405 犇犗犐:10.14152/j.cnki.2096191X.2019.03.015
目前主流的3D 开发平台都未集成 语 音 识 别 功 能。为 了 满 足 虚 拟 智 能 家 居 的 语 音 交 互 需 求,本 文 尝 试 对 基 于 隐 马 尔 可 夫 算 法 的 语 音 识 别 策 略 进 行 了 改 进 ,并 应 用 在 了 虚 拟 智 能 家 居 交 互 系 统 当 中 。
相关文档
最新文档