语音识别技术的发展
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一
都 具 有 了相 当 高 的 汉 语 语 音 识 别 水 平 。 进入2 1 世 纪 , 随着 消 费类 电子 产 品 的 普 及 , 嵌 入 式 语 音 处 理 技 术 发 展 迅 速 。 基 于 语音 识别 芯片 的嵌 入式 产 品也越来 越 多, 如S e n s o r y 公 司 的R S C 系列 语 音 识 别芯 片 、 I n f i n e o n 公 司 的U n i s p e e c h 和U n i l i t e 语 音 芯 片 等 ,这 些 芯 片 在 嵌入 式 硬 件 开 发 中 得 到 了广 泛 的应 用 。在 软件 上 , 目前 比较 成 功 的 语 音 识 别 软 件 有 :N u a n c e 、I B M 的V i a v o i c e 和M i c r o s o f t 的S A P I 以及 开 源 软 件 H T K ,这 些 软 件 都 是 面 向 非 特 定 人 、 大 词 汇 量 的 连 续 语 音 识别 系统 。 三 、语 音识 别技 术 的发 展 现状 语 音 识 别 技 术 通 过 全 球 科 学 家 的 共 同 努 力 , 经 历 半 个 多 世 纪 的 研 究 , 目前 已 经 发 展 到 了 接 近 实 用 的 阶 段 。 在 实 验 室 环 境 下 , 大 词汇 量 的 朗读式 连续 说话 的宽 带语音 信号 的 平 均 识别 率 可 以达 到 9 0 %以 上 。 正 式 有 了 如 此 高 的 识 别 率 之 后 , 语 音 识 别 技 术 慢 慢 地 从 实验 室演示 系统逐 步走 向实用化商 品。以I B M V i a v 0 i c e 和D r a g o n D i c t a t i o n 为 代 表 的 两 个 听写机 系统 的 出现 ,使 “ 语 音 识 别 ” 逐 步 进 入大 众视线 ,引起 了广泛 的社会关注 。 由 于 校 对 和 更 正 识 别 的 错 误 很 麻 烦 和 浪 费时 间 ,这样 便 降低语 音识别 的优 势 。同 时 , 由 于 使 用 的 环 境 或 讲 话 口 音 习惯 等 因 素 的影 响,语 音识 别 的 内容 大大 降低 ,识 别的 内容不 能达 到 l 0 0 % 的 正 确 ,所 以很 多 人 认 为 目前 的 语 音 识 别 系 统 还 无 法 满 足 实 用 要 求 。 是 通 常 人 们 所 说 的 以说 话 的 内容 作 为 识 别 对 目前 ,A T & T 和M I T 等将 语 音 识 别 技 术 应 用 象 的技术 ,它是4 个方面 中最重要 和研 究最广 在 一 些 有 限 词 汇 的 特 定 任 务 上 , 如 电话 自动 转 泛 的一 个 方 向 , 也 是 本 文 讨 论 的主 要 内容 。 接 、 电话 查 询 、数 字 串 识 别 的 任 务 中 , 当 讲 话 二 、语 音 识别 的 研究 历 史 的 内容 是 系 统 所 存 储 的 内容 存 在 的 ,且 使 用 环 语音识别的研究工作始于2 0 世纪5 0 年 境 的 声 学特 性 与 训 练 数 据 的 声 学 特 性 相 差 不 太 代 ,1 9 5 2 年B e l 1 实 验室开 发的A u d r y 系统是 第 大 时 ,语 音 识 别 的 正 确 识 别 率 可 以接 近 1 0 0 % 。 但 是 ,在 实 际 使 用 中 如 果 这 些 条 件 被 破 坏 ,则 个 可 以识别 1 O 个英文数字的语音识别系统 。 1 9 5 9 年 ,R o r g i e 和F o r g e 采 用 数 字 计 算 会 对 识 别 系 统 造 成 一 定 的 影 响 。 机 识 别 英 文 元 音 和 孤 立 词 , 从 此 开 始 了 计 我 国 的 语 音 识 别 研 究 一 直 紧 跟 国 际 水 算 机 语 音识 别 。 平 , 国 家 也 很 重 视 国 内 中 科 院 的 自 动 化 6 0 年代 ,苏联的M a t i n 等 提 出 了 语 音 所 、 声 学 所 以及 清 华 大 学 等 科 研 机 构 和 高 校 结 束 点 的 端 点 检 测 , 使 语 音 识 别 水 平 明 显 都 在 从 事 语 音 识 别 领 域 的 研 究 和 开 发 。 国 家 上 升 ; vi n t s y u k 提 出了 动 态 编 程 , 这 一提 8 6 3 智 能计 算 机专 家 组 为语 音 识别 技术 研 究 法 在 以后 的 识别 中不 可或 缺 。6 0 年 代末 、 专 门立 项 , 并 取 得 了 高 水 平 的科 研 成 果 。 我 7 O 年 代 初 的 重 要 成 果 是 提 出 了 信 号 线 性 预 国 中 科 院 自 动 化 所 研 制 的 非 特 定 人 、 连 续 语 测编码 ( L P C ) 技术和动态时间规整 ( D T W ) 技 音 听 写 系 统 和 汉 语 语 音 人 机 对 话 系 统 , 其 准 0 % 以上 。 术 , 有 效 地 解 决 了 语 音 信 号 的 特 征 提 取 和 确 率 和 系 统 响 应 率 均 可 达 9 不 等 长 语 音 匹 配 问 题 ; 同 时 提 出 了 矢 量 量 四 、语 音识 别 技 术发 展趋 势 化( V Q ) 和隐 马 尔可 夫模 型 ( H M M ) 理论 。 语 音 作 为 当 前 通 信 系 统 中 最 自 然 的 通 信 8 O 年代 语音 识别研 究进 一 步走 向深入 : 媒 介 , 语 音 识 别 技 术 是 非 常 重 要 的 人 机 交 互 H M M 模 型和 人工 神经 网络 ( A N N ) 在 语 音 识 别 中 技 术 。 随 着 计 算 机 和 语 音 处 理 技 术 的 发 展 , 成 功应用 。t 9 8 8  ̄ ,F U L E E K a i 等用V Q / I — I 删 语 音 识 别 系 统 的 实 用 性 将 进 一 步 提 高 。 应 用 方 法实现 了9 9 7 个 词汇 的非特定人 连续语 音识 语 音 的 自动 理解 和翻 译 ,可消 除人 类相 互交 别 系统S P H I N X 。这 是 世 界 上 第 1 个 高 性 能 的 非 往 的 语 言 障 碍 。 国外 已有 多 种 基 于 语 音 识 别 特 定人、大词汇 量、连续语音识 别系统 。 产 品 的 应 用 ,如 声 控 拨 号 电话 、 语 音 记 事 本 进入9 0 年 代 后 , 语 音 识 别 技 术 进 一 步 等 ,基 于 特 定 任 务 和 环 境 的 听 写 机 也 已 经 进 成 熟 , 并 开 始 向 市 场 提 供 产 品 。 许 多 发 达 入 应 用 阶 段 这 预 示 着 语 音 识 别 技 术 有 着 非 国家如 美 国、 日本 、韩 国以及 I B M 、A p p l e 、 常广泛 的应 用领 域和 市场 前景 。随 着语 音技 A T & a m p ;T 、M i c r o s o f t 等 公 司 都 为 语 音 识 别 术 的 进 步 和 通 信 技 术 的 飞 速 发 展 , 语 音 识 别 系 统 的 实 用 化 开 发 研 究 投 以 巨 资 。 同 时 汉 技 术 将 为 网 上 会 议 、 商 业 管 理 、 医 药 卫 生 、 语 语 音 识别 也 越 来越 受 到重 视 。I B M 开 发 的 教 育培 训等 各个 领域 带来 极大 的便 利 ,其 应 V i a V o i c e 和M i c r o s o f t 开 发 的 中 文 识 别 引 擎 用 和 经 济 、 社 会 效 益 前 景 非 常 良好 .
语 音 识 别 是 一 门交 叉 学 科 。语 音 识 别 研 究经 历 了5 O 多年 的研 究历 程 ,经 过 5 O多 年 的积 累研 究 ,获 得 了 巨大 的进 展 。特 别 是近2 0 年 来 , 语 音 识 别 技 术取 得 了 显着 的 进 步 , 并 逐 步 的 走 向 市 场 。 在 未 来 的 日子 里 ,语 音 识 别技 术将 应 用更 为 广泛 。 语 音识 别 技 术概 述 语 音识 别是解 决机 器 “ 听 懂 ” 人 类 语 言 的一项 技术 。作 为 智能计 算机 研 究的主 导 方 向和人 机语 音 通信 的关键 技术 ,语音 识别 技 术 一直 受到 各 国科 学界 的广泛 关注 。如今 , 随 着语 音识 别 技术研 究 的突破 ,其 对计 算机 发 展 和 社 会 生 活 的 重 要 性 日 益 凸现 出 来 。 以 语 音识 别技 术 开发 出的产 品应 用领 域 非常 广 泛 ,如 声控 电话交 换、信 息 网络 查询 、家庭 服 务 、宾馆 服 务 、医疗 服务 、银 行服 务 、工 业 控制 、语 音 通信 系统 等 ,几乎 深入 到社 会 的每个行 业和每个 方面 。 广 泛 意 义 上 的 语 音 识 别 按 照任 务 的 不 同 可 以分 为4 个 方 向 :说 话 人识 别 、 关键 词 检 出 、语 言 辨 识 和 语 音 识 别 。说 话 人 识 别技 术 是 以话 音 对 说 话 人 进 行 区别 ,从 而 进 行 身份 鉴 别 和 认证 的 技 术 。 关 键 词 检 出技 术 应 用 于 一 些 具 有 特 定 要 求 的 场 合 , 只 关 注 那 些 包 含 特 定 词 的 句子 ,例 如对 一些特殊人名 、地名 的电话 监听 等 。语 言辨 识技 术是 通过 分析 处 理一 个语 音 片 断 以 判 别 其 所 属 语 言 种 类 的 技 术 ,本 质 上 也 是 语 音 识 别 技 术 的 一 个 方 面 。语 音 识 别 就
投稿邮箱:w a n o u i e z z s @l 6 3 . c o m
信
王致 信 胡 文 东 中共青 岛市黄 岛 区委党 校
【 摘 要】语 音识别技术研究让人更加方便地享受到更 多的社会信息资源和现代化服务,对任何事都能够通过语音交互的方式。 【 关键词】语音识别技术 ;发展趋势
都 具 有 了相 当 高 的 汉 语 语 音 识 别 水 平 。 进入2 1 世 纪 , 随着 消 费类 电子 产 品 的 普 及 , 嵌 入 式 语 音 处 理 技 术 发 展 迅 速 。 基 于 语音 识别 芯片 的嵌 入式 产 品也越来 越 多, 如S e n s o r y 公 司 的R S C 系列 语 音 识 别芯 片 、 I n f i n e o n 公 司 的U n i s p e e c h 和U n i l i t e 语 音 芯 片 等 ,这 些 芯 片 在 嵌入 式 硬 件 开 发 中 得 到 了广 泛 的应 用 。在 软件 上 , 目前 比较 成 功 的 语 音 识 别 软 件 有 :N u a n c e 、I B M 的V i a v o i c e 和M i c r o s o f t 的S A P I 以及 开 源 软 件 H T K ,这 些 软 件 都 是 面 向 非 特 定 人 、 大 词 汇 量 的 连 续 语 音 识别 系统 。 三 、语 音识 别技 术 的发 展 现状 语 音 识 别 技 术 通 过 全 球 科 学 家 的 共 同 努 力 , 经 历 半 个 多 世 纪 的 研 究 , 目前 已 经 发 展 到 了 接 近 实 用 的 阶 段 。 在 实 验 室 环 境 下 , 大 词汇 量 的 朗读式 连续 说话 的宽 带语音 信号 的 平 均 识别 率 可 以达 到 9 0 %以 上 。 正 式 有 了 如 此 高 的 识 别 率 之 后 , 语 音 识 别 技 术 慢 慢 地 从 实验 室演示 系统逐 步走 向实用化商 品。以I B M V i a v 0 i c e 和D r a g o n D i c t a t i o n 为 代 表 的 两 个 听写机 系统 的 出现 ,使 “ 语 音 识 别 ” 逐 步 进 入大 众视线 ,引起 了广泛 的社会关注 。 由 于 校 对 和 更 正 识 别 的 错 误 很 麻 烦 和 浪 费时 间 ,这样 便 降低语 音识别 的优 势 。同 时 , 由 于 使 用 的 环 境 或 讲 话 口 音 习惯 等 因 素 的影 响,语 音识 别 的 内容 大大 降低 ,识 别的 内容不 能达 到 l 0 0 % 的 正 确 ,所 以很 多 人 认 为 目前 的 语 音 识 别 系 统 还 无 法 满 足 实 用 要 求 。 是 通 常 人 们 所 说 的 以说 话 的 内容 作 为 识 别 对 目前 ,A T & T 和M I T 等将 语 音 识 别 技 术 应 用 象 的技术 ,它是4 个方面 中最重要 和研 究最广 在 一 些 有 限 词 汇 的 特 定 任 务 上 , 如 电话 自动 转 泛 的一 个 方 向 , 也 是 本 文 讨 论 的主 要 内容 。 接 、 电话 查 询 、数 字 串 识 别 的 任 务 中 , 当 讲 话 二 、语 音 识别 的 研究 历 史 的 内容 是 系 统 所 存 储 的 内容 存 在 的 ,且 使 用 环 语音识别的研究工作始于2 0 世纪5 0 年 境 的 声 学特 性 与 训 练 数 据 的 声 学 特 性 相 差 不 太 代 ,1 9 5 2 年B e l 1 实 验室开 发的A u d r y 系统是 第 大 时 ,语 音 识 别 的 正 确 识 别 率 可 以接 近 1 0 0 % 。 但 是 ,在 实 际 使 用 中 如 果 这 些 条 件 被 破 坏 ,则 个 可 以识别 1 O 个英文数字的语音识别系统 。 1 9 5 9 年 ,R o r g i e 和F o r g e 采 用 数 字 计 算 会 对 识 别 系 统 造 成 一 定 的 影 响 。 机 识 别 英 文 元 音 和 孤 立 词 , 从 此 开 始 了 计 我 国 的 语 音 识 别 研 究 一 直 紧 跟 国 际 水 算 机 语 音识 别 。 平 , 国 家 也 很 重 视 国 内 中 科 院 的 自 动 化 6 0 年代 ,苏联的M a t i n 等 提 出 了 语 音 所 、 声 学 所 以及 清 华 大 学 等 科 研 机 构 和 高 校 结 束 点 的 端 点 检 测 , 使 语 音 识 别 水 平 明 显 都 在 从 事 语 音 识 别 领 域 的 研 究 和 开 发 。 国 家 上 升 ; vi n t s y u k 提 出了 动 态 编 程 , 这 一提 8 6 3 智 能计 算 机专 家 组 为语 音 识别 技术 研 究 法 在 以后 的 识别 中不 可或 缺 。6 0 年 代末 、 专 门立 项 , 并 取 得 了 高 水 平 的科 研 成 果 。 我 7 O 年 代 初 的 重 要 成 果 是 提 出 了 信 号 线 性 预 国 中 科 院 自 动 化 所 研 制 的 非 特 定 人 、 连 续 语 测编码 ( L P C ) 技术和动态时间规整 ( D T W ) 技 音 听 写 系 统 和 汉 语 语 音 人 机 对 话 系 统 , 其 准 0 % 以上 。 术 , 有 效 地 解 决 了 语 音 信 号 的 特 征 提 取 和 确 率 和 系 统 响 应 率 均 可 达 9 不 等 长 语 音 匹 配 问 题 ; 同 时 提 出 了 矢 量 量 四 、语 音识 别 技 术发 展趋 势 化( V Q ) 和隐 马 尔可 夫模 型 ( H M M ) 理论 。 语 音 作 为 当 前 通 信 系 统 中 最 自 然 的 通 信 8 O 年代 语音 识别研 究进 一 步走 向深入 : 媒 介 , 语 音 识 别 技 术 是 非 常 重 要 的 人 机 交 互 H M M 模 型和 人工 神经 网络 ( A N N ) 在 语 音 识 别 中 技 术 。 随 着 计 算 机 和 语 音 处 理 技 术 的 发 展 , 成 功应用 。t 9 8 8  ̄ ,F U L E E K a i 等用V Q / I — I 删 语 音 识 别 系 统 的 实 用 性 将 进 一 步 提 高 。 应 用 方 法实现 了9 9 7 个 词汇 的非特定人 连续语 音识 语 音 的 自动 理解 和翻 译 ,可消 除人 类相 互交 别 系统S P H I N X 。这 是 世 界 上 第 1 个 高 性 能 的 非 往 的 语 言 障 碍 。 国外 已有 多 种 基 于 语 音 识 别 特 定人、大词汇 量、连续语音识 别系统 。 产 品 的 应 用 ,如 声 控 拨 号 电话 、 语 音 记 事 本 进入9 0 年 代 后 , 语 音 识 别 技 术 进 一 步 等 ,基 于 特 定 任 务 和 环 境 的 听 写 机 也 已 经 进 成 熟 , 并 开 始 向 市 场 提 供 产 品 。 许 多 发 达 入 应 用 阶 段 这 预 示 着 语 音 识 别 技 术 有 着 非 国家如 美 国、 日本 、韩 国以及 I B M 、A p p l e 、 常广泛 的应 用领 域和 市场 前景 。随 着语 音技 A T & a m p ;T 、M i c r o s o f t 等 公 司 都 为 语 音 识 别 术 的 进 步 和 通 信 技 术 的 飞 速 发 展 , 语 音 识 别 系 统 的 实 用 化 开 发 研 究 投 以 巨 资 。 同 时 汉 技 术 将 为 网 上 会 议 、 商 业 管 理 、 医 药 卫 生 、 语 语 音 识别 也 越 来越 受 到重 视 。I B M 开 发 的 教 育培 训等 各个 领域 带来 极大 的便 利 ,其 应 V i a V o i c e 和M i c r o s o f t 开 发 的 中 文 识 别 引 擎 用 和 经 济 、 社 会 效 益 前 景 非 常 良好 .
语 音 识 别 是 一 门交 叉 学 科 。语 音 识 别 研 究经 历 了5 O 多年 的研 究历 程 ,经 过 5 O多 年 的积 累研 究 ,获 得 了 巨大 的进 展 。特 别 是近2 0 年 来 , 语 音 识 别 技 术取 得 了 显着 的 进 步 , 并 逐 步 的 走 向 市 场 。 在 未 来 的 日子 里 ,语 音 识 别技 术将 应 用更 为 广泛 。 语 音识 别 技 术概 述 语 音识 别是解 决机 器 “ 听 懂 ” 人 类 语 言 的一项 技术 。作 为 智能计 算机 研 究的主 导 方 向和人 机语 音 通信 的关键 技术 ,语音 识别 技 术 一直 受到 各 国科 学界 的广泛 关注 。如今 , 随 着语 音识 别 技术研 究 的突破 ,其 对计 算机 发 展 和 社 会 生 活 的 重 要 性 日 益 凸现 出 来 。 以 语 音识 别技 术 开发 出的产 品应 用领 域 非常 广 泛 ,如 声控 电话交 换、信 息 网络 查询 、家庭 服 务 、宾馆 服 务 、医疗 服务 、银 行服 务 、工 业 控制 、语 音 通信 系统 等 ,几乎 深入 到社 会 的每个行 业和每个 方面 。 广 泛 意 义 上 的 语 音 识 别 按 照任 务 的 不 同 可 以分 为4 个 方 向 :说 话 人识 别 、 关键 词 检 出 、语 言 辨 识 和 语 音 识 别 。说 话 人 识 别技 术 是 以话 音 对 说 话 人 进 行 区别 ,从 而 进 行 身份 鉴 别 和 认证 的 技 术 。 关 键 词 检 出技 术 应 用 于 一 些 具 有 特 定 要 求 的 场 合 , 只 关 注 那 些 包 含 特 定 词 的 句子 ,例 如对 一些特殊人名 、地名 的电话 监听 等 。语 言辨 识技 术是 通过 分析 处 理一 个语 音 片 断 以 判 别 其 所 属 语 言 种 类 的 技 术 ,本 质 上 也 是 语 音 识 别 技 术 的 一 个 方 面 。语 音 识 别 就
投稿邮箱:w a n o u i e z z s @l 6 3 . c o m
信
王致 信 胡 文 东 中共青 岛市黄 岛 区委党 校
【 摘 要】语 音识别技术研究让人更加方便地享受到更 多的社会信息资源和现代化服务,对任何事都能够通过语音交互的方式。 【 关键词】语音识别技术 ;发展趋势