人体动作识别中的深度学习模型选择
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
普适 计 算 中的 人体 动作 识别 是 受益 于深 度 学 习的领 域 之一 。人 体 动 作 识别 中相 关 的研 究方 法包 括 :对 穿戴 设备 时 序数 据 的滑 动 窗 口分 段 、手 动特 征 提取 过程 以及 一 系列 的 (有监 督 )分 类方 法 。很 多情 况 下 ,这些 相对 简 单 的方法 已经能 够获 得较 高 的识 别准 确度 。 然 而 , 一些 更复 杂 的行 为动 作对 这 些 需要手 动 设计 的方 法提 出了一 定 的挑 战,例 如在 医疗 应 用 中的动 作识 别等 口1。 1.2 深 度学 习在 人体 动 作识 别 中的应 用 障碍
帧 ,可 以基 于一 些信 号特 征例 如信 号 能量 来划 分 ,或 者通 过 时间 滑 窗的 方法 分段 。然 后 从每 一 帧或每 一 段提 取 一组特 征 ,其 中 最常 见 的包括 统计 特 性或频 域 特性 。 2.1 卷 积神 经网 络在 人体 动作识 别 中的 应用
目前 在普 适 计算 中 比较受 欢迎 的 是基 于卷 积 神经 网络 的模 型 , 许多 研究 人 员都在 探 索它 们在 不 同动 作识 别任 务 中 的识别 效 果 。卷 积神 经 网络 因其 可 以采用 原始 信 号直 接作 为 网络输 入 而避 免 了复 杂 的特 征提 取过 程 , 已经应 用在 特 定领 域 ,例 如检 测 自闭症 的 典型 动 作[3],这 一应 用很 显然 优 于之 前领 先的 识别 方法 。 2.2 递 归神 经网 络在 人体 动作 识别 中 的应用
1 深度学 习在人体动 作识 别中的研 究现状
在 过 去 十年 中 ,深 度学 习 己成 为机 器学 习领 域 最热 门的研 究方 向 ,并且 在 学术 研 究和 商业 用途 的驱动 下 , 出现 越 来越 多 的变体 。 通 过 Torch7Il_等机 器 学 习框 架 ,深度 学 习能 被大 众 所使 用 ,并 且在 很 多应 用 领域 中 发挥 重要 作用 。 1.1 人体 动 作识 别 的研 究现 状
ELECTRONICS WORLD ·探 索 与 学 习模 型选择
广 州 中 医药 大学 医学信 息工程 学院 谭 火媛 罗晓牧
【摘要 】目前深度 学习已成为机器学习领域最热门的研究方向,在众多应用领域取得良好的效果,这使得不少深度 学习爱好者跃跃欲试。然 而 ,虽 然关 于深度 学习 的研 究论 文 日益 增 多 ,但 是仍 然 缺乏 如何针 对 不 同的应 用场 景选 择合 适 的深度 学 习模 型的指 导 。本 文探 讨 了根 据 可 穿
戴 式传 感 器在 人体 动作 识 别 中的信 号特 点 ,为如 何根 据 不 同的动 作识 别任 务选 择合 适 的深度 学 习模 型提供 参 考 。 【关键词 】深度学习;动作识别 ;卷积神经网络 (CNN);递归神经网络 (RNN)
在 普适 计算 (Ubiquitous Computing)中 ,基 于深度 学 习的人体 动 作 识别开 始逐渐 地取代 现存依 赖于人 工手动 特征提 取和分类 的分析 方 法 。但 是对于 各种不 同的动作 识别任 务,包 括精准 手势动作 识别 、跑 步 、上楼 梯等 不同粒度 的行为 ,如何 选择合 适的模 型仍然没 有一个 统 一 的分析 方法 。本文 通过结合 深度学 习领域 最新 的论文 ,探 索卷积 神 经 网络 fConvolutional networks,CNN)和 递归神经 网络 (Convolutional Neural Network,I )在 人体动作识 别中 的应 用 。通过 大量随机采 样 模 型配置 的动 作识别 实验 ,比较不 同模型在 人体动 作识别 的不 同任 务 上 的适用性 ,可 以为对深 度学 习感 兴趣 的研 究人员提供一 定的参考 。
尽 管 已经有 一 些关 于深 度模 型 在动 作 识别 的各 种 应用 场 景 中的 探 索 ,但是缺 乏一个 系统 的关于深度 模型适 用性 的分析 。各种论 文 的 作者报 告他们 在初步 实验 中探 索参数 空 间,但是通 常忽 略细节 。实验 的整个 过程不 但不清 晰 ,而 且难 以复制 。一些论文 中展现 单个 实例 , 例 如卷 积神经 网络在 某一特 定场景 获得较好 的识别 效果 ,然而单 单报 告峰值 性能数 据并不 能反 映一种方法 在普适 计算 中的所有 识别任 务具 有适用 性 ,因为还 需要花 费多少精 力去优化 提 出的方法 以及调试 与之 比较 的方法仍 然是未 知 的。一个研 究者寻找 到跟 论文 中效果 同样 好 的 参数配 置的可 能性有 多大 ?在参数探 索 的过程 中报 告 的与其他模 型 比 较 的识 别效 果有多大 的代表 性 ?哪一个参 数对识 别效果 的影响 最大 ? 这些 问题对 于研究者 是非 常重要 的,但是 目前在相 关研 究中很 少有提 及 ,这很 大程度上 限制 了深度 学习在人体动 作识别 中的应用和推 广。
深度 学 习将 对 普适 计算 中的人 体动 作识 别 带来 巨大影 响 ,它将 取代 缺 乏鲁 棒性 且 需要 手动 设置 的特征 提取 过程 。然而 ,对 于 研 究 者而 言 ,为 他们 的 具体 应用 场景 选 择合 适 的深度 学 习模 型 是一 件 比 较 困难 的事 情 。很 多促 进深 度 学 习发展 的研 究 几乎 都 只是 呈现 了系 统 的最优 效 果 ,而 很少 介绍 这些 看 起来 最优 的参数 是如 何确 定 的 。 在 参数 探 索 过 程 中 ,对 于 最 佳 效 果 是如 何 与 一 般 情 况 下 的 效 果 比 较 ,也没 有做 出很好 的解 释 。
2 常用 的深 度学习方法在人体动作识别 中的应用
使 用 可 穿 戴 传 感 器 收 集 的 人体 运 动 数 据 是 多 变 量 时 间 序 列 数 据 , 在 普 适 计 算 中 分 析 这 些 数 据 通 常 是 使 用 基 于 管道 (pipeline— based) 的方 法 。首 先是 将 这 些 时 间序 列 数据 分 割 成 连 续 的段 或 者
帧 ,可 以基 于一 些信 号特 征例 如信 号 能量 来划 分 ,或 者通 过 时间 滑 窗的 方法 分段 。然 后 从每 一 帧或每 一 段提 取 一组特 征 ,其 中 最常 见 的包括 统计 特 性或频 域 特性 。 2.1 卷 积神 经网 络在 人体 动作识 别 中的 应用
目前 在普 适 计算 中 比较受 欢迎 的 是基 于卷 积 神经 网络 的模 型 , 许多 研究 人 员都在 探 索它 们在 不 同动 作识 别任 务 中 的识别 效 果 。卷 积神 经 网络 因其 可 以采用 原始 信 号直 接作 为 网络输 入 而避 免 了复 杂 的特 征提 取过 程 , 已经应 用在 特 定领 域 ,例 如检 测 自闭症 的 典型 动 作[3],这 一应 用很 显然 优 于之 前领 先的 识别 方法 。 2.2 递 归神 经网 络在 人体 动作 识别 中 的应用
1 深度学 习在人体动 作识 别中的研 究现状
在 过 去 十年 中 ,深 度学 习 己成 为机 器学 习领 域 最热 门的研 究方 向 ,并且 在 学术 研 究和 商业 用途 的驱动 下 , 出现 越 来越 多 的变体 。 通 过 Torch7Il_等机 器 学 习框 架 ,深度 学 习能 被大 众 所使 用 ,并 且在 很 多应 用 领域 中 发挥 重要 作用 。 1.1 人体 动 作识 别 的研 究现 状
ELECTRONICS WORLD ·探 索 与 学 习模 型选择
广 州 中 医药 大学 医学信 息工程 学院 谭 火媛 罗晓牧
【摘要 】目前深度 学习已成为机器学习领域最热门的研究方向,在众多应用领域取得良好的效果,这使得不少深度 学习爱好者跃跃欲试。然 而 ,虽 然关 于深度 学习 的研 究论 文 日益 增 多 ,但 是仍 然 缺乏 如何针 对 不 同的应 用场 景选 择合 适 的深度 学 习模 型的指 导 。本 文探 讨 了根 据 可 穿
戴 式传 感 器在 人体 动作 识 别 中的信 号特 点 ,为如 何根 据 不 同的动 作识 别任 务选 择合 适 的深度 学 习模 型提供 参 考 。 【关键词 】深度学习;动作识别 ;卷积神经网络 (CNN);递归神经网络 (RNN)
在 普适 计算 (Ubiquitous Computing)中 ,基 于深度 学 习的人体 动 作 识别开 始逐渐 地取代 现存依 赖于人 工手动 特征提 取和分类 的分析 方 法 。但 是对于 各种不 同的动作 识别任 务,包 括精准 手势动作 识别 、跑 步 、上楼 梯等 不同粒度 的行为 ,如何 选择合 适的模 型仍然没 有一个 统 一 的分析 方法 。本文 通过结合 深度学 习领域 最新 的论文 ,探 索卷积 神 经 网络 fConvolutional networks,CNN)和 递归神经 网络 (Convolutional Neural Network,I )在 人体动作识 别中 的应 用 。通过 大量随机采 样 模 型配置 的动 作识别 实验 ,比较不 同模型在 人体动 作识别 的不 同任 务 上 的适用性 ,可 以为对深 度学 习感 兴趣 的研 究人员提供一 定的参考 。
尽 管 已经有 一 些关 于深 度模 型 在动 作 识别 的各 种 应用 场 景 中的 探 索 ,但是缺 乏一个 系统 的关于深度 模型适 用性 的分析 。各种论 文 的 作者报 告他们 在初步 实验 中探 索参数 空 间,但是通 常忽 略细节 。实验 的整个 过程不 但不清 晰 ,而 且难 以复制 。一些论文 中展现 单个 实例 , 例 如卷 积神经 网络在 某一特 定场景 获得较好 的识别 效果 ,然而单 单报 告峰值 性能数 据并不 能反 映一种方法 在普适 计算 中的所有 识别任 务具 有适用 性 ,因为还 需要花 费多少精 力去优化 提 出的方法 以及调试 与之 比较 的方法仍 然是未 知 的。一个研 究者寻找 到跟 论文 中效果 同样 好 的 参数配 置的可 能性有 多大 ?在参数探 索 的过程 中报 告 的与其他模 型 比 较 的识 别效 果有多大 的代表 性 ?哪一个参 数对识 别效果 的影响 最大 ? 这些 问题对 于研究者 是非 常重要 的,但是 目前在相 关研 究中很 少有提 及 ,这很 大程度上 限制 了深度 学习在人体动 作识别 中的应用和推 广。
深度 学 习将 对 普适 计算 中的人 体动 作识 别 带来 巨大影 响 ,它将 取代 缺 乏鲁 棒性 且 需要 手动 设置 的特征 提取 过程 。然而 ,对 于 研 究 者而 言 ,为 他们 的 具体 应用 场景 选 择合 适 的深度 学 习模 型 是一 件 比 较 困难 的事 情 。很 多促 进深 度 学 习发展 的研 究 几乎 都 只是 呈现 了系 统 的最优 效 果 ,而 很少 介绍 这些 看 起来 最优 的参数 是如 何确 定 的 。 在 参数 探 索 过 程 中 ,对 于 最 佳 效 果 是如 何 与 一 般 情 况 下 的 效 果 比 较 ,也没 有做 出很好 的解 释 。
2 常用 的深 度学习方法在人体动作识别 中的应用
使 用 可 穿 戴 传 感 器 收 集 的 人体 运 动 数 据 是 多 变 量 时 间 序 列 数 据 , 在 普 适 计 算 中 分 析 这 些 数 据 通 常 是 使 用 基 于 管道 (pipeline— based) 的方 法 。首 先是 将 这 些 时 间序 列 数据 分 割 成 连 续 的段 或 者