计算机视觉技术在军事体育训练体能考核中的应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计算机视觉技术在军事体育训练体能考核中的应用
魏际英,卫强,费洋
摘要:为实现军事体育训练考核的公平、高效,本文针对《军事体育训练大纲》要求,提出使用基于深度学习的计算机视觉技术实现俯卧撑、仰卧起坐、引体向上、曲臂悬垂的自动计数及错误分析。
本文通过分析大量人体样本训练人体姿态模型,提取人体重要运动部位涉及的角度和位置,根据具体动作要求计算动作完成准确程度。
实验结果表明,该方法能够准确获取人体运动轨迹,动作计数准确率和错误分析成功率均大于99%。
关键词:计算机视觉;训练;考核
0 引言
《军事体育训练大纲》[1]的颁布实施,对于提高学员的身心素质、实战化训练水平以及提升战斗力具有重要作用。
目前各单位在考核过程中,大多仍是采用人工考核的方式,存在效率低、漏判错判率高、公平公正被质疑等问题。
少数单位已实现采用传统穿戴式设备进行智能考核,大大提高了考核效率,漏判错判率也有所下降,公平公正得到了有效保障。
但传统穿戴设备智能考核系统存在着设备庞大、施工复杂、占地面积大、运输困难、不利于野外训练等缺陷,尤其穿戴式设备增加了人体运动负担,影响到考核人员完成动作的规范性。
计算机视觉技术是人工智能的一个重要分支,是使用计算机模拟人眼对目标物进行识别、追踪、判别决策等。
深度学习引入后,计算机视觉技术得到了长足发展,目前已被广泛应用于安防、无人机、医疗检查、体育运动等多个领域。
因此,本文提出使用计算机视觉技术来实现军事训练考核的智能化。
通过对深度学习卷积神经网络输入大量人体运动图片,训练并生成稳定可靠的人体姿态估计模型。
考核过程中通过图像采集设备(摄像机或摄像头)实时获取考核运动视频图像,使用生成的人体姿态估计模型逐帧计算人体主要运动部位所形成的角度和位置,并根据这些数据按照《军事体育训练军事体育训练大纲》要求计算出动作的准确性,从而实现智能考核的功能。
相比传统穿戴式设备智能考核的方式,本文所提出的计算机视觉技术的考核方案同样具备效率高、漏判错判率低、公平公正等特点,同时还具有以下优点:设备体积小、运输携带方便、适合野外训练;操作简单,只需在人工考核的基础上布设视频图像采集设备;考核人员不需要穿戴任何设备,考核过程中全程无感。
1 人体姿态估计模型训练
1.1 网络设计
人体姿态估计是对图像或视频中人体关节点的位置进行定位分析,分为2D 和3D 姿态估计(以下均为2D 姿态估计)。
人体姿态估计在不同尺度下,可能包含人体方位、肢体动作、相邻关节点关系等信息。
本文采用堆叠沙漏网络(Stacked Hourglass Networks)[2]实现人体姿态估计模型。
单个Hourglass 网络设置,首先Conv 层和Max Pooling 层的作用是将目标特征缩小至很小的分辨率,每一个Max Pooling 处网络进行分叉,并对原有pre-pooled 分辨率的特征进行卷积,取得最低分辨率后,开始进行upsampling,并逐渐结合不同尺度的特征信息。
较低分辨率采用的是最近邻上采样形式,将不同的特征集逐一进行求和。
整个hourglass 是对称的,获取低
分辨率特征过程中每有一个网络层,则在上采样的过程中相应低就会有一个对应网络层,得到hourglass 网络模块输出后,再采用两个连续的1×1 Conv 层进行处理,得到最终的网络输出。
堆叠沙漏网络(Stacked Hourglass Networks)由多个stacked hourglass 模块组成,通过重复进行bottom-up,top-down 推断估计人体姿态。
Stacked Hourglass Networks 输出heatmaps 的集合,每个heatmap 表示关节点在相应像素点出现的频率,Residual 模块不仅提取了较高层次的特征(卷积路),而且保留了原有层次的信息(跳级路)。
不改变数据尺寸,只改变数据深度,可以把它看成一个保尺寸的高级“卷积”层。
1.2 训练及测试结果
使用Caffe 深度学习框架实现堆叠沙漏网络模型,设置pose_training.prototxt 中的各个参数,batchsize 为8。
测试结果:使用Nvidia GTX 1070 测试单人姿态估计达到28~30FPS(帧/秒),多人姿态估计达到13~18FPS(帧/秒)。
在MPII Human Pose 数据集上测试结果:
表1 训练测试结果
网络输出18 个关键点坐标,格式为:
“keypoints”:[190.74,126.837,0.943594,190.861,172.698,0.892558,151.426,174.343,0.852508,136.668,102.202,0.85403 3,
136.644,44.7066,0.945382,230.213,172.737,0.815636,254.79 4,102.233,0.894463,266.251,48.0951,0.900904,162.819,326.91 4,0.627533,153.095,440.082,0.686759,157.943,546.775,0.749 9,213.735,328.556,0.613637,217.048,441.727,0.730703,217.03 7,545.087,0.7967,179.325,123.587,0.952431,202.224,123.534,0.955873,167.808,138.295,0.887894,215.442,138.292,1.01478]
2 《军事体育训练军事体育训练大纲》动作实现
2.1 仰卧起坐动作实现
通过夹角余弦定理计算出所需角度的大小,仰卧起坐动作关键夹角。
图1 仰卧起坐平躺
角1 为肩部、臀部、脚踝夹角,用于判断平躺时是否触地。
图2 仰卧起坐上起
角2 为肘部、臀部和膝部夹角,用于判断上起时肘部是否触及腿部。
角3 位肩部、臀部和膝部夹角,用于判断上起动作是否完成。
动作辨别正误方法:
平躺时:角1 不小于175°则判定身体触地。
上起时:角3 小于90°则判定上起完成,角2 小于10°则判定手臂触及腿部。
计数:角1、角2、角3 的一次完整变化过程完成一次仰卧起坐计数。
2.2 俯卧撑动作实现
通过夹角余弦定理计算出所需角度的大小,俯卧撑动作关键夹角。
图3 俯卧撑上起动作
角1 为肩部、肘部和手腕夹角,用于判断上起动作时手臂是否伸直。
角2 为肩部、臀部和膝部夹角,用于判断上起动作时臀部是否保持平直。
角3 为臀部、膝部和脚踝夹角,用于判断上起动作时膝部是否保持平直。
角4 为肩部、脚踝和手腕夹角,用于判断上起动作是否完成。
图4 俯卧撑下撑动作
角1 为肩部、肘部和手腕夹角,用于判断下撑动作深度。
角2 为肩部、臀部和膝部夹角,用于判断下撑动作时臀部是否保持平直。
角3 为臀部、膝部和脚踝夹角,用于判断下撑动作时膝部是否保持平直。
角4 位肩部、脚踝和手腕夹角,用于判断下撑动作是否完成。
动作辨别正误方法:
上起时:角1 不小于175°则判定手臂伸直,角2 和角3 不小于175°则判定身体保持平直,角4 大于20°时判定上起动作完成。
下撑时:角1 不大于90°则判定已达到下撑深度,角2 和角3不小于175°则判定身体保持平直,角4 小于10°时判定下撑动作完成。
计数:角2 和角3 合格的情况下,角1、角4 的一次完整变化过程完成一次俯卧撑计数。
2.3 引体向上动作实现
通过夹角余弦定理计算出所需角度的大小,单杠动作关键夹角。
图5 单杠拉起动作
图6 单杠悬垂动作
角1 为右手腕、颈部和左手腕夹角,用于判断是否完成拉起或者悬垂。
角2 为右臀、右膝和右脚踝夹角,角3 为左臀、左膝和左脚踝夹角,用于判断单杠动作过程中膝盖是否保持垂直。
动作辨别正误方法:
单杠拉起时:角1 大于175°则判定拉起动作完成,同时可判定下颚已通过杠杆;角2 和角3 大于175°则判定膝盖保持垂直。
单杠悬垂时:角1 小于60°则判定悬垂动作完成;角2 和角3大于175°则判定膝盖保持垂直。
计数:角2 和角3 合格的情况下,角1 的一次完整变化过程完成一次仰卧起坐计数。
2.4 曲臂悬垂动作实现
通过夹角余弦定理计算出所需角度的大小,曲臂悬垂关键夹角。
图7 曲臂悬垂杠上动作
角1 为右手腕、颈部和左手腕夹角,用于判断杠上动作是否合格。
角2 为右臀、右膝和右脚踝夹角,角3 为左臀、左膝和左脚踝夹角,用于判断曲臂悬垂动作过程中膝盖是否保持垂直。
动作辨别正误方法:
计时:角1 大于175°,角2 和角3 大于175°则开始计时;角1小于175°则结束计时。
3 网络拓扑实施
视频采集设备获取考核图像后通过AP 及网桥传递给算法服务器进行动作分析和计算,结果发送至各个终端查询。
图8 网络拓扑
4 实验结果和分析
通过在试点单位测试,结果表明该系统已达到《军事体育训练大纲》要求的考核标准,动作计数准确率达到99%以上,判定动作是否符合大纲要求,准确率同样达到99%以上。
存在的问题及解决方法:
当逆光、暗光等条件下,人体图像检测的准确度有所下降,导致动作计数准确率下降。
解决方法:①通过调整相机参数及补光,提高光照强度,有效提高动作计数准确率;②在训练模型样本中增加逆光、暗光等条件下的样本量,从根本上解决极端光照问题。
5 结论
人工智能的深入研究为训练考核提供了坚实的技术背景。
如本文所述,计算机视觉技术作为人工智能的重要分支,所构建的训练考核系统,可以达到无感、稳定、准确等效果,紧贴《军事体育训练大纲》要求,实现了考核的公平、公正、高效。
除此之外,本文的设计更加易于扩展。
针对《军事体育训练大纲》的变化只需补充相应的样本数据即可得到可用的模型,动作实现更加容易。