(完整word版)手势识别技术综述
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
手势识别技术综述
作者单位:河北工业大学计算机科学与软件学院
内容摘要:
手势识别是属于计算机科学与语言学的一个将人类手势通过数学算法针对人们所要表达的意思进行分析、判断并整合的交互技术。一般来说,手势识别技术并非针对单纯的手势,还可以对其他肢体动作进行识别,比如头部、胳臂等。
但是这其中手势占大多数。本文通过对手势识别的发展过程、使用工具、目的与市场等进行综述,梳理出手势识别发展的思路,让读者对手势识别有一个总体上的认识,同时也可以让读者在此基础上进行合理想象,对手势识别的未来有一个大体印象。
Abstract:
Gesture recognition is an interactive technology using mathematical arithmetic to the analysis,judge and assembly meaning that people want to convey which belongs to computer science and Linguistics.In general, gesture recognition technology is not for simple gestures expressed by hands ,it can also aim to other body movement recognition, such as the head, arm and so on. But the gesture accounted for most of the analysis. In this paper, by describing the development process, tools used , objective and market of gesture recognition , we can sort out the ideas of the development of gesture recognition, and let readers have an overall understanding of gesture recognition. At the same time, it can let the reader imagine that on hand gesture recognition based on reason ,and have a general impression of its future.
1.定义
说到手势识别,首先要对手势识别中的手势有一个清晰的认知。手势在不同的学科中有不同含义,而在交互设计方面,手势与依赖鼠标、键盘等进行操控的区别是显而易见的,那就是手势是人们更乐意接受的、舒适而受交互设备限制小的方式,而且手势可供挖掘的信息远比依赖键盘鼠标的交互模式多。在学术界,人们试图对手势定义一个抽象、明确而简洁的概念以为手势及其应用的研究提供依据。1990年Eric Hulteen和Gord Kurtenbach曾发表的题为“Gestures in Human-Computer Communication”中定义:“手势为身体运动的一部分,它包括一部分信息,而且是一种能被观察到的有意义的运动。挥手道别是一种手势,而敲击键盘不是一种手势,因为手指的运动没有被观察,也不重要,它只表示键盘
被按下这一动作。”
从定义上讲,手势识别是一种利用数学算法,包括计算机图形学,辅以摄像头、数据手套等输入工具,针对收集到的信息,比如手掌、手指各关节的方位、角度等进行判断、分析并作出正确回复的技术。许多测试品已开始使用三维手势识别来提升准确率及反应速度。但是,分析手势的特点,回顾手势识别的发展历史,可以更好地把握其发展脉络,从而对未来手势识别的潜力与可能方向做出基本判断。
2.发展过程
手势是任意的,手不同部位的方向、角度及弯曲程度等的不同信息可能会有实际意义上的天壤之别。所以手势识别应该基于用户与程序、设备之间的约定。
针对手势的任意性,最初的手势识别主要使用各种与手及手臂通过直接的接触式有线机器设备进行数据采集。它可以直接检测诸如手指、关节及手臂的方位、角度等。典型的设备有数据手套等。通过内含许多传感器的数据手套,可以十分精确地获取手势识别所需的各种信息,此外其反应速度、识别准确度、稳定性也得到了保障。但是该设备在实际中的造价比较高昂,更重要的是会对手的灵活性有一定限制,因而没有得到有效推广。此后推出的穿戴式光学标记可通过红外线将手指及手掌变化传输到屏幕上,也保持了数据手套的优点。该设备虽减轻了重量,提高了手部的灵活性,但是仍需较复杂的输入输出转换设备,此外也会对手部动作的自然性产生影响。【1】
基于视觉的手势识别技术能够使手部动作的表达更加自然,同时也可以为未来其他的肢体识别技术所应用,因此成为了主流。手型模型是通过计算机图形学对二维的手势图像属性,如手的颜色、纹理、边界、轮廓等进行分析。【6】该方法主要使用三种组件:探测组件、运动轨迹组件、识别组件。【6】探测组件负责有针对性地收集有特点的视觉信号并将手势信号整理成码。运动轨迹组件负责实时定位,虽然它对于只需静态手势的设备并不是必要的组件,但是其可以优化手部中各部位的运动曲线,提升设备精度。
基于视觉的手势识别按手势的动态特点可以分为静态的与动态的两种,静态手势识别针对单个手型,主要包括手势分割及手势识别两部分,前者是后者的基础。【3】静态手势识别方法难以识别区分度较小的手势、实时性差,因此向动态手势识别过渡已经成为一种趋势。【3】
大部分手势识别应用是将每个手势作为一个整体,之后通过计算相似度来进行模式匹配。这种方法显而易见的缺点是只有当收集到的数据与预设模型的相似程度很高时才会比较准确,另外对于某些比较相似的手势区分效果不好。【6】
3.研究方法
目前常用的手势识别研究方法主要有以下几种:
(1)基于人工神经网络的手势识别
神经网络基于统计和概率学方法的组织和判断具有抗干扰、自学习、易控制和处理高效的特点,可用于处理信息缺失的模式并进行模式推广。如果整个神经