基于数据手套的汉语手指字母流识别系统
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
k l , ) 出层的阈值 为{ (= ,, n ) = , …,0 ,输 2 bl l …, 。 k 2 o
设 函数 m ) 为神经 网络 的传输 函数,则神 经网络的输入 输 出关系如下 :
3 字母流识别系统的实现
3 识别系统的总体设计 . 1
本系统是基于数据手套的汉语拼音字母流识 别系统 ,按 照系统 的工作过程 ,主要 由数据采集、网络训练、在线识别、
[ sr c]T i pp rs de h hn s n e lhb tf w rc g io n lsict n steei apo lm hthg e h rw r Ab tat hs a e t isteC ieef g rap ae l eo nt n ad cas ai .A h r s rbe ta ih r ad ae u i o i i f o
小值 。
弹性 B P算法消除 了偏导数 的大小对权值 的有害影 响, 只利 用梯度的符号表示 权值的更新方 向。这种算法具有 收敛 速度快 和 占用内存小的优点 ,对较大型 的神经 网络具有较好
的分类能 力。
弹性 神经 网络的基本原理为 :首先为各权重赋一个初始 值 ,设 定权 重变化加速 因子和减速 因子 ,在 网络前馈迭代 中 当连 续误 差符 号不变时 ,采用加速策 略;当连续误差梯度符 号变 化时 ,采 用减速策 略 ,以期稳定收敛 _。网络结合 当前 4 】 误差梯度 符号 与变化步长 实现 B , 了避免 网络学 习发 生震 P为 荡 或下溢 ,算法要求设定权值变化 的上下 限。此训练模 式下
P X ) ( = , 1 _ j 一) t l 1 t _,一1 一,一) l I 2 2 t t … , 1l 1 tX ,) 2
(1 7
q l , 1) =, …, ,隐含层到输 出层 的连接权 为 {k( 1 , n, 2 1 H v }=, …, j 『 2 H
输入层
隐含层
输出层
图 1 典 型三层前馈 基 B P罔络
设该神经 网络样 本点个数为 P ,某一输入 向量 为 X =
( , , 《), = ,, P, …, p l …, 隐含层维数 为 H 神经 网络的理 2 ,
行概率估计 ,实现手势字母 的细分 ,并输 出汉语拼音序列。
第3 卷 7
第 2 期 2
刘 明涛 ,雷
勇 :基于数据手套 的汉语手指字母流识别 系统
19 6
接 权 { = ,, , j l , , ) W小il … n = , … n ,隐 含 层 的 阈 值 为 f 2 i 2 H
那么 , 特定的状态 序列 xT { …, } = x, x 的概率可表示为 :
r t, J “ :
w
Se 31连 续误 差梯 度变化 判断与 步长 调整 : tp .
Ch n s n e p a e o Re o n to y tm i e eFi g r Al h b t Fl w c g iin S se
Ba e n Da a Gl v s do t o e
LI M i g t o LEI n U n - , a Yo g ( c o l f o r n n r y No twetr oye h i l iest Xi n7 0 7 , h n ) S h o we dE eg , r oP a h s nP ltc n c v ri , ’ 1 0 2 C ia e a Un y a
中田分类 T 1 号: P8 3
基于数据 手套的汉语 手指 字母 流识别 系统
刘 明涛 ,雷 勇
( 西北工业大学动力与能源学院 ,西安 7 0 7 ) 10 2 摘 要: 针对 目前研究中对数据手套硬件要求较高 的现状 ,研究汉语手指字母流的识别分类问题,提 出一种低要求 、高识别精度的数据手
两者联系 的桥梁 。 系统 的
典型 B 网络基于误差 函数最小准则 ,误差信号从后 向 P 前传递 。在反 方向传递 过程 中 ,根据误差信号 的梯度逐步修 改权值和 阈值 。但这种 方法 收敛 速度慢 ,且容易陷入局部极
Ch n s l h b tfo Ex e i n a e u t h i e e a p a e w. p rme t lr s ls s ow h tt i t o a e r b n 91 r c g i o ae a d o t u l h b tfo e f c i e y l t a h sme h d c n g tmo e t. % e o n t n r t n u p ta p a e w f e t l , a i l v wh c r v s t eh d i fe tv i h p o e m t o s f ci e he e
练结束 ,否则继续学 习。
Se 3 tp
3 神经网络输入输出向量设计 . 2
由于 不同的操作 者手 部外形尺寸差异 ,使用数据手套时 产 生的信号值有所不 同, 因此数据手套在使用时需进行校正 。 rw 表示输 出最大值 ,rw i a a 表示输出最小值 ,用 rw l a 表示 当前手 势输 出值 ,校正归一化值 o t1 由下式确定 : u 可
个指式代表一个汉语拼音字母 ,按照汉语拼 音方案拼 成普
通话 ,作 为手 势语 的有机补充 。中国手语共有 3 个手 指字 0
母 ,汉语 句子 中的任意一个词语都可 以根据汉语拼音 由序列 手指字母表示。因而本文所讨论 的手指字母流 的识别对于手 语识别领 域来 说至 关重要 。
文献[J 了较为深入的研究,但其研究是基于 1 1 进行 8传
作者简介 : 明涛(96 ) 男 , 刘 18 - , 硕士研究 生, 主研方向 : 虚拟现实 ,
模式识别 ,航空发动机测试 ;雷 勇 ,教授
性 ,学 习算法采用弹性 B 算法 ,实现单个手指字母的分 P
收稿 日期 :2 1- —1 0 1 51 0
Em i ieu t 2. r — a :mj cm @16 o l u cn
第3 7卷 第 2 期 2
Vl . 7 O 3 1
・
计
算
机
工
程
21 年 1 01 1月
Nov m b r2 e e 01 l
NO2 .2
Co mpu e g ne rn trEn i e ig
人工 智能 及识 别技 术 ・
文章编号:1o-48o12_6_ 3 文献标识码: 0 32(1)—0 番- 2 2 1 0 A
z _ =厂 (
jl =
f2 q + j ) (W ・ b + )
il =
( 1 )
定义神经 网络 的误差 函数为 :
E :I
.
综合模块 4个部分组成 。利用 V C程序进行数据的采集和在
() 2
1 一】 J I Z , I
线识别 ,使用 Ma a 进 行网络训练和样本检验 ,数据库作为 tb l
的弹性 算法具体过程如下 :
图 2 数据 手套识. 射系统 结构
Se l 初始化参数 ,对 每个权值 、阈值赋 区间[ ,] tp 一1 上 1
数据采集 完成对 数据 的采集和预处理 ,网络训练和在线
的随机数。设置减速因子 矿和 一 ,权值的变化上限 △ 和
变化 下限 △ 。
感器数据手套的 ,采用人工神经 网络和学 习二叉树方法 ,完 成单个手势的识 别分类。 本文采用 5 T公司的 5 D 传感数据手套 Daa lv la t Go e t U r5 进行 了大胆尝试 。先对手势进行粗 分组,然 后采 用改进型神 经 网络有效地识别单个手指字母 ,再建立马尔科 夫模型 ,进
[ ywo d ]B erl e r; ro d ld t lv ;igr lhb t o lsict n o l eie t ct n Ke r s Pnua nt k Mak vmo e;aago e f e p ae w c s a o ; ni ni a o wo n a l f a f i i n d f i i
识 别部 分是基于 B P神经 网络的 。神经 网络学 习函数采用弹 性 梯度 算法,在 线识 别系统完成对手指字母 的识别 ,综合模 块 主要基于 马尔科夫模型。先根据汉语拼音方案有关规则对 网络识 别结果进行调整 ,然后输出汉语 拼音字母流 。
Se 2 网络 向前学 习,依 次输 入所有学 习样本 ,计 算并 tp 保 存误差能量函数梯度 。计算实 际输 出与期望输 出的误差指 标 ,如误差指标小于设定指标或学 习次数大于设定次数则 训
DOI 1 . 6 /i n10 —4 82 1 . .5 : 03 9js .0 03 2 .0 2 0 5 9 .s 12
1 概述
手语识别作为人体语言理解 的一部分 , 有着重要的作用, 根据手势输入介质 ,手语识别系统可分为 2种 :基于 图像信 息 的手语识别系统和基于数据手套的手语识 别系统 。手语是 聋哑人交 际的工具 , 中国手语按照 历史 的发展可 以分为 2类 : 手势语 和手指语 l 。手势语是从象形语言发展起来 的,它充
Th smeh d u e i to ssBP e r l ewo ka dM ak d la d etmae eip e u n ep o a ii yChn s lh b ts el g r e o o tu n ua t r n rovmo e n si tst n ut q e c r b b ly b i ee ap a e p ln ulst up t n h s t i
r qu r me t i d t l v sa e n e e o h u r n t d , i d o we a d r e u r me t n g e e o n t n r t t d i p o s d. e i e n sO l a a g o e r e d d f rt e c re tsu y a k n fl o rh r wa e r q ie n sa d hi h rr c g i o a e meho s r po e i
套方法。该方法使用 B P神经 网络结合 马尔科 夫模型 ,按照汉语拼音规则进行输入拼音序列概率的估计 ,输 出汉语拼音 。仿真实验结果表 职 ,采用该方法能获得 9%以上的单个手指字母识别率 ,并能有效输出汉语 拼音。 1
关健词 :B P神经网络;马尔科夫模 型;数据手套 ;手指 字母流分类 ;在线识 别
想输 出为 Y ( , , Y ) 神经网络的实际输 出为 Z = y y …,. , P o =
2 识别系统的基本原理
2 算法筒介 . 1
首 先,对汉语手指字母手势进行分组 ,确定神经网络的 输入 向量 。然 后利用典 型的三层前 馈 B 网络 的海量 并行 P
( , , z ), z z …, 输出向量的维数为n 。 乞 O 输入层到隐含层的连
分利 用人 的手势、 表情和身体的动作形象地表达物体和行为。 而手指语则 由字母语言发展起来 ,用手指指式进行 交流 ,用
一
类 。再运 用马尔科夫模型结合汉语拼音方案进行神经网络输 出序列的概率估计 ,完成对手语字母流的识别 。
2 弹性梯度 B . 2 P网络算法 典型三层前馈型 B P网络的结构如 图 1 所示 。
设 函数 m ) 为神经 网络 的传输 函数,则神 经网络的输入 输 出关系如下 :
3 字母流识别系统的实现
3 识别系统的总体设计 . 1
本系统是基于数据手套的汉语拼音字母流识 别系统 ,按 照系统 的工作过程 ,主要 由数据采集、网络训练、在线识别、
[ sr c]T i pp rs de h hn s n e lhb tf w rc g io n lsict n steei apo lm hthg e h rw r Ab tat hs a e t isteC ieef g rap ae l eo nt n ad cas ai .A h r s rbe ta ih r ad ae u i o i i f o
小值 。
弹性 B P算法消除 了偏导数 的大小对权值 的有害影 响, 只利 用梯度的符号表示 权值的更新方 向。这种算法具有 收敛 速度快 和 占用内存小的优点 ,对较大型 的神经 网络具有较好
的分类能 力。
弹性 神经 网络的基本原理为 :首先为各权重赋一个初始 值 ,设 定权 重变化加速 因子和减速 因子 ,在 网络前馈迭代 中 当连 续误 差符 号不变时 ,采用加速策 略;当连续误差梯度符 号变 化时 ,采 用减速策 略 ,以期稳定收敛 _。网络结合 当前 4 】 误差梯度 符号 与变化步长 实现 B , 了避免 网络学 习发 生震 P为 荡 或下溢 ,算法要求设定权值变化 的上下 限。此训练模 式下
P X ) ( = , 1 _ j 一) t l 1 t _,一1 一,一) l I 2 2 t t … , 1l 1 tX ,) 2
(1 7
q l , 1) =, …, ,隐含层到输 出层 的连接权 为 {k( 1 , n, 2 1 H v }=, …, j 『 2 H
输入层
隐含层
输出层
图 1 典 型三层前馈 基 B P罔络
设该神经 网络样 本点个数为 P ,某一输入 向量 为 X =
( , , 《), = ,, P, …, p l …, 隐含层维数 为 H 神经 网络的理 2 ,
行概率估计 ,实现手势字母 的细分 ,并输 出汉语拼音序列。
第3 卷 7
第 2 期 2
刘 明涛 ,雷
勇 :基于数据手套 的汉语手指字母流识别 系统
19 6
接 权 { = ,, , j l , , ) W小il … n = , … n ,隐 含 层 的 阈 值 为 f 2 i 2 H
那么 , 特定的状态 序列 xT { …, } = x, x 的概率可表示为 :
r t, J “ :
w
Se 31连 续误 差梯 度变化 判断与 步长 调整 : tp .
Ch n s n e p a e o Re o n to y tm i e eFi g r Al h b t Fl w c g iin S se
Ba e n Da a Gl v s do t o e
LI M i g t o LEI n U n - , a Yo g ( c o l f o r n n r y No twetr oye h i l iest Xi n7 0 7 , h n ) S h o we dE eg , r oP a h s nP ltc n c v ri , ’ 1 0 2 C ia e a Un y a
中田分类 T 1 号: P8 3
基于数据 手套的汉语 手指 字母 流识别 系统
刘 明涛 ,雷 勇
( 西北工业大学动力与能源学院 ,西安 7 0 7 ) 10 2 摘 要: 针对 目前研究中对数据手套硬件要求较高 的现状 ,研究汉语手指字母流的识别分类问题,提 出一种低要求 、高识别精度的数据手
两者联系 的桥梁 。 系统 的
典型 B 网络基于误差 函数最小准则 ,误差信号从后 向 P 前传递 。在反 方向传递 过程 中 ,根据误差信号 的梯度逐步修 改权值和 阈值 。但这种 方法 收敛 速度慢 ,且容易陷入局部极
Ch n s l h b tfo Ex e i n a e u t h i e e a p a e w. p rme t lr s ls s ow h tt i t o a e r b n 91 r c g i o ae a d o t u l h b tfo e f c i e y l t a h sme h d c n g tmo e t. % e o n t n r t n u p ta p a e w f e t l , a i l v wh c r v s t eh d i fe tv i h p o e m t o s f ci e he e
练结束 ,否则继续学 习。
Se 3 tp
3 神经网络输入输出向量设计 . 2
由于 不同的操作 者手 部外形尺寸差异 ,使用数据手套时 产 生的信号值有所不 同, 因此数据手套在使用时需进行校正 。 rw 表示输 出最大值 ,rw i a a 表示输出最小值 ,用 rw l a 表示 当前手 势输 出值 ,校正归一化值 o t1 由下式确定 : u 可
个指式代表一个汉语拼音字母 ,按照汉语拼 音方案拼 成普
通话 ,作 为手 势语 的有机补充 。中国手语共有 3 个手 指字 0
母 ,汉语 句子 中的任意一个词语都可 以根据汉语拼音 由序列 手指字母表示。因而本文所讨论 的手指字母流 的识别对于手 语识别领 域来 说至 关重要 。
文献[J 了较为深入的研究,但其研究是基于 1 1 进行 8传
作者简介 : 明涛(96 ) 男 , 刘 18 - , 硕士研究 生, 主研方向 : 虚拟现实 ,
模式识别 ,航空发动机测试 ;雷 勇 ,教授
性 ,学 习算法采用弹性 B 算法 ,实现单个手指字母的分 P
收稿 日期 :2 1- —1 0 1 51 0
Em i ieu t 2. r — a :mj cm @16 o l u cn
第3 7卷 第 2 期 2
Vl . 7 O 3 1
・
计
算
机
工
程
21 年 1 01 1月
Nov m b r2 e e 01 l
NO2 .2
Co mpu e g ne rn trEn i e ig
人工 智能 及识 别技 术 ・
文章编号:1o-48o12_6_ 3 文献标识码: 0 32(1)—0 番- 2 2 1 0 A
z _ =厂 (
jl =
f2 q + j ) (W ・ b + )
il =
( 1 )
定义神经 网络 的误差 函数为 :
E :I
.
综合模块 4个部分组成 。利用 V C程序进行数据的采集和在
() 2
1 一】 J I Z , I
线识别 ,使用 Ma a 进 行网络训练和样本检验 ,数据库作为 tb l
的弹性 算法具体过程如下 :
图 2 数据 手套识. 射系统 结构
Se l 初始化参数 ,对 每个权值 、阈值赋 区间[ ,] tp 一1 上 1
数据采集 完成对 数据 的采集和预处理 ,网络训练和在线
的随机数。设置减速因子 矿和 一 ,权值的变化上限 △ 和
变化 下限 △ 。
感器数据手套的 ,采用人工神经 网络和学 习二叉树方法 ,完 成单个手势的识 别分类。 本文采用 5 T公司的 5 D 传感数据手套 Daa lv la t Go e t U r5 进行 了大胆尝试 。先对手势进行粗 分组,然 后采 用改进型神 经 网络有效地识别单个手指字母 ,再建立马尔科 夫模型 ,进
[ ywo d ]B erl e r; ro d ld t lv ;igr lhb t o lsict n o l eie t ct n Ke r s Pnua nt k Mak vmo e;aago e f e p ae w c s a o ; ni ni a o wo n a l f a f i i n d f i i
识 别部 分是基于 B P神经 网络的 。神经 网络学 习函数采用弹 性 梯度 算法,在 线识 别系统完成对手指字母 的识别 ,综合模 块 主要基于 马尔科夫模型。先根据汉语拼音方案有关规则对 网络识 别结果进行调整 ,然后输出汉语 拼音字母流 。
Se 2 网络 向前学 习,依 次输 入所有学 习样本 ,计 算并 tp 保 存误差能量函数梯度 。计算实 际输 出与期望输 出的误差指 标 ,如误差指标小于设定指标或学 习次数大于设定次数则 训
DOI 1 . 6 /i n10 —4 82 1 . .5 : 03 9js .0 03 2 .0 2 0 5 9 .s 12
1 概述
手语识别作为人体语言理解 的一部分 , 有着重要的作用, 根据手势输入介质 ,手语识别系统可分为 2种 :基于 图像信 息 的手语识别系统和基于数据手套的手语识 别系统 。手语是 聋哑人交 际的工具 , 中国手语按照 历史 的发展可 以分为 2类 : 手势语 和手指语 l 。手势语是从象形语言发展起来 的,它充
Th smeh d u e i to ssBP e r l ewo ka dM ak d la d etmae eip e u n ep o a ii yChn s lh b ts el g r e o o tu n ua t r n rovmo e n si tst n ut q e c r b b ly b i ee ap a e p ln ulst up t n h s t i
r qu r me t i d t l v sa e n e e o h u r n t d , i d o we a d r e u r me t n g e e o n t n r t t d i p o s d. e i e n sO l a a g o e r e d d f rt e c re tsu y a k n fl o rh r wa e r q ie n sa d hi h rr c g i o a e meho s r po e i
套方法。该方法使用 B P神经 网络结合 马尔科 夫模型 ,按照汉语拼音规则进行输入拼音序列概率的估计 ,输 出汉语拼音 。仿真实验结果表 职 ,采用该方法能获得 9%以上的单个手指字母识别率 ,并能有效输出汉语 拼音。 1
关健词 :B P神经网络;马尔科夫模 型;数据手套 ;手指 字母流分类 ;在线识 别
想输 出为 Y ( , , Y ) 神经网络的实际输 出为 Z = y y …,. , P o =
2 识别系统的基本原理
2 算法筒介 . 1
首 先,对汉语手指字母手势进行分组 ,确定神经网络的 输入 向量 。然 后利用典 型的三层前 馈 B 网络 的海量 并行 P
( , , z ), z z …, 输出向量的维数为n 。 乞 O 输入层到隐含层的连
分利 用人 的手势、 表情和身体的动作形象地表达物体和行为。 而手指语则 由字母语言发展起来 ,用手指指式进行 交流 ,用
一
类 。再运 用马尔科夫模型结合汉语拼音方案进行神经网络输 出序列的概率估计 ,完成对手语字母流的识别 。
2 弹性梯度 B . 2 P网络算法 典型三层前馈型 B P网络的结构如 图 1 所示 。