使用超声波的智能手机手势识别
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2018,54(2)1引言近几年人机交互技术(Human-Computer Interaction )发展迅猛,基于触屏科技的手机设备如IOS ,Android ,Windows Phone 等大展风采,基于此类智能手机的识别技术也热门起来。
虽然触屏的出现给人们的生活带来了极大便利,但仍有诸多限制。
为了拓展功能,便携式的键盘,远程遥控等设备开始兴起,但仍无法满足用户对便捷的需求。
声控传感器,脑电波传感器等研究的出现让人们看到无需和机器接触就可以控制其操作的优越性。
多年来许多学者在此方面付出了诸多努力得到不小成效。
在前人的基础上,本文设计了一种使用超声波的面
向智能手机的手势识别系统,即AGRS (in-Air Gesture Recognition System )系统。
该系统使用手机自带的扬声器和话筒发射和采集超声波信号,陀螺仪作为辅助传感器测定手机摆放位置,进行手势识别。
由于人耳的可听范围为20Hz~20kHz [1],一般情况下成年人听不见超过18kHz 的声音。
所以本实验的发射频率为20kHz 。
由于人体在移动过程中会反射声波,引起Doppler 效应。
AGRS 系统提取运动变化中的时间序列,对其数据进行特征提取,然后使用HMM 或SVM 模型进行识别归类。
最终得到了超过95%的识别率。
使用超声波的智能手机手势识别
徐曾春,吴凯娇,胡平
XU Zengchun,WU Kaijiao,HU Ping
南京工业大学计算机科学与技术学院,南京211816
College of Computer Science and Technology,Nanjing University of Technology,Nanjing 211816,China
XU Zengchun,WU Kaijiao,HU Ping.Ultrasonic waves based gesture recognition method for smartphone puter Engineering and Applications,2018,54(2):239-245.
Abstract :With the rapid development of smart phones,people ’s life has been er experience of mobile device can be improved in many scenarios with the assist of in-air gesture recognition.In this paper,AGRS,an in-air ges-ture recognition system that can be applied to off-the-shelf smart devices is proposed.In AGRS,the loudspeaker is used to emit a continuous 20kHz tone and the microphone is used to receive the gesture-reflecting ultrasonic wave.AGRS can recognize the position of mobile device by the gyroscope.After the gesture has been separated from noise,AGRS adapts CFAR algorithm.The characteristic of ultrasonic can be extracted by using the Doppler shift and be handled by FFT con-version.Finally,suitable classifier has been chosen to recognize gestures of AGRS.The experimental results demonstrate that AGRS is able to achieve gesture recognition accuracy of above 95%.
Key words :ultrasonic;gesture recognition;Doppler
摘要:现今智能手机发展迅猛,人们生活质量得到大幅提高。
为了更有效地利用智能手机资源,提高用户体验,提出了一种使用超声波的智能手机手势识别系统(AGRS 系统)。
该系统使用移动设备自带的扬声器发射20kHz 的超声波信号,使用话筒接收反射信号。
AGRS 系统可通过陀螺仪辅助判断当前手机摆放状态。
系统使用虚警率以降低手势误识别率。
AGRS 利用声波的Doppler 效应提取特征值,用FFT 算法处理声波信号,最后选择适合的分类器对手势进行识别。
实验结果证明AGRS 系统手势识别率超过95%。
关键词:超声波;手势识别;多普勒效应
文献标志码:A 中图分类号:TP 391.4doi :10.3778/j.issn.1002-8331.1608-0081
基金项目:江苏省重点研发计划(社会发展)(No.BE2015697)。
作者简介:徐曾春(1973—),女,工程师,研究领域为智能计算、计算机网络;吴凯娇(1992—),女,硕士研究生,研究领域为信号处理、
模式识别,E-mail :shirleywkj@ ;胡平(1962—),男,博士,教授,研究领域为人工智能及其应用、计算机控制技术。
收稿日期:2016-08-01修回日期:2016-09-21文章编号:1002-8331(2018)02-0239-07
CNKI 网络优先出版:2017-02-10,/kcms/detail/11.2127.TP.20170210.0832.028.html
Computer Engineering and Applications 计算机工程与应用
239
Computer Engineering and Applications 计算机工程与应用
2018,54(2)2相关工作本文并不是第一个使用超声波及多普勒(Doppler )效应的。
Georg [2]等人使用超声波仪器,与可穿戴设备,加速器,陀螺仪等设备配合,提高了手势识别的精确度,最终得到90%的准确度。
Kaustubh [3]使用一个超声波多普勒声纳仪进行语音识别。
Stephen [4]等人使用声纳仪发送20kHz 的频率,以1024点的快速傅里叶(Fast Fourier Transform )处理数据实现了对用户行为状态的检测。
Douwe [5]等人使用压电变压器发送40kHz 的超声波脉冲信号,7个装在PCB 上的微机扬声器接收信号,实现了5cm 到100cm 内90°范围内的挥手手势识别。
Amel [6]等人使用压敏传感器为超声波检测(针对肌肉骨骼检测)构建了学习数据库。
Junjue [7]等人使用扬声器接收信号,利用人手敲击桌面发出的声响,使用振幅波谱密度(amplitude spectrum density )进行特征分类定位按键,实现了虚拟键盘,准确度高达90%。
Bogdan [8]使用超声波测距仪进行手势识别控制机器移动方向。
Chunyi [9]等人使用多部移动设备发射蜂鸣信号进行移动设备间的测距。
微软公司则推出了soundwave [10]软件,使用电脑自带的扬声器发射18~22kHz 的声波,用话筒接受反射信号,利用多普勒效应进行手势识别。
除了使用超声波,类似的也有使用无线设备进行手势识别,如Heba [11]等人在房间里多个点放置无线设备,手机接收反射的无线信号,使用离散小波变换处理信号,将主要数据和其他无线设备点的信号融合后进行手势识别,仅用单个无线设备达到了87.5%的识别率。
与以上这些工作相比,本文提出了一种仅使用移动设备本身,不附加其他设备,基于安卓平台的手势识别系统,经过训练后能以高精度识别用户手势。
3系统框架现今市场上手机品牌多种多样,手机的设计构造也不尽相同。
本文系统难点在于仅使用一个话筒和扬声器进行手势识别。
首先通过多普勒效应抓取到单个手势移动时间序列,然后再对其进行分析处理。
3.1声波特征提取声波的Doppler 效应[12]本质是频率的变化,当移动物体靠近声源时频率上升,当移动物体远离声源时频率下降。
AGRS 系统使用手机自带的扬声器作为发射设备发射20kHz 的超声波信号,话筒作为接收设备接收反射的超声波,人手为声波反射介质,采样频率为44.1kHz ,公式如下:f r =f e ⋅æèçöø÷v i ±v o v i ∓v o (1)其中,f r 是接收到的反射频率,f e 是发射频率,v i 是声波在空气中的运动速度,v o 是物体相对于接收设备的移动速度。
图1为接收到原始信号的时域显示,显示了在时间序列上声波能量大小的变化。
图2为信号的时
频显示,显示了整个录音文件时间序列上频率的变化。
图3为通过Doppler 效应抓取到的单个手势,显示了单个手势在时间序列上的信号的时频变化。
从图3可以看出,没有手势时能量集中在20kHz (即发射频率)附近,为较平稳的直线。
当一个手势开始
运动时会出现明显的频率变化[13],通过设定频率变化的
阈值可以获得有实际意义的手势时间序列,然后再对此序列进行分析。
不同的手势所引起的时频图变化各不相同,特征明显,图4分别给出了挥手向前、向后、向左、向右4种基本手势所引起的时频变化图。
以图4(a )为例,图中出现了一个明显波峰,说明有物体正在向发射源靠近,波被压
缩,造成频率上升,波长变短,当物体停止移动时,波渐
渐恢复正常,频率回落到20kHz 。
与之相反,如图4(b )
所示,图中出现了明显的波谷,说明有物体原理发射源,频率下降,波长变长,当物体停止移动时,波又渐渐恢复正常,频率上升回20kHz 。
同理可知,
向左和向右手势
0246810121416180.4
0.3
0.2
0.1
-0.1-0.2
-0.3
-0.4
-0.5
-0.6Time/s
E n
e
r g y /
d
B 图1
时域信号
24681012141618
2.0
1.5
1.0
0.5
Time/s
F
r
e
q
u e
n
c
y
/
1
04
H
z
0图2信号的时频图
00.20.40.60.8 1.0 1.2 1.4 1.6 1.8
2.05
2.04
2.032.022.01
2.00
1.99
1.98
1.97
1.96
1.95Time/s
F r
e
q u
e
n c
y
/1
4
H z
有运动
无运动
图3Doppler 效应引起的信号的时频变化
240
2018,54(2)特征均为先靠近发射源,然后远离发射源,但是细节方
面略有不同。
3.2系统流程图5为ARGS 系统流程图。
首先,通过话筒获取一段时间序列,经过快速傅里叶(FFT )变换将此序列从时域信号转换为频域信号。
接着搜索此事件片段中有无手势序列,若无就更新环境噪声阈值及虚警率噪声功率,若有就开始进入手势识别分析系统。
手势识别先对抓取出的手势片段进行去噪,然后提取特征值,再进行数据均衡化处理,最后再使用HMM 分类器或SVM 分类器进行分类,输出手势。
4实现细节
4.1获得反射的超声波数据集
最初,系统先获得手势运动的时间序列片段,此时片段已经经过FFT 处理,结果如图6所示。
由于本实验扬声器的发射信号为20kHz ,测试设备话筒靠近扬声器,因此能量集中在20kHz 附近。
选取19750Hz 和20250Hz 附近的点分析数据,得到图7,纵轴进行了选取放大。
然后判断是否有手势移动,如果有就进行识别,如果没有就更新环境阈值。
为了排除噪声对手势识别的影响,本文系统保持对
环境噪声的实时更新。
当系统刚开始启动时快速更新
噪声阈值,稳定后,环境噪声在没有手势的时候持续更
新。
更新规则如下:
0.20.40.60.8 1.0 1.2 1.4 1.6 1.802.052.042.032.022.012.001.991.981.971.961.95Time/s F r e q u e n c y /104H
z 0.5 1.0 1.5 2.0 2.5 3.0 3.5
02.05
2.04
2.03
2.02
2.01
2.00
1.99
1.98
1.97
1.96
1.95Time/s
F r
e
q u
e
n c
y
/10
4H
z
0.5 1.0 1.5 2.0 2.502.052.042.032.022.012.001.991.981.971.961.95Time/s F r e q u e n c y /104H
z
0.5 1.0 1.5 2.0 2.5
02.05
2.04
2.03
2.02
2.01
2.00
1.99
1.98
1.97
1.96
1.95Time/s
F r
e q u
e
n c
y
/10
4H z
(a )挥手向前(b )挥手向后
(c )挥手向左(d )挥手向右
图4
不同的手势时频图
图5
系统流程图00.5 1.0 1.5 2.0 2.5
Frequency/104Hz
-40
-50
-60
-70
-80
-90
-100
-110
-120
-130
-140E n e
r g y /
d
B 图6经FFT 处理后的频率图徐曾春,吴凯娇,胡平:使用超声波的智能手机手势识别
241
Computer Engineering and Applications 计算机工程与应用
2018,54(2)N t =()1-αN t -1+αE t (2)N t 代表当前t 时刻噪声阈值,N t -1代表t -1时刻的噪声阈值,E t 代表当前t 时刻环境噪声。
本文系统中α取值为0.1。
4.2虚警率话筒收集扬声器发出的超声波经过物体反射得到的信号,当发生一系列的能量密度频率变化超过阈值,则判定发现手势。
由于用户在使用手机时离移动设备较近,所以反射声波比环境噪音信号强。
但是,对于环境噪音的变化必须实时更新,系统才能将手势与环境噪音区分并识别出来,降低误判率。
为了达到这个目标,AGRS 系统使用了虚警率(CFAR )[14]算法。
虚警率是一种统计方法,原来应用于雷达系统中,用来识别干扰物体所引起的反射。
CFAR 使用高斯分布N (μ,σ2)来接近环境噪音能量。
客观情况下,噪声总是存在,有时噪声会突然爆发产生集中能量,当噪声能量超过一定阈值()μ+γσ或者γ标准差超过平均噪声阈值,噪声就会被检测出来。
就算给定噪声分布,检测系统仍然有可能会因为突发噪音出错,出错概率为1-erf æèçöø÷γ2,以γ为数值呈指数下降。
关于噪声功率μ的取值,本文系统使用了窗口为W 的滑动窗口估计:μ()t =1W A ()t +æèçöø÷1-1W μ()t -1(3)A ()t 代表恰巧在t 时刻前的短期平均噪声功率。
假设x ()t 是在t 时刻话筒接收到的声波信号,那么A ()t =1W ∑k -t -W +1t ||x ()t 2
(4)对于σ()t 的估算方法和μ()t 类似。
关于窗口宽度
W 的选取,W 要比环境声音短得多,这样就算产生突发噪音,在W 窗口内也可以被近似看成高斯分布。
AGRS 系统按以下规则识别手势:(1)当声波信号强度超过环境噪音阈值N t ;(2)当声波信号强度||x ()t 2超过CFAR 阈值()μ+γσ;(3)当前检测与前一个能通过安全边界明确区分开来。
4.3抗干扰突发噪音
由于本文系统的检测基于声波能量,所以系统检测
可以轻易地被噪声干扰。
但是,用户在使用移动设备时
一般不会离得太远,一般为10~30cm ,并且声音信号功
率的降低遵循距离上的平方反比定律,所以,对于远距
离的噪声源,比如说几米开外的噪音对系统的影响可以
被忽略。
经检测,近处噪声源主要来自以下两种:(1)附近的
声音;(2)用户触摸屏幕。
这两种造成了近处无意义的
噪音。
为了应对这两种噪声,本文系统使用了手机自带的陀螺仪。
陀螺仪是一种检测装置,可以在三维空间感知物体旋转。
陀螺仪作为本检测系统的辅助资源。
在系统启动的初期,陀螺仪会先检测手机的摆放状态收集陀
螺仪数据进行短期校准。
阈值ε用来判断手机摆放状
态是否发生变化。
ε1为最低阈值,ε2为最高阈值。
当手机摆放在桌子上时,系统仅仅在陀螺仪确认手机摆放状态没有发生变化时才会进行检测;若用户手持手机,则当陀螺仪数据在ε1和ε2之间时系统检测手势。
而关于附近的声音,因为本系统的处理声波频率范围为19750Hz 到20250Hz ,如果附近声音强度过大甚至对超声波频率范围产生影响,则其在可听范围内的频谱会产生强烈波动,如果在全频率范围内波动过大,则视为噪音抛弃。
4.4特征值提取
如上文所述,多普勒效应的本质是频率的变化,所以本文系统所需提取的特征值是手势运动时所产生的频率的变化,不同的手势引起的频率变化规律不同。
由图7可知,声波能量在20kHz (发射频率)达到最大值,其周围存在的小波峰即为手反射的超声波。
因为次高
峰既有可能是手势移动引起的,又有可能是能量中心引
起的旁瓣,所以本文系统选取观测次高峰的移动规律区分不同的手势,当次高峰超过一定阈值,则判定为一个
手势开始,当次高峰回落到阈值以下说明手势出现间断。
如果连续有3个次高峰在阈值以下,则判定一个手势结束。
本文系统预设一个完整的手势完成时间为0.4s ,
将次高峰的频率波动序列存入向量F t 中,若长度小于
0.2s ,则视为噪声抛弃,不识别。
根据式(1)可以获得当
前瞬时速度作为辅助判断。
根据以上手势抓取规则,在数据采集阶段将获得大
量手势集合。
由图4可知不同的手势随着时间变化的时频序列不同,
不同的手势将分为各自的手势集合分别训练。
4.5数据归一化
将向量F t 放入HMM 训练之前,需先将数据进行归一化处理,以消除超声波密度的影响。
Frequency/104Hz 1.51.00.50E n
e
r g y
/
1
0-
8
1.9751.9801.9851.9901.995
2.0002.0052.0102.0152.0202.
2
5
图720kHz 附近的频率图环境噪声更新
242
2018,54(2)x =F t ()i -min ()F t max ()F t -min ()F t (5)式中max 为样本数据的最大值,min 为样本数据的最小值,F t ()i 是样本数据F t 中第i 个数据,x 是归一化后的数据。
4.6训练HMM 模型隐马尔科夫模型是一种非常强的分类器。
这种随机模型对于时变波谱很有效,并且能很好地分析信号特征。
要建立HMM 模型有三个基本问题:评估问题、解码问题、学习问题。
评估问题:现已知HMM 模型λ=
(A ,B ,π)和观察序列O =O 1,O 2,…,O t ,如何有效计算
P (O |λ)。
这决定了识别系统的准确度。
解码问题:给定观察序列O =O 1,O 2,…,O t 及模型λ=(A ,B ,π),如何寻
找当前最优的隐藏状态序列S =q 1,q 2,…,q t ,使S 对观
察序列O 的解释最为合理。
Yang 和Lugger [15]在2010年使用了最大期望(EM )算法,对于给定的观测数据计算极大似然估计。
对于问题三学习问题,即如何调整模型参数,最好的解决方案就是提供多个观察序列加大训练数据集。
公式表示如下:λ=arg max P (O |λ)(6)为了便于计算,本文选择离散型HMM 模型,观察值为F t (即次高峰的频率波动序列),F t 长度为30,隐藏状态数Q 设为5,然后使用每一种手势的训练集为每一个手势建立一个HMM 模型。
最开始,初始化参数λ=(A ,B ,π),其中A 表示状态转移矩阵,B 表示混淆矩阵,π表示初始状态概率,F t 为训练样本,之后利用Baum-Welch 算法对模型进行调整,直至获得最优模型参数。
得到了最优HMM 模型后,将实时的观测序列F t
作为测试数据输入,使用Viterbi 算法计算最大似然手势模型输出,得到相似度,F t
与哪个手势模型相似度最高则判定为这个手势。
4.7使用SVM 分类支持向量机是一种简单有效的机器学习算法,被广泛地应用于图像识别和分类问题中。
对有限的训练数据进行分类,SVM 分类器拥有极大的优势。
SVM 的提出是为了将低维空间中线性不可分样本集向高维空间映射变为线性可分的样本集(即找到一个将数据分割的超平面)而提出的。
超平面方程可以表示为:w T x +b =0(7)其中x 表示数据点,w T 中T 代表转置。
假设输入向量为x ∈R n ,则SVM 的基本形式表示为:
f ()x =∑i =
l l a i y i ϕ()x i ⋅ϕ()x +b =∑i =l l a
i y i K ()x ,x i +b (8)
ϕ代表非线性映射函数ϕ()x :R n →R n ′()n ≪n ′,其中运算符“⋅”代表内乘,x i ,y i 和a i 分别代表第i 个训练样本,类型标签和拉格朗日乘子,K 代表核函数,
b 代表
偏差。
使用SVM 时有一点需要注意,SVM 要求输入向量长度一致。
本文系统中SVM 使用的是默认的内核,训练集的
输入数据为F t (即次高峰的频率波动序列),长度为30。
由于本文系统训练了8种手势,所以识别标签为1~8。
惩罚参数变化范围为[2-8,28]。
经过训练后,即可使用SVM 对测试数据进行分类。
5评测
5.1实验描述
本文使用手机扬声器发射20kHz 的信号,通过话筒接收反射信号。
由于手机设备生产厂家不同,话筒与
扬声器的相对位置不尽相同,AGRS 系统会智能地选择靠近扬声器的话筒接收信号。
信号的采样频率选用国
际标准为44.1kHz 。
FFT 采用汉明窗,窗口大小为4096。
AGRS 系统在多种手机设备上进行了测试,测试手
机种类如下:小米3,三星S4和索尼M51W 。
测试环境分为安静、普通、嘈杂;用户的使用方式分为摆放和手
持;测试用的手势设计如表1。
对于环境的嘈杂都度,本文认为安静的环境一般指
室内办公环境,几乎没有高频噪音,只有一点低频噪音,
对系统几乎没什么影响。
普通的环境是指有一点高频噪音。
而嘈杂的环境则是指各个频段内都有噪音。
5.2手势识别准确性
AGRS 系统用于训练的手势数据集来自于5名志愿者,每个人每种手势各做50次,相邻的的手势之间要求时间间隔不得低于1s 。
最终,每种手势收集了250个样
本,共2000个样本。
验证时采用十折交叉验证,即将数据集分成10份,其中9份作为训练集,1份作为测试集,
轮流进行测试验证。
测试结果如表2所示。
从表2结果可知,本文系统在安静和普通的环境下运作良好,精度超过95%。
但是在极端嘈杂的环境下,例如餐厅,娱乐场所等地,系统识别精度受到影响较大。
表3为微软推出的soundwave 软件手势识别精度[10]。
与
之相比,AGRS 系统是面向智能手机的应用,而soundwave
是面向电脑的应用,由于手机有陀螺仪的辅助支持,并
手势描述
从右向左从设备前挥手
从左向右从设备前挥手
向前靠近设备
向后远离设备
从左前方到右后方在设备前挥手
从右后方到左前方在设备前挥手
从左后方到右前方在设备前挥手
表1手势种类
徐曾春,吴凯娇,胡平:使用超声波的智能手机手势识别
243
Computer Engineering and Applications 计算机工程与应用
2018,54(2)采用了虚警率降低手势的误识别,所以手势识别的精确度比电脑更高。
5.3分类器性能分析本文使用了两种分类器:HMM 和SVM 分类器,SVM 分类器选用了线性(Linear )内核和径向基(RBF )内核两种。
本文HMM 分类器使用的是Kevin Murphy 开发的工具箱,2005.6.8版本。
SVM 分类器使用的是台湾大学开发的LibSVM 工具箱,3.20版本。
如图8所示,测试结果表明效果最明显的是使用Linear 内核的SVM 分类器,在样本很少的时候精确度提升最快,其次是HMM 分类器,最后和使用Linear 内核的SVM 分类器达到的精度相似。
由表4和表5可看出,HMM 在训练,识别时耗时都长,最终,本文系统选择使
用Linear 内核的SVM 分类器。
6结语本文提出了一种基于声波的Doppler 效应,使用手
机自带的扬声器,话筒和陀螺仪进行手势识别的方法,
利用虚警率降低误识别概率,使用FFT 算法提取超声波特征,扬声器发射20kHz 的超声波信号,话筒接收反射回来的超声波,对19750Hz 到20250Hz 之间的频率进行重点分析,最后使用合适的分类器对手势进行识别。
最终,AGRS 系统对手势的识别率达到了95%以上。
当然AGRS 系统还有不足之处有待改进,比如对于从右向左的手势和从左向右的手势区分度不太高;手势识别的精确度还有待提高;如何在嘈杂的环境中提高识别精度;如何降低系统功耗等等。
参考文献:
[1]Fausti S A ,Erickson D A ,Frey R H ,et a1.The effects of noise upon human hearing sensitivity from 8000to
20000Hz[J].The Journal of the Acoustical Society of America ,1981,69(5):1343-1349.
[2]Ogris G ,Stiefmeier T ,Junker H ,et ing ultrasonic
hand tracking to augment motion analysis based recog-nition of manipulative gestures[C]//IEEE International Symposium on Wearable Computers ,2005:152-159.
[3]Kalgaonkar K.Ultrasonic Doppler sensor for voice activity
detection[J].IEEE Signal Processing Letters ,2007,14(10):
754-757.
[4]Tarzia S P ,Dick R P ,Dinda P A ,et al.Sonar-based mea-
surement of user presence and attention[C]//Proceedings
of the International Conference on Ubiquitous Comput-
ing ,2009:89-92.
地点家咖啡厅不同手势识别率/%
双手
96.67100.00↑↓(向前向后)95.0096.67↔(向左或向右)98.33
93.33表3微软soundwave 软件各个手势识别的准确度0510152025trained instance number 10095
9085
80
75
706560A c c
u r
a c
y /%HMM Linear RBF 图8不同分类器的识别精度分类器HMM Linear RBF 平均每组手势耗时/s 0.76180.00080.0022表4不同分类器的训练时间分类器HMM Linear RBF 平均每组手势耗时/s
0.1117
0.00030.0018
表5不同分类器的识别时间
安静普通嘈杂有无有无有无手持桌面手持桌面手持桌面手持桌面手持桌面手持96.3596.9595.2495.1293.6794.8990.2168.5665.4567.5458.6797.6798.1396.3696.5494.8495.4890.4670.2363.9868.3160.2399.3499.2198.6699.2198.7998.4596.3584.3573.6283.8668.5299.1698.6898.2499.5498.3698.67
96.28
81.3570.4381.2165.4796.8996.9595.4396.2593.2995.5690.8671.3369.8770.4564.7696.7596.5494.6595.3893.9794.6890.4572.6470.6271.3265.12
96.87
96.75
94.1296.6493.2395.4590.3173.1369.9871.8466.5796.5396.7693.8494.3292.5693.7669.3469.2766.4868.4664.2197.45
97.50
95.82
96.78
95.20
95.87
89.28
73.86
68.80
72.87
64.19
表2各个手势识别的准确度%244
2018,54(2)[5]van Willigen D M ,Mostert E ,Pertijs M A P.In-air ultra-sonic gesture sensing with MEMS microphones[C]//IEEE SENSORS ,2014:90-93.[6]Ourahmoune A ,Hamitouche C ,Larabi S.Learning ultra-sound gesture database :building and application to mus-culoskeletal ultrasound exams[C]//Annual International Con-ference of the IEEE Engineering in Medicine &Biology Society ,2014,36:1809-1812.[7]Wang Junjue ,Zhao Kaichen ,Zhang Xinyu ,et al.Ubiqui-tous keyboard for small mobile devices :harnessing mul-tipath fading for fine-grained keystroke localization[C]//International Conference on Mobile Systems ,2014:14-27.[8]Kreczmer B.Ultrasonic range finder for support of human gestures recognition[C]//International Conference on Hu-man System Interactions (HSI ),2015:25-27.[9]Peng Chunyi ,Shen Guobin ,Zhang Yongguang ,et al.Beep-Beep :a high accuracy acoustic ranging system using COTS mobile devices[C]//Proceedings of the Fifth Inter-national Conference on Embedded Networked Sensor Sys-tems ,2007:1-14.[10]Gupta S ,Morris D ,Patel S ,et al.SoundWave :using the
Doppler effect to sense gestures[C]//SIGCHI Confer-ence on Human Factors in Computing Systems ,2012:
1911-1914.
[11]Abdelnasser H ,Youssef M ,Harras K A.WiGest :a ubiq-uitous WiFi-based gesture recognition system[C]//IEEE Conference on Computer Communications (INFOCOM ),2015:1472-1480.
[12]Gill T P.The Doppler effect :an introduction to the the-
ory of the effect[M].[S.l.]:Logos Press ,1965.
[13]Uegami M ,Iwamoto T ,Matsumoto M.A study of detec-tion of trip and fall using Doppler sensor on embed-
ded computer[C]//2012IEEE International Conference
on Systems ,Man ,and Cybernetics ,2012:3263-3268.
[14]Blum R ,Kassam S ,Poor H.Distributed detection with
multiple sensors I.Advanced topics[J].Proceedings of the
IEEE ,1997,85(1):64-79.
[15]Yang B ,Lugger M.Emotion recognition fromspeech sig-nals using new harmony features[J].Signal Processing ,2010,90(5):1415-1423.
[11]Hinton G E ,Osindero S.A fast learning algorithm for deep belief nets[J].Neural Computation ,2006,18(7):1527-1554.[12]Lei Z ,Liao S.Face recognition by exploring informa-tion jointly in space ,scale and orientation[J].IEEE Trans on Image Processing ,2011,20(1):247-256.[13]宋克臣,颜云辉,陈文辉,等.局部二值模式方法研究与展望[J].自动化学报,2013,39(6):730-744.[14]Taigman Y ,Yang M ,Ranzato M ,et al.DeepFace :clos-ing the gap to human-level performance in face verifi-cation[C]//Conference on Computer Vision and Pattern
Recognition ,2014:1701-1708.
[15]Vincent P ,Larochelle H ,Bengio Y ,et al.Extracting and composing robust features with denoising autoencoders[C]//
Proceedings of the 25th International Conference on
Machine Learning ,A :ACM ,2008:1096-1103.[16]张学工.关于统计学习理论与支持向量机[J].自动化学
报,2000,26(1):32-42.
[17]Lei Z ,Liao S.Face recognition by exploring informa-
tion jointly in space ,scale and orientation[J].IEEE Trans
on Image Processing ,2011,20(1):247-256.
(上接167页)[4]尹蔚彬.从拉坞戎语看濒危语言的特点[J].西北民族大学学报:哲学社会科学版,2016(2):114-118.[5]黄昌宁.统计语言模型能做什么?[J].语言文字应用,2002,1(2):77-84.[6]张绍麒,张文峰,姜岚,等.计算机辅助方言研究系统的建设与胶东方言电子语音语料库的研制[J].鲁东大学学报:哲学社会科学版,2006,23(3):120-123.[7]Chung S F ,Wang S Y ,Tseng Y W.The construction of the NCCU foreign language learner corpus[J].Foreign Language Studies ,2010(12):71-98.[8]Greenbaum S ,Svartvik J.The London-Lund corpus of spo-ken English[M].[S.l.]:Lund University Press ,1990.[9]俞士汶,段慧明,朱学锋,等.北京大学现代汉语语料库基本加工规范[J].中文信息学报,2002,16(5):51-66.[10]李宇明.总结经验,开拓创新,努力促进“十一五”语言文字应用研究[J].语言文字应用,2007(1):1-11.[11]Austin P nguage documentation and description[Z].
The Hans Rausing Endangered Languages Project ,2002,1.
[12]Johnson nguage documentation and archiving ,or
how to build a better corpus[J].Language Documenta-
tion and Description ,2004,2:140-153.
[13]韦树关.中国濒危语言研究新进展[J].广西民族大学学
报:哲学社会科学版,2006,28(5):2-5.
[14]韦茂繁,秦红增.语言、濒危与文化——语言学与人类学
的对话[J].广西民族大学学报:哲学社会科学版,2013
(1):42-47.
[15]孔江平.语言文化数字化传承的理论与方法[J].北京大学
学报:哲学社会科学版,2013,50(3):89-97.
[16]SUN Junyi.jieba 中文分词[EB/OL].[2016-07-21].https ://
/fxsjy/jieba.
[17]陶伟.警务应用中基于双向最大匹配法的中文分词算法
实现[J].电子技术与软件工程,2016(4):153-155.
[18]52NLP .SIGHAN 中文汉语分词测评[EB/OL].[2016-07-21].
http :///中文分词入门之资源.(上接238页)徐曾春,吴凯娇,胡平:使用超声波的智能手机手势识别
245。