基于声纹识别的Web身份认证系统设计

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
个个对外发布 ,将造成存取上的不便 ,必须使 用较简单的
格式包装这一数据序列 ,再对外发布 。字符 串是最简单的格 式之一 ,这一序 列的声 纹特征 可使 用格 式化 I 的方式 串接 / O
成 一 个 字 符 串 , 透 过 I k wn 1 外 发布 该 字 符 串变 量 , 并 Un o 接 3对
t e e o g r i i fs e c a l s Ac u l e t e u t h w h t h s s tm u t b e f rc n r li g W e e o r e a d h sg o d n fc t h n u h tan ng o p e h s mp e . t a s s lss o t a i yse i s i l o o to l b r s u c n a o d i e t i ai t r t s a n i on p ro ma c n to g p ra ii . e f r n e a d sr n o b lt t y
[ src]T i pp r ein batet a o ytm ae n v i pit eo nt n AnAc vX o t lsd vlp di ebo e o Ab ta t hs ae s s d g We uh ni t ns s b sdo oc r c g io . t e c n o e eoe t rwsr ci e e nr i i r i nh t
作者简介:曾 斌( 7 -) 1 0 ,男,副教授, 9 主研方向: 信息安全, 身
份认证 系统 ;姚 路 ,讲 师、硕 士 ;陈志诚 ,讲师、博士研究生
E ma :t e e u l .h b n - i r i @p b c . . l uc iw h o 收稿 日期 :2 1—2 3 01 — 02
A P等 ,由 A P A te S) 于 S 对 cvX控件具有更好 的支持 ,因此将 i
以 AS P技术开发浏览器端与服务器端之 间的数据传递方式。 常见的声纹验证技术有动态时间校正( nm cTmeWapn , Dya i i rig
DT 与隐藏式马尔科 夫模 型等 , W) 动态 时间校正在识别连续语
7 4 。 _
练千
H M声 纹 识 别 / M 声纹训练 A t e 录 音 ci X v 控 件
特征值 字符串 c 0[】C OB] 0[] O [ [] 0 [ ] [二工二l c【]2 c[]1 ]二二工二]
[ [ c j]I[ c 7 【l c 9 二工二]口州 】 】 ”8
音 上 的效 果 不 佳 且 运 算 费 时 , 当字 词 量 增 大 时辨 识 速 度 较 慢 , 这 方 面 隐 马 尔 科 夫 模 型 明显 优 于 动 态 时 间校 正 】 因此 ,本 。

最后获得代表语 音频谱 的包络 ,即倒频谱系数 ,为一 J
十阶的倒频谱系数矩阵 ,这一序列的倒频谱系数数组 ,如果
文献标识码: A
中圈 分类号: P0 T 39
基于声纹识别的 We b身份认证 系统设计
曾 斌,姚 路,陈志诚
( 海军工程大学管理工程 系,武汉 4 0 3 ) 30 0 摘 要: 设计一个基于声纹识别 的 We 身份认证系统 。 浏览器端利用 自主开发的 A t e b 在 c vX录音控件录取封装使 用者 的声纹特征并传送给 i
DOI 1 .99jsn10 —4 82 1 50 7 : 03 6/is. 03 2 .0 11.4 . 0
1 概 述
近年来 ,由于因特网和电子商务的迅速发展 ,We b服务
su ofc n MF C ,在 有信道 噪声 和频 谱 失真 时 , t m C e iet r i , C) M C 参数表现比较 稳定。由线性预测系数导出倒谱系数是 FC 种常用的语音识别参数 ,在安静的环境下 ,线性预测 倒谱
De i n 0 e d n iyAu h n ia i n S se sg fW b I e tt t e tc t0 y tm
Ba e 0 Vo c prntRe o nii n s d n i e i c g to
ZENG n YAO , Bi , Lu CHEN ic e g Zh —h n
d sg e orp e e tteChn s r swh c r e aae ya n etdsln esae An n asa ev ie rn aa a ei o sr ce fe e in dt e r s n ie ewod ih aes p td b ni sre ie c tt. d t tbl oc p td tb s sc n tu td atr h r he i
[ ywo d ]ie tyatet ain vie r teo nt n HidnMak vMo e( Ke r s d ni u ni t ;ocp n c g io ; d e r o dl t h c o i r i HMM)Dy a cTme rigDT ; n mi i pn ( W) Wa

器需要存取大量资源并提供各种信息服务 。目前 ,网络上最
普遍的身份认证方式属于密码验证存取行为 ,文字密码容易 被 窃取 或遗失 ,甚至造成个人或单位财产的遗失 。为了增加
网 站 上 数 据 的 安 全 性 ,在 认 证 过 程 中 ,除 了 使 用 密 码 方 式 进
系数与 MF C系数的性能相差不多。研究表 明 ,采用感觉加 C 权的线性预测倒谱 系数有更好 的识别稳健性 。 本文在 网站 资源 的存取 过程 中加 入一种 声纹验证 的机 制 ,以控制 网站使用者的访问及重要资源的存取 ,从而达到 加强数据 安全 的 目的。
第3 7卷 第 1 期 5
V_ .7 O 3 1






2 1 年 8月 01
A u us 2 1 g t 01
N o.5 1
Co mpu e t rEng n e i g i e rn
人 工 智 能及识 别技 术 ・
文章 编号:1 o 3 8 o1 5_19 o _ 4 ( l 1_o — 3 0 22 ) 4
符合 开发 浏览器 端录 音程序 的设 计需求 ,因此 ,本文 采用 A t e 控制控件 的技术开 发浏览器 端录音控件 。常见的 因 ci X v
基金项 目:湖北省 自然科 学基金资助项 目(R 06 Z Y18)
性计算 、数据挖掘 和模 式匹配 ,如动态时 间规整、 隐马 尔 可夫模型( d e ro d lHMM) 】 HidnMak vMo e, ”、神经网络 和多特 征组合等技术 。 目前 ,通常使 用的算法主要有模板 匹配法 、
文选 择隐马尔科夫模型作为声纹识别系统 的设计方案 。基于
供浏览器存取 ,其转换方式如图 2所示 。
十阶倒频谱系数 阵列
C T 1

声纹 识别 的 We b身份认证系统架构见图 1 。
0 1 2 3 4 5 6



2 3

浏 览 器
声纹模型
为是平稳的,因此,可以对语音信号进行分帧分析。目 , 前
比较有效的识别参数为 Me频率倒谱系数( l rqec e— l Me Feuny C p
l0 5





0 =一∑ (一m/ ) 一 1 na
m=l
2 1 年 8月 5日 01
P <n (1 1)
特 网应用程序设计包括采用公共 网关接 口( o C mmo ae y nG t wa It fc, G ) ne ae C I r 和应用服务提供商(p l ao e i rvdr A p ct n Sr c Po ie, i i ve
实 际应 用,其技术手段主 要包括对声音特征进行线性 或非线
微 软 所 提 供 的 以组件 对 象 模 型 ( o o etO jc dl C mp n n betMo e, C OM) 为基础 的 Ac vX技术等 。其中 ,A t e te i c vX控制控件技 i 术能 够支持现 有网站技术及 其他 因特 网的标准 ,具有 自动下 载并 自行 安装 功能 ,可开发功能强大 的软件控件 ,并提供一 套安全 问题 的解决方案 ,具备较好 的集成功能 ,这些优点正
( e at n f n g me t n ie r g Na a Unv ri f n ie r g Wu a 3 0 0 C i a D pr me t o Ma a e n gn e n , v l i es yo gn e n , h n4 0 3 , h n ) E i t E i
服务器 ,服务器 端使用隐马尔科夫模型表述单字 ,单字之 间通过增加静音状态分割以及语音训练形成稳定 的声纹特征模型作为身份验证 的
基础库 。实 际测试结果表 明,该系统识别性 能好 、可移植 性强 ,适用于 网络资源的远程声控 。
关健词 :身份认证 ;声 纹识 别 ;隐马尔科 夫模型 ;动态时间校正
rcr n n aslt ev iepo et so euesa dte a s rt esre. nte sre ie d e ro dl eoda de cpua t oc rpre ft sr n h nt nf t ev rI e rsd,aHid nMak vMo e( eh i h r e oh h v HMM)i s
最近邻方法、神 经网络法 、隐马尔可夫模型方法和 V 聚类 Q 方法等 。实 际证 明使用隐含马尔可夫模型效果更好 。它能很
好地描述语音信号的时变性 和平稳性 ,例如 ,基于 H MM 的 声纹识 别技 术在 环绕智能 中的成功应 用 。 ] 选 取声纹识别的特征参数在声纹识别系统 中非常重要 。 作为准 平稳 的随机过程 ,语音信号在 1 ~5m 内可以认 0 ms2 s
1 制 数 字 才 能还 原 为原 来 上传 的数 据 ,这 个译 码 后取 得 的 6进 字 符 串 是经 过包 装 的 ,必 须 依 浏 览 器 端 包 装 字 符 串 的 方 式 ,
2 基于声纹识别的 we 身份认证系统设计 b
21 系统结构 .
整个 系统包括 浏览器端 录音程序、浏 览器端与服务器端
之间声纹数据的传递以及声 纹训练与识别程序 等部份。在录 音程序 方面需 要具备能够在 We b页面上运行程序 的能力 , 这
方面 的标 准语言很 多,例如 ,Jv aa语言、嵌入式脚 本语言和
行 验证 外 ,语音是人类身上最 自然的特征之一 ,声卡及麦克
风 是 目前个人计算机 的基 本配置之 一 ,所以,利 用声 音进 行 身份认 证是所有生物验证 系统 中所需花费最小 的一种 。 声 纹识 别属 于生物识 别技术 的一种 ,它通过 分析语 音波
形计算 出说 话人生理 和行 为特征 的语音参数 , 自动识 别说 话 人 身份 。与语音识别 不同,声 纹识 别利 用的是语 音信 号中的 说话人信息 ,而 不考 虑语 音中的字词意 思,能够很好地满足 因特 网的身份认证要求…。如今 ,声纹识别技术 已逐渐走 入
因特 例 1

w w wN 务 器
图 2 倒频谱系数数组转换为一个特征值字符 串的示 意图
服务器
在浏览器端 ,使用 A t e 控制控件录 下的声纹特征 , ci X v 透过窗体 的包装传送至 We 服务器 , b 窗体所传送 数据将 由内 嵌 的 AS P程序存取 。AS P程序取得 的数据是编码过的格式 , 需 要译码 为成 对 的字 符 串数值 ,并转换 字符 串 中的加号 与
相关文档
最新文档