基于模型的单通道语音分离综述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第2 7卷 第 1 1期
21 0 0年 1 1月
计 算 机 应 用 研 究
Ap l a in Re e r h o o u e s p i t s a c fC mp t r c o
Vo _ 7 No 1 l2 . 1
NO V. 2 O 0l
基 于 模 型 的 单 通 道 语 音 分 离 综 述
ti o c. h stpi
Ke r s ig ec a n ls e c e a ain;mo e— a e ;s e k rd p n e t p a e —ee t n p a e ・ d p n e t y wo d :sn l —h n e p e h s p rt o d l s d p a e — e e d n ;s e k rs lci ;s e k ri e e d n b o n
sekr eedn,pa e slco n pae— dp ne t e aao . nl e h ao sot m nso ec ehd p ae— p netsekr e t nad sekr n eedn prt n A ay dtem jr hr o ig f ahm to d - ei i s i z c
鸡 尾 酒 会 问题 … 。
这 类 病 态 问题 有 近 似 唯 一 解 。 欠 定 问题 中有 一 种 极 端 情 况 就 是 M =1的情 形 , 类 语 音 这
se c e aa o n i us d m jrme o sd v l e n t i rtr w i o l go p it tre m jr aeois p e h sp r i a d ds se ao tn c t d e e p d i h l e ue hc cud ru n he ao c tgr : h o e ta h o e
离研 究发 展 方 向 进 行 了展 望 。
关键 词 :单通道 语音 分 离;基 于模 型 ;说 话人依 赖 ;说话人 选择 ;说话 人独 立 中图分类 号 :T 3 14 P9 .2 文献 标志码 :A 文章 编号 :10 — 6 5 2 1 ) 14 2 — 7 0 13 9 ( 0 0 1 — 0 5 0
杨 海 滨 ,张 军
( 国防科 学技 术 大学 信 息 系统与 管理 学院 ,长 沙 4 0 7 ) 10 3
摘
要 : 音 分 离是 实现机 器 听觉的一 个 重要 而基 础 性 的 任 务 , 通 道语 音 分 离是 语音 分 离 中最 为 困难 的 问 语 单
题 。讨论 了基 于模型 的单通 道语 音分 离方 法 , 话人 依赖 的 、 话 人 选择 的和 说 话 人独 立 的 三类 单通 道 语音 对说 说 分 离问题展 开分析 , 并指 出当前方 法存在 的 问题 和影 响算 法性 能的 关键 因素 。最后 对基 于模 型的 单通 道语 音 分
Leabharlann Baidu
定 问题相对 困难得多 , 往往需 要对 源信 号作 更强 的假设 , 得 使
0 引言
多源混合 语音 信号的识别一 直 以来 是机器 听觉 的一 个重 要而又困难的问题 。而人类 却 可以在 嘈杂 的声音 环境 中集 中 听力于某些感 兴趣 的语音 , 类似于从混合语音信号 中分离 出其 想要 的源信号 。如何用计算 机实现 人类所 具有 的从多声 源混 合信 号中分离 出全部或部分感兴趣源信号 的能力 , 通常被称为
a d su id t e k y fc o st a f ce h ef r n e o h l oi m. i al , ic s e h u u e r s a c i ci n n n t d e h e a t r h taf td t e p r ma c ft e a g rt e o h F n l d s u s d t e f t r e e r h dr t s o y e o
Ab t a t p e h s p r t n i ni o tn n a i ts o o u e u i o sr c :S e c e a a i s mp ra t d b sc a k frc mp t r d t n,a d sn l —h n e p e h s p r t n i te o a a a i n i ge c a n l e c e a ai s h s o mo tdf c l p o l m i h ed o p e h s p rt n T i a e e iw d t e r s a c o i f mo e — a e i ge c a n l s i u t r b e n te f l fs e c e a ai . h sp p rr ve e h e e r h t p c o d l s d s l h n e i i o b n
Y ANG Ha — i Z ibn. HANG J n u
( colfI omai yt & Maa e et N t n l nvrt o freTcnlg ,C agh 10 3 hn ) Sho o n r tnSs m f o e n gm n , ai a i sy fDe i ehooy hn sa4 07 ,C ia o U e i ec
d i1 .9 9 ji n 10 —6 5 2 1 . 10 6 o:0 3 6 /. s. 0 139 .0 0 1 .0 s
S r e fmo e - a e i ge-h n e p e h s p r to u v y o d lb s d sn l - a n ls e c e a a i n - c
21 0 0年 1 1月
计 算 机 应 用 研 究
Ap l a in Re e r h o o u e s p i t s a c fC mp t r c o
Vo _ 7 No 1 l2 . 1
NO V. 2 O 0l
基 于 模 型 的 单 通 道 语 音 分 离 综 述
ti o c. h stpi
Ke r s ig ec a n ls e c e a ain;mo e— a e ;s e k rd p n e t p a e —ee t n p a e ・ d p n e t y wo d :sn l —h n e p e h s p rt o d l s d p a e — e e d n ;s e k rs lci ;s e k ri e e d n b o n
sekr eedn,pa e slco n pae— dp ne t e aao . nl e h ao sot m nso ec ehd p ae— p netsekr e t nad sekr n eedn prt n A ay dtem jr hr o ig f ahm to d - ei i s i z c
鸡 尾 酒 会 问题 … 。
这 类 病 态 问题 有 近 似 唯 一 解 。 欠 定 问题 中有 一 种 极 端 情 况 就 是 M =1的情 形 , 类 语 音 这
se c e aa o n i us d m jrme o sd v l e n t i rtr w i o l go p it tre m jr aeois p e h sp r i a d ds se ao tn c t d e e p d i h l e ue hc cud ru n he ao c tgr : h o e ta h o e
离研 究发 展 方 向 进 行 了展 望 。
关键 词 :单通道 语音 分 离;基 于模 型 ;说 话人依 赖 ;说话人 选择 ;说话 人独 立 中图分类 号 :T 3 14 P9 .2 文献 标志码 :A 文章 编号 :10 — 6 5 2 1 ) 14 2 — 7 0 13 9 ( 0 0 1 — 0 5 0
杨 海 滨 ,张 军
( 国防科 学技 术 大学 信 息 系统与 管理 学院 ,长 沙 4 0 7 ) 10 3
摘
要 : 音 分 离是 实现机 器 听觉的一 个 重要 而基 础 性 的 任 务 , 通 道语 音 分 离是 语音 分 离 中最 为 困难 的 问 语 单
题 。讨论 了基 于模型 的单通 道语 音分 离方 法 , 话人 依赖 的 、 话 人 选择 的和 说 话 人独 立 的 三类 单通 道 语音 对说 说 分 离问题展 开分析 , 并指 出当前方 法存在 的 问题 和影 响算 法性 能的 关键 因素 。最后 对基 于模 型的 单通 道语 音 分
Leabharlann Baidu
定 问题相对 困难得多 , 往往需 要对 源信 号作 更强 的假设 , 得 使
0 引言
多源混合 语音 信号的识别一 直 以来 是机器 听觉 的一 个重 要而又困难的问题 。而人类 却 可以在 嘈杂 的声音 环境 中集 中 听力于某些感 兴趣 的语音 , 类似于从混合语音信号 中分离 出其 想要 的源信号 。如何用计算 机实现 人类所 具有 的从多声 源混 合信 号中分离 出全部或部分感兴趣源信号 的能力 , 通常被称为
a d su id t e k y fc o st a f ce h ef r n e o h l oi m. i al , ic s e h u u e r s a c i ci n n n t d e h e a t r h taf td t e p r ma c ft e a g rt e o h F n l d s u s d t e f t r e e r h dr t s o y e o
Ab t a t p e h s p r t n i ni o tn n a i ts o o u e u i o sr c :S e c e a a i s mp ra t d b sc a k frc mp t r d t n,a d sn l —h n e p e h s p r t n i te o a a a i n i ge c a n l e c e a ai s h s o mo tdf c l p o l m i h ed o p e h s p rt n T i a e e iw d t e r s a c o i f mo e — a e i ge c a n l s i u t r b e n te f l fs e c e a ai . h sp p rr ve e h e e r h t p c o d l s d s l h n e i i o b n
Y ANG Ha — i Z ibn. HANG J n u
( colfI omai yt & Maa e et N t n l nvrt o freTcnlg ,C agh 10 3 hn ) Sho o n r tnSs m f o e n gm n , ai a i sy fDe i ehooy hn sa4 07 ,C ia o U e i ec
d i1 .9 9 ji n 10 —6 5 2 1 . 10 6 o:0 3 6 /. s. 0 139 .0 0 1 .0 s
S r e fmo e - a e i ge-h n e p e h s p r to u v y o d lb s d sn l - a n ls e c e a a i n - c