中科大语音实验室简介

合集下载

中国科学技术大学英语语言实践中心简介

中国科学技术大学英语语言实践中心简介中国科学技术大学英语语言实践中心(English Practice Center，EPC)建于2006年，位于科大东区新图书馆二楼东侧。

在我校研究生教育创新计划支持下，经过十三年的持续建设，英语语言实践中心已建成一个集英语口语实践/写作实践、英语学习服务及英语应用为一体的立体、交叉平台，为研究生英语语言应用能力的提升提供个性化、全方位、一站式服务。

英语口语实践平台英语口语实践平台是专门为选修研究生日常交流英语与研究生学术交流英语的同学所搭建的英语口语实践场所。

请选修该课程的同学务必认真阅读以下选课须知，以免影响学分的获取。

1．学时要求选修研究生日常交流英语和研究生学术交流英语的同学在完成20学时课堂学习的同时，须在EPC口语实践平台修满20学时的实践课，方可获得“日常交流英语”或“学术交流英语”课程的成绩及相应学分。

2．课程预约请同学们登录EPC主页（/）的口语实践平台（Oral Practice Platform）预约课程。

该系统的登录用户名和密码无须注册，为研究生信息平台选课时用的系统平台密码，不可使用统一身份认证。

每学期口语实践课堂周次以研究生院的教学日历为准。

每位同学每次最多可预约课时为4学时，修完预约课堂的同时可以再次预约新的课堂。

3．上课预约后必须按时到课，课前及课后须在EPC前台刷本人一卡通记录学时。

每节课课前25分钟内刷卡有效，课堂开始10分钟后刷卡无效，系统将无法录入学时。

为了更好地参与课堂实践，请同学们提前查看网站所提供的相应课件介绍并在课前对自己所选话题做好充分准备。

4．评价实践课堂结束前，任课老师会对每位同学的口语实践表现进行评价。

评价分为：优、良、中、差四个等级，教师同时记录缺课同学的姓名。

若实践表现三次被测评为“差”，系统会发出邮件提醒。

收到邮件的同学，两周内须预约参加应用平台的英语口语能力测评，否则系统无法录入相应学时。

5．反馈请同学们在课后及时登录选课系统填写课堂学习的英文反馈。

语音室介绍

电气工程系语音室简介
语音室是我校通讯客服专业开展教学工作的重要场所，是专为学生进行口语训练和听力训练的场合。

本实验室配制数字语言学习系统，由主控台，学生跟读型录音机和学生专用课桌椅组成，另配有接在学生录音机上的耳机话筒和连接电缆。

本实验室还可纠正学生的发音，进行口语训练，听力训练，学生可跟读并进行录音重放和复听，将自己的读音与老师的比较，再跟读加以模仿纠正，达到读音准确的目的。

本语音室可同时容纳80名学生上课，是一套软、硬件结合、功能强大、操作简便的教学系统，
语音室系统包括：课堂教学系统、自主学习系统、无纸化考试系统、教学资源库及教学管理系统等五大模块。

1、课堂教学功能：具有广播教学、示范教学、分班教学、小组讨论、监听辅导、呼叫，对讲、插话讲解等功能。

2、自主学习系统功能：具有自主点播、自我测试、自主录音、重放和复听。

3、考试系统功能：具有试卷制作、专业化考试(含听力考试，口语考试，阅读考试，写作考试，口译考试)功能。

4、资源库管理系统功能：具有资源分类(含听力资料、听读资料、听力测试、阅读考试、电子书籍、音像资料、教案、学生录音)、教案制作、资源库使用情况统计、资源库的容量应强大，兼容性、扩展性好，具有可升级性。

高等学校外语语音实验室的建设和管理

作性能。
．
其规章制度的真正的完整性。目前，对于高校的语言实验室，每个学校基本上都有较为完善的语音室管理规章制度，但要完完全全的执行起来就有着一定的难度。在日常的工作中，一名语音室管理员要同时
学生是语音室的使用者，对在语音室上课的学生要严格的要求，
水平
负责多个语言实验室的语音设备并要维持语音室教学管理的秩序，这样管理员在管理的过程中就会显得有些 “ 势单力薄” 。另外，在对语
音室进行管理的过程中，往往会和学生产生一些正面的冲突。例如，
学生进入语音室上课是需要穿上鞋套的，对违规的学生要进行批评和
的效果。
音室规范使用的保障。只有在管理员，教师和学生共同的认真执行之
中，才能保障语音室多媒体教学的教学活动顺利进行，使语音实验室在教学中发挥应有的作用，从而提高并促进多媒体语音室教学的
水平。
２．语音设备的维护保养不够重视，部分设备过于陈旧语音设备的使用寿命，与语音设备的维护和保养有着直接的关
学生必须穿鞋套进入教室，并按照课表，班级，对应学号入座。上课上课前认真填写语音室座位表，检查学生机，耳机是否有完好，如有损坏要及时的向管理员和任教老师报告，对故意损坏设备的学生根据损坏的程度进行不同程度的批评和赔偿。下课后学生要打扫教室的卫生，做好值日工作。３．认真执行语音实验室的规章制度，提高多媒体语音室教学的
职教
台
高等学校外语语音实验室的建设和管理

声学所简介

声学所的定位是，在声学和信号信息领域，以凝聚高水平的科研和管理人才为根本，以满足国家经济发展、社会进步、国防安全等方面的需求为目标，以提升自主创新能力为主线，以解决关系国家全局和长远发展的基础性、战略性、前瞻性重大科技问题为着力点，着力突破维护国家安全和权益、增强国际竞争力的前沿科学问题、核心关键科技问题、受制于人的瓶颈技术问题和重大系统集成问题，着力突破带动新兴产业发展和提高人民健康水平的战略高科技问题，成为国家创新体系中“不可替代”的、有骨干引领作用和重要国际影响力的研究所，努力实现“国家的声学所，国际的科学家”的组织目标。2010年，声学所形成了 “十二五”发展战略规划，将重点发展5个重大科学技术研究方向、4个基础研究方向、4个重点战略高技术研究方向。力争通过“创新2020”的实施，在声学与信号信息处理领域中，理论上有重大创新，突破一批关键核心技术，形成一批重大创新成果；形成一批结构合理，动态优化的创新团体；使科技布局更为合理；并将在“创新2020”实施过程中进一步强化管理制度建设。
截至2010年底，声学所共有在职职工736人。其中科技人员662人、科技支撑人员138人，包括中国科学院院士6人、研究员及正高级工程技术人员84人、副研究员及高级工程技术人员174人；全所进入创新岗位370人。
声学所共有中国科学院“百人计划”入选者11人（新增1人）；国家杰出青年科学基金获得者1人；新世纪百千万人才工程国家级人选3人。
为了将科研技术成果更好地服务于社会，并且与社会资源相结合，以产业发展形成科研体制的创新。2010年，声学所调整产业化政策，加大工作支持力度，建立完善的产业化发展平台。结合区域经济发展需求，积极建立特色产业基地，推动区域经济发展，建立了浙江中科电声研发中心、浙江省电子电声产品质量检验中心、南京下一代网络应用技术工程分中心；围绕国家重大需求，紧跟市场脉搏，增强自主创新能力，建立了无锡中科智能信息处理研发中心；加强与国内知名企业的合作，强理化所联合实验室。2010年，声学所与青岛市政府及青岛高新区科技合作获得重要进展，成立了由所领导牵头的专门工作机构，推进“中科院声学所北海研发及产业化基地”的建设。声学所的院地合作工作正在蓬勃发展，呈现出多学科、多项目、多点“开花”的良好态势。既支持了地方经济建设，也壮大了声学所的实力；既扩展了科学院和声学所的影响力，也深化了产学研的有效结合；对进一步支持经济发展、促进研究所科研工作将起到重要作用。

普通语音实验室简介---江梅芬

语音实验室简介
语音室为我院英语视听说、综合英语、专业英语、语音、商务英语视听说、文学鉴赏课、精品示范课程录制、跨文化交际等课程提供完备的多媒体教学场所，成为我院学生进行英语语言学习与实践的重要场所。

语音室一方面为学生提供英语视听说课程教学的场所和设备，另一方面更为学生的实践教学创造良好的条件，我们通过电脑屏幕和语音设备，将详实的理论和生动而富有趣味的多媒体材料结合起来；通过教学软件和光盘，为同学们构筑起虚拟的活动空间，通过欣赏优美的英文歌曲和精彩的原版电影，为同学们创造一个轻松活泼的英语语言学习环境。

G.729标准中文版(中国科学技术大学,中科大-ADI联合实验室,jt)

4
中国科学技术大学中科大-ADI 联合实验室内部使用资料
激励，采用了 17-bit 的代数码书。Adaptive-codebook 和 Fixed-codebook 的增益采用了 7-bit 的矢量量化，对于 Fixed-codebook 增益应用了 MA 预测。最后，使用最终的激励信号更新滤波器的存储单元（Filter Memories）。
本建议组织如下：第 2 节概述了 CS-ACELP 算法。第 3 和第 4 节分别讨论了 CS-ACELP 编码器和解码器原理。第 5 节描述了本编解码器的 16-bit 定点算法软件。
2．编解码器概述
CS-ACELP 编解码器是基于码激励线性预测（Code-Excited Linear-Prediction，CELP）编解码模型的。它对 10 ms 语音帧信号进行操作，语音信号的采样率是 8 kHz，即每秒 8000 个样点，10 ms 语音帧对应有 80 个语音样点。要对每个 10 ms 语音帧信号进行分析以提取
图 1 CELP 合成模型概念方块图
2.1 编码器
编码原理如图 2 所示。预处理块完成对输入信号的高通滤波和信号缩放处理。预处理过的信号作为后续分析的输入信号。每 10 ms 帧进行一次 LP 分析以计算 LP 滤波器系数。这些系数将转换成 LSP 并进行 18-bit 预测式两级矢量量化（Vector Quantization，VQ）。激励信号是用分析合成（analysisby-synthesis）搜索过程来选择的，该过程中根据感知加权失真测量（Perceptually Weighted Distortion Measure），原始的和重建的语音的误差（Error）要最小化。这是通过用一个感知加权滤波器（Perceptual Weighting Filter，PWF，PW 滤波器）滤波误差信号（Error Signal）来实现的，PW 滤波器的系数是从非量化的 LP 滤波器得到的。感知加权的量是自适应的，以改善输入信号的性能，使之具有一个平坦的频率响应。

科大讯飞深度研究报告.docx

科大讯飞深度研究报告：良工心磨砺，静听春江暖i投资（微信号：itouzi8）“VIP会员俱乐部”旨在搭建专业的产业链研究社群。

通过汇集产业专家、行业分析师、PE/VC、上市公司及实业高管和职业投资人，一起进行深入、全面、前瞻性的产业链研究，发掘股权、股票市场的投资机会。

申请加入VIP方法：请加小i个人微信，微信号：itouzi6，加入时请标注：vip+姓名+公司+职位+手机作者：长城证券周伟佳投资建议：在苹果发布SIRI三年后的今天，语音行业愈发成熟，语音应用遍地开花，互联网语音门户的盈利模式逐渐成形。

$科大讯飞(SZ002230)$在这3年里，证明了自己的技术实力与市场能力，确立了中文语音门户霸主地位，同时取得了财务增长。

在进一步优化了股权结构之后，讯飞将再次起飞。

预计公司2014年至2016年EPS为0.55/0.89/1.42元，对应PE51/31/20倍，首次覆盖，强烈推荐。

投资要点：股权结构合理确保长期增长：近期公司增加科大控股与胡宏伟先生为公司一致行动人，合计持股达到总股本20.95%，高持股比例确保公司高管有足够动力。

公司第二期授予的股票期权的行权价格为29.88元，接近现价，彰显公司信心。

行业门槛不断抬高：语音技术已经脱离了小打小闹的年代，需要大量的资金和人力的投入。

讯飞依托中科大的学术实力和人力资源供给，拥有强大的研究团队。

同时拥有多项业内唯一的产业资源，如国家863产业化基地、发改委“语音高技术产业化示范工程”、语音技术标准牵头制定单位等，享有“语音技术国家队”的政策待遇。

可以说，讯飞将行业门槛提升到一个新的高度。

技术实力一统江湖：公司在中文语音行业积累了十几年，在普通话测评、呼叫中心，及语音云上亿用户中积累了大量的语音数据，对不常用语如专业用语和方言等等识别率逐步提高，难以复制。

目前市场上其它中文语音相关公司，很多是讯飞的旁支，也有在讯飞系统上进行二次开发，真正的能与讯飞匹敌的对手，尚未出现。

六系俞能海老师实验室介绍

空间信息处理信息隐藏 E-Health 密码学通信网络
• 位置
– 电4楼 4层
研究方向
• 研究小组
– 信息检索组 --- 俞能海教授
– 密码学研究组 --- 胡红钢教授
– E-Health组 --- 刘斌副教授
保持独立 + 相互支撑 +
– 媒体内容安全组 --- 李卫海副教授
– 网络组 --- 张弛副教授 – 信息隐写组 --- 张卫明副教授
视觉计算与安全组
• 单张图像人脸识别研究 - SIT
论文： Liansheng Zhuang, Allen Yang, etc. “Single-Image Face Recognition via Sparse Illumination Transfer”, accepted in CVPR 2013.
学科交叉
– 视觉计算与安全小组 --- 庄连生博士、姚鹏博士
承担项目
• • • • • • 国家自然科学基金 973 863 国家科技支撑计划博士点基金 ….
承担项目
1. 2. 3. 4. 5. 6. 7. 8. 国家自然科学基金重点项目, “面向Web的社会网络理论与方法研究”，课题编号：60933013，时间：2010.1 - 2013.12；国家自然科学基金（青年项目）, “基于稀疏表示的大规模鲁棒物体识别技术研究”, 课题编号：，时间：2012.1 – 2014.12；国家重大科技专项，“新型移动多媒体音视频编解码关键技术研发”，课题编号：2010ZX03004-003，时间：2010.1 - 2012.12 国家高技术研究发展计划（863 计划）," 基于网络热点的个性化集成检索系统 ",2008 （项目编号：2008AA01Z117）高等学校博士学科点专项科研基金资助项目，" 互联网用户社会关系网络挖掘与个性化信息检索模型 "（项目编号：20070358040） The Interactive and Digital Media (IDM) Research & Development (R&D) Singapore， " Qianfan Interactive Media Platform "，2007. 国家自然科学基金项目，" 网络信息热点发现与深度知识挖掘模型研究" （项目编号： 60672056，2007.1-2009.12） ….

语音实验室

数字语音实验室可支持MP3等流行音频格式，可以通过电脑、磁盘等转载，在电脑中设有海量资料库可供教师任意点播；教师可采用数字化方式备课，即进行音频、文字编辑和MP3课验室的所有功能，而且又扩展了几十种应用功能，例如数字化复读、音波对比、视频点播、对谈练习、电子阅览、教材阅读、作业发布、考试测验等等。这些功能的加入不仅仅丰富了课堂教学，而且也改变了语音实验室的应用模式，让语音实验室从单项的语音教学功能变成了多功能的语言、计算机、多媒体课件的整合教室，还可在课后向学生开放，接受来自各年级、各语种、各学科的学生同时自由学习。
通常具有个别交流、小组交流、示范交流等交流功能。
另外还有监听功能、遥控功能、学生座录音控制操作功能。
现代教育技术
是系统最基本的功能，可选择不同课程内容进行教学活动。 2．课程编辑功能
利用已有的课程内容和学生自己录制的课堂练习内容，自动编辑成各种练习用音频片段。具有快速复制、句型重复、滞留练习时间等功能。
三、语音实验室在教学中的功能 3．呼唤功能
通常具有全呼、声道呼叫、呼叫应答等呼唤功能。 4．对话功能
二、数字化语音实验室数字化语音实验室是将音频部分全部采用数字信号传输的
语音实验室。数字化语音实验室不仅消除了噪声干扰，而且音质可达到专业的立体声音质；数字语音实验室通常配备高清晰的彩色显示器，各种教学材料高质量地传输到每台显示器和耳机，学生可利用逼真清晰的影像和优质的语音材料进行跟读和听力等练习。
现代教育技术
语音实验室
语音实验室是学生进行口语训练和听力训练的场所。在语音实验室里学生可以听老师标准的读音，并将自己的读音录制下来，与老师的读音比较，可以跟读加以模仿纠正，以达到读音准确的目的。一、语音实验室的类型

SANAKOLAB语言实验室建设方案

SANAKO LAB100语言实验室建设方案圣纳科（天宝）北京代表处2016年1月4日目录一、芬兰SANAKO（天宝）公司简介 (3)二、LAB100硬件终端型语言实验室系统简介 (6)1、SANAKO LAB 100 (6)2、教学功能 (7)三、系统优势简介 (8)1、音质优势 (8)2、线路（POE供电系统） (8)3、学生终端机 (8)4、耳机话筒 (9)5、终端扩展性好 (9)6、多语言文字操作界面 (9)7、系统软件稳定性强 (10)8、操作界面人性化 (10)9、软件操作简便性 (10)10、设备安全环保 (10)11、无限大的动态资源库 (11)12、国际权威机构认证 (11)13、录音存储格式 (11)14、模拟信号转换数字信号 (11)15、防涂写材料设计 (11)16、小组讨论 (11)17、提高自学利用率 (12)18、CD翻录 (12)19、快速同步录音 (12)四、方案设计 (12)1、专业性原则： (12)2、语音清晰原则： (12)3、先进性原则： (12)4、可靠性原则： (13)5、实用性原则 (13)6、可扩充性原则 (13)8、易维护性原则 (13)五、教学功能 (13)六、部分用户案例（排名不分先后） (14)七、SANAKO语言实验室产品所获国际认证 (17)八、获奖情况 (25)九、售后服务承诺 (25)十、设备图片 (27)十一、特色案例 (29)十一、实际案例 (29)十二、设备清单 (30)一、芬兰SANAKO（天宝）公司简介芬兰SANAKO（天宝）公司是世界著名的专业语言学习设备生产商，其产品一向以耐用可靠、操作简便而著称。

早在1961年SANAKO 公司就推出了语言实验室的产品，其优秀的质量和完善的服务备受世界各地用户的推崇。

芬兰SANAKO（天宝）语言实验室以其卓越的品质、全球化设计、丰富的功能而著称，被公认为全球专业语言实验室的先驱者。

语音实验室在语言学课程教学中的作用

很好的录音仪器，可以录制满足实验语音学高精度
收稿日期：２０１２ — １１ — １２基金项目：安徽省教育厅人文社会科学研究项目“ 安徽寿县方言资源有声数据库研究” （ＳＫ２Ｏ１２ＢＯ４７）；安徽大学博士科研启动
向于选择投入时间少而就业方面“ 收效 ” 快的专业。
笔者认为语音实验室在语言学教学中有着进一步开
发的空间，可以激发本科生学习语言学的兴趣、培养
研究生语言研究能力、提高教师教学水平。语音实验室要在语言学教学中发挥一定的作
第２８卷第１期２０１３年１月
宿
州学
院
学
报
ＶＯ１．２８，Ｎｏ．１
ＪｏｕｒｎａｌｏｆＳｕｚｈｏｕＵｎｉｖｅｒｓｉｔｙ
Ｊａｎ．２０１３
ｄｏｉ：１０．３９６９／ｊ．ｉｓｓｎ．１６７３－２００６．２０１３．０１．０３６
５６２３９５５．ｈｔｍ
一
流互动中彰显民族特色，才能以“ 我族” 身份跻身于世界民族的行列中。“ 多元一体” 的中华民族之所以能够“ 拥有特色鲜明、样式纷呈的习俗文化 ” ［６］，是全
［２］张首先，马丽．文化符号视域下青年大学生的民族文化认同危机［Ｊ］．天府新论，２００７（６）：ｌｌ５一ｌ１６

2020年语音实验室建设评价总结

外国语学院语音实验室建设评价总结回顾一年的工作，在学校的正确领导和上级主管部门的精心指导下，外国语学院语音室的工作，以不断深化教育改革、加快教育技术现代化建设步伐为目标，较圆满地完成了全年的工作任务，并取得了一定的成效。

一、语音室建设方面本年度，在学校的大力支持下，将原语音室九升级改造为集翻译、口译等教学功能和视频会议室为一体的多功能语音实验室。

多功能翻译语音室的创建，加快了语音教学改革，改变了教学理念和观念，全面提高了教学水平，推动了学校加强对学生实践能力和创新能力的培养，也为培养高素质、创新型应用人才做出贡献。

二、设备管理方面加强了对设备设施的管理、维护、保养工作，确保了设备完好，保证了课堂教学有序进行。

其一，在每学期结束时对语音室的情况进行排查, 与资产处和后勤处对接, 对损坏的设备及桌凳及时地进行维修或更换, 在下学期开学前一个星期左右再次进行检测,并摆放好相关的教学用品,确保教学顺利地进行.其二，各任课教师在上完课后及时关闭所有电源，并安排学生打扫好语音室卫生，确保了各个语音室干净整洁, 设备利用率和完好率进一步提高。

其三，督促任课教师填写好设备使用情况登记本，如遇设备故障问题，通知管理员及时与资产处联系，安排相关人员尽快维修。

最后，建立完整的资产分账, 账、卡、物每学期清点一次，资产标签按学校资产处的要求严格进行了进行张贴。

三、卫生管理方面本年度，按照学校要求，外国语学院组织全体上课教师和所带班级学生对语音室进行了彻底大扫除，清除了15间语音室1072个座位课桌和讲台上的陈年旧渍和常年累积的水性笔涂鸦。

在学校的支持下，基建处在暑假期间对语音室墙面进行了粉刷。

语音室整体卫生面貌焕然一新。

日常卫生检查也在同步进行，学校开课期间，每天中午及下午两次对语音室卫生情况进行检查并记录，督促上课老师监督学生课后打扫语音室卫生。

每周一向学院汇报上周的卫生情况。

本年度，各语音室卫生状况良好。

今后，在学校和院部领导和同事的支持与共同努力下, 力争把语音室的工作上升到一个新的阶段，为我校师生营造一个良好的教学环境。

中国科学技术大学英语语言实践中心简介

中国科学技术大学英语语言实践中心简介中国科学技术大学英语语言实践中心(EPC)建于2006年，位于科大西区活动中心二楼。

在我校研究生教育创新计划支持下，经过四年的建设，英语语言实践中心已建成一个集英语语言实践、英语助学服务及英语应用为一体的立体、交叉平台，为研究生英语语言应用能力的提升提供个性化、全方位、一站式服务。

截止2011年7月受益学生已达12172人且学生满意率均在99%以上。

EPC英语实践平台选课须知亲爱的同学们，欢迎选修英语语言实践中心的英语实践课程！请同学们选课前务必认真阅读以下选课须知，以免影响学分的获取。

1．学时要求选修研究生日常交流英语与研究生学术交流英语的同学须在EPC实践平台修满10学时的实践课，方可获得“日常交流英语”或“学术交流英语”课程的成绩及相应学分。

每学期实践课堂持续开放15周左右。

2．课程预约请同学们登录EPC主页（/）实践平台预约。

该系统的登录用户名和密码就是您选课时用的学号和密码，无须注册。

预约所显示上课的周次以研究生院的教学日历为准。

每位同学每次最多可预约课时为3学时。

3．上课预约后必须按时到课，课前及课后须在EPC前台刷本人一卡通记录学时。

每节课课前25分钟内刷卡有效，迟到10分钟后刷卡无效，系统将无法录入学时。

为了更好地参与课堂实践，请同学们提前查看网站所提供的相应课件介绍并在课前对自己所选话题做好充分准备。

4．评价实践课堂结束前，教员会对每位同学的实践表现进行评价。

评价分为：优、良、中、差四个等级。

教员同时记录缺课同学的姓名。

若实践表现三次被评为“差”，系统会发出邮件提醒。

收到邮件的同学，两周内须预约参加应用平台的英语口语能力测评，否则系统无法录入相应学时。

5．反馈请同学们在课后48小时内登录选课系统填写英文反馈，否则系统不记录该次学时。

反馈是匿名上传，任课老师会及时查看以期促进教学。

6．取消预约预约后若不能按时上课，请提前24小时取消预约以免浪费教学资源。

合心合意，飞向未来——合肥求学记

合肥的“科里科气”“出圈”了从“最没有存在感的省会”之一，到跻身新一线城市，合肥的“科里科气”“出圈”了。

量子通信、墨子传信、悟空探秘、九章计算、本源司南、祖冲之号……一批科技成果从合肥走向世界，合肥也被推向了世界的舞台。

从接手不被看好的京东方，到押宝存储芯片，再到“抄底”深陷低谷的蔚来汽车，每一次不被看好的“豪赌”，都让合肥赚得盆满钵满。

“中国最牛风投机构”“中国最敢赌的城市”，人们这样形容合肥，而这背后，是合肥对科技创新的无比重视，是这座城半个多世纪以来的苦心经营，真心付出。

为科学家省吃俭用，合肥可是有传统的。

20世纪60年代末，中国科学技术大学因“战备疏散”南下，合肥勒紧了裤腰带接纳了他们。

给口粮，给土地，给校舍，给一切……甚至让中国科学技术大学成了彼时南方唯一有暖气的高校。

2020年，合肥财政科技投入占一般公共预算支出比重达14%，位列全国重点城市第一。

如今，在高新区云飞路，数百米长的街道聚集着20多家量子科技企业，人们亲切地称其为“量子大街”。

在科学岛附近，合肥的第4个大科学装置——聚变堆主机关键系统综合研究设施（CRAFT）园区已正式交付启用，通透美观的玻璃外立面，造型别致的非线性屋面……园区内14栋单体建筑身上都有着满满的科技感。

有人说，走在合肥的路上，科研机构和创新创业基地随处可见，连空气中仿佛都弥漫着科技的气息。

草木蔓发，春山可望，科技合肥仍在积蓄力量，奔向更光明灿烂的未来。

最舒适，是合肥温度在合肥求学的这些年，独在异乡为异客，却不曾有丝毫不适。

这座城的每一个角落，每一处细节，都在不经意间传递着最舒适的合肥温度。

合心合意，飞向未来——合肥求学记●微微“合肥最好玩的地方是合肥南站！因为可以买一张票去附近任意的热门旅游城市。

”这是网络上很多人对合肥的调侃。

每当有网友想求一份合肥的旅游攻略时，评论区总有不和谐的声音：合肥没有文化底蕴，是“美食荒漠”……合肥真如网友所说的这般不堪吗？作为来合肥求学的外乡人，在合肥生活了这几年，只觉得这样的言论实在是有失偏颇。

中科大语音实验室简介

Thanks for your attention!
본 회사는 중국 최대 디지털 음성 기술 제공자로서 음성합성, 음성인식 등 다양한 기술이 이미 국제 기준에 부합하여 높은 수준을 자랑하고 있습니다.
欧洲语种意大利语
德语
法语
近期成果与演示：表现力与个性化
• 语音合成系统的话者转换
–利用少量目标发音人数据构建合成系统
•源合成系统（1000句） •目标合成系统（1000句） •话者转换系统（5句）
0.5 0 A M J T F V S B P R U G H N C L O Q
近期成果与获奖
• 2011年国际NIST语种识别最混淆方言对测试第一名
评测时间：2008-2011
评测对象：声纹语种识别技术
评测单位：美国国家标准技术研究院（NIST) 参赛单位：麻省理工学院、法国科学研究中心(LIMSI )，捷克布尔诺科技大学
在研项目
1. 面向移动互联网的新一代语音合成关键技术及系统，安徽省科技厅（11010202190）,2011-2012 。
2.
3. 4. 5. 6. 7. 8.
结合发音动作参数的统计建模语音合成方法研究，国家自然科学基金委员会（60905010）， 2010-2012
用于灵活可控语音合成的发音动作参数-声学参数联合建模方法研究，国家自然科学基金委-英国爱丁堡皇家学会国际合作交流项目（61111130120）， 2011-2012 高噪声环境下的语音增强与主动降噪方法研究，安徽省科技厅（11010202188），20112012 高技术项目，编号：40901040102，2011-2016 声纹识别中合成语音的鲁棒性研究，国家自然科学基金委（60970161），2010-2012 基于情境建模的高效视觉匹配方法及其应用研究，国家自然科学基金委（61172158)， 2011-2013 语种识别技术研究，华为公司（YJCB2011048HW），2012 –2013

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

• 中文合成系统 • 英文合成系统
STOP
近期成果与演示：方言和少数民族语音合成技术
藏语合成系统：各种方言合成系统：
四川话
分词：文本：
广东话
发音文本：
18
近期成果与演示：多语种语音合成
科大讯飞是中国最大的智能语音技术提供商，在语音合成、语音识别等多项技术上处于国际领先水平
IFLYTEK is the largest provider of speech and language technology in China, holding the worldwide leading technologies in speech synthesis, speech recognition, etc. 私達の会社は中国ではぃちばん大きぃ音声合成の技術のプロバイダーで、音声合成、音声認識などの技術の上で国際的なトップ水準があります
最近期成果与获奖
• 2011年国际英文语音合成大赛再次荣获第一名
评测时间：2006～2011 评测对象：英文语音合成技术评测单位：“Blizzard Challenge”国际英文语音合成大赛参赛单位：IBM、微软、MIT、CMU、英国爱丁堡大学、日本ATR等
–Blizzard –自然语音–本项目单
1NELSLIP 1
2NELSLIP 2
LPT 3
2011 2010
NELSLIP0.33 BLZ
MITLL 5.872
MITLL 0.405
BLZ 2
2009，2011年语种识别测试中获8个高混淆度方言对测试冠军，通用测试亚军 2008，2010年连续两届说话人评测中关键指标均保持前两名
近期成果与获奖
–对特定发音人的模仿
STOP
近期成果与演示：表现力与个性化
• 具有情感的语音合成 • 歌唱合成
语音识别演示：讯飞语点
• 2012年3月22日，以“语音点亮生活”为主题的科大讯飞新一代“语音云”发布暨语音开发者大会在北京国家会议中心隆重举行 • Free download： /index.html
본 회사는 중국 최대 디지털 음성 기술 제공자로서 음성합성, 음성인식 등 다양한 기술이 이미 국제 기준에 부합하여 높은 수준을 자랑하고 있습니다.
欧洲语种意大利语
德语
法语
近期成果与演示：表现力与个性化
• 语音合成系统的话者转换
–利用少量目标发音人数据构建合成系统
•源合成系统（1000句） •目标合成系统（1000句） •话者转换系统（5句）
研究队伍
• • • • • • • • • • 王仁华戴礼荣刘庆峰胡郁郭武凌震华宋彦邓力江辉在读研究生教授（博导）教授（博导）讲座教授（博导）讲座教授付教授，博士付教授，博士博士客座教授（微软Redmond研究院）客座教授（加拿大York University) 博士生 9名，硕士生 25名
1. 国家863十一五重点项目：多语言语音合成关键技术与应用产品开发（课题编号：2006AA010104）。 2. 国家863十一五专题课题：基于HMM模型的高表现力多语种语音合成技术（课题编号：2006AA01Z137）。 3. 高技术研究项目两项 4. 中德合作科研项目（PPP）：面向德国汉语学习者的普通话发音训练系统 5. 科技部标准研究专项：语音识别与合成技术标准研究。
(BUT)、清华大学等
8个高混淆方言对三大核心测试指标通用测试在参测系统中排名第一名 DCF Min第二名 EER DCF 第三名 DCF
测试时间测试时间
第一名 Min 第二名 DCF
第三名 EER
2009 2008
NELSLIP 0.107 LPT
MITLL 2.625
MITLL 0.187
• 研ቤተ መጻሕፍቲ ባይዱ成果获2010年度 IEEE信号处理学会最佳青年作者论文奖（ IEEE Signal Processing Society Young Author Best Paper Award）
–语音及语言信息处理国家工程实验室获批建设
近期成果与演示：大语料库拼接合成技术
年份
自然度
1995年 <3.0
5 4.5 4.8 4.2 3.8 3.7 3.3 3.3
Challenge 测试结果（自然度指标）迄今唯一自然度大于4分的参测系统
3.1 3 3
位
–参测系
2.1 1.9 1.6
–MOS
4 3.5 3 2.5 2 1.5 1
2.7
2.7
2.6
2.6
2.6
2.5
统
编
号 –2006～2011年Blizzard Challenge大赛六连冠匿
1998年 3.0
1999年 3.5
2001年 3.8
2003年 4.3
STOP
• 2009年 – 中文合成系统 – 英文合成系统
STOP
近期成果与演示：可训练参数语音合成
• 可训练参数语音合成
– 基于HMM对语音进行建模，并通过训练得到合成所需的参数预测模型 – 基本不需要人工干预的情况下自动、快速地进行系统构建 – 合成语音具有很高的自然度 – 音质相比拼接合成尚有一定差距
Thanks for your attention!
研究方向
一、语音合成 (Speech Synthesis) 二、语音识别 (Speech Recognition)
计算机
三、说话人识别 (Speaker Recognition)
四、语种识别 (Language Recognition)
五、语音评测 (Speech Assessment)
近年完成的项目
学术交流与合作
1. 第九届全国人机语音通讯学术会议，于2007年10月21日-24日在安徽省黄山市召开； 2. 第六届中文口语语言处理国际会议（The Sixth International Symposium on Chinese Spoken Language Processing ），于2008年12月16日-19日在云南省昆明市召开； 3. 中德合作科研项目（PPP），柏林应用科学大学计算机科学及传媒系/ Computer Science and Media Department , TFH Berlin； 4. 组织研究小组参加国际语音处理技术的学术性比赛：Blizzard Challenge 2006-2011; NIST-SLE-2007&2009&2011,NIST-SRE-2008&2010 5. 2007年和2008年度：日本东京大学和名古屋科技大学开展学术交流；2009-2012 年英国爱丁堡大学学生交流2人 6. 学生及教师交流：新加波，日本东京大学和名古屋科技大学，英国爱丁堡大学，加拿大约克大学，微软亚洲研究院，约12人次。 7. 支持学生参加国际会议。
近期成果与获奖
• • KD系列汉语文语转换系统获2002年国家科技进步二等奖
近期成果与获奖
• • “智能语音交互关键技术及应用开发平台”，2011 年度国家科技进步二等奖（证书号：2011-J-220-201-D01）
近期成果与获奖
“智能语音交互关键技术及应用平台 ”获得2008年度安徽省科技进步奖一等奖
0.5 0 A M J T F V S B P R U G H N C L O Q
近期成果与获奖
• 2011年国际NIST语种识别最混淆方言对测试第一名
评测时间：2008-2011
评测对象：声纹语种识别技术
评测单位：美国国家标准技术研究院（NIST) 参赛单位：麻省理工学院、法国科学研究中心(LIMSI )，捷克布尔诺科技大学
国家语音及语言工程实验室科大讯飞语音实验室
郭武
主要内容
√ √ √ √ √ √ 宗旨研究队伍研究方向在研项目学术交流与合作近期成果与获奖
宗
旨
本实验室是中国科技大学、国家智能计算机研究开发中心、安徽科
大讯飞信息科技有限公司的联合实验室，主要开展人机语音交互技术的研究与开发。
以中文信息处理为核心，建成国内一流，国际上有声誉的高水平语音技术研究实验室。面向国家重大需求，研究语音信息处理应用技术。为国内语音技术企业或行业提供新技术，增强国内语音技术企业在国内外市场的竞争能力。创造进行高水平科研与开发的环境与平台，吸引国内外信息领域优秀人材。
在研项目
1. 面向移动互联网的新一代语音合成关键技术及系统，安徽省科技厅（11010202190）,2011-2012 。
2.
3. 4. 5. 6. 7. 8.
结合发音动作参数的统计建模语音合成方法研究，国家自然科学基金委员会（60905010）， 2010-2012
用于灵活可控语音合成的发音动作参数-声学参数联合建模方法研究，国家自然科学基金委-英国爱丁堡皇家学会国际合作交流项目（61111130120）， 2011-2012 高噪声环境下的语音增强与主动降噪方法研究，安徽省科技厅（11010202188），20112012 高技术项目，编号：40901040102，2011-2016 声纹识别中合成语音的鲁棒性研究，国家自然科学基金委（60970161），2010-2012 基于情境建模的高效视觉匹配方法及其应用研究，国家自然科学基金委（61172158)， 2011-2013 语种识别技术研究，华为公司（YJCB2011048HW），2012 –2013