科大讯飞5.0语音软件的安装和操作要领
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
朗读效果排名的话,是这样的(由高至低):
a. neospeech liang
b. 科大讯飞小燕
c. neospeech lily
d. neospeech hui
e. 科大讯飞小宇
科大讯飞电话语音识别InterReco——应用开发及工具包
为了方便语音识别系统的开发,InterReco提供了一系列的开发接口和应用工具,从而使得应用系统的开发更加高效,主要包含如下:
一、应用开发接口
·语音识别接口
语音识别接口是InterReco提供的最重要的对外接口,是应用开发人员使用识别引擎进行语音识别开发所必需使用的接口。这个接口提供强大的功能,能够发挥InterReco语音识别系统的优势,通过不同的并发编程模型简化编程复杂度,优化系统性能表现。
·语法接口
语法编译管理接口提供API形式的语法编译和管理的方法,主要用来解决动态语法的编译、加载、激活的过程。用户根据需要使用这些接口可以对自己的应用程序做出恰当的优化,提高应用系统灵活性。语法管理接口允许用户管理和设置语法缓冲的策略。
·端点检测接口
端点检测是语音识别一个重要的输入环节,该接口允许用户通过编程对端点检测的处理策略,和语音识别引擎进行交互。
·音频输入接口
该接口提供一套能够使用户把电话语音输入设备挂接到InterReco语音识别引擎的方法,包含各种品牌的电话语音卡和麦克风。通过这个接口,能够消除输入设备的多样化带来的集成复杂度,使得产品在音频输入方面具备优秀的可扩展性。
·管理维护接口
该接口提供管理维护接口、日志接口、以及其他一些辅助接口。
二、应用优化方法
分析和优化在语音识别的开发、应用过程中扮演非常重要的角色,好的分析和优化工具往往能够决定语音识别的应用是否能够成功。InterReco 2.0中提供的主要分析优化方法有:·分析识别效果
通过Call-Log纪录,使用分析工具分析统计,得出当前应用的总体识别率、语法内识别率等重要技术指标。这些指标能够反映出当前语音应用的总体识别效果,同时也能够分析应用中存在的问题。
·识别优化
通过识别效果的分析,对识别的语音界面、识别语法、识别模型、系统参数进行优化,以达到提高用户满意度,提升识别效果的目的。
·自适应
分为无监督和有监督的自适应,识别系统在运行过程中会以一定的间隔对当前的应用场景进行一次无监督的声学模型自适应,这种适应的内容包括:说话人特征自适应,包含口音和方言;通道特征自适应,包含无线通道、VoIP编解码通道;应用特征,包含词汇、环境噪声等。
三、工具包
InterReco提供了丰富的开发调试工具,能够在集成开发的过程中为用户提供全面有效的支持。主要包含:
·识别演示程序
识别演示程序是一个基于对话框风格的Windows GUI界面,其主要功能是在Windows环境下,为用户提供一个简便、友好的方式,使得用户能够使用麦克风完成基本识别功能,或者使用离线识别功能,也可以设置一些系统参数验证其效果。
·语法调试分析工具
用户来可以直接用文本而不是实际语音对于自己编写的语法进行分析和调试。主要功能有:输出语法的所有定义范围、测试一个说法是否满足语法要求。
·语法管理工具
管理语法缓存工具,可以使用该工具查看当前InterReco系统语法缓存的详细情况,还可以使用该工具手工删除指定的语法缓存条目,该工具还提供了预先编译语法文件的功能。·用户词典工具
用户自定义词典工具。通过该工具,可以对输入词条列表生成发音,并保存为用户自定义词典。
这些开发接口和工具包可以帮助合作伙伴更快速的将语音识别产品集成到各中应用系统中,并作为合作伙伴在语音识别业务设计、调试和效果优化等各阶段的技术助手,帮助合作伙伴更快速的开发成功的语音识别应用系统。
科大讯飞5.0语音软件的安装和操作要领
科大讯飞5.0语音软件(硬盘版),它是目前最好的语音朗读软件,小宇(男声)、小倩(女声)的发音可与真人发音媲美,尤其是小宇(男声)磁性发音效果好,听起来很自然。5.0语音软件操作方便简单,只要把解说词的文本粘贴上去,点合成就可发音读了。下面我就介绍科大语音5.0软件的安装及使用方法。
一、软件大小:
01运行库5.0版(332MB)语音库(可先下载):02小宇(男声)5.0版(1.12GB)03小倩(女声)5.0版(583MB)04小燕(女声)5.0版(1.67GB)05小琳(女声)5.0版(137MB)06英语(女声英语)(223M) 07小美(女声粤语)(983M)。
二、安装方法:
1.安装运行库:用虚拟光驱软件打开或Winrar解压后打开 InterPhonic5.0运行库.iso,点击 Runtime(Demo)_Chinese (PRC).msi 安装即可
2.把 InterPhonic.5.0演示版2M文本限制破解.rar 的两个文件解压到 【安装目录】\iFly Info Tek\InterPhonic 5.0\bin 覆盖原有文件
3.安装工具包:点击ToolKit_Chinese (PRC).msi安装.运行ToolKit\ToolKit.exe 安装过程中出现绑定运行库 打开上面所说覆盖了的文件 ttsknl.dll
4.安装想要的语音库,任选一个或几个语音库,如双击小倩文件夹里的setup.exe自动安装。
5、如果你想用CSSML编辑器,iFlyTTS.dll文件要到网上另外下载。将iFlyTTS.dll文件粘贴到x:\Program Files\iFly Info Tek\InterPhonic 5.0\bin文件夹里并在CSSML编辑器的查看--选项--语音合成运行库 设成iFlyTTS.dll文件。
配置合成引擎:
请先选择一个引擎, 点击 .列出引擎 来获得