智能语音服务

相关主题

智能语音服务常见问题

产品文档

本文档著作权归腾讯云单独所有，未经腾讯云事先书面许可，任何主体不得以任何形式复制、修改、抄袭、传播全部或部分本文档内容。

【商标声明】

及其它腾讯云服务相关的商标均为腾讯云计算（北京）有限责任公司及其关联公司所有。本文档涉及的第三方主体的商标，依法由权利人所有。

【服务声明】

本文档意在向客户介绍腾讯云全部或部分产品、服务的当时的整体概况，部分产品、服务的内容可能有所调整。您所购买的腾讯云产品、服务的种类、服务标准等应由您与腾讯云之间的商业合同约定，除非双方另有约定，否则，腾讯云对本文档内容不做任何明示或模式的承诺或保证。

常见问题

最近更新时间：2019-06-17 12:21:59

离线语音识别相关问题

1. POST 语音数据大小有限制吗？

目前每次 POST 语音数据大小不超过 5M。

2. 发送请求的形式是否可以为 post xxx/appid -d "projectid=xx&type=yy" ？

不可以，用户只能以 p ost xxx/appid?projectid=xx&type=yy 的形式发送请求。

3. 生成的签名最后是否可以包含符号 \n ？

可以，签名最后包含 \n 对鉴权无影响。

4. 拼接签名原文字符串时，是否可以用 IP 地址替换 HOST？

可以。

音频格式相关问题

1. 什么是采样率？

采样率指音频的取样频率，即每秒钟取得声音样本的次数。我们的服务支持待识别音频的采样率一般为 8k 与 16k。

2. 什么是采样位数？

采样位数即将采样样本振幅量化。我们的服务支持待识别音频的采样位数为 16Bit。

3. 什么是通道数？

通道数指声音的通道数目，常有单声道和立体声（双声道）。我们的一句话语音识别服务和实时语音识别服务暂时只支持单声道音频识别，录音文件识别既支持单声道音频，也支持立体声音频识别。

4. 如何查看音频格式？

Linux系统下：

用 file 命令 file 音频文件名称。

例： file test.wav

此音频的采样率为 8k，采样位数为 16Bit，声道为 mono 即单声道（双声道为 stereo）。

Windows 系统下：

可以下载相关软件查看和修改音频格式：Adobe Audition CS6。

对象存储 + 离线语音识别相关问题

1. 上传语音的格式有哪些？

用户接入测试时上传的语音文件格式应符合通用标准格式，例如 mp3，wma，wav 等格式。

2. 上传语音的时长在什么范围？

上传的语音时长应大于或等于 1 秒并小于 1 个小时。

3. 对异步回调 URL 有什么要求？

用户接入测试时提供的异步回调 URL 需要对外网正常提供服务，以保障回调操作正常进行。

4. 对象存储源 bucket 和目的 bucket 命名有什么规则？

源 bucket 和目的 bucket 的命名不能一样，否则第一次识别的文本放入目的 bucket 时，由于与源 bucket 同名，系统会自动触发一次识别请求，并返回识别失败信息。

5. 用户收到识别文本结果后，没有立即返回确认信息，会有什么后果？

建议用户在收到正常识别数据后，立即返回确认信息，再对识别文本做后续处理，否则系统会在超时未收到信息时再次发送回调通知。