【CN110070885A】音频起始点检测方法和装置【专利】

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 201910151018.4
(22)申请日 2019.02.28
(71)申请人 北京字节跳动网络技术有限公司
地址 100041 北京市石景山区实兴大街30
号院3号楼2层B-0035房间
(72)发明人 李为 黄传增 李琰 
(74)专利代理机构 北京竹辰知识产权代理事务
所(普通合伙) 11706
代理人 陈龙
(51)Int.Cl.
G10L 25/18(2013.01)
G10L 25/21(2013.01)
G10L 25/87(2013.01)
(54)发明名称
音频起始点检测方法和装置
(57)摘要
本公开公开了一种音频起始点检测方法、装
置、电子设备和计算机可读存储介质。

其中该音
频起始点检测方法包括:根据与音频的音频信号
对应的频域信号确定各频段对应的第一语音频
谱参数;针对各频段,根据当前频段的第一语音
频谱参数和从剩余频段中选取的预设个数频段
的第一语音频谱参数确定当前频段的第二语音
频谱参数;根据各频段对应的第二语音频谱参数
确定所述音频中的音符和音节的一个或多个起
始点位置。

本公开实施例由于在确定第二语音频
谱参数时参照了多个频段对应的第一语音频谱
参数,使得确定的第二语音频谱参数更为准确,
从而可以准确的检测出音频中的音符和音节的
起始点,
减少了误检和漏检情况的发生。

权利要求书2页 说明书10页 附图5页CN 110070885 A 2019.07.30
C N 110070885
A
权 利 要 求 书1/2页CN 110070885 A
1.一种音频始点检测方法,其特征在于,包括:
根据与音频的音频信号对应的频域信号确定各频段对应的第一语音频谱参数;
针对各频段,根据当前频段的第一语音频谱参数和从剩余频段中选取的预设个数频段的第一语音频谱参数确定所述当前频段的第二语音频谱参数;
根据所述各频段对应的第二语音频谱参数确定所述音频中的音符和音节的一个或多个起始点位置。

2.如权利要求1所述的音频起始点检测方法,其特征在于,所述针对各频段,根据当前频段的第一语音频谱参数和从剩余频段中选取的预设个数频段的第一语音频谱参数确定所述当前频段的第二语音频谱参数,包括:
针对各频段,根据当前频段的第一语音频谱参数和从剩余频段中选取的预设个数频段的第一语音频谱参数确定第一语音频谱参数的均值,将所述均值作为所述当前频段的第二语音频谱参数。

3.如权利要求1所述的音频起始点检测方法,其特征在于,所述针对各频段,根据当前频段的第一语音频谱参数和从剩余频段中选取的预设个数频段的第一语音频谱参数确定所述当前频段的第二语音频谱参数,包括:
针对各频段,根据当前频段的第一语音频谱参数和从剩余频段中选取的预设个数频段的第一语音频谱参数确定第一语音频谱参数的均值;
根据所述当前频段的第一语音频谱参数和所述均值确定所述当前频段的第二语音频谱参数。

4.如权利要求3所述的音频起始点检测方法,其特征在于,所述根据所述当前频段的第一语音频谱参数和所述均值确定所述当前频段的第二语音频谱参数,包括:计算所述当前频段的第一语音频谱参数与所述均值的差值;
根据所述差值确定所述当前频段的第二语音频谱参数。

5.如权利要求4所述的音频起始点检测方法,其特征在于,所述根据所述差值确定所述当前频段的第二语音频谱参数,包括:
根据所述当前频段对应的差值和从剩余频段中选取的预设个数频段对应的差值确定差值的均值,将所述差值的均值作为所述当前频段的第二语音频谱参数。

6.如权利要求1-5任一项所述的音频起始点检测方法,其特征在于,所述剩余频段为按照时序位于所述当前频段之前的所有频段。

7.如权利要求1-5任一项所述的音频起始点检测方法,其特征在于,所述根据所述各频段对应的第二语音频谱参数确定所述音频中的音符和音节的一个或多个起始点位置,包括:
根据所述各频段对应的第二语音频谱参数绘制语音频谱参数曲线;
根据所述语音频谱参数曲线确定局部最高点,根据所述局部最高点对应的第二语音频谱参数确定所述音频中的音符和音节的一个或多个起始点位置。

8.如权利要求1-5任一项所述的音频起始点检测方法,其特征在于,所述根据与音频的音频信号对应的频域信号确定各频段对应的第一语音频谱参数包括:
将所述音频的音频信号切分为多个子音频信号,将各子音频信号转换为频域信号,每个子音频信号对应一个频段;
2。

相关文档
最新文档