朗读语气韵律可变性分析及韵律自动评价初探
语音库的韵律标注及参数自动提取实现
0 引 言 完 整 的标注 系统 是语 料库 建设 中很重 要 的一 环, 括 音 段标 注 和 韵律 标 注 . MI 第 一 个在 世 包 TI T是 界范 围 内发 布 的带 有 标注 的 语 音 库, 的 目的 是 为语 音 识 别提 供 声 学一 语 音 知识 - .iera 它 1 Sl r n等人 设 v n J 计 的基 于美 国英 语 的 To I B ToeadBekIdcs是 当前 国际 上 最 流行 的 韵律 标 音 系 统 .目前 已有 n ra n i ) n e
[ 作者简介 ]达哇彭措 (9 1 ) 男( 16 一 , 藏族 )青海 玉树 人, , 副教授 , 主要从事藏语语音学研 究 .
i
4 3 -— ・ —
1 1 标 注 规 则 .
音段标注为音素层, 韵律标注包括音素、 音节、 韵律词、 韵律短语、 声调五层, 这些符号将标注在各层
的每 一个韵 律 单元上 , 于参数 提 取和 统计 , 便 如表 1 示 . 所
1 语音 库标 注
对录 制 切分好 的 语音 进行 标注 , 括音 段标 注和 韵律 标 注 . 段 标 注在 某 种 程 度上 可 以认为 是 字 包 音 音转 换 , 是指 将表 义 的文本 输 入形 式转 化为 表音 的文 本 输 入形 式 . 当前 的 汉语 语 音 合 成 系统 多 采用 音
第3 2卷 总 第 8 2期
2 011 年 6 月
西 北 民 族 大 学 学. 2
Jih1 f ot e n e i r aoatsNau ̄ S i c ) o - r ws U i r t f tnHi ( tr c n e n Ao N h t v sy o N i e e
汉语的韵律、词法与句法
汉语是一种语言,其特点包括韵律、词法和句法。
以下是对汉语韵律、词法和句法的简要解释:
1.韵律(Prosody):韵律是指语言的音调、声调、音节长度和重音等语音特
征。
在汉语中,声调是非常重要的韵律成分,它可以改变词义。
汉语有四个声调:平声、上声、去声和入声。
除了声调,汉语还有轻声,即不带声调的音节。
韵律对汉语的表达和语意都有很大的影响。
2.词法(Lexicon):词法是研究词的形态和构词法的学科。
在汉语中,词法
主要关注词的结构和词义的变化。
汉语中的词是由单个或多个字构成的,每个字都有特定的意义。
通过组合不同的字,可以形成不同的词,这些词可以通过前缀、后缀或其他的构词法进行变化。
3.句法(Syntax):句法是研究句子结构和句子之间关系的学科。
在汉语中,
句法是指句子的构造方式、语序、成分和句子之间的逻辑关系。
汉语是一种主谓宾语的语序,即主语通常放在句首,谓语动词位于主语后面,宾语放在谓语动词后面。
汉语的句子通常没有严格的词序,因此可以根据语境进行灵活调整。
句法规则对于理解和表达汉语的句子结构和意义非常重要。
综上所述,汉语的韵律、词法和句法是构成汉语语言体系的重要组成部分,它们共同决定了汉语的语音特点、词汇形态和句子结构,对于理解和运用汉语都具有重要意义。
泰州市靖江市2021-2022学年九年级上学期期末语文试题(含解析)
泰州市靖江市2021-2022学年九年级上学期期末语文试题(考试时间:150分钟满分:150分)注意:所有试题的答案一律填写在答题卷上,写在试卷上的无效。
一、积累与运用(共24分)阅读下面文字,完成下面小题。
许多人所谓的成熟,不过是被习俗磨去了棱角,变得世故而实际了。
那不是成熟,而是精神的【甲】和个性的消亡。
真正的成熟,应当是独特个性的形成【乙】真实自我的发现【丙】精神上的结果和丰收。
成熟是一种明亮而不刺眼的光辉,一种圆rùn而不腻耳的音响,一种不再需要对别人【丁】的从容,一种终于停止向周围申诉求告的大气,一种不理会喧闹的微笑,一种洗刷了偏激的淡漠,一种无须声张的厚实,一种能够看得很远却又并不dǒu qiào的高度。
在余秋雨的笔下,苏东坡便拥有这样的品格。
人生海海,世事繁杂,愿你我都能够修炼出一颗玲珑tī透心,用更大的格局经营自己的人生。
1. 根据拼音在田字格内写出相应的汉字。
2. 填入【甲】【丁】两处的词语,最恰当的一项是()A. 【甲】衰竭【丁】战战兢兢B. 【甲】衰竭【丁】察言观色C. 【甲】早衰【丁】察言观色D. 【甲】早衰【丁】战战兢兢3. 下列说法不正确的一项是()A. “那不是成熟,而是精神【甲】的和个性的消亡。
”是并列关系的复句。
B. “真正的成熟,应当是独特个性的形成【乙】真实自我的发现【丙】精神上的结果和丰收。
”【乙】【丙】处的标点应为逗号。
C. 苏轼,字子瞻,号东坡居士。
他一生三起三落,曾先后被贬黄州、惠州、儋州,虽屡遭打击,却依然乐观面对生活。
D. “人生海海”是比喻的说法,意思是人生像大海一样变幻不定、起落浮沉。
4. 根据提示填写课文原句。
(1)不应有恨,_______________________。
(2)_______________________,病树前头万木春。
(3)日出而林霏开,______________________(4)___________________,夜吟应觉月光寒。
韵律词
韵律词( Prosodic Words)王洪君汉语的韵律词、韵律短语和语流的节律生成(王洪君)prosodic的两种含义一般说的prosodic:指语音的超音质方面,包括快慢、抑扬、平仄、押韵等。
美国音系界的prosodic:指语音和语法接面上的语音现象。
语音语法接面的单位是综合考虑一个语法单位的所有语音表现而得到的语音单位(是考虑了语法条件而得到的语音单位)是说话人心里有可恢复原型的语音单位,不是实际语流中出现的仅以语音条件定义的单位。
英语语音语法接面的韵律单位层级(mora) - 音节- 音步- 韵律词- 黏附词组–韵律短语- 语调短语韵律词:总有固定的词重音的有意义的语段。
与文字的词、语法的实词大多一致。
基本韵律词:有固定词重音的单纯词或派生词。
词重音位置由词的语法类、构造类及词末或次末位音节的mora数目共同决定。
复合韵律词:由两个或两个以上基本韵律词组成,有固定的“左重”词重音。
黏附词组:由韵律词和没有词重音的语法词组成,因此也只有一个词重音。
如I’m an apple 韵律短语:由韵律词和韵律短语组成的同处一个语法结构单位又小于一个语调短语的语段。
⒈汉语音步与停延段的语音标准音步:一个连调域。
首音节强度大,声母辅音性强;末音节低音线有明显的下降停延段:一个或多个连调域。
末音节低音线有明显的突降,末音节延长或有无声段。
⒉汉语韵律词、韵律短语的语音标准总原则:作为语音-语法接面的单位,必须有语音上的条件。
而且,这种语音条件是综合了语段的各种可能分布的所有语音表现而得出的,不仅仅是考虑一次性的语流。
它在语法上也有稳定的对应。
根据语音语法的关联不同,汉语的韵律单位可分为3级单位:韵律词:总是作为一个稳定音步出现。
一般为2音节,除轻声音节外不超过3音节,个别为1音节(限韵律短语末有延拍的位置)。
[1-3音节]类词韵律短语(复合韵律词):内部没有停延界,但可以有音步界。
也就是说,它可能作为一个稳定的停延段或停延段中的一个音步出现,但不能是两个停延段。
汉语的韵律研究吴宗济先生的韵律思想及其深远影响
汉语的韵律研究吴宗济先生的韵律思想及其深远影响Report of Phonetic Research 20081汉语的韵律研究——吴宗济先生的韵律思想及其深远影响李爱军中国社会科学院语言研究所吴宗济先生70余年的音路历程,代表着二十世纪中叶以来中国现代语音学发展的光辉历程。
他运用现代语音学的实验手段,对汉语普通话的语音特性展开了开创性的全面探索,不仅对音段的声学和生理特性进行了系统的分析研究,而且对汉语的韵律特性及其在言语工程等方面的应用研究作出了不可磨灭的贡献。
《吴宗济先生语言学论文集》便是吴宗济先生音路历程的缩影。
在庆贺吴宗济先生百岁华诞的时候,我们重点介绍他在汉语韵律研究方面的成就,特别是他提出的或然变调和必然变调的语调思想,以及近年来他对篇章韵律和书法绘画等等其他艺术表达手段的共同特性的探索。
吴宗济先生不仅自己身体力行,而且积极带领同仁和学生共同研究,他的影响已经涉及几代人。
吴宗济先生十分注重语音研究成果在言语工程中的应用,特别是对提高汉语语音合成的自然度的影响。
在他的带动和影响下,国内外对汉语韵律的研究越来越繁荣,推动了韵律研究,也推动了整个语音研究与言语工程技术的合作。
1引言二十世纪初期,刘复、赵元任两位语言学大师,开始用实验语音学方法对声调进行研究,浪纹计是测算声调频率的主要工具。
赵先生在系统阐述了汉语语调的定义、语调的类型以及语调和字调的关系的基础上,提出“汉语的语调实际是词的或固有的字调和语调本身的代数和是“小波浪加大波浪”的著名理论。
吴宗济先生师从赵元任先生,自上世纪60年代开始,在普通话的音段特征方面做了一系列的实验研究,80年代开始从事普通话的变调研究,并继承和发展了赵先生的语调思想,将赵先生提出的“橡皮条效应”以及“小波浪和大波浪”的关系进行了具体的量化,在语法、语音和音系三个层面考察语调的变化模式。
通过对二字到四字的变调的调形分析,找出短语中的连读变调规律,作为研究成句语调的基础。
朗读流畅性作为阅读能力的指标
朗读流畅性作为阅读能力的指标:基于一个理论的,实证的,历史的分析一、综述:研究目的:通过这篇文章,料想朗读流畅性是否是整体阅读能力的一个指标。
Logan(1997):将“阅读流畅性”定义为,无需对解码等阅读加工过程付出太多有意注意,,具有复杂的跨任务的自我协调能力,运用自发性的技巧平稳、省力和自动化地准确阅读书面材料的能力。
该定义强调阅读过程的自动化(即阅读速度)和准确性。
Adam(1990):有技巧性的阅读能力最显著的特征是将文本转化为口语的速度。
这个特征就是作者界定的“朗读流畅性”,即对文本进行速度与准确性兼具的口头翻译。
作者论点:朗读是以口语形式转译书面材料的过程,流畅的朗读需要同时协调知觉、基本的词语技能、词汇表征、句法加工和将书面材料中的观念联系起来等复杂、多面向的技能。
讨论前的警告(未来的展望):1、朗读流畅性与阅读理解之间的关系在中小学强于高中。
拥有了大量可以瞬时识别的“视觉词”(即在多种情况下读者都能识别的词)后,阅读变得更加熟练和自动化,阅读时对文字材料本身的注意减少,更着意于理解其中的观点及从复杂的文字材料中进行学习。
2、朗读流畅性只是基本阅读能力的指标,并不是学生分析文学作品或复杂的说明文的指标。
二、理论基础:以行为主义的视角来看,朗读流畅性是语音分割、解码能力、快速字词识别的直接测量方式。
假定使学生快速准确地将书面语言转换为口头形式的朗读流畅性能力,同时也能反映学生理解文本意义的能力的理论基础是什么呢?1、信息加工取向理论:自动化理论LeBerge和Samuels:根据认知资源理论,人类是单通道加工者,注意资源是有限的,一旦注意被分配到一项活动中,它就不可能同时用于其他活动。
我们能同时做几件事是因为我们不断在两个或更多的任务之间转换注意力,或者其中的一项任务已经掌握得非常熟练,能自动进行,无须注意。
根据阅读的简单观点:阅读至少包含两项任务:字词识别和语言理解。
字词识别指在没有语境线索的帮助下解码书面文字;语言理解指理解或建构材料的意义。
汉语言文学中的音韵与韵律研究
汉语言文学中的音韵与韵律研究汉语是世界上最古老的文字之一,其音韵和韵律的研究在汉语言文学中有着重要的地位。
音韵是指语言中的音素和音变规律,而韵律则是指语言中的音调和韵律规律。
本文将着重探讨汉语言文学中音韵与韵律的重要性以及相关的研究方法和成果。
首先,音韵与韵律在汉语言文学中的重要性不言而喻。
音韵是汉语言的基础,决定了词语的发音和语调,而韵律则决定了诗歌、散文等文学作品的韵律美感。
音韵和韵律的准确运用不仅能增加汉语言文学作品的艺术性和美感,还能让读者更好地领悟作品的内涵和情感。
其次,研究汉语言文学中的音韵与韵律需要采用一定的研究方法。
一种常用的方法是通过对汉字的发音和演变过程进行研究,以了解不同时期和地区的音韵变化规律。
另一种方法是通过对古代文献和古代诗歌的研究,分析其中的音律规律和韵律结构。
此外,利用现代科技手段进行声学实验和语料库分析也是研究音韵与韵律的重要方法。
在音韵研究方面,学者们对于汉字的音变过程进行了深入研究。
比如,经典的韵书《切韵》对汉字的音韵进行了系统分类,并提供了中国古代汉字的音韵变化规律。
另外,关于汉字音韵变化的学术争议也层出不穷,例如《广韵》和《集韵》等书提供了不同的音韵分类方法,学者们对于这些音韵学著作进行了研究和比较,为汉字音韵的研究做出了重要贡献。
在韵律研究方面,古代诗歌是学者们的重要研究对象。
诗歌是汉语言文学中韵律最为明显的表现形式之一,通过对古代诗歌的分析,可以揭示出汉语言文学中丰富的韵律变化。
例如,五言绝句是古代最为流行的诗歌形式之一,它以平仄和押韵规则为基础,通过一定的音律方式表达诗人的情感和思想。
研究者通过对五言绝句的音律规律进行分析,揭示出了许多古代诗人的创作技巧和韵律美感。
除了传统的文献研究方法,现代科技手段也对音韵与韵律的研究提供了新的途径。
通过声学实验和语料库分析,研究者可以获取大量的音频和文本数据,并通过计算机模拟和分析,揭示出汉语言文学中音韵和韵律的一些规律和特点。
韵律语法理论与汉语研究
韵律语法理论与汉语研究一、本文概述《韵律语法理论与汉语研究》这篇文章旨在探讨韵律语法理论在汉语研究中的应用及其重要性。
韵律语法,作为一种语言学理论,强调语言的韵律结构对于语法结构和意义表达的影响。
本文首先将对韵律语法理论的基本概念和核心思想进行介绍,然后分析汉语韵律特性的独特性,以及这些特性如何影响汉语的语法和语义。
接着,文章将综述近年来韵律语法理论在汉语研究中的实践应用,包括韵律句法分析、韵律与语义关系研究等方面。
文章将展望韵律语法理论在汉语研究中的未来发展,以及可能面临的挑战和机遇。
通过对韵律语法理论与汉语研究的深入探讨,本文旨在提升对汉语语言特性的理解,推动汉语语言学研究的深入发展。
二、韵律语法理论的核心内容韵律语法理论的核心内容在于揭示语言中的韵律结构如何与句法结构相互作用,共同塑造语言的表达形式。
该理论主张,语言的韵律结构是一种独立于句法结构的层级结构,它在语言的生成和理解过程中发挥着至关重要的作用。
韵律结构通过音节、重音、语调等韵律单位来组织语言,使得语言在发音时具有和谐的节奏和韵律。
在汉语研究中,韵律语法理论的应用尤为重要。
汉语作为一种声调语言,其韵律特性在语言表达中占据了举足轻重的地位。
韵律语法理论通过深入剖析汉语的韵律结构,揭示了汉语句子中的韵律模式和韵律规则,为我们理解汉语的句法结构和语义关系提供了新的视角。
韵律单位与韵律结构:韵律单位是构成韵律结构的基本元素,包括音节、重音、语调等。
韵律结构则是由这些韵律单位按照一定的规则和层级关系组织而成的。
韵律与句法的相互作用:韵律结构与句法结构在语言的生成和理解过程中是相互作用的。
一方面,韵律结构可以对句法结构产生制约和影响,使得句法结构在韵律结构的框架下进行调整和变化;另一方面,句法结构也可以对韵律结构产生影响,使得韵律结构在句法结构的引导下呈现出特定的模式和规则。
韵律与语义的关系:韵律语法理论还强调了韵律与语义之间的密切关系。
韵律结构不仅可以通过影响句法结构来间接影响语义表达,还可以通过自身的韵律特征来直接传达语义信息。
朗读评价量表
朗读评价量表
朗读评价量表是一种用于评估个体在朗读任务中的表现的工具。
它通常由一系列标准化的评价项目组成,用于测量朗读的流利程度、准确性、韵律和语音表达能力等方面。
以下是一个常见的朗读评价量表的示例:
1. 流利程度:
一字不落,流畅自如;有时会停顿或重复词语;反复停顿或中途停顿较多。
2. 准确性:
完美无误,没有发音或语法错误;偶尔有发音或语法错误;频繁出现发音或语法错误。
3. 韵律:
把握得当,语调自然流畅;有时语调不够准确或变化不明显;语调错误或极不自然。
4. 语音表达能力:
表达丰富,情感饱满;偶尔缺乏情感表达;缺乏情感表达或语气单调。
这些评价项目可以根据具体需求进行调整或扩展。
评估者会根据被评价者的表现,将其打分或做出相应的评价,以便提供有关朗读能力的反馈和改进建议。
融合语言学统计特征的韵律发音质量自动评测方法
融合语言学统计特征的韵律发音质量自动评测方法张珑;李海峰;马琳【摘要】在发音质量自动评测任务中,韵律发音质量评测是非常重要的高级环节,对语音的自然度和可理解程度方面有着直接和重要的影响.本文在韵律相关的多种声学特征的基础上,进一步融合了韵律相关的多种语言学统计特征,并使用支持向量机为分类模型,实现对韵律发音质量的有效评测,人机相关性达到0.779,相对提升了3.45%.同时,采用基于浮动思想的SFFS算法进行特征筛选,去除了目标无关的特征,提高了支持向量机模型的精度和泛化能力,进一步提升了评测性能.【期刊名称】《智能计算机与应用》【年(卷),期】2014(004)005【总页数】4页(P19-21,25)【关键词】发音质量评测;韵律评测;语言学统计特征;支持向量机;特征筛选【作者】张珑;李海峰;马琳【作者单位】哈尔滨工业大学计算机科学与技术学院,哈尔滨150001;哈尔滨师范大学计算机科学与信息工程学院,哈尔滨150025;哈尔滨工业大学计算机科学与技术学院,哈尔滨150001;哈尔滨工业大学计算机科学与技术学院,哈尔滨150001【正文语种】中文【中图分类】TN912.3;TP3910 引言人们在进行言语交流时,相互之间传递的不仅仅是语言文字信息,还包含着丰富的韵律信息。
韵律信息属于超音段信息,主要反映着说话人发音的抑扬顿挫(节奏),强调(重音),语调和语气等。
一方面,韵律信息有助于说话人更清楚、准确地表达所要表达的信息,提升语言的自然度水平和可理解程度;另一方面,韵律信息有助于听话者更清楚、准确地理解所听到的信息,甚至包含对说话人意图、情感、态度、语气等多个方面的把握和理解。
在发音质量自动评测任务中,对韵律发音质量进行评测是非常必要,也是非常重要的。
然而,从音节层到音步层,声调连读会产生变调;从音步层到句子层,声调会受到句调的影响再次发生变化;从句子层到语篇层,句调还会受到基调的影响,句调的高低、强弱、宽窄、长短将再次发生变化[1]。
韵律特征分析在中文语音识别中的应用研究
韵律特征分析在中文语音识别中的应用研究中文语言是一种以声调为特征的语言,而其相对应的语音识别技术也必须考虑这一特征。
除了与声调有关的基频、音调等特征,韵律特征也是中文语音识别中的重要研究方向之一。
本文将从韵律特征的概念、韵律特征分析的方法、韵律特征在中文语音识别中的应用以及未来研究方向等方面,全面地探讨韵律特征分析在中文语音识别中的应用研究。
一、韵律特征的概念韵律特征是指语音中词与词之间、句与句之间,在时间和频率上呈现出的变化规律。
在中文语言中,韵律特征主要包括基频、时长、音调等。
其中,基频(fundamental frequency,F0)指的是声音振动的周期,也就是声调的高低;时长则是指声音持续的时间;而音调则是指在一个词语或一个句子中,声调在不同位置上的变化情况。
二、韵律特征分析的方法对于韵律特征的分析,传统的方法是通过手动标注来实现。
但是,这种方法费时费力,而且不够准确。
因此,随着机器学习的发展,越来越多的研究者正在尝试使用自动化的方法来实现韵律特征的分析。
目前比较流行的自动标注方法包括基于模型的方法和基于数据的方法。
前者依赖于事先训练好的语音模型,而后者则主要依赖于大规模的标注语音数据库。
在实际应用中,这两种方法往往会结合在一起,以实现更加准确的韵律特征分析。
三、韵律特征在中文语音识别中的应用韵律特征对中文语音识别的影响非常大。
以音调为例,中文语言中的声调相对来说比较复杂,而且同样的音节在不同句子中的音调可能会有所变化。
因此,对于中文语音识别的研究者来说,如何准确地识别声调就是一个非常重要的问题。
研究表明,通过将韵律特征融合到传统的语音识别系统中,可以显著提高中文语音识别的准确率。
此外,还可以利用韵律特征来优化语音合成和语音转换等方面的应用。
四、未来研究方向虽然韵律特征在中文语音识别中的应用已经取得了不小的成绩,但是在未来的研究中,仍然存在许多挑战和机遇。
例如,在大规模标注语音数据库方面,目前仍然存在一定的局限性;在韵律特征的自动分析方面,如何结合深度学习等先进的技术,进一步提高韵律特征分析的准确性也是一个研究热点。
言语功能评定
四、吞咽障碍评定
(一)概念
吞咽生理过程
AB:口阶段,CD:咽阶段,E:食管阶段
吞咽反射过程
外周感受器 (舌根、喉后壁、前腭弓、扁桃体、软腭等)
上位中枢 (大脑皮层)
孤束核 (外周感受器信息汇总)
延髓网状结构吞咽中枢 (吞咽运动程序)
运动神经元 (疑核、舌下神经核、面神经核、三叉神经运动核)
吞咽相关肌肉
(aphasia battery of
失语症检查法
battery, WAB)
Chinese,ABC)
(Boston diagnostic
改良Boston
aphasia
examination,
BDAE)
中康法中国康复研究中心失语症检
查法(Chinese rehabilitation
SLA
research center aphasic examination,CRRCAE)
(三)失语症的分类
运动性失语 Broca失语 感觉性失语 Wernicke失语 命名性失语 失写症 失读症
面对言语语言障碍的患者,我们要解决很多问题.
是 否? 类 型? 程 度? 加重还是好转? 其他认知障碍吗?
(四)评定方法
西方失语成套测验 汉语失语成套测验
波士顿诊断性
(western aphasia
4.音标法:用音标标明构音障碍患者语音, 评价构音障碍的有无、程度和构音错误 的分类。
5.应用仪器检查法:包括光纤维腭咽喉内镜 检查法、电视荧光放射照相术、气体动 力学检查法、喉动态描记仪、舌压力传 感器、舌运动描记器、电腭动描记器、 唇二维运动学分系法等等。这些仪器主 要针对构音器官运动。
6.语言障碍诊疗仪:应用计算机技术,制定标准 的语音频普曲线图,对受试者的语音通过语音 识别系统与标准样本比较,对语音进行分析, 更具有客观性和稳定性。有学者报道应用微机 言语矫治系统评价构音障碍,其结果与人工构 音障碍检查结果相符合,由于其评价是由计算 机自动完成,更具有客观性和稳定性。
语音合成技术的性能评估方法分析
语音合成技术的性能评估方法分析随着人工智能技术的发展,语音合成技术在各个领域都得到了广泛应用。
语音合成技术指的是将文本转化为声音的技术,通过自然的语音输出来满足人们对于多样化和个性化的声音需求。
准确评估语音合成技术的性能是提高合成质量和用户体验的关键。
本文将分析语音合成技术的性能评估方法,介绍其中主要的指标和评估工具,以及应用场景。
为了保持中立和客观,本文将不涉及任何政治内容。
一、评估指标在评估语音合成技术的性能时,需要考虑以下几个指标:1. 自然度:自然度是指合成语音与真实语音之间的相似程度。
自然度的高低直接影响用户对合成语音的接受度。
评估自然度的方法包括主观评价和客观评价。
主观评价通常通过让大量的受试者听取合成语音并进行评分来获取用户的主观感受。
客观评价则通过一系列的算法和模型来分析语音的频谱、共振等特征。
2. 流畅度:流畅度是指语音合成系统在连续合成长篇文本时,各个音节之间的平稳过渡。
流畅度的评估依赖于音素或音节的间距、声学模型的连续性和韵律处理等因素。
评估流畅度可以通过自动测量连续性、抑制乱音和抖动等方法。
3. 发音准确度:发音准确度是指合成语音中的音素是否准确匹配目标语言的音素库。
这对于提高合成语音的可懂度非常重要。
评估发音准确度通常通过人工检查合成语音的内容是否与输入文本一致。
4. 感情表达能力:许多应用场景中,语音合成系统需要表达不同的情感,如兴奋、悲伤和愤怒等。
评估感情表达能力可以通过情感识别模型和情感分类任务来进行。
二、评估工具为了准确评估语音合成技术的性能,研究人员开发了许多评估工具。
下面介绍几种主流的评估工具:1. MOS (Mean Opinion Score):MOS是一种常用的主观评价方法,通过让受试者打分来评估语音合成的质量。
受试者听取合成语音并给出一个在1到5等级间的打分,其中1代表质量非常差,5代表质量非常好。
计算平均分数可以得到一个总体评价。
2. CER(Character Error Rate):CER是一种客观评价方法,用于测量合成语音和目标文本之间的差异。
神经语气词心理分析
神经语气词心理分析1简单介绍在日常对话中,我们会下意识地对一个人说话的方式进行评价,我们有时会喜欢或讨厌一个人的腔调。
这时候,我们是在讨论韵律(prosody)。
韵律包括了音高和响度的变化,以及音节、单词和短语的长度变化等。
这些参数能够帮助我们表达各种情绪和态度,这些韵律被称为情感韵律。
除此之外,韵律还蕴含着语言学的信息,例如句末升调可以表示询问,重音参与了很多种语言的词汇加工(例如英语),音调参与了很多音调语言(例如中文)的加工等等,这些韵律被称为语言韵律。
早期对于失语症患者的研究发现,就算是左侧大面积损伤的患者在进行无意义表达时,依然可以通过韵律来表达信息,因此研究者认为右半球韵律加工中起到重要作用。
之后一系列的偏侧化研究发现,长时声调变化的加工往往向右偏侧化,短时的则向左偏侧化,这和之前言语感知中双通道理论早期加工的时间不对称性质一致。
这篇笔记从情感韵律和语言韵律两个角度讨论语言中的韵律加工。
需要注意的是,这一部分并没有像言语生成和理解那样有一些完善的框架,只有一些单一的理论,所以整体的逻辑并没有很严密。
2情感韵律2.1情感韵律的知觉情感韵律感知常常被认为与情商相关。
当我们听到一句话时,即使使用了陌生的语言,我们也可以了解到说话者的内心是平静还是兴奋、积极还是消极。
但大脑是怎么加工情感韵律的呢?目前已发现有五个主要脑区参与了加工,它们分别是:右侧STG中部和前部、杏仁核、右侧额顶皮层腹侧、基底节与双侧眶额皮层、额下皮层。
右侧STG中部和前部:听觉整合首先,Beaucousin发现,当被试听到有情感的语句时,STG中部和前部以及STS位置右半球的激活比左半球更大[1]。
该实验采用情绪分类的范式,让被试将机器生成的语音和演员说的有情感的语音进行情绪分类。
另一研究指出,这个区域从早期加工中接受到信息后,其对于情绪语音的反应程度与整体的声音参数显著相关,但是不能被某个声音参数单独解释,说明其主要通过整合不同的声音参数来理解情绪。
考察重音与韵律的英语句子客观评价系统研究
考察重音与韵律的英语句子客观评价系统研究李心广;王桂珍;杨思哲【摘要】介绍英语语音语调相关知识,根据国内英语学习者现状,研究基于重音与韵律的英语句子客观评价系统,通过提取语音的能量特征,对英语句子进行重音划分,使用改进的成对变异指数(Pairwise Variability Index,PVI)算法作为句子评价核心,旨在提高说话人对英语句子的重音与节奏的把握。
%The general knowledge of English pronunciation and intonation are introduced. To explore the ways to improve the domestic English learners’pronunciation and intonation, besides, to help learners better handle the speech prosody, especially in sentence stress and rhythm, an objective evaluation system of English sentences is established, which extracts the energy charac-teristics, marks the stressed syllables, and evaluates the test sentence by using the improved PVI(Pairwise Variability Index).【期刊名称】《计算机工程与应用》【年(卷),期】2013(000)008【总页数】6页(P105-109,150)【关键词】语音语调;重音;韵律;能量特征;成对变异指数(PVI)【作者】李心广;王桂珍;杨思哲【作者单位】广东外语外贸大学思科信息学院,广州 510006;广东外语外贸大学思科信息学院,广州 510006;广东外语外贸大学思科信息学院,广州 510006【正文语种】中文【中图分类】TP391随着语音识别技术的进步,计算机辅助语音教学技术(Computer-Assisted Language Learning,CALL)[1-2]成为了研究的热门,而发音质量客观自动的评价是计算机辅助语言学习(CALL)系统中的核心技术[3]。
播音主持语言的韵律标注研究
申请
硕士学位论文
播音主持语言的韵律标注研究 A Study of Prosodic Labeling in Chinese Language of Announcing and Compering
培养单位:播音主持艺术学院
姓 名:邹 煜
学 号:2001702010
专 业:语言学及应用语言学 研究方向: 计算语言学
Basing on the above, the Part 3 of this article establishes the rules,ways and contents of the prosodic labeling in the language of announcing and compering. Those rules includes that the rules of the prosodic labeling in the language of announcing and compering must be helpful to the research and teach of the the language of announcing and compering and obey the general rules of the prosodic labeling. Those rules still include the labeling should be exoteric; the prosodic labeling should harmonize the POS tagging, syntactical tagging and semantic tagging of the transcription text. On the contents of the prosodic labeling, according to ToBI and C-ToBI, this article establishes the a suit of signal system which is the same with prosodic labeling in the language of announcing and compering and complete the labeling of Pin Yin, break index, stress index and tone and intonation. For example, on the labeling of the stress index, this article defines the stress hierarchy of non-accented syllables, the prosodic word stress, the prosodic phrase stress, the intonation phrase stress (or nuclear accent) and the intonation group stress. Among them, the nuclear accent and the intonation group stress are very important in the announcing production.
诗词韵律检测
诗词韵律检测诗词韵律检测是一种非常重要的工具,用于检测诗词中的韵律是否符合规范。
在古代,诗词是一种非常重要的文学形式,被广泛使用于社交场合和文学创作中。
而韵律则是诗词中非常重要的一部分,它不仅体现了诗词的音乐性,也能够增强诗词的美感和表现力。
在古代,诗词韵律的规范非常严格,需要符合一定的音韵规律。
其中最为常见的是平仄规律和押韵规律。
平仄规律是指诗词中的音节分为平声和仄声两种,平声音节的声调平稳,仄声音节的声调变化较大。
在诗词中,平声音节和仄声音节的排列顺序需要符合一定的规律,否则就会破坏诗词的韵律。
押韵规律则是指诗词的末尾需要有相同的韵母,这样才能形成押韵。
为了检测诗词的韵律是否符合规范,人们发明了诗词韵律检测工具。
这种工具可以自动分析诗词中的音节、韵母和声调,然后根据平仄规律和押韵规律来判断诗词的韵律是否符合规范。
如果不符合规范,这种工具会自动给出错误提示,帮助诗人及时修改。
现代的诗词韵律检测工具已经非常普及,它们可以在电脑、手机等设备上使用。
这种工具不仅可以用于诗词创作中,也可以用于诗词教学和研究中。
例如,一些学校和研究机构会使用诗词韵律检测工具来检测学生或研究人员的诗词作品,以帮助他们提高创作水平和韵律掌握能力。
当然,诗词韵律检测工具也有一些缺点。
例如,它们只能检测诗词的韵律,但无法评价诗词的内容和表现力。
此外,诗词韵律检测工具也无法完全代替人类的判断和审美能力。
因此,在使用诗词韵律检测工具时,仍需要结合人类的审美和判断能力,才能更好地创作出符合规范的诗词作品。
总之,诗词韵律检测是一种非常重要的工具,它可以帮助诗人和学生更好地掌握诗词的韵律规律,提高创作水平和表现力。
虽然它有一些缺点,但在现代化的诗词创作和教学中,诗词韵律检测工具仍然具有非常重要的作用。
儿歌的朗读方法
儿歌的朗读办法儿歌,是儿童诗歌中的一种,它语句精练,构造简短,韵律幽美,节拍分明,易懂易记,读起来琅琅上口,深为孩子们所爱好.一位儿童文学作家曾说过“儿歌是常识的百宝袋,储藏着人类说话的珍宝……”是以,让孩子多听.多读.多背儿歌,有利于孩子进修说话,能进步他们对儿童文学的兴趣,从中受到各方面的教导.家长欲教孩子朗诵儿歌,需做好选择.剖析.熟习儿歌等预备工作.我们应当尽量选择一些词句幽美.浅易易懂.顺口好听的儿歌.如:《三个好孩子》和《小熊过桥》.教诲儿童朗读儿歌的办法1.激发情感,造就朗读兴趣幼儿的情感轻易受情形的变更而变更,常因情形的转变而不顺应,表示为胆小不敢措辞.所以,起首要引诱幼儿启齿措辞.教师经由过程和幼儿攀谈.做游戏.讲故事.观赏儿歌等,使幼儿产生信赖感.稳固了幼儿的情感,也锤炼幼儿启齿措辞,当幼儿对教师有了情感后,就可以斟酌进行朗读演习了.其次,要遵守从易到难.循序渐进的原则.从最简短.最切近幼儿生涯的儿歌开端,教师要耐烦启示,具体指点.如儿歌《珍珍的家》,先启示幼儿对比本身的家,知道本身的家里也有爸爸.妈妈.爷爷.奶奶.布娃娃等,然后把珍珍换成幼儿本身的名字,使幼儿有必定的亲热感,天然地将对家庭的爱意和迷恋表达出来.再次,教师恰当的勉励是打开幼儿大胆朗读的金钥匙.实时.恰当地勉励,可使幼儿在轻松高兴的心境下进修朗读,防止一开端就给幼儿挑缺点,不然会使幼儿对朗读掉去兴趣.此外,帮忙幼儿懂得儿歌内容.幼儿懂得了儿歌内容,学起来就会兴趣昂扬,学得快,记得牢.如学儿歌《太阳》前,可先让幼儿在户外感触感染太阳的暖和,又经由过程光盘让幼儿懂得到太阳对动植物的感化,幼儿学起来天然后果明显.2.懂得人物性情,变换语气语调经由一段时光的演习,幼儿已可以或许进行初步的朗读了.但因为缺乏对人物性情的懂得和朗读技能,朗读时语气平庸,语调平直.是以,要重视帮忙幼儿懂得儿歌中的人物性情,使幼儿知道不合的人物和情节在朗读时要用不合的语气和语调.如《进修小黄鸭》,帮忙幼儿懂得小白鸭是娇小的,读“我最小,我要先吃”时,声音要奶声奶气;小黑鸭以大自居,读“我最大,我要多吃”时应粗声大气;小黄鸭懂得推让,语气要轻柔,使幼儿能很好地揣摩和表示四只小鸭不合的性情.我们还经由过程火组朗读.分脚色朗读等多种情势,使幼儿懂得重音对朗读的影响,经由过程演习,幼儿朗读得有条有理,活灵巧现.3.在朗读中帮忙幼儿体验作品所表达的情感和情感在朗读中,教师要留意文学作品的艺术沾染力,让幼儿的情感能随主人公的遭受迁徙,设身处地的睁开思维运动,能像主人公一样在主要的时刻觉得害怕,在取得成功时觉得轻松和高兴.如朗读诗歌《小熊过桥》,读到“立不稳,站不牢,走到桥上心乱跳”时,留意让幼儿领会小熊过桥时的主要心境.读“妈妈,妈妈,快来呀,快把小熊抱过桥”时,音调要高,声音要强,读得要快一些,让幼儿领会小熊害怕不敢过桥的心境.读“小熊过桥回头笑,鲤鱼乐得尾巴摇”时,让幼儿领会小熊过桥后轻松高兴的心境.幼儿有了这种情感体验,就能更好地进步幼儿说话的沾染力.表示力.4.在朗读中进修说话艺术文学作品中的说话,是经由加工的艺术说话,优良作品中的说话都是简洁.活泼,富于情感的,幼儿会从中学到大量新的词汇.在朗读进程中,教师要有意识地引诱幼儿进修.懂得描写天然现象.动植物特点.人的表面等的形容词.代表抽象意义的词(如大胆.说谎.光彩等)以及形容人的心理运动状况的词(如希望.着急.高兴.冲动.满足等).如许可以大大丰硕幼儿的说话材料,加深幼儿对说话的懂得和应用,促进幼儿说话的成长.5.组织好朗读评价,进步朗读技能朗读评价包含先生评价,幼儿自我评价和对其他幼儿的评价.教师评价要留意对幼儿进行双向评价,即对幼儿进行表扬勉励的同时,也要提出恰当的请求;使幼儿不但获得成功的体验,也能增加持续尽力的信念.同时针对不合的幼儿,提出合适其成长的评价和请求,如某个小同伙胆子小,从未自力朗读过,在他第一次给大家扮演时,固然声音小,神色木呐,但这对于他来说是一个不小的进步,同样该赐与了表扬,并提出请求:下次大家还想听到你为大家朗读儿歌.小班后期,教师可在幼儿朗读后都要请大家说一说他读得怎么样?好在哪儿,不好在哪儿?或请幼儿说一说本身读得怎么样.从声音.神色.动作.语气等各方面引诱幼儿进行评价,可取得更为优越的后果.儿歌朗读教授教养计谋学生朗读儿歌是一字一顿,或是一字一拖,每相邻两个字之间的停留是一样的,停留的时光都相等.特殊是齐读的时刻,这种现象尤其凸起.而如许读出来给人的感到是呆板的.单调的,毫无趣味可言.第一:把儿歌读准确.起首请学生找出本首儿歌中须要重点练习的音节(即含有本课进修的声母.韵母的音节).然后,把这些音节板书在黑板上,强化练习,反复拼读这些音节,力争读准音,然后还原于儿歌中来读,请求读准确.第二:留意儿歌的停留,造就学生语感.想要学生留意停留,起首是示范读.范读时,老是放慢语速,让学生能清楚地感触感染到儿歌的停留.可以夸大地范读,是为了让学生找一找朗读儿歌的那种感到,知道儿歌朗读应当是顿挫顿挫的.让学生感触感染其韵味.然后,带着学生逐句读,再然后师生合作.第三,感触感染儿歌内容,在朗读中融入本身的懂得.固然汉语拼音部分的儿歌只要肄业生熟读,不请求懂得其内容,但是,在指点朗读的进程中,恰当地给学生讲一讲儿歌中的有些词语,让学生在朗读中感触感染儿歌的内容,学生往往会觉得别致,因而兴趣很浓.在朗读中,也可以要肄业生语音恰当地放低,语速放慢,学生很尽力地同时也很高兴地读着,几乎没有学生开小差,大家兴趣很高,后果也不错.第四,加动作读,把本身对儿歌的懂得表达出来.在儿歌朗读中,为了增长教授教养的趣味性,还可以引诱学生加进本身的动作进行朗读.可以以鼓掌方法,学生一边鼓掌一边读,高兴极了每次,学完儿歌,我都邑安插一个功课:把今天学的儿歌扮演给家长看.学生往往欢呼雀跃,欢乐之情溢于言表.幼儿儿歌节拍感控制的一点做法“念得快一点!”“别托调!”“有节拍地念!”……如许的请求经常出如今儿歌教授教养的教室上,即便先生经常有意识地提示,但相似“小僧人念佛”的儿歌声仍此起彼伏.荣小燕先生在《我班有个小问号》的儿歌教授教养中,对若何让幼儿控制儿歌的节拍感,并有节拍地朗诵出幽美的儿歌进行了测验测验,具体分一下两点.观赏.区分两种不合的朗诵方法.“示范”在幼儿教授教养中是不成或缺的教授教养手腕,在儿歌教授教养中也不破例.一改常态的是,荣小燕先生除了应用正面示范的手段外,还将不好听地(也就是拖调的念法)也念了一下,意在让幼儿比较两种不合朗诵办法.幼儿在观赏比较中感触感染到快一点的念法更好听,因为它有节拍感.幼儿有了这一熟习后,模拟“有节拍地念”就更有抓手了.假如教师不示范,只是提“有节拍地念”这些请求,或者教师不示范得那么清楚,不让幼儿知道本身的朗诵方法有何等难听,那么幼儿对“如何的朗诵方法才是有节拍的好听念法”的熟习不会那么清楚.借助乐器帮忙幼儿有节拍地朗诵.幼儿固然知道有节拍念儿歌会好听,也知道了哪种方法才叫“有节拍地念”,但念着念着,又会消失拖调的现象,如何能让幼儿有节拍地念完全首儿歌呢?除了让幼儿对儿歌内容更闇练以外,还能测验测验另一种方法——借助乐器.打击声音洪亮.清楚的乐器,帮忙幼儿有节拍地朗诵.在幼儿朗诵儿歌时拍铃鼓,同时勉励幼儿和先生一路鼓掌,幼儿朗诵出来的儿歌天然而然地就和鼓掌.拍铃鼓的节拍一样了,听起来朗朗上口,异常好听,幼儿朗诵起来也很有成就感,朗诵积极性大大进步.若何更好的记忆儿歌歌词?学会歌词是孩子学唱歌曲的主要一步.家长为孩子选择歌曲时,歌词一般应具有以下特色:内容与文字有味,并易于记忆和懂得;歌词内容富于爱.富于美.富于想象.富于教益;歌词情势与内容应合实用动作表示.为孩子选择好了合适的歌曲,那么若何帮忙孩子更好更快地记忆歌词呢?图片提示法:该办法合适于歌词较形象.每一乐句的歌词内容合实用一张图片表达意思的歌曲.这种办法直不雅形象,便于懂得记忆,并且在学唱的进程中可以依据孩子学唱的情形,恰当递减图片,增长进修的趣味性.层次性.图片可所以家长克己,画一些较简略.能表现歌词内容的绘画,不强求美不雅性,讲求实用;也可以让孩子本身绘画歌词内容,如许成效会更大,自动性也会大有进步.动作感触感染法:该办法合适于歌词内容直接描写动作进程,或比较易于用动作表示的歌曲,在引诱孩子进修相似的歌曲时,可和孩子依据歌词内容配合创编动作,经由演习,孩子就知道什么动作代表哪句歌词,进修歌词就变得简略了.这种办法具有动作性.轻易激发孩子歌颂时的情感表示.故事导人法:有的歌曲具有必定的情节性,难以用动作表示,歌曲内容经常是有地点.有人物.有情节,这时家长只需把歌词内容“添枝接叶”变成一个完全的故事.在表达时,要重点凸起歌词内容,如许的办法轻易吸引孩子留意力,使孩子在很短时光内控制歌词内容.儿歌朗诵法:有的歌曲歌词较庞杂,有必定的节拍,但缺乏情境性扮演,这时家长就可以采取“儿歌朗诵法”教孩子学唱,起首把歌词内容单独从歌曲里分别出来,用朗诵办法教孩子进修歌词内容,学会今后,再匹配曲调.这种记忆歌词的办法能帮忙孩子进修一些较难的歌曲.游戏情境法:这种办法实用于能进行游戏的歌曲,有许多游戏都陪同着歌曲进行的.这时我们无须分清歌词和游戏的主次地位,可以让孩子在反复的游戏进程中不竭地感触感染进修歌词内容.如歌曲《丢手绢》.《城门城门几丈高》等.这种办法具有情趣性,使人不知疲惫,在玩中学,在学中玩.对接演习法:这种办法其实也是一种游戏办法,在引诱孩子进修记忆歌词的时刻,经由过程你说上半句,我接下半句的办法进修歌词.这种方法直接,并且富有比赛性质,是孩子爱好的方法.图谱教授教养法:有的歌曲歌词内容较长且有反复.难记忆.家长可带领孩子一路制造图谱,把一首歌变成一张图谱,歌词内容用符号暗示或图案暗示,一般一乐句用一种符号或图案暗示,这种方法是把歌词变成孩子所懂得熟习的符号进行进修,有点像成人合唱时的歌谱,后果明显.这种办法合适年纪大一点的孩子.填补材料《三个好孩子》三个好孩子,三个小胖子,穿衣扣扣子,红红帮冬子,冬子帮珍子,互相来帮忙,都是好孩子.我的小鼓响咚咚,我的小鼓响咚咚,我说的话儿它都懂,我说小鼓响三响,小鼓它就咚!咚!咚!啊呀呀,这不成,妹妹睡在小床中,我说小鼓别响啦,小鼓说声:懂!懂!懂!《小熊过桥》小熊过桥,小竹桥,摇摇摇,有只小熊来过桥,立不稳,站不牢,走到桥上心乱跳.头上乌鸦哇哇叫,桥下贱水哗哗笑,“妈妈妈妈快来呀,快把小熊抱过桥!”河里鲤鱼跳出水,对着小熊大声叫,“小熊小熊别害怕,眼睛向着前面瞧.”一.二.三向前跑,小熊过桥回头笑,鲤鱼乐得尾巴摇.。
《浙江省中小学英语听说计算机评测系统装备指导意见》
浙江省中小学英语听说计算机评测系统装备指导意见1 范围本意见规定了浙江省中小学英语听说计算机评测的定义,装备内容和场所要求等内容。
本意见适用于浙江省中小学英语听说计算机评测系统的装备。
2 术语下列术语适用于本文件。
2.1 听说计算机评测人与计算机之间,以对话的方式交换信息,进行工作或执行某一任务。
听说计算机评测是借助计算机技术、网络技术、语音技术,用接近人类自然思维的交流语言、交流方式、交流习惯实现人机交互,完成英语听说训练和评测。
2.2 语音技术包括自动语音识别技术(Auto Speech Recognize,简称ASR )、语音合成技术(T ext to Speech 简称TTS),语音评测技术(Computer Assisted Language Learning)。
2.3 语音识别(ASR)将人类语音中包含的词汇内容转换为计算机可读输入的过程。
2.4 语音合成(TTS)将文字信息转化为标准流畅的语音并朗读出来的过程。
2.5 语音评测计算机模拟专家对口语语音按一定的参考标准和打分规则进行评分。
2.6 评测系统评分英语听说计算机评测系统使用语音评测技术,对语音样本评出的分值。
2.7 专家基准分由不少于三位英语听说评测专家对语音样本独立评分,取各分的算术平均值。
2.8 相关系统描述两个定距变量间联系的紧密程度,计算公式为:本意见中的相关系数是反应评测系统评分与专家基准分对同一组数据评分排序一致程度。
其中N为语音样本量,专家基准分为,评测系统评分为,r为评测系统评分与专家基准分的相关系数。
相关系数的取值范围介于0~1之间,越接近1表示评测系统评分和专家基准分的之间线性关系越接近。
2.9 基本准确率评测系统评分与专家基准分的差值小于等于满分15%的数据所占的比例,是衡量评测系统评分与专家基准分接近程度的指标。
2.10 显著误差率评测系统评分与专家基准分的差值大于满分25%的数据所占的比例,是衡量评测系统评分出现显著较大误差的概率的指标。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第八届中国语音学学术会议 1 朗读语气韵律可变性分析及韵律自动评价初探贾惠彬 陶建华摘要韵律评价是语音评价的一个重要组成部分。
迄今为止,基于频谱分析的发音质量评价已取得了长足的进步,然而对于韵律质量评价的研究甚少。
对于朗读语气的韵律模式,本文在详细分析了说话人间的声调、基频走势和句子节律组织的可变性的基础之上,提出了一种自动韵律评价方法,通过从声调、基频走势和节律组织三个方面计算待测语句与它的多个标准参考韵律模式间的相似度,来预测待测语句的韵律等级。
该方法在本文收集的数据库上进行了测试,取得了很好的人机评分相关度。
1引言近年来,计算机辅助教学系统在语言学习中发挥出越来越重要的作用[3],这些系统不仅能评价学习者的发音质量,而且也能指出他们的发音错误。
对于普通话水平考试系统而言,要测试考试者的普通话流利水平。
当前大多数系统是通过整合自动语音识别技术来评价学习者或考试者的发音质量[5,6]的。
实际上,韵律评价也是语音评价的一个重要方面。
对于汉语学习者来说,如果他们能掌握地道的汉语韵律模式,通常认为他们的普通话达到了一个很高的水平。
虽然当前许多计算机辅助教学系统能够指出学习者发音中的声调错误,然而没有一个系统能够评价发音者的韵律质量。
对于语音合成系统评测而言,它的评测内容包括合成语音的可懂度和自然度。
然而当前语音合成系统的可懂度达到了一个很高的水平而自然度并没有达到理想的程度。
定期举行语音合成系统评测对促进合成系统的发展起到了极大的推进作用,然而组织一次评测需要花费巨大的人力和物力,且评测结果不能重复利用。
对于系统的开发者来说,每次算法和系统的改变不可能都进行正式的评测。
通常来说,通过直接计算韵律错误来评价韵律质量是非常困难的,因为很难清楚的定义正确的韵律。
而且即使说话人的韵律特征一定程度上偏移了它的理论标准也不一定会影响句子的自然度,并且韵律复杂变化的本质让韵律质量评价成为一项非常困难的任务。
迄今为止,这方面的研究成果甚少。
对于朗读语气的韵律模式,在基于语料库的语音合成系统中对单一说话人的韵律参数进行了分析和建模工作,并取得了很好的语音合成自然度[25,26]。
而对于韵律评价工作而言,不同于语音合成的单一说话人的韵律分析和建模,而需要的是对多个说话人间的韵律可变性的分析和建模,这方面的研究工作也非常少。
朗读语气的韵律模式,从音系层来讲,可以分成句子的声调、基频走势和句子的节律组织三个组成部分。
本文详细分析了说话人间的声调、基频走势和句子的节律组织的可变性。
基于对说话人间韵律可变性的分析,提出了一种自动韵律评价方法,通过计算待测语句与多个标准参考韵律模式间的相似度,来评价待测语句的韵律质量。
最后,该方法在本文收集的试验数据库上进行了测试,试验结果表明该方法取得了很好的人机评分相关度。
本文的组织结构如下:第二部分描述了实验所需的数据库。
第三部分详细介绍了韵律建模方法,并进行了韵律可变性分析。
第四部分介绍了自动韵律评价方法,并对实验结果进行了详细的分析。
最后是文章的结论部分。
2试验数据库在本试验中,我们构建了两个数据库,一个是标准语音库,它由多个标准发音人录制而成,包括200个句子的8遍录音(由6个女播音员和2个男播音员录制);另一个是韵律评价库,它来源于多个语音合成系统,它包括相同的200个句子的5遍语音。
这些句子的文本选自人民日报,句子的平均长度为15个音节。
当前语音合成系统所合成的语音为朗读风格。
为了保持标准语音库和韵律评价库中语音风格的一致性,在录制标准语音库时,都采用朗读风格,并且发音人没有通过刻意改变节律模式和增加句重音来表达特殊的语意。
标准语音库用于分析说话人间韵律的可变性,同时它也作为自动韵律评价时的标准参考。
韵律评价库中包含各种韵律错误,如不适当的声调变化,不合适的句子基频走势,错误的停延方式,并且专家对句子的整体韵律质量进行了评分。
对于语音库的标注,我们分别采用Praat软件和HTK工具包对这两个语音库进行了基频提取和自动切分,最后进行了人工校正。
3 韵律可变性分析韵律组织在言语交流中起着非常重要的作用,它不仅是清楚表达语义的关键,还能直接反映讲话人的态度、意向、情绪以及对听话人的期望等信息。
人在讲话时,总是先将意识层的信息转化成音系层的表达手段,如选择怎样的声调、语调、轻重模式和节律模式等,最后再通过控制发音器官来实现相应的声学目标[9]。
言语的韵律组织是一个相当复杂的过程,是语义的、语法的、词法的、音段的、生理的以及心理的等不同层次约束的充分协调。
通常来讲,说话人发音时不得不服从某些约束,比如声带的振动频率,发音器官的运动速度等等的约束,这些约束导致了即使是不同的说话人在表达相同的说话内容时也会表现为不同的韵律形式。
对于朗读风格的韵律表现可以分成音节的声调、句子的节律组织和句子的基频走势三个方面,它并不包括句子的重音信息。
这三个方面是相辅相成,很难独立的来分析和处理,它们共同表达了句子的语意信息。
由于全面研究韵律的可变性和不变性是非常困难的,本文首先在一个相对严格的条件下对这些现象进行一定的初步分析,即研究对于朗读风格的相同说话内容不同说话人之间的韵律差异,包括:节律组织、音节调型、基频走势等内容。
在韵律参数中,基频是最重要的参数,为了去除说话人本身音域范围的影响,对提取的基频首先按照如下公式进行规一化:ffffμσ−=(1)其中,f表示规一化后的基频值,fμ和0fσ分别表示基频的均值和方差。
3.1 节律组织可变性分析节律组织的外在表现是将语句划分成“许多段落,就是所谓的意群;每个节落又可分成许多小段落,就是所谓节拍群。
节落和节落之间有长短不等的间歇,句子里的词或词里的音节又各有不同的高低轻重和快慢不等速度”(罗常培和王均,1957:147)。
传统观点认为停顿是节奏单元之间的分隔标记(郭锦桴,1993:178),但越来越多的研究结果证明“音延”也可以用来分割节奏单元(吴洁敏,1990;谢军,2000:196)。
用“停延”代替“停顿”作为节奏单元间的分割标记的观点已经被普遍接受。
在本实验所研究的语料库中,节律层级标注也是以“停延”的知觉强度作为依据的。
初敏[10]等在研究普通话节律组织的局部语法约束和长度约束时,对于语调平稳、语速适中的录音,对句子的节律组织采用四级标注标准,分别是韵律词、复合韵律短语、韵律短语和语调短语,其中韵律词边界没有明显可感知的停延标记。
而对人耳能感知到的弱、中、强三级停延分别用复合韵律词,韵律短语和语调短语进行标注。
本文中,我们采用了与初敏等采用的相同的标注标准。
但并不对韵律词进行标注。
为了韵律可变性分析的方便,本文中采用数字序列的方式把句子的节律组织进行量化,如{}0,1,2,3...2,1...表示一个句子的节律组织。
在这个数字序列中,0代表音节间没有停延,1代表音节间的复合韵律词停延,2代表音节间的韵律短语停延,3代表音节间的语调短语停延。
不同说话人在表达相同的说话内容时可能会选择不同的节律组织模式。
不同节律模式的差异主要存在于两个方面,一是停延位置的不同,二是停延等级的不同。
如下面的例子,它们来自于标准语音库。
亚洲|金融风暴$把东南亚经济|搞跨了。
亚洲金融风暴|把东南亚经济|搞跨了。
亚洲金融风暴$把|东南亚经济搞跨了。
亚洲金融风暴|把东南亚经济|搞跨了。
亚洲金融风暴$把东南亚经济|搞跨了。
亚洲金融风暴|把东南亚经济|搞跨了。
在上例中,“”代表复合韵律词停延,“|”代表韵律短语停延,“$”代表语调短语停延。
从上例中可以看出不同的说话人在选择不同的节律模式时,停延位置和停延类型的差异。
本实验中,我们从标准语音库中选取4个说话人的语音进行分析,其中包括两男两女,分别用“A”、“B”、“C”和“D”来表示。
下面我们将详细分析四个说话人两两之间的节律组织的差别,如下表所示。
在表1中表示了说话人A出现不同停延的位置处,说话人B出现的停延等级,如在说话人A出现为复合韵律词停延的位置,说话人B选择没有停延的比例为8.0%,选择复合韵律词停延的比例为84.3%,选择韵律词停延的比例为7.7%,而在这些位置处说话人B没有选择语调短语停延。
表1 说话人A与B间的节律差异表2 说话人A与C间的节律差异表3 说话人A与D间的节律差异表4 说话人B与C间的节律组织差异表5 说话人B与D间的节律差异表6 说话人C与D间的节律组织差异通过以上的分析发现,对于表达相同的说话内容,虽然受到特定的上下文和语义表达的约束,然而在选择节律模式时存在较大的灵活性和随机性,具体表现在停延位置的不同和停延等级的不同,然而这种差异并没有导致句子自然度的下降。
3.2基频走势可变性分析汉语中以超音段上的音高(及时长)来体现的语调,一直以来是国内外学者的研究重点,其目的在于从基频曲线上分离出什么属于语调。
Eva Gauding [29-30]提出汉语语调“栅格”结构,定量地标记随时间变化的音高范围。
在这个模型中,疑问语调和陈述语调具有不同的栅格。
沈炯[31-32]首先用实验看到音高音域的实际表现,他说“语调是由一连串声调音域组织起来的音高调节形式,语调是在声调音域中滑动的曲线。
”。
曹建芬[34]认为语调存在于声调之中,必须通过各个声调的沉浮而得以实现。
这些学者认为汉语的语调跟语句的音高范围,音高的高低线,“调子”以及各个音节声调等密切相关。
有些学者则认为汉语的语调是句末调问题[21, 22, 23]。
林茂灿[35]认为汉语语调体现于两个独立变量:音高重音和边界调。
音高重音的作用是传递话语中语言学内容那部分更重要,而边界调的作用是传递话语的语气,如陈述句和疑问句。
迄今为止,并没有一个完整的语调描述模型。
而语调是与话语的基频变化紧密相关,反映了语句的音高范围,音高的高低线等因素。
鉴于建立完整的语调模型是非常困难的,本文中我们将采用基频走势来近似语调模型的功能,用基频走势来反映句子基频曲线随时间的高低变化。
基频走势,可以用句中音节基频曲线的最大值、均值和最小值来组成的三条曲线来表征。
图1表征了句子的基频走势和真实的基频曲线。
FValue图1 基频走势根据上述基频走势的建模方法,本文中分析了200个句子的四遍录音的基频走势的相关度。
句子基频走势的相关度采用计算一个句子的三条基频走势曲线的相关系数而得到。
图2表示了200句语音的四遍录音的相关度的均值和方差。
四遍录音的基频走势的平均相关度为0.81。
图 2 句子基频走势相关度的均值和方差从上图中可以看出,虽然试验中都采用的是朗读风格的语音,然而句子间的基频走势仍具有一定的可变性。
3.3 音节调型可变性分析普通话中的音节具有稳定的调型,它的形状依赖于声调的类型,是不能被任意改变的。
然而在连续语句中,由于受到发音风格和上下文的约束,调型的变化非常复杂。