汉语普通话基础元音i、y连续感知实验研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

汉语普通话基础元音[i][y]连续感知实验研究
Research on Continuous Perception of [i] and [y]in Mandarin
提要:本文通过汉语普通话基础元音[i][y]的辨认区分实验,旨在探讨汉语普通话基础元音[i][y]的连续听感边界问题,并从声调、测试界面、性别、刺激音高低等方面进行探究,最后得出元音[i][y]的连续听感格局,并与元音[i][y]的孤立听感格局进行对比。

关键字:辨认区分听感
一引言
Liberman等(1957)对浊塞音[b]、[d]、[ɡ]进行实验研究,结果显示人们对辅音属于范畴感知。

Fry、Abramson等(1962)对英语元音[i]、[ɛ]、[æ]进行研究,认为人们对元音是连续感知。

Cheung Yuk-Man(2003)对汉语普通话舌尖元音[ɿ]、[ʅ]进行实验研究,认为舌尖元音是独立于“范畴感知”和“连续感知”之外的第三种感知类型。

本实验采用Liberman开创的语音感知经典范式对汉语普通话基础元音[i][y]进行实验研究,不过我们不探讨元音感知类型,我们旨在找出元音[i][y]的边界位置,并讨论影响因素,探讨听感边界的状态,并通过归一化的方式得出元音[i][y]的听感格局图,从而为探讨元音[i][y]的声学和听觉之间的关系提供参考。

二实验方法
2.1 语料选取
按声调①进行分类,本实验的语料均为使用频率高、较易辨识的二字组,分别为:阳平组“移民-渔民、小姨-小鱼”,上声组“以后-雨后、无以-无语”,去声组“意见-遇见、美意-美玉”。

我们将“移民-渔民”、“以后-雨后”、“意见-遇见”定义为前字组,“小姨-小鱼”、“无以-无语”、“美意-美玉”定义为后字组。

2.2 实验录音
发音人为一位老北京人②,录音设备为装有Cool Edit 2.0的笔记本电脑,采样率为11025Hz、 16位、单声道。

在安静的环境下,请发音人以自然语速朗读实验语料。

2.3 刺激音合成
元音的前三条共振峰是元音听辨的重要线索(Ladefoged & Broadbent,1957;Liberman,1967)。

Jachson(2012)表示[i][y]的不同主要在F2、F3上。

故本次实验利用Praat软件改变元音的F2、F3来合成刺激音,从[i]合成到[y],每个调类有11个刺激音。

其刺激音连续统具体制作方法为:阳平组,F2从2278Hz合成到1967Hz,步长为31;F3从3113Hz合成到2165Hz,步长为95。

上声组,F2从2292Hz合成到1745Hz,步长为55;F3从2960Hz合成到2237Hz,步长为72。

去声组,F2从2302合成到2046Hz,步长为26;F3从3162Hz合成到2271Hz,步长为89。

2.4 E-Prime脚本制作
辨认实验采取二选一迫选的方式,即播放一个刺激音,要求被试选择听到的是[i]还是
①由于阴平组没有常用语料,故本次实验只包含阳平组、上声组和去声组。

②参照胡明扬先生的意见,看发音人的父母是否为北京人。

老北京人就是父母双方为老北京人,本人在北京长大。

(胡明扬 1981:北京话社会调查商务印书馆)
[y],双字组共3*11=33个刺激音。

区分实验采取间隔一个刺激音对比的方法,如刺激音1-3、3-1、2-4、4-2等刺激对儿的形式,再加上相同刺激组组成的刺激对儿,如刺激音1-1、2-2等,播放AX式刺激音,要求被试选择听到的两个刺激音是相同还是不同,双字组共3*(9*2+11)=87个刺激音。

根据测试界面的不同,我们又将辨认和区分实验各分正反序两个脚本:辨认实验测试界面默认[i]在前为正序,[y]在前为反序③。

区分实验测试界面默认相同不同为正序,不同相同为反序。

实验共8个脚本,8个脚本中均有练习和正式实验两部分。

2.5 实验被试
实验被试共28人,17男11女,均为在北京出生丙长大的老北京人,年龄在18到25 岁之间,都是京津两地的在校大学生。

实验被试无视听障碍,右利手,均为自愿参加实验,实验在安静的语音实验室进行。

2.6 实验过程
辨认实验和区分实验的过程均为:画面出现注视点“+”✂播放刺激音,被试进行选择✂出现空白页面✂画面出现注视点“+”……以此类推。

2.7 数据计算
本实验最终选取了24个有效数据进行分析,男女各半。

数据分析主要依靠Excel进行。

2.7.1 辨认数据
边界位置:指两条辨认曲线交点处F2、F3的赫兹值。

边界宽度:辨认曲线上,从辨认率25%处的F2、F3的赫兹值到辨认率为75%处的F2、F3的赫兹值之间的差值。

最大辨认率:主要探讨被试对元音的[i][y]的最大辨认率及其位置。

感知范围:每个目标字的F2、F3的数值范围占[i][y]整体区间范围的百分比。

辨认反应时:被试听到刺激音到完成判断所需要的时间,单位为毫秒(ms)。

2.7.2 区分数据
区分峰值:区分曲线上的显著峰值,即区分正确率的最大百分比的值。

峰值位置:区分峰值所对应的的刺激音对儿。

峰界对应:辨认实验的边界位置同区分实验的区分峰值的对应情况。

区分反应时:被试听到刺激音对儿到完成判断所需要的时间,单位为毫秒(ms)。

三实验结果分析
3.1 调类对[i][y]听感分界的影响
三个调类中[i][y]的两条辨认曲线均有一个交点。

阳平前字组、上声前字组、去声前后字组的边界位置均在刺激4到刺激5之间;阳平后字组在刺激5到刺激6之间;上声后字组在刺激4处。

界前界后分离度均达到了100%。

[i][y]的辨认曲线在边界位置处都呈现出陡升陡降的走势。

总体来说,三个调类都有一个明显的区分峰值,且三个调类的区分率都比较接近,都在64.22%到77.59%之间。

[i]的感知范围为30%到47%,[y]的感知范围为53%到70%,[i]的感知范围比[y]的感知范围小,以[i]的感知范围为例,阳平(35%、47%④)>去声(34%、39%)>上声(34%、30%)。

在听感边界上,F2为2106Hz到2214Hz,F3为2670Hz到2862Hz。

在边界宽度上,F2为31Hz
③“移民-渔民”为正序,“渔民-移民”为反序,剩下的以此类推。

④第一个百分比为前字组的感知范围,第二个百分比为后字组的感知范围。

后文同理。

到101Hz;F3为95Hz到210Hz。

在区分峰值上,三声区分峰值位置与边界位置基本对应,区分峰值是:阳平(77.59%、74.74%)>上声(76.03%、66.47%)>去声(64.22%、66.47%)。

3.2 测试界面对[i][y]听感分界的影响
测试界面正反序的三个调类的[i][y]的辨认曲线都有一个交点,阳平前字组正序的边界位置在刺激4处;阳平前字组反序、上声前字组正反序、上声后字组反序、去声前字组正反序、去声后字组正序在刺激4到刺激5之间;阳平后字组正反序在刺激5到刺激6之间;上声后字组正序在刺激3处;去声后字组反序在刺激5和刺激6处。

界前界后分离度都达到了100%,边界位置处的辨认曲线均有陡升陡降的走势,区分峰值均比较明显。

在感知范围方面,[i]的感知范围正序比反序小,在阳平前字组中,正序的感知范围为30%,反序为36%;在阳平后字组中,正序为46%,反序为47%;在上声前字组中,正序为32%,反序为37%;在上声后字组中,正序为20%,反序为33%;在去声前字组中,正序为33%,反序为36%;在去声后字组中,正序为36%,反序为41%。

在边界位置方面,无论正反序,F2最小在上声前字组,正序为2116Hz,反序为2090Hz;最大在去声前字组,正序为2218Hz,反序为2211Hz;F3最小在阳声后字组,正序为2676Hz,反序为2662Hz;最大在去声前字组,正序为2873Hz,反序为2851Hz。

在区分峰值位置方面,正序比反序偏后(上声后字组和去声前字组除外),在阳平前字组中,正序的区分峰值在刺激4到刺激6之间,反序在刺激3到刺激5之间;在阳平后字组中,正序在刺激6到刺激8之间,反序在刺激5到刺激7之间;在上声前字组中,正序在刺激5到刺激7之间,反序在刺激4到刺激6之间;在上声后字组中,正序在刺激4到刺激6之间,反序在刺激5到刺激7之间;在去声前字组中,正序在刺激2到刺激4之间,反序在刺激5到刺激7之间;在去声后字组中,正序在刺激6到刺激8之间,反序在刺激3到刺激5之间。

在区分峰值方面,三个声调中,前后字组的正序均大于反序,在阳平前字组中,正序的区分峰值为79%,反序为76.44%;在阳平后字组中,正序在80.25%,反序为77.2%;在上声前字组中,正序为81.35%,反序为71.65%;在上声后字组中,正序为72.88%,反序为62.07%;在去声前字组中,正序为67.24%,反序为61.3%;在去声后字组中,正序为70.06%,反序为64.75%。

可见[i][y]的顺序有利于被试对于刺激音的听辨。

3.3 性别对[i][y]听感分界的影响
男女三个调类的[i][y]的辨认曲线都有一个交点。

在阳平前字组中,男女的边界位置均在刺激4到刺激5之间;在阳平后字组中,男女均在刺激5到刺激6之间;在上声前字组中,男性在刺激4到刺激5之间,女性在刺激5到刺激6之间;在上声后字组中,男性在刺激4到刺激5之间,女性在刺激3到刺激4之间;在去声前字组中,男女均在刺激4到刺激5之间;在去声后字组中,男性在刺激5到刺激6之间,女性在刺激4到刺激5之间。

界前界后分离度都达到了100%。

边界位置处的辨认曲线都有陡升陡降的走势,区分曲线的峰值都比较明显。

在感知范围方面,阳平前后字组、上声后字组和去声后字组,均为男性感知范围大于女性;上声前字组和去声前字组,均为男性感知范围小于女性。

以[i]的感知范围为例,在阳平前字组中,男性的感知范围为36%,女性为32%;在阳平后字组中,男性为47%,女性为45%;在上声前字组中,男性为35%,女性为45%;在上声后字组中,男性为31%,女性为25%;在去声前字组中,男性为34%,女性为36%;在去声后字组中,男性为46%,女性为36%。

在边界位置方面,无论男女,F2 最小在上声前字组,男性为2100Hz,女性为2045Hz;F2最大在去声前字组,男性为2215Hz,女性为2211Hz;F3最大在去声前字组,男性为2863Hz,女性为2851Hz。

在边界宽度方面,阳平前后字组、上声前字组和去声后字组均为男性大于女性;上声后字组和去声前字组均为女性大于男性。

在区分峰值位置方面,阳平前后字组、上声前后字组和去声前字组,均为男性的峰值位置不比女性靠前,去声后字组,男性的区分峰值位置较女性靠前。

在阳平前字组中,男性的区分峰值位置在刺激4到刺激6之间,女性在刺激3到刺激5之间;在阳平后字组中,男性在刺激6到刺激8之间,女性在刺激4到刺激6之间;在上声前字组中,男女均在刺激4到刺激6之间;在上声后字组中,男性在刺激4到刺激6之间和刺激5到刺激7之间;女性在刺激4到刺激6之间;在去声前字组中,男性在刺激5到刺激7之间,女性在刺激2到刺激4之间;在去声后字组中,男性在刺激3到刺激5之间,女性在刺激6到刺激8之间。

在区分峰值方面,三个声调的前后字组均为男性小于女性。

在阳平前字组中,男性的区分峰值为77.59%,女性为83.79%;在阳平后字组中,男性为75.17%,女性为83.79%;在上声前字组中,男性为75.52%,女性为77.59%;在上声后字组中,男性为65.63%,女性为68.97%;在去声前字组中,男性为70.57%,女性为71.38%;在去声后字组中,男性为65.63%,女性为77.59%。

3.4 刺激音高低对[i][y]区分率的影响
刺激音的高低并未对区分率产生明显的影响,四个声调的低-高刺激和高-低刺激的区分率折线图的走势基本一致。

区分峰值出现的位置,无论是低-高刺激还是高-低刺激,大致是对应的。

在阳平前字组中,低-高刺激区分峰值在刺激4到刺激6之间,为70%;高-低刺激区分峰值在刺激5到刺激3之间,为75%。

在阳平后字组中,低-高刺激区分峰值在刺激5到刺激7之间,为75%;高-低刺激区分峰值在刺激6到刺激4之间,为70%。

在上声前字组中,低-高刺激区分峰值在刺激4-刺激6之间,为65%;高-低刺激区分峰值在刺激6到刺激4之间,为70%。

在上声后字组中,低-高刺激区分峰值在刺激4到刺激6之间,为40%;高-低刺激区分峰值在刺激7到刺激5之间,为60%。

在去声前字组中,低-高刺激区分峰值在刺激5到刺激7之间,为55%;高-低刺激区分峰值在刺激6到刺激4之间,为60%。

在去声后字组中,低-高刺激区分峰值在刺激6到刺激8之间,为55%;高-低刺激区分峰值在刺激5到刺激3之间,为60%。

3.6 小结
汉语普通话基础元音 [i][y]三个调类的听感边界是:F2为2106Hz到2214Hz,F3为2670Hz到2862Hz,并不是一个固定的值,而是一个动态的边界。

为了直观展现三个声调中,[i][y]的听感空间,我们以F2为横坐标,以F3为纵坐标,做出了[i][y]的具体听感空间图以及归一化的听感空间图,如下:
图1 [i][y]三个声调的听感空间及归一化后的听感空间汉语普通话基础元音[i]的感知范围为30%到47%,[y]的感知范围为53%到70%,[i]的感知范围比[y]的感知范围小,这一点在无论是测试界面还是性别,都有一定的体现。

在三个声调中,[i]的感知范围是:阳平>去声>上声,这在测试界面和性别中,基本满足。

如下图:
图2 [i][y]三个声调的感知范围
3. 汉语普通话基础元音[i][y]三个调类的区分峰值是:阳平>上声>去声,在测试界面和性别中,仍然满足。

4. 同一声调中,正序[i]的感知范围小于反序[i]的感知范围。

即,播放相同的刺激音时,由于正序[i][y]和反序[y][i]的不同,对被试听辨[i][y]会产生一定的影响。

另外,正序的区分峰值大于反序的区分峰值(去声相反),说明“相同---不同”更容易让被试做出正确选择。

5. 同一声调中,男女的[i][y]感知范围相差不大,说明性别对[i][y]的感知无明显影响,阳平前后字组、上声后字组和去声后字组,均为男性感知范围大于女性;上声前字组和去声前字组,均为男性感知范围小于女性。

在边界宽度方面,阳平前后字组、上声前字组和去声后字组均为男性大于女性;上声后字组和去声前字组均为女性大于男性。

在区分峰值位
置方面,阳平前后字组、上声前后字组和去声前字组,均为男性的峰值位置不比女性靠前,去声后字组,男性的区分峰值位置较女性靠前。

在区分峰值方面,三个声调的前后字组均为男性小于女性。

6. 四个声调的低-高刺激和高-低刺激的区分率折线图的走势基本一致。

区分峰值出现的位置,无论是低-高刺激还是高-低刺激,大致是对应的。

四结语
在汉语普通话的听感研究中,实验字组的设计分为单字组和双字组。

单字组实验是孤立感知,双字组实验是连续感知。

孤立感知是连续感知的基础,连续感知是听感研究的目标。

(石锋,2015年11月南开大学实验语言学沙龙讲话)
下面分别是单双字各调类辨认曲线和区分曲线对比图:
图3 单、双字各调类辨认、区分曲线
从图中我们可以看到:单双字的辨认曲线的走向大体一致,边界位置比较集中;单双字的区分曲线的走向大体一致,区分峰值也比较集中。

下面是单双字听感边界、感知范围、边界宽度、区分峰值及位置的具体情况:
表1单、双字各调类辨认、区分数据
从上述表格,我们可以看到:
1.听感边界与区分峰值基本对应,说明被试在听感边界需要花费较多的时间来进行判断。

单双字实验中,[i]的感知范围不大于[y]的感知范围。

其中,单字实验中,[i]的感知范围为31%-50%;双字实验中,单字组[i]的感知范围为34%-35%,后字组[i]的感知范围为30%-47%,说明了语音环境对[i][y]的感知范围有一定的影响。

为了更清楚地说明这个问题,我们以F2为横坐标,以F3为纵坐标,将单字组和双字组的实验结果进行归一化处理,得到下图:
图4 [i][y]总归一化后的听感空间
2.单字组边界宽度变动幅度大于双字组边界宽度变动幅度,说明双字的听感边界较单字组稳定。

语境的存在,有利于被试对刺激音的听辨。

单字组的曲分峰值的变动幅度大于双字组的区分峰值的变动幅度,与听感边界的变化幅度保持一致的趋势。

参考文献:
黄荣佼汉语普通话元音[i]和[y]听感实验南开大学2013年硕士学位论文
丁云黄荣佼普通话一级元音[i][y]单字听感边界初探及单双字对比研究实验语言学 2014年第3卷第1号
丁云方言母语者对普通话元音[i][y]听辨的分析实验语言学 2014年第3卷第2号
丁云普通话一级元音[i][y]双字听感研究及单双字对比分析实验语言学 2015年第4卷第1号。

相关文档
最新文档