心理声学(Psychoacoustic Facts and Models )第一章
fdk-aac编码原理
fdk-aac编码原理
fdk-aac是一种开源的、高性能的AAC(Advanced Audio Coding)音频编码库。
以下是fdk-aac编码的基本原理:
1.AAC编码概述:AAC是一种先进的音频编码标准,旨在提供更高的音频质量和更低的比特率。
它采用了基于子带的编码技术,通过对音频信号进行频域分析和量化来实现高效的压缩。
2.Psychoacoustic Model(心理声学模型):AAC编码使用心理声学模型分析音频信号,模拟人耳的感知特性。
这包括对音频信号的掩蔽效应进行建模,以便更有效地分配比特率给对人耳更敏感的信号部分。
3.MDCT(Modulated Discrete Cosine Transform):AAC使用MDCT作为频域变换技术,将音频信号从时域变换到频域。
这种变换有助于提取信号的频域特征,为后续的量化和编码提供基础。
4.Quantization and Coding(量化和编码):MDCT输出的频域系数经过量化和编码,以减少数据量。
AAC使用了一系列的编码技术,如Huffman编码和熵编码,来进一步压缩数据。
5.Bit Allocation(比特分配):根据心理声学模型的分析结果,AAC对每个频带分配适当的比特率,以确保对人耳敏感的频段获得更多的比特,从而提高音质。
6.码率控制:AAC编码器通常具有码率控制功能,以确保生成的编码流满足指定的比特率要求。
这对于网络传输和存储空间的有效利用非常重要。
fdk-aac是一个高度优化的AAC编码库,它在实现这些基本原理的同时,通过一系列的技术手段和算法来提高编码效率和音频质量。
6心理声学
• 心理声学(psychoacoustics)是心理物理学 的一个部分。心理物理学是研究物理刺激 的参数(如:声音的强度,光的波长)和心理 量(如:响度,颜色)之间关系的科学。 • 在心理声学中,刺激信号为声音(物理量), 而感觉则为听觉(心理量)。确定物理量的单 位比较容易,而确定心理量的单位就比较 困难。
• 二、双耳声源定位 • 双耳声源的定位是基于双耳听到声音的时 间差(低频)和强度差(高频)。 • 领先效应
江苏省人民医院(南京医科大学附属第一医院)
WHO预防聋和听力减退合作中心
• 三、双耳听觉融合和双耳听觉偏向 • 如果把同样的声音经由两个耳机同时送人 两个耳朵,听觉系统可将此两个声音融合 为一个声音,其位置在头部的中央。 • 四、双耳掩蔽级差
江苏省人民医院(南京医科大学附属第一医院)
WHO预防聋和听力减退合作中心
第四节 频率的选择性与音调的感受
• 音调 • 音色
江苏省人民医院(南京医科大学附属第一医院)
WHO预防聋和听力减退合作中心
第五节 双耳听觉
• 一、双耳听觉的累积作用
• 阈值、响度、双耳声音的融合、声源的定位、声源位置的 鉴别、双耳听觉的特殊效应、助听 • 双耳节律
江苏省人民医院(南京医科大学附属第一医院)
WHO预防聋和听力减退合作中心
江苏省人民医院(南京医科大学附属第一医院)
WHO预防聋和听力减退合作中心
第三节 响度的感觉பைடு நூலகம்
• 一、生理基础 • 神经冲动的速率 • 发生冲动的神经的数量 • 二、 频度对响度的影响s • 三、强度和响度的关系 响度的单位:方,宋 • 四、时值对响度的影响 适应和疲劳 TTS 异常响度:病理性适应和重振 • 五、强度变化的察觉
心理声学在心理治疗中的应用
心理声学在心理治疗中的应用心理声学是一门研究声音对人类心理和情绪的影响的学科。
它探索了声音对人类认知、情感和行为的作用,以及如何利用声音来促进健康和治疗心理问题。
在心理治疗中,心理声学被广泛应用,它可以通过音乐疗法、声音放松和声音刺激等方式来帮助人们改善心理健康。
音乐疗法是心理声学在心理治疗中最常见的应用之一。
音乐具有独特的情感表达和情感诱发的能力。
通过选择适当的音乐,治疗师可以帮助患者表达和释放情感,缓解焦虑和压力。
音乐还可以激发人们的创造力和想象力,帮助他们探索和理解内心的冲突和问题。
此外,音乐还可以帮助患者建立积极的情感体验和情感联系,提高自尊和自信心。
声音放松是另一种常见的心理声学应用。
声音放松利用声音的特定频率和节奏来诱导身心放松。
通过听取自然环境中的声音,如海浪的声音、鸟鸣声等,人们可以放松身心,减轻压力和焦虑。
声音放松还可以通过音乐、冥想和呼吸练习等方式来帮助人们进入放松状态。
这种放松状态不仅可以改善心理健康,还可以提高注意力和集中力,增强学习和工作效率。
声音刺激是心理声学在心理治疗中的另一个重要应用领域。
声音刺激可以通过改变声音的频率、音量和节奏等方式来影响人们的情绪和行为。
例如,快速节奏的音乐可以提高人们的兴奋和活力,而缓慢节奏的音乐可以帮助人们放松和入睡。
声音刺激还可以通过声音的空间分布和立体声效果来创造身临其境的体验,增强人们对环境的感知和情感体验。
这种声音刺激不仅可以用于治疗焦虑和抑郁症,还可以用于改善注意力和认知功能。
除了上述应用外,心理声学还在其他领域展现出潜力。
例如,虚拟现实技术结合心理声学可以创造出逼真的虚拟环境,帮助人们面对和克服恐惧和创伤。
声音诱导幻觉可以通过声音的特定频率和节奏来改变人们的意识状态,帮助他们进入冥想、放松和集中注意力的状态。
此外,心理声学还可以应用于人机交互和游戏设计领域,通过声音的设计和应用来提高用户体验和情感参与。
尽管心理声学在心理治疗中的应用已经取得了显著的进展,但仍然存在一些挑战和限制。
windows声音应用程序开发指南 张新宇 第4章 MP3文件格式
第4章 MP3文件格式
所有的数据划分为小的数据段,每一个数据段称为 一帧(Frame),通常一帧存储1秒的数据。
对声音数据进行分析,得到其光谱能量分布,即 得到声音频率的光谱图,根据整个光谱的能量分布确 定表示这些数据需要的最合适的位数(bit)。 根据比特率以确定每一帧能够存储的最大比特 (bit)。 分布在每一帧中的频率数据与一个生理心理声学 模型中的数据(这些数据存储在一个CODEC参考表中) 进行比较,以决定这些数据的取舍。
第4章 MP3文件格式
4.3.2 与感觉有关的压缩解压器
总体来看,MP3分两步进行压缩: (1) 有损压缩:舍弃那些人们根本听不到的声音数据。 (2) 无损压缩:对认为重要的数据进行高效压缩处理。 其中有损压缩部分最复杂,也是MP3编码的重点。因
为与感觉有关的CODEC只是提供了一种原理,并没有提
与音调1的正弦波的频率就有较大的区别。如图4-3:
通常正常的人在点A时刻只能听到音调1,而听不到音
第4章 MP3文件格式
调2,因为此时音调2的频率与音调1非常相似;在点B 时刻就能听到音调1和音调2,因为此时音调1的频率与 音调2的频率不相似。另外我们注意到,在整个过程中, 音调2的音量并没有发生变化。
第4章 MP3文件格式
1 000 Hz 音调 1 0dB
1 000 Hz
1 100 Hz 音调 2 -10dB A
4 000 Hz
B
音量
时间
图4-3 两个频率非常相近的声音和两个频率不相近的 声音产生的不同效果
第4章 MP3文件格式
2) 时间遮蔽效应
一种基于空气信道的音频伪装模型
一种基于空气信道的音频伪装模型摘要:音频伪装作为一种寄生通信技术,使用需满足两个条件:一是要有能够携带隐藏信息的音频载体;二是音频载体要有冗余,能够容纳额外的隐藏信息而不显著降低自身的通信性能。
本文对空气信道的信息隐藏技术展开研究,提出了一种基于空气通道的音频伪装模型,该模型包括信息伪装通信模型、听觉系统模型、音频伪装模型等三个部分。
关键词:信息隐藏;空气通道;音频伪装;信息干扰;听觉系统1 概述空气信道是对无线通信中发送端和接收端之间通路的一种形象比喻,对于无线电波而言,它从发送端传送到接收端,其间并没有一个有形的连接,它的传播路径也有可能不只一条,为了形象地描述发送端与接收端之间的工作,可以想象两者之间有一个看不见的道路衔接,科研人员把这条衔接通路称为信道。
通信系统由发信机、发信天线、收信机、收信天线和各种终端设备组成。
发送机主要由话筒、音频处理器、调制器、混频、功率放大器组成。
它功能主要是对信号进行变换,对原始的电信号进行变换成适合在无线信道中传输的信号将信号放大后,再通过天线送往无线信道。
收信机从混有噪声的信号中恢复出原信号。
音频在空气信道中传输在其输入输出过程中难免会产生噪音的干扰。
随着工业发展,大气和工业无线电噪声干扰日益严重,工业电器辐射的无线电噪声干扰平均强度非常高,加上大气无线电噪声和电台间的干扰,在之前,几瓦发射功率就能实现的远距离短波无线电通信,而如今,几十倍于这样的功率也不一定能够保证可靠的通信。
大气和工业无线电噪声主要集中在无线电频谱的低端,随着频率的升高,强度逐渐降低。
这类噪声的强度很高,严重影响着空气通信的可靠性,尤其是脉冲型突发噪声,经常会使数据传输出现突发错误,十分影响通信质量。
基于此,本文特提出了一种基于空气信道的音频伪装模型。
该模型面向空气信道传播,音频伪装算法除了满足不可感知性外,还能够同时抵抗空气信道中噪声的干扰因素,具备很强的鲁棒性。
2基于空气信道的音频伪装模型2.1 信息伪装通信模型信息伪装通信系统与传统的通信系统较大的区别在于,在其发送端存在一个已知的强信号,即载体也可以视作信息伪装通信系统中的“边信息”(side information)。
心理声学名词解释
心理声学名词解释
心理声学是研究声音在人类心理和认知过程中的作用、效应和机制的学科。
在心理声学中,有许多重要的名词需要解释,下面是其中一些常见的名词解释:
1. 声音感知:指人类对声音的感知和认知过程。
它涉及到感觉器官接收声音刺激、通过感觉信息传递到大脑、大脑对声音进行处理和解释等一系列过程。
2. 听觉注意:指人类在感知声音时所选择和集中注意力的能力。
听觉注意可以通过选择性注意和分配注意来控制,它对声音的感知和理解起到重要作用。
3. 声音记忆:指人类对声音的记忆能力。
声音记忆可以进一步分为短时记忆和长时记忆两种,短时记忆用于短期的声音信息存储,而长时记忆用于长期的声音记忆存储。
4. 声音感情:指声音在情感表达上的作用和效果。
声音可以通过音调、音高、音色等特征来传递情感信息,如高音调可能表达兴奋或愤怒,低音调可能表达平静或悲伤等。
5. 声音恐惧症:指对声音产生过度恐惧或焦虑的心理疾病。
声音恐惧症可以由不同因素引起,如过去的负面经验、感知问题等,会导致对特定声音或一般声音的过度恐惧。
6. 声音干扰:指不相关声音对目标声音感知和理解的干扰。
声音干扰可以使人们难以注意到、理解或记忆目标声音,影响声
音的有效传达和处理。
7. 声音注意死角:指听觉系统对声音的感知存在的一些局限性。
例如,人类的注意力往往更容易被突然和重要的声音吸引,而忽略或忽视一些低频或不重要的声音。
这些是心理声学中一些重要的名词解释,它们帮助我们更好地理解声音在人类心理和认知过程中的作用和效应。
心理声学在语音识别技术中的应用探索
心理声学在语音识别技术中的应用探索语音识别技术是一种将语音信号转化为文字的技术,近年来得到了广泛的应用。
然而,在实际应用中,语音识别技术还存在一些问题,例如在嘈杂的环境下,识别率较低;对于不同人的语音特征,识别准确度也有所不同。
为了解决这些问题,心理声学作为一门研究人类声音感知和语言处理的学科,开始在语音识别技术中得到应用。
心理声学研究了人类对声音的感知和认知过程,包括声音的音高、音量、音色等特征。
在语音识别技术中,心理声学可以帮助识别系统更好地理解和处理语音信号。
例如,通过分析人类对不同音高的感知差异,可以对语音信号进行音高调整,使得在嘈杂环境中的语音识别更加准确。
此外,心理声学还可以研究人类对不同音色的感知偏好,从而优化语音合成技术,使得合成的语音更加自然流畅。
除了对声音特征的研究,心理声学还可以研究人类对语音的认知过程。
在语音识别技术中,人类的语言模型是非常重要的一部分。
通过研究人类对语言的理解和记忆过程,可以优化语音识别系统的语言模型,提高识别准确率。
例如,通过研究人类对不同语法结构的理解能力,可以设计更加准确的语音识别模型,使得系统能够更好地理解和解析复杂的语音输入。
心理声学在语音识别技术中的应用还可以帮助解决说话人识别的问题。
在实际应用中,不同人的语音特征存在较大的差异,这对于语音识别系统来说是一个挑战。
通过研究人类对不同说话人的声音特征的感知差异,可以设计更加准确的说话人识别算法,提高系统的准确率。
此外,心理声学还可以研究人类对不同情感的声音特征的感知,从而实现情感识别的功能,为语音识别技术的应用场景进一步拓展。
尽管心理声学在语音识别技术中的应用已经取得了一些成果,但仍然存在一些挑战和问题。
首先,心理声学研究的结果往往是针对个体或者小样本的,如何将这些研究结果应用到大规模的语音识别系统中,仍然需要进一步的研究和探索。
其次,心理声学研究往往是基于实验室环境下的数据,如何将这些研究结果应用到实际的应用场景中,也是一个需要解决的问题。
心理声学模型在音频质量评估中的应用
心理声学模型在音频质量评估中的应用音频质量评估是指对音频信号的感知质量进行评估和分析的过程。
在过去,人们主要依靠主观评价来判断音频质量,但这种方法存在主观性强、耗时长等问题。
随着科技的发展,心理声学模型逐渐应用于音频质量评估中,为我们提供了一种更为客观、高效的评估手段。
心理声学模型是一种模拟人类听觉系统的数学模型,通过模拟人耳的听觉特性和心理感知过程,来预测人们对音频质量的感知。
它可以将音频信号转化为与人耳听觉特性相关的特征参数,进而通过这些参数来评估音频质量。
心理声学模型的应用使得音频质量评估更加客观、准确。
心理声学模型主要包括两个方面的内容:听觉特性建模和心理感知建模。
听觉特性建模主要研究人耳对音频信号的感知特性,包括音频信号频谱、响度、韵律等方面。
心理感知建模则研究人们对音频信号的主观感知,包括音频质量、清晰度、舒适度等方面。
通过对这两个方面的建模,心理声学模型可以较为准确地预测人们对音频质量的感知。
在音频质量评估中,心理声学模型可以应用于多个方面。
首先,它可以用于音频编码算法的优化。
音频编码算法是将音频信号压缩以减小文件大小的过程,但压缩会导致音频质量的损失。
通过心理声学模型,我们可以评估不同编码算法对音频质量的影响,从而选择最优的编码算法。
其次,心理声学模型可以用于音频设备的优化。
不同的音频设备对音频信号的处理方式不同,如均衡器、压缩器等。
通过心理声学模型,我们可以评估不同设备对音频质量的影响,从而选择最适合的设备。
此外,心理声学模型还可以用于音频场景的优化。
音频场景是指音频信号在特定环境中的传播和感知过程。
不同的场景会对音频质量产生不同的影响,如噪声、混响等。
通过心理声学模型,我们可以评估不同场景对音频质量的影响,并采取相应的措施进行优化。
心理声学模型在音频质量评估中的应用不仅提高了评估的客观性和准确性,还大大提高了评估的效率。
传统的主观评价需要耗费大量的时间和人力,而心理声学模型可以在短时间内自动完成评估,极大地节省了成本。
心理声学研究在广告音效设计中的应用
心理声学研究在广告音效设计中的应用音效在广告中扮演着至关重要的角色,它能够引起观众的注意力、激发情感、增强记忆力,并最终促使消费者做出购买决策。
而心理声学研究则致力于探索音频对人类心理和行为的影响。
在广告音效设计中,心理声学研究的应用可以帮助广告商更好地引导消费者的情感和行为。
本文将探讨心理声学研究在广告音效设计中的应用。
首先,心理声学研究可以帮助广告商选择合适的音效来引起观众的注意力。
研究表明,高音频声音(如尖锐的声音)能够更容易地吸引人们的注意力,而低音频声音(如沉闷的声音)则能够产生一种平静和稳定的感觉。
因此,在广告中,如果想要引起观众的兴趣和注意力,可以选择一些高音频的声音效果,如尖锐的铃声或者刺耳的声音。
而如果想要营造一种安静和放松的氛围,可以选择一些低音频的声音效果,如柔和的音乐或者轻柔的风声。
其次,心理声学研究可以帮助广告商利用音效来激发观众的情感。
音效可以通过声音的音调、音量和节奏等方面来传达情感。
例如,快速的节奏和高音量的声音通常会让人感到兴奋和紧张,而慢速的节奏和低音量的声音则会让人感到平静和放松。
因此,在广告中,如果想要激发观众的情感,可以选择一些快节奏和高音量的声音效果,如激烈的鼓点或者激动人心的音乐。
而如果想要传达一种平静和温馨的情感,可以选择一些慢节奏和低音量的声音效果,如柔和的钢琴曲或者轻柔的雨声。
此外,心理声学研究还可以帮助广告商利用音效来增强观众对广告的记忆力。
研究表明,音效可以帮助人们更好地记忆和理解信息。
例如,通过在广告中使用一些独特和易于识别的声音效果,如动物的叫声或者汽车的喇叭声,可以帮助观众更容易地记住广告内容。
此外,通过在广告中使用一些与产品相关的声音效果,如食物的咀嚼声或者汽车的引擎声,可以帮助观众更好地联想到产品,并增强对广告的记忆。
最后,心理声学研究还可以帮助广告商利用音效来影响观众的行为。
研究表明,音效可以通过创造一种特定的环境氛围来影响人们的行为。
心理声学研究中的声音认知与信息加工模型
心理声学研究中的声音认知与信息加工模型声音是我们日常生活中不可或缺的一部分,它承载着丰富的信息,影响着我们的情绪和行为。
在心理学领域中,声音认知与信息加工模型成为了研究的热点。
本文将探讨声音认知的基本过程以及不同声音对人们的心理状态和行为的影响。
声音认知是指个体对声音进行感知、辨别和理解的过程。
它包括了声音的感知、辨别和解码等环节。
在感知环节中,个体通过听觉系统接收声音刺激,并将其转化为神经信号。
在辨别环节中,个体将不同的声音进行分类和区分,例如区分人声和环境声。
在解码环节中,个体对声音进行理解和意义的提取。
声音认知的基本过程受到多个因素的影响,其中包括声音的特征、个体的认知能力以及环境的背景音等。
声音的特征包括音高、音强、音色和音调等。
个体的认知能力则涉及到注意力、记忆和语言能力等。
环境的背景音也会对声音认知产生干扰和影响。
研究表明,不同声音对人们的心理状态和行为产生不同的影响。
例如,悦耳的音乐可以提高人们的情绪和幸福感,而刺耳的噪音则会引起人们的厌恶和烦躁。
此外,声音还可以影响人们的注意力和记忆。
一些研究发现,具有情感色彩的声音更容易引起人们的注意,而声音的重复性则有助于记忆的形成。
声音认知的研究还涉及到声音的情感表达和社会意义的理解。
声音可以通过声调、语速和音量等来传递情感信息,例如高兴、悲伤和愤怒等。
此外,声音还可以传递出社会意义,例如不同的口音可以指示出说话者的地域和社会身份。
在信息加工模型中,声音认知被视为一个复杂的过程,涉及到多个认知环节的协同作用。
这些环节包括感知、辨别、解码和意义提取等。
在感知环节中,个体通过听觉系统接收声音刺激,并将其转化为神经信号。
在辨别环节中,个体将不同的声音进行分类和区分。
在解码环节中,个体对声音进行理解和意义的提取。
在意义提取环节中,个体将声音与其它信息进行关联,形成完整的认知。
声音认知与信息加工模型的研究对于理解声音对人们心理状态和行为的影响具有重要意义。
心理声学对人类认知的启示与研究方法
心理声学对人类认知的启示与研究方法音乐、声音和语言是人类社交和文化交流的重要组成部分。
心理声学作为一门研究声音和听觉感知的学科,对人类认知的启示和研究方法具有重要意义。
本文将探讨心理声学对人类认知的启示,并介绍一些常用的研究方法。
一、声音对情绪和情感的影响声音是情绪和情感表达的重要媒介之一。
心理声学研究发现,声音的音调、音量和语调等因素对人的情绪和情感状态有着显著影响。
例如,高音调的声音往往让人感到愉悦和兴奋,而低音调的声音则更容易引发人的沮丧和悲伤情绪。
此外,语音的语调和语速也能传递出人的情感状态,如快速而激动的语速往往代表着紧张和兴奋,而缓慢而低沉的语速则暗示着悲伤和沮丧。
这些研究结果揭示了声音在情绪和情感表达中的重要作用,也为人们更好地理解和识别他人的情感提供了依据。
二、声音对记忆和学习的影响声音还对人类的记忆和学习过程产生着重要影响。
心理声学研究发现,与无声信息相比,带有声音的信息更容易引起人们的注意力,并且更容易在记忆中保持。
这是因为声音能够激活人脑中的多个感知通道,增强信息的加工和存储。
例如,学习时播放背景音乐或者使用有声教材,能够提高学习者的注意力和记忆效果。
此外,声音还可以通过联想作用帮助人们加强记忆。
例如,通过将要记忆的内容与特定的声音或音乐联系起来,能够提高记忆的效果。
这些研究结果为人们提高学习和记忆效果提供了一些有效的策略和方法。
三、心理声学的研究方法心理声学研究主要采用实验和调查的方法。
实验方法通常通过控制和操纵声音的特征,观察人们对声音的感知和反应,从而研究声音对人类认知的影响。
例如,研究者可以通过改变声音的音调、音量和语调等因素,观察人们对不同声音的情感和情绪反应。
调查方法则通过问卷调查和访谈等方式,了解人们对声音的主观感受和认知。
例如,研究者可以设计问卷,让被试者评价不同声音对他们情绪和情感的影响。
这些研究方法结合了定量和定性的研究手段,能够全面地揭示声音对人类认知的影响。
第八章 心理声学基础
返回
§8-2听觉与视觉
当我们看到红、 黄等色彩(暖色) 当我们看到红、橙、黄等色彩(暖色) 常会引起温暖的感觉, 而看到蓝、 时 , 常会引起温暖的感觉 , 而看到蓝 、 灰等色彩( 冷色) 紫 、 灰等色彩 ( 冷色 ) 时则引起寒冷的 感觉。 象这样, 感觉 。 象这样 , 由一种感觉而引起另一 种感觉的现象就是 联觉 。 作为联觉的一 个特例, 声音也会给人以视觉的感受, 个特例 , 声音也会给人以视觉的感受 , 从表4 中可以看出, 从表4.2中可以看出,有很多的听觉术语 都是从视觉术语转化而来的。 都是从视觉术语转化而来的。
心理状态
重放声(想听的声音) 重放声(想听的声音) 动画片 噪声(不想听的声音) 噪声(不想听的声音) 看了不愉快的不想看的
11主属性主属性副属性副属性频率频率基频基频音强音强声压级声压级心理感受心理感受高高大大愉快愉快小小不愉快度不愉快度空间模空间模清澈清澈式属性式属性浑浊浑浊时间模时间模平滑平滑式属性式属性粗糙粗糙明亮性明亮性明亮明亮灰暗灰暗丰满性丰满性丰满丰满干瘪干瘪从表中可以看出清澈音是一种音调高从表中可以看出清澈音是一种音调高响度小且令人愉快的声音而丰满音则响度小且令人愉快的声音而丰满音则是一种音调低响度大且令人愉快的声是一种音调低响度大且令人愉快的声音调音调与与频率频率相关相关决定于声波中的最低决定于声波中的最低频率频率基音基音
返回
明亮性
是衡量声音明亮或灰暗的属性, 是衡量声音明亮或灰暗的属性 , 清晰明 亮的声音听上去觉得明亮, 亮的声音听上去觉得明亮 , 而暗淡无光 的声音则觉得灰暗。人们对1 的声音则觉得灰暗。人们对1~3kHz的声 音在耳感上觉得明亮, 音量较大 , 音在耳感上觉得明亮 , 音量较大, 明亮 程度增强。 程度增强。
心理声学研究的最新进展与应用
心理声学研究的最新进展与应用近年来,心理声学研究在心理学领域中取得了重要的突破和进展。
心理声学是研究声音对人类心理过程的影响的学科,它通过对声音的分析和实验研究,揭示了声音对人类认知、情绪和行为的影响机制。
本文将从不同的角度探讨心理声学研究的最新进展与应用。
第一部分,我们将探讨声音对情绪的影响。
研究表明,不同的声音对人的情绪产生不同的影响。
例如,高音调的声音往往能够引起人的紧张和兴奋,而低音调的声音则会让人感到平静和放松。
此外,音乐也是一种能够调节情绪的声音形式。
研究发现,悲伤的音乐能够引起人的悲伤情绪,而欢快的音乐则能够使人感到愉悦和快乐。
这些研究结果为情绪调节和心理治疗提供了新的思路和方法。
第二部分,我们将讨论声音对认知的影响。
声音对人的认知过程有着重要的影响。
研究表明,声音的音调、音量和节奏等特征都会对人的注意力和记忆产生影响。
例如,高音调的声音能够引起人的注意力,而低音调的声音则会使人的注意力集中。
此外,声音的节奏和音量也会影响人的记忆。
有研究发现,快节奏的声音能够促进人的记忆,而大音量的声音则会使人的记忆更加深刻。
这些研究结果为教育和学习提供了新的启示和方法。
第三部分,我们将探讨声音在广告和市场营销中的应用。
声音在广告和市场营销中起着重要的作用。
研究发现,声音广告比文字广告更容易吸引人的注意力和记忆。
例如,一些广告中使用的音乐和声音效果能够让人产生积极的情绪和联想,从而增加对产品的好感度和购买意愿。
此外,声音还可以用于品牌塑造和产品定位。
通过选择特定的声音和音乐,企业可以为自己的品牌和产品赋予独特的形象和个性。
第四部分,我们将讨论声音在医学和健康领域的应用。
声音在医学和健康领域中有着广泛的应用。
研究表明,一些特定的声音可以帮助人们放松身心,缓解压力和焦虑。
例如,自然环境中的声音,如鸟鸣和海浪声,能够刺激人的感官,促进身心健康。
此外,声音还可以用于治疗一些心理和神经疾病。
音乐疗法和声音疗法已经被广泛应用于抑郁症、焦虑症和自闭症等疾病的治疗中,并取得了显著的效果。
心理声学
Fundamentals of Psychoacoustics- How people respond to sound ?基本心理声学 – 人类对声音的反应 ?杨少波博士长安福特马自达汽车有限公司2012年五月18号 汽车NVH技术讲座BackgroundA fundamental matter with regard to psychoacoustics investigation is to state quantitative relations between physically defined sound stimuli and the hearing sensations they cause For example, an increase from 60 dB to 80 dB of a sound level of a 1 KHz tone modulated with a 70 Hz represents a 4 times for the perceived loudness, at the same time, the hearing sensation roughness changes by a factor of approximately 1.5 times. A change of a magnitude within the physical metric leads to a change of the belonging hearing sensations which in their psychoacoustic metric show a completely different dimension. Therefore, it is reasonable for psychoacoustic examinations to strictly differentiate between physically described magnitude (level, frequency, duration, ..) and the belonging hearing sensations (loudness, pitch, subjective durations,..)Physiology of the hearing systemMiddle earOuter earInner earPhysiology of the hearing systemPhysiology of the hearing system•Outer ear – Pinna + outer ear canal + ear drum ( Tympanic membrane) •Middle ear – Auditory ossicles (malleus + incus + staps). Three tiny bones translate ear drum oscillations to the inner ear. The process of this transformation consists of adaptation of the air oscillations in the outer ear to the liquid oscillations in the inner ear. •Inner ear – a snail shaped structure (cochlea) consists of two canals which are separated by a membrane (basilar membrane. Sensory cells, called haircells are arranged on this membrane. These cells, achieved transformation for the liquid oscillation into nerve potential which results in a phenomena called “sound”Physiology of the hearing system•Of particular importance is the “frequencyto-space” walk in the inner ear. High frequency sound is sensed near the entrance of the cochlea and low frequency sound is sensed at The tip of the cochlea. •Sensory cells inside semicircular canals transform the stimulus into electric nerve impulses which are transmitted via numerous switching stations. They are two types of sensory cells (so called outer and inner haircells. Inner haircells are mainly responsible for the reception of sound, and on the other hand, the outer haircells, quite surprisingly, itself produces very low tone (sound level close to 0 dB). This is called “Otoacoustic emissions”. It shows that the hearing system is not merely a receiver of sounds but, under certain conditions, can also be regarded as a transmitter of sounds.Fundamentals of PsychoacousticsCritical Band Human ear respond to sound in group of frequencies, that is the spectral and temporal resolution of human hearing system. For the whole human hearing frequency range of 20 – 20,000 Hz, there are 24 Critical Bands. The unit of the critical bands are Bark in honor of the German scientist Von Barkhausen. Calculation of the critical band and band width can be based on the following equations:26.81 f Critical band Z = + f − 0.53, Bark 1960 ( Z + 0.53) f = 1960 , Hz (26.28 − Z )Fundamentals of PsychoacousticsCritical BandCritical Band Z 1 2 3 4 5 6 7 8 9 10 11 12 Frequency f 118.6 204.2 297.2 398.5 509.3 631.1 765.5 914.6 1080.9 1267.7 1479.0 1719.8 Band width Hz 102.1 89.3 97.1 106.1 116.3 128.1 141.7 157.7 176.6 199.0 226.0 259.0 Critical Band Z 13 14 15 16 17 18 19 20 21 22 23 24 Frequency f 1996.9 2319.1 2698.5 3151.6 3702.5 4386.3 5258.1 6407.5 7992.2 10317.5 14060.6 21087.2 Band width Hz 299.7 350.8 416.3 502.0 617.3 777.8 1010.6 1367.1 1955.0 3034.2 5384.9 3513.3Fundamentals of PsychoacousticsLoudness N is the psychological metrics that correlates to physical sound intensity. Loudness, a subjective measure, is often confused and attempted with objective measures of sound intensity such as dB. Filters such as A-weighting attempt to adjust intensity measurements to correspond to loudness as perceived by the average human. However, true perceived loudness varies from person to person and cannot be measured this way. Loudness is also affected by parameters other than intensity, including: frequency, and duration. When hearing loss is present, the perception of loudness is altered. Sounds at low levels are no longer audible to the hearing impaired, but interestingly, sounds at high levels often are perceived as having the same loudness as they would for an unimpaired listener. The unite of loudness is Sone. 1kHz tone @ 40dB is defined as 1 Sone. For the 1kHz pure tone, unually every 10dB increase in SPL results in a doubling in loudness. .Fundamentals of PsychoacousticsA-B-C- weighting curve Parallel to Germany acousticians, English and the rest of world tried to simulate human sound perception with a set of weighting network, named A-, B-, and C- weighting. In 1964 ISO actually adopted these ideas to use A-weighting as a filter for the calculation of human perception. There were a world-wide attempts to use A-weighting to simulate human hearing perceptions. A-weighting is inverse of the equal loudness curve of 40 phon, Bweighting is that of 70 phon, and C-weighting is for the 100 phon. Recently, with the advancement of digital signal processing techniques people has become more and more acceptable to the precise calculation of the loudness driven by German acousticians.Fundamentals of PsychoacousticsLoudness level phon is a unite of loudness level LN for pure tones. By definition, 1 phon is equal to 1 dB SPL at a frequency of 1 kHz. The follow plot is a way of mapping the dB SPL of a pure tone to the perceived loudness level in phons. .N (loudness ) = 2( LN ( Phon ) − 40 ) 10Fundamentals of PsychoacousticsEqual loudness curveEqual loudness curveFundamentals of PsychoacousticsEffect of sex and age on perceived loudness Just Audible Thresholds (JAT) are different for different sexes and different age groups. They are illustrated in following figure. The data is from the US.Fundamentals of PsychoacousticsEffect of band width on perceived loudness Loudness depends on the frequency of the noise signal. Broad band noise is louder than a single tone noise, ie. 60dB white noise is much louder than a 60dB pure tone sound. But, if the band width of a broad band noise is less than its critical band width, the perceived loudness is the same as that of a pure tone noise. 100Critical bandwidth 80dB 80 60dB 60 40dB 40 20dB 20 0.02 0.05 0.1 0.2 0.5 1 2 5 Bandwidth of broadband noise 10 20 Level of 1 kHz toneFundamentals of PsychoacousticsDoubling loudness requires 10 times increase in sound intensity For sound levels above 40dB, an increase of the level by 10dB leads to an doubling of the loudness. Although a level increase of 10dB results in a 10-times increase in the sound intensity.dB required to double a 1-kHz sound12 level required for the doubling 10 8 6 4 2 0 0 20 40 60 80 100 level of a 1-kHz soundFundamentals of PsychoacousticsEffect of duration on perceived loudness When the during is shorter than 100ms, perceived loudness decreases. When the duration is 10ms, perceived loudness is 50% of the loudness at 100ms. The following plot is for a 1-kHz sound.60 Loudness level, phon 55 50 45 40 1 10 100 1000 ms60 Level 1-kHz tone, dB 55 50 45 40Fundamentals of PsychoacousticsAdd on loudness if two sound has frequencies close to each other (less than critical band), then the total perceived loudness will only be slightly higher than either sound; if they are far from each other, then two sounds will not competing for the same hearing nerve ends, the perceived total loudness will be much higher than either one.Fundamentals of PsychoacousticsContour of equal loudness indexS = 0.7Smax + 0.3∑ Si31.5Hz 63 128 250 500 1000 2000 4000 8000 75dB 79 82 85 85 87 82 75 68S=0.7*26.5+0.3*134.2=59 SonesFundamentals of PsychoacousticsPitch is the perceived fundamental frequency of a sound. A 40dB 1000 Hz sound carries a pitch of 1000 mels (Steven, el). The principle behind is the “frequency-to-space” walk in the inner ear. High frequency sound is sensed near the entrance of the cochlea and low frequency sound is sensed at the tip of the cochlea. While the actual fundamental frequency can be determined through physical measurement, it may differ from the perceived pitch because of overtones, or partial tones, in the sound. The human auditory perception system may also have different sensation of perceived fundamental frequency of a sound at different levels. For example, an increment of low frequency per tone below 2 kHz will result in decrease in perceived pitch, while an increment of pure tone greater than 2 kHz will increase perceived pitch. The following plot shows the relationship between sound level and their perceived pitch change percentages.Fundamentals of Psychoacoustics-3 -2 -1 0 1 2 3% 6 kHz 4kHx 1kHz 200 Hz 40 50 60 70 80 dBChange in pitchFundamentals of Psychoacoustics Virtual Pitch The hearing system is capable of extracting the fundamental frequency of the higher harmonics of a complex tone. This is clearly best shown by our daily telephone system. The tiny piezo speaker of a telephone can not produce any sound below 300Hz. The fundamental frequency of the vocal cord of a male speaker is about 100 Hz. The human hearing system has the capability of constructing the “virtual pitch”of a male speaker on the phone. Without this capability, we will not be able to distinguish male from female on today’s telephones.Fundamentals of PsychoacousticsSharpness –Perception of timbre of a sound. By definition, a narrow band 1kHz pure tone @ 60 dB carries a sharpness of 1 Acum.For narrow band sound with its bandwidth smaller than its critical bandwidth, the sharpness is independent of the bandwidth but strongly depend on its centre frequency. For sound with bandwidth greater than critical bandwidth, sharpness does depend on the low and in particular, the high end of the bandwidth. The sharpness of a sound can be described by the following equation:Acum dZ Z N ZdZZ g Z N ,)()()(S Sharpness 24'24'∫∫=432104 8 12 16 20 24g(Z)Amplitude modulation (AM ) is a technique used in electronic communication, most commonly for transmitting information via a carrier wave wirelessly. It works by varying the strengthof the transmitted signal in relationto the information being sent, for example, changes in the signalstrength can be used to reflect sounds being reproduced for a speaker or light intensity for a television pixel.Frequency modulation (FM ) is a form of modulation whichrepresents information as variations in the instantaneous frequency of a carrier wave.Fundamentals of PsychoacousticsFluctuation strength In the case of sounds with a temporal envelope showing a fluctuating structure, if the change of the sound structure is slow (less than 20 Hz), then a sensation of fluctuation produced in hearing system. By definition, 60dB 1-kHz tone with AM frequency of 4Hz and 100% modulation depth carries a fluctuation strength of 1 vacil. Besides modulation depth, fluctuation strength also depend on the sound level, higher the level, the higher perceived fluctuation strength becomes:Fundamentals of Psychoacousticsmodmod f 44Hz f LF Hz+∆=Roughness When a sound structure change rate become higher than 20Hz, a sensation of roughness is produced in the human sensation system. By definition, 60dB 1-kHz tone with a modulation frequency of 70Hz and a 100% modulation depth carries a roughness value of 1 asper. Similar to the fluctuation strength, the higher the sound level,the higherthe perceived roughness becomesmodf *L F ∆=Fundamentals of PsychoacousticsFundamentals of Psychoacoustics Articulation Index The Articulation Index or AI gives a measure of the intelligibility of hearing speech in a given noise environment. The basic interpretation of the AI value is the higher the value then the easier it is to hear the spoken word. The basic method of evaluating AI uses the concept of an 'idealised speech spectrum' and the third octave spectrum levels of the background noise. A way of calculating AI consists of the following steps:Idealised speed spectrum dB[k] –Noise level dB[k], in every 1/3 Oct band If < 0.0 Contribution to AI = 0.0If > 30.0 Contribution to AI = 30.0AI contribution in that band = Contribution[k] * Weighting_Factor[k] Weighting factor are biased towards 1.6 and 2.0 KHz.The contribution is found for each third octave band in the region 200Hz to 5kHz and summed to give the AI value.Fundamentals of PsychoacousticsSpeech Spectrum30354045505560657075802002503154005006308001000125016002000250031504000500063008000Frequency, HzT a r g e t s p e c t r u m , d BANSI ideal ANSI raised Veh targetANSI ideal speech, raised speech and Vehicle target spectrumFundamentals of Psychoacoustics There are two ways of calculating AI, one is standard ANSI S3.5-1969 and other one is developed for/by automotive industry and it is known as Vehicle AI. ANSI AI uses 0~1.0 as unit and vehicle AI uses 0~100% as its unit. ANSI uses raised speech spectrum in a noisy environment to reflect the fact that people will raise his/her voice in a noisy environment but vehicle AI uses a fixed spectrum as its target spectrum. As a results, ANSI and vehicle AI can give a quite different AI calculation result as shown in an example (standard AI spectrum but at different level) below:Overall level, dB ANSI AI Vehicle AI Loudness, Sone 450.54799.7 2.93550.54794.21 6.24650.54776.8912.31750.54746.6123.35850.54418.7743.27950.410 2.7579.37Fundamentals of Psychoacoustics Speech area describes a healthy young male adult speech amplitude and spectral range. Healthy young male in 18-24 age group have voice covering a frequency range of about 200 –5,000 Hz and sound pressure level between 30 –70 dB measured at 1 meter away from heir mouths.Fundamentals of Psychoacoustics Masking:We all know masking from our daily life. When we talk in a quiet environment, it is not necessary to raise our voice in order to be heard. But in a noise area or in a case of passing train, one has to raise his voice considerably in order to be heard. So the Just Noticeable Threshold voice sound level when a masker is present (called masked threshold) increases when a masker in present.Masked threshold for a pure tones masked by narrow band noise: When the test sound approach to the masker sound (narrow band), the masked threshold for the test sound increases very quickly at a slop of about 100dB/Oct and reaches a maximum of 2-6dB, depending on the center frequency of the masker sound, below the level of the masker sound. This is illustrated in the following figure.Fundamentals of Psychoacoustics Masked threshold for the test tone increases sharply as it approaches the centre frequency of the narrow band masker (1-kHz, in this case) and decrease at a slower rate as it leave the center frequency of the masker at higher frequency end. But it can be heard when it reaches 3dB below the level of the maker tone of 1-kHz.Fundamentals of Psychoacoustics Masked threshold for a pure tones masked by white noise In this case, the masked threshold for the pure tone stays flat up to 500Hz and above that it increases at a slope rate of 10dB/oct. The masked threshold for a pure tone masked by a white noise is plotted here.Fundamentals of Psychoacoustics Temporal masking In real world, most sound has a time structure and varies with time. For example, the sound of speech, time structure is very important. Loud sounds (vocals) and quiet sounds (constants) alternate in human speech.Pre-masking:if the sound is followed by a masker sound immediately, the masked threshold for the sound to be heard increases depend how close it is followed by the masker sound.Post-masking:On the other side, if the sound is immediately followed by a masker sound, the masked threshold fo the sound is also increased, again depend on how far it is behind the masker sound.Simultaneously masking:when the sound and maker sound are on at the same time, simultaneously masking occurs. And the threshold for the sound to be audible increase in a manner as described in previous spectral masking.Fundamentals of Psychoacoustics Masker soundTestersoundTester sound ∆t∆t 10ms 200ms5030100Pre-masking Simultaneousmasking Post-masking Level of test tone, dBFundamentals of PsychoacousticsJust noticeable threshold for amplitude variationFor white noise, the threshold of just noticeable amplitude variation is about 1 dB, but for pure tone signal, a non-linear behavior exists.Fundamentals of Psychoacoustics Just noticeable threshold for amplitude variationIt is also interesting to see that for a given modulation depth,4Hz is the most sensitive to human ear for the sensation of amplitude variation. 4Hz frequency is consistent with the human hearing sensation for fluctuation.Fundamentals of PsychoacousticsJust noticeable threshold for frequency variationThe threshold for just noticeable frequency variations for sinusoidal Frequency modulated tone is approximately 3.6 Hz up to 500 Hz andafter that is about 0.7% of the centre frequency of the sound.Critical duration of the hearing systemIn psychoacoustics the following critical durations are very important:200ms and 2 ms.200ms marks the field of stationary hearing. The masked threshold shows no dependencies as regards to the duration as long as the time period is not below 200ms. Example of application: latch 2nd latch and 1st latch sound needs to be designed to be within 200ms to avoid a sensation of 2 impacts. 2ms marks the ability loss for human ear to follow the time structure of a sound. At with human auditory sensitivity for roughness disappears.Fundamentals of Psychoacoustics Psychoacoustics methods1.Method of adjustment–tester controls the direction and level of astimulus until certain event happens. For an example, to determinethe just noticeable level of a tone, the tester adjusts the level of a tonein both directions until the minimum threshold level of a tone is achieved.2.Method of tracking–tester only control the direction of a stimulus until acertain event happens.3.Magnitude Estimation–test needs to assign a number to assess theseverity of an event.4.Yes-No procedure–test has to decide whether or not an event is present5.Two interval choice–signal is presented to test in intervals, tester has todecide in which interval an does certain event exsits.parison of Stimulus pairs–sound is presented to tester in pairs, thetester has to decide which pair produces the biggest difference for certain sound characteristics.Thank you ! Questions and Answers。
心理声学
音调
音调是声音听来调子高低的程度。音调主要决定于声音的波长。但是,它也不是单纯地由波长决定,与声音 强度也有关系,不过关系不大。类似响度的宋量表,也制定了音调量表。音调定量判断实验是让听者调节发生器 产生一系列纯音,使它们在音调上听来间隔相等。这样取得的平均判断构成了音调量表,其单位称为美。在此量 表上,34cm(1000Hz)纯音的音调被定为1000美(mel)。
主观属性
是一个声音听来有多响的程度。响度主要随声音的强度而变化。两者的量的关系,按古典的心理物理 学规律,响度与强度的对数成正比。为了检验这一假说的正确性,现代心理物理学进行了响度的定量判断实验, 并建立了响度量表。以不同声强级的1.4m纯音为参照声,通过响度平衡实验,可以得到一簇线。在一条线上,各 波长的纯音尽管声强级不同,但都与该曲线上的纯音感觉一样。这一声强级即定为此曲线上各纯音的响度级。
原理
原理
心理声学模型是对人听感的统计性质的数学表述模型,它解释人各种听感的生理原理。
由于人耳听觉系统复杂,人类迄今为止对它的机理和听觉特性的某些问题总是还不能从生理解剖角度完全解 释清楚。所以,对人耳听觉特性的研究仅限于在心理声学和语言声学内进行。人耳对不同强度和不同波长声音的 一定听觉范围称为声域。在人耳的声域范围内,声音听觉心理的主观感受主要有响度、音高、音色等特征和掩蔽 效应、短波定位等特性。其中响度、音度、音色可以在主观上用来描述具有振幅、波长和相位三个物理量的任何 复杂的声音,故又称为声音“三要素”;而对于多种音源场合的人的耳掩蔽效应等特性尤为重要,它是心理声学 的基础。
声学效应
声掩蔽
复合声
非线性
复合声
对于纯音,声音的音调主要决定于波长,而对于由基波和谐波组成的复合声,自H.von亥姆霍兹以来,普遍 认为复合声的音调决定于基波的波长,因为基波的强度在波谱中占优势,而且给人的感觉也的确如此。但是若复 合声的基波很弱,甚至完全被滤掉,它的好像还能被听见。这种失去基波的音被称为谐波。人们的言语声是以声 带发出的长波声为基波的。在中,它虽然被滤掉,但还是能听懂,因为说话的内容主要存在于谐波部分,而不是 基波。音调究竟决定于波长,还是决定于波谱。研究还不能作出结论,不过大多数学者倾向于前者,因为后者存 在主观意识的“脑补”成分,有唯心主义的意味。
心理声学中的声音注意力与分辨能力研究
心理声学中的声音注意力与分辨能力研究心理声学是研究声音在人类心理过程中的作用的学科,其中声音注意力和分辨能力是其重要的研究方向之一。
声音注意力是指个体在面对多个声音刺激时,选择性地关注其中一个声音的能力。
而声音分辨能力则是指个体在面对相似的声音刺激时,区分它们的能力。
声音作为一种重要的感知刺激,对人类的心理过程有着深远的影响。
在日常生活中,我们常常需要在复杂的声音环境中进行信息的筛选和处理。
例如,在嘈杂的餐厅中,我们需要将朋友的声音与周围的噪音区分开来,以便更好地进行交流。
这就需要我们的声音注意力发挥作用,有选择性地关注特定的声音。
声音注意力的研究始于20世纪50年代,最早是通过行为实验来探索个体在注意力任务中的表现。
实验中,被试需要在多个声音刺激中识别特定的声音或者进行声音定向任务。
通过这些实验,研究者发现,个体在特定条件下能够有效地将注意力集中在目标声音上,而忽略其他干扰声音。
这表明,声音注意力是一种有选择性的过程,能够帮助我们在复杂的声音环境中获取所需的信息。
随着技术的发展,研究者们开始使用脑电图(EEG)和功能磁共振成像(fMRI)等神经科学方法来研究声音注意力的神经机制。
通过这些技术,研究者们发现,声音注意力涉及多个脑区的协同工作。
前额叶皮层和颞叶皮层被认为是声音注意力的重要脑区,它们参与了注意力的选择性和维持过程。
而大脑皮层的神经元活动也会受到注意力的调节,从而影响对声音的感知和处理。
除了声音注意力,声音分辨能力也是心理声学中的重要研究内容。
声音分辨能力是指个体在面对相似的声音刺激时,区分它们的能力。
例如,在音乐中,我们需要分辨不同的乐器声音,以便欣赏音乐的美妙。
声音分辨能力的研究不仅有助于了解个体对声音的感知和认知过程,还可以为音频技术的发展提供指导。
声音分辨能力的研究主要通过行为实验和神经科学方法进行。
在行为实验中,被试需要在相似的声音刺激中识别差异或者进行声音辨别任务。
通过这些实验,研究者们发现,个体的声音分辨能力受到多个因素的影响,包括声音特征的差异、个体的经验和训练等。
心理声学(Psychoacoustic Facts and Models )第一章
心理声学:事实和模型第一章 刺激和过程在这一章中,简要回顾了声音的光谱特性和时间之间一些基本的相关性。
对扬声器和耳机将电信号转换成声音进行了阐述。
此外,还提到一些心理物理学方法和程序。
最后,对刺激和一般听觉感受之间的关系和心理声学中的原始数据的处理进行了讨论。
1.1声音的时间和频谱特性在心理声学经常使用的声音的一些时间和频谱特性如图1.1。
声音很容易通过声压随时间的变化P (t )进行描述。
和大气压力的大小相比,声源所造成的声压的时空变化是非常小的。
声压的单位是帕斯卡(Pa )。
在心理声学中,经常涉及声压值10-5帕(绝对阈值)到102帕(痛阈)。
为了解决涉及范围很大的量值的处理,通常使用声压级L ,声压和声压级有关方程20log()p L dB p = (1.1) 式中,基准声压020p Pa μ=。
除了声压和声压级,声强I 和声强级在心理声学中也很重要。
在平面行波,声压级及声强级相关方程如下:0020log()10log()p I L dB p I == (1.2) 式中,基准声级-122010 W/m I =。
特别是在处理噪声时,与直接使用声强相比,使用声强密度更方便。
例如,虽然定义不是很确切,但“1 Hz 带宽的声音强度”也可用来表达“噪声功率密度”。
对声强密度取对数即为声强密度级,通常缩短密度级l 。
对于密度级与频率无关的白噪声,L 和L 相关方程如下:[10log(/)]L l f Hz dB =+∆ (1.3)其中,f ∆表示赫兹(Hz )衡量问题的声音带宽。
图1.1 心理声学常用刺激的时间功能和相关的频谱在图1.1中,图“1-KHz tone”显示了连续正弦振荡的声压p的时间函数,和1ms时间内的最大值,对应频谱只用一个中心频率1 kHz时的谱线。
“beats”图是最容易解释的谱域,显示了两个振幅相同的纯音的组合。
相应的时间功能清楚地显示一个包络的强烈变化。
“AM tone”图,描绘了一个正弦调幅中心频率为2 kHz的音调的时间功能和频谱。
喉机能检查
喉机能检查目前的临床医学不仅满足于疾病治疗,而且把重点放在涉及到所有领域的各个气管的正常机能恢复和维持,并且为此越来越着重与确立客观、定量的检查法。
在喉科学也是不仅要治疗各种疾病,而且在日常生活中的语言沟通的重要性越来越被强调。
随着显微镜手术及随之带来的各种精密手术器具的开发和医疗技术的发展,形成了嗓音外科(phonosurgery)的概念,并且在此概念下确立了为精密诊断及治疗各种嗓音障碍及喉疾病的客观性的喉肌能检查法。
喉肌能检查有如下种类1. 气流动力学检查(aerodynamic study)2. 声带的震动检查(vibratory study)3. 音响检查(acoustic study)4. 肌神经检查(neromuscular test)5. 心理声学检查(psycyacoustic evaluation)一、气流动力学检查(aerodynamic study)声音是随呼吸作用吸入到肺的空气经支气管和发音器官后通过喉头的过程中震动声带而产生的。
这时吸入的空气是发出声音的能源,所以气流动力学检查能查出嗓音障碍发生机制的必要检查项目。
1) 最大声时 Maximum phonation time (MPT)是指在一个呼吸里最长发声的时间,由于声带疾病引起声带闭锁不全时最大声时的数值会比正常值低。
最大声时检查是目前最简便而普遍使用的确认发音能力各个角度的测量法之一。
患者要保持最舒适的坐姿或站姿,大口吸气之后以舒适的音度和音量发出“a~”,尽量发音长时间,并测量坚持发音的时间。
这种检查法不需要复杂的检查器具和特别的技术,任何人都可以简单的测试。
是查出日常语言生活中必要的发音能力障碍程度的检查,同时测量声带吸入的空气是否变换成音响信号的定量测量法。
例如,出现声带麻痹或声带上长出来的小瘤-声带结节、声带息肉等,最大发音持续时间会显著下降。
韩国人的最大发音时间平均值约为男性30秒、女性20秒。
2) 发音率(phonation quotient)是肺活量除以最大声时的价,发音时流出口的气流比率有密切的关系。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
心理声学:事实和模型第一章 刺激和过程在这一章中,简要回顾了声音的光谱特性和时间之间一些基本的相关性。
对扬声器和耳机将电信号转换成声音进行了阐述。
此外,还提到一些心理物理学方法和程序。
最后,对刺激和一般听觉感受之间的关系和心理声学中的原始数据的处理进行了讨论。
1.1声音的时间和频谱特性在心理声学经常使用的声音的一些时间和频谱特性如图1.1。
声音很容易通过声压随时间的变化P (t )进行描述。
和大气压力的大小相比,声源所造成的声压的时空变化是非常小的。
声压的单位是帕斯卡(Pa )。
在心理声学中,经常涉及声压值10-5帕(绝对阈值)到102帕(痛阈)。
为了解决涉及范围很大的量值的处理,通常使用声压级L ,声压和声压级有关方程20log()p L dB p = (1.1) 式中,基准声压020p Pa μ=。
除了声压和声压级,声强I 和声强级在心理声学中也很重要。
在平面行波,声压级及声强级相关方程如下:0020log()10log()p I L dB p I == (1.2) 式中,基准声级-122010 W/m I =。
特别是在处理噪声时,与直接使用声强相比,使用声强密度更方便。
例如,虽然定义不是很确切,但“1 Hz 带宽的声音强度”也可用来表达“噪声功率密度”。
对声强密度取对数即为声强密度级,通常缩短密度级l 。
对于密度级与频率无关的白噪声,L 和L 相关方程如下:[10log(/)]L l f Hz dB =+∆ (1.3)其中,f ∆表示赫兹(Hz )衡量问题的声音带宽。
图1.1 心理声学常用刺激的时间功能和相关的频谱在图1.1中,图“1-KHz tone”显示了连续正弦振荡的声压p的时间函数,和1ms时间内的最大值,对应频谱只用一个中心频率1 kHz时的谱线。
“beats”图是最容易解释的谱域,显示了两个振幅相同的纯音的组合。
相应的时间功能清楚地显示一个包络的强烈变化。
“AM tone”图,描绘了一个正弦调幅中心频率为2 kHz的音调的时间功能和频谱。
时间函数显示随调制频率变化的包络的正弦振荡。
相应的频谱说明,一个调幅音调需要三条线来描述。
水平的差异,ΔL,一方面在2kHz之间的中线,要么较低或其他上侧线,都涉及到调制,M的程度,由方程(1.4)L m dB20log(/2)]6ms期间的包络波动表明,对应的调制频率为167赫兹,在谱域中,上部和下部线路与中心线之间的频率差,称为载波。
“音频脉冲”图显示纯音的时间函数和频谱,即固定间隔矩形门。
音频率是2KHz,选通间隔为6 ms。
在谱域,线之间的间距对应的选通频率为167Hz。
“直流脉冲”图显示了类似的情况。
只是在这种情况下,是一个直流电压,而不是一个周期的纯音门控。
直流脉冲的持续时间是1ms,间隔为8ms。
相应的频谱显示,8毫秒的倒数分离线,即125 Hz 。
在频率对应于1/1ms,2/1ms,3/1ms等时,谱线的幅度显示不同的最小值。
最后一个例子是产生离散或谱线的“调频”。
描述了一个频率为2 kHz音调在1~3 kHz 频率范围内,调制频率为200 Hz的正弦调频。
相关频谱的振幅关于2 kHz对称,并遵循其包络的一个贝塞尔函数。
如果调制指数(即频率偏差和调制频率之间的比率)小到使大多数贝塞尔频谱线消失,那么由此得到的频谱类似于具有一条中心线和两侧线的调幅音调的频谱。
然而,相对于调幅音调,调制指数小的调频音调的侧线相位差为90°。
图1.1中的“短纯音”图是描述一系列连续产生的声音而非谱线的第一个例子。
函数描述了频率2 kHz ,宽度2ms 的单个短纯音。
相应的频谱最大值可达2 kHz ,与最小值相差500 Hz 。
因此,单个短纯音的频谱相当于音脉冲或直流脉冲的频谱。
尽管音脉冲和直流脉冲产生的是谱线,单个短纯音产生的是一个连续的频谱。
白噪声是产生连续频谱的声音的一个重要例子。
在心理声学中,出于实际考虑,白噪声的带宽通常限制在20 Hz~20 kHz 。
从图1.1中的“白噪声”图可以看出,频谱密度在0~20 kHz 整个范围不受频率影响。
应该提到的是,这适用于长期频谱的白噪声,而瞬时频谱的白噪声可能会出现一定的频率相关性。
白噪声的时间函数的振幅呈现高斯分布。
如果白噪声的带宽受到滤波器的限制,我们可以得到带通噪音。
图1.1中“带通噪声”图是中心频率为1 kHz ,带宽为200 Hz 的带通噪声的时间函数ΔF 的一个典型例子。
时间函数表明,它是没有周期性的单一现象。
对于白噪声,带通噪声的规则是,在一个特定的时刻,振幅只能按一定的概率给出;其概率函数呈现高斯分布。
包络波动的速度取决于滤波器的带宽。
第一近似理论,带通噪声的时间函数可以被视为一个1kHz 的音调经随机的幅度(和相位)调制。
通常情况下,每秒包络的极大值n 可近似等于如下公式0.64.n f =∆ (1.5)因此,“有效”的调制频率*mod f 与带通噪声带宽f ∆,可近似等于如下公式*mod 0.64.f f =∆ (1.6)在带通噪声的带宽为200 Hz 时,这意味着包络的极大值平均间距约8ms 出现一次。
在图1.1“带通噪声”图中的时间函数表明,这种近似是有效的。
“窄带噪声”图显示讨论了带通噪声的相同功能。
然而,在这种情况下,带宽只有20Hz ,包络波动非常缓慢,并且包络极大值的时间间距平均增大到约80ms 。
时间函数的变化表明,窄带噪声可以第一近似为一个1 kHz 的纯音经过随机调幅。
图的“高斯-直流脉冲”显示了一个高斯状包络的直流脉冲的时间函数和频谱。
高斯形状代表时间包络变化的速度和相关的频谱带宽之间的最佳交换,本图中的带宽和持续时间所产生的即为一个最小的高斯形状。
例如,时间1p t ms =是矩形窗函数在相同的声压下在曲面上截取同样大的面积,即高斯直流脉冲。
在这种情况下,持续时间p t 测量出的声压是最大声压值的一半以下,正好是0.456倍的最大声压。
本例中,在谱域的相应带宽接近500Hz 。
图的“高斯形短纯音”显示了一种门控音的时间函数和频谱,由于其时间包络相对陡峭的斜坡以及其相对狭窄的频谱分布成为心理声学的首选。
在图1.1中给出的例子描述的是一个单一的高斯形音脉冲的情况。
如果脉冲以1 Hz 的频率重复,并且频谱包络保持不变,那么将会生成间距为1Hz 的线谱。
图1.2 高斯噪声的声压超过一个规定声压的概率归一于其均方根如上所述,噪声信号不能给出它们的最大振幅,因为高斯噪声振幅按高斯分布变化。
这意味着,只能用概率来表示其声压超过给定值。
在图1.2,这个概率作为一个实际的声压函数,归一于其长期的均方根(RMS )值。
实际声压在RMS 值以上的概率随实际声压与RMS 的比值的减小而减小。
如果一个削波噪声信号可以容忍1%的时间,这意味着一个声压振幅以2.6倍的RMS 值的不失真传输。
对于心理声学实验,更严格的限制是必要的,因为削峰可容忍的只有0.1%的时间。
因此,因此,声压超过RMS 值的3.4倍无失真传输。
出于实用的目的,这意味着噪声信号的读数与纯音每米要降低10dB ,以避免噪声信号的严重失真。
1.2扬声器和耳机的声音介绍心理声学实验中,通常通过扬声器或耳机将电磁波转变成声波。
在这两种情况下,频率响应和由传感器产生的非线性失真是非常重要的。
图1.3显示的包含低频、中频电动式扬声器和高频压电喇叭三个扬声器的机壳的频率响应。
这个组合体在暗室中进行测量时的频率响应(1L 为一倍f 时)在35Hz~16kHz 范围内是水平的,上下波动不超过±2 dB 。
在图3中也给出了频率响应产生的二次失真2L (2f )和三次失真3L(3f ),但从零点上移了20dB 。
图 1.3 在暗室中音箱的频率响应1L 和频率响应产生的二次失真2L (2f )和三次失真3L(3f ),上移了20dB 。
图1.4 a ,b 图(a )一个扬声器在正常客厅(密集)和在暗室(分散的)中的频率响应,图(b )显示了在客厅中很大频率范围内的频率响应。
在心理声学应用中,只有0.1%或更低的失真系数被允许,对应于60dB 的水平差异。
考虑到1L 平均为85dB , 2L 和3L 趋向于零,这就意味着,规模使用时相应的失真水平分量不应超过45dB 。
在整个频率范围内的结果清楚地绘于图1.3,失真系数很难低于0.1%。
然而,在一个频率范围约150Hz ,失真系数平均约为0.3%,,这是一个比较好的扬声器代表图。
如果声音不是在暗室而是在一个“正常”的房间,如客厅,通过扬声器再现的话,将会增加其复杂性。
房间的频率特性是叠加在扬声器的频率特性上的。
图1.4就是一个例子。
在左侧图中的虚线代表在暗室中测量扬声器的频率特性,实线代表在客厅中相同的扬声器的频率特性。
图 1.4a数据显示,房间的共振明显改变与之相结合的频率响应变得清晰。
图1.4b显示大频率范围的扬声器加上房间的部分频率响应。
此图显示出非常尖锐,窄的凹陷处的频率响应。
如果纯音的频率只是在这样的凹陷处轻微变化,那么小的频率变化就转化成一个大的振幅变化,这会导致清晰可闻的响度差异。
如果声音通过耳机呈现,这些问题大多是可以被克服的。
一个优势是,耳机在心理声学中通常用于表示在感兴趣的频率范围内非常小的非线性失真(小于0.1%或-60dB)。
耳机的频率响应被用来衡量真正的耳朵,因为目前的耦合器可以产生误导的结果。
因此,耳机的频率响在暗室中通过由扬声器或耳机再现的音调的主观响度比较进行测量。
在DIN 45619 T.1中描述了此过程的具体细节。
由于衡量真正的耳朵时,耳机的频率响应通常在心理声学中显示一个带通特性,均衡器得到了的发展。
耳机和均衡器的结合提供了一个自由场的等效频率响应,频率响应曲线在± 2 dB的范围内是水平的。
为DT 48和TDH 39耳机开发的自由场均衡器的衰减特性如图1.5。
这些衰减特性也说明了各自的耳机的自由场等效频率响应(DT 48如图a,TDH 39如图b)。
此外,给出了为认识包含无源和有源元件的均衡器的电路图。
当均衡器输入1V电压时,均衡器和耳机的结合产生了声压级80dB的自由场。
如果在没有均衡器的情况下使用耳机,那么就必须牢记它们会像带通滤波器一样改变声音。
这意味着,无论是音色和响度都受到很大影响,特别是宽频带的声音。
1.3方法和程序在下面的部分,将讨论心理声学中经常使用的几种方法。
这些方法之间的主要区别是:它们是专为不同类型的心理声学任务设计的,而且它需要不同的时间到达有关的结果。
调整方法。
在此方法中,受控主体是刺激。
例如,主体是改变一个纯音直到刚好能被听到。
在另一项实验中,主体可能是改变一个声音的频率直到其尖锐度等于参考音的尖锐度,或在另一的情况下,直到其尖锐度关于参考音的尖锐度的间距一个八度音程。