异常声音检测系统文献

合集下载

噪音检测报警系统的设计与研究-毕业设计

噪音检测报警系统的设计与研究-毕业设计

噪音检测报警系统的设计与研究学生:XX 指导老师:XX内容摘要:本文以AT89S52 单片机为控制核心, 通过播音判断电路寻找广播间歇时段, 实时采集噪声环境内的噪音信号,根据A/ D 转换后的噪音电平值计算出复杂环境下噪声信号的平均功率; 根据噪声信号的功率大小自适应地控制大厅环境内的广播音量,实现了复杂噪声环境下自适应音量控制系统。

该系统的硬、软件设计简单,性能良好,价格低廉。

实验结果表明,该系统实现了预期功能,自适应效果良好,性价比较高,具有良好的推广价值。

关键词: 语音判断噪音采集自适应音量控AT89S52 单片机An adaptive volume cont rol AT89S52 MCUs ystem based on noisecollection is intAbstract :roduced. By looking forbroadcasting intermittent period using the voice judge circuit ,complicated noise signal at hall environment is sampledreal2time. Through A / D conversion and calculation ,the average power of noise signal can be measured. According tothe average power of noise signal ,an adaptive volume cont rol system at complicated noise environment is designed. Thedesign of hardware and sof tware is simple and cost performance is good. Experimental result s show that the whole system can adaptive adjust s volume according to the environment noise signal , and it s engineering value is good.Keywords:voice detection noise sampling adaptive volume cont rol AT89S52前言 (1)1 硬件设计方案 (2)1.1 系统组成与工作原理 (2)1.2 系统组成框图 (2)1.3 噪音检测电路 (3)1.4 播音判断电路 (3)1.5 A/ D 接口与CPU控制电路 (4)2 软件设计方案 (5)2.1 软件设计思路 (5)2.2 程序流程框图 (5)2.3 程序源码 (6)3 软件综合调试 (9)3.1 系统调试工具keil c51 (9)4 实验结果 (10)5 结束语 (11)参考文献 (13)噪音检测报警系统的设计与研究前言噪音能够给人带来生理上和心理上的危害主要有以下几方面:a. 损害听力 b. 噪音损害视力 c.有害于人的心血管 d. 影响人的神经系统, 使人急躁、易怒 e. 影响睡眠, 造成疲倦。

基于单片机的声音定位系统的设计

基于单片机的声音定位系统的设计

基于单片机的声音定位系统的设计【摘要】声音定位技术利用声学与电子装备,接收声波来确定声响模块具体位置的一种技术,它是一种重要的军事侦察手段,同时在其他方面也有广泛的应用。

本系统采用低功耗MSP430单片机作为控制器,控制整个声音定位系统的协调工作,在一块平板上贴一张坐标纸,在其四角外侧分别固定安装一个声音接收模块,通过驻极体话筒检测音频信号,然后声音接收模块将声音信号传送至信息处理模块,判定声响模块所在的位置的X、Y坐标,并以数字形式在液晶上显示X、Y坐标值。

【关键词】低功耗MSP430单片机;声音定位;声音接收模块;声响模块1.声音定位系统发展现状声音定位在人的日常生活中着重要意义。

例如,当你独自行走时,突然听到一个响声.你会想到这个声音什么意思,对你有无威胁,它来自何方等等。

确定声音的方向和距离需要比较来自两耳信息,然后做出对比判断和反应。

声音定位技术利用声学与电子装备接收声波来确定声响模块具体位置的一种技术,它是一种重要的军事侦察手段,产生于第一次世界大战。

开始根据火炮发出的声音测定火炮位置。

其系统有多个声测哨站与声测中心组成,两者用电缆连接。

声测哨站根据传感器接受信号,声测中心记录信号并根据同一信号到达不同传感器的时间差计算火炮位置。

声音定位在战场之外也同样具有广泛的应用前景。

它可用于电话会议系统、视频会议系统、可视电话等系统中的控制摄像头和传声器阵列波速方向对准正在说话的人;也可用于语音及说话人识别软件的前端预处理,以提供高质量的声音信号,提高语音及说话人识别软件的识别率;亦可用于强噪声环境下的声音获取、大型场所的会议记录,以提高声音拾取质量;还可用于助听装置中,更好地为耳障患者服务等。

2.本系统的功能本声音定位系统,在一块不大于1m2的平板上贴一张500mm×350mm的坐标纸,在其四角外侧分别固定安装一个声音接收模块,声音接收模块通过导线将声音信号传输到信息处理模块,声音定位系统根据声响模块通过空气传播到各声音接收模块的声音信号,判定声响模块所在的位置坐标。

家庭异常情况智能监控系统设计与实现的开题报告

家庭异常情况智能监控系统设计与实现的开题报告

家庭异常情况智能监控系统设计与实现的开题报告一、选题背景与意义家庭异常情况智能监控系统是目前智能家居领域的一个热门研究课题。

随着人们生活水平的提高,对家居环境的安全、舒适、智能化需求越来越高,家庭智能化监控系统因其实用性和可行性受到了人们的广泛关注。

此外,很多时候家庭中的异常情况会给人们带来不安全的因素,例如天气异常引起的火灾、老年人突然倒地等。

基于这些安全考虑,特别是老年人等弱势群体的身体和生命安全问题,需要一种有效地监控系统来避免这些问题的发生。

因此,本文计划设计一个家庭异常情况智能监控系统,以提高家庭的监控能力。

二、研究内容1. 智能家居及监控系统原理及分类。

2. 研究家庭异常情况检测的技术。

3. 基于机器学习理论的异常情况检测算法的设计及实现。

4. 设计一个基于android平台的系统前端,与监控系统后端进行数据通信。

5. 探索实现一种智能化的声音识别系统,能够识别并记录家庭中出现的异常声音及其来源。

6. 通过图像识别技术检测出现的异常情况及火灾情况,并发出警报提示家庭中的人员。

三、研究方法和技术路线1. 首先进行智能家居及家庭监控系统相关文献的调查,了解目前家庭智能化控制及监控技术的最新进展情况。

2. 掌握图像识别、机器学习、声音识别及通信技术的基本原理。

3. 根据研究问题的特征,确定有效的异常情况检测算法。

使用深度学习技术开发基于机器学习的异常情况检测算法。

4. 设计并实现一个智能监控系统,包括前端开发(android平台)、后端开发(基于python的编程语言)和数据通信端开发。

5. 使用图像处理技术来检测可能存在的火灾,并开发警报系统迅速通知家庭中的人员。

6. 利用深度学习和声音分析算法,实现声音识别功能。

当出现异常声音时,将自动记录并向家庭中的人员发出警报信号。

四、研究计划第一年:1. 熟悉智能家居及家庭监控系统的相关理论知识。

2. 了解机器学习相关算法及技术。

3. 设计并开发家庭异常情况智能监控系统的前端(android)和后端(基于python的编程语言)。

电力设备故障声学检测技术综述及展望

电力设备故障声学检测技术综述及展望

电力设备故障声学检测技术综述及展望摘要:电力系统的安全稳定运行关乎民生国计,电力系统设备不可避免会发生各种形式的故障,毫无预警的电力事故可能造成严重的社会影响,因此加强电力设备的状态检测具有重大意义。

为了适应电力系统不断智能化及电力系统不断提高的检测要求,无损检测技术受到越来越广泛的关注。

声学检测技术作为无损检测的典型代表,具有检测精度高、准确性强、定位方便等优势。

国内外学者已开展若干研究,研究的方向主要涉及声学检测技术中信号采集、故障诊断、故障定位以及声学检测系统的研发应用等方面。

关键词:电力设备;故障1 电力系统声学检测原理1.1 电力设备异响机理电力系统中的电力设备异响主要有两大类:1)电力设备机械振动异常引起的异响;2)电力设备异常放电引起的异响。

电力设备机械振动引起的异常声响通常是由于设备过负荷、设备组件松动或老化、设备潜在缺陷、运输及安装不当的情况下,设备受到的电磁力导致设备产生异常振动,进而通过设备的机械结构和空气传导,形成异响。

如电力变压器的铁芯松动异响、风扇异响等都属于电力设备的机械振动异响。

电力设备放电所致异响的激励源类型比较多,激励源主要包括电晕放电、局部放电、沿面放电、微粒放电等。

例如,电晕放电导致的异响通常是由于电力设备高压端表面不均匀而导致电场畸变引起。

畸变的电场将电离附近的空气而产生等离子体,在空气的电离过程中部分能量以声音的形式向外传递产生异响。

不同电力设备的不同异常作为激励源所产生的声信号各具特点,且电力设备故障类型和其激励产生的声音信号通常具有强对应关系,因此通过检测声音信号对电力设备运行状态进行监测,保证电力系统正常运行,具有较强的技术可行性。

1.2 声学检测系统架构声学检测技术与电力设备故障检测技术中的超高频检测、红外检测、光学检测等技术的本质区别在于所采集和分析的信号不同,但是基本应用架构有着共通之处。

声学检测在电力设备故障检测的应用架构主要包括待测对象层、硬件处理层、数据分析层,各层通过数据交互,为系统应用层提供故障处理解决方案及依据。

智能监控前端系统中异常声音检测的实现

智能监控前端系统中异常声音检测的实现

( MF C C )a n d d i f f e r e n c e c o e ic f i e n t . I t r e c o g n i z e s s o u n d s b y i mp r o v e d D T W a l g o r i t h m . E x p e r i me n t a l r e s u l t s o n t h e T I T MS 3 2 0 D M3 6 8
ro f n t — e n d s ys t e m ,t h i s pa p e r p r e s e n t s a s c h e me of a b n o r ma l s o u nd s d e t e c t i o n b a s e d o n mi x e d c h a r a c t e r i s t i c p a r a me t e r s a nd i mp r o v e d
ZHANG Lu— l u ,CHEN Yap — WU , J I ANG Ro n g - xi n
( I n s t i t u t e o f Di g i t a l T e c h n o l o g y a n d I n s t r u me n t , Z h e j i a n g U n i v e r s i t y , H a n g z h o u 3 1 0 0 2 7 , C h i n a ) [ A b s t r a c t ]Ai mi n g a t t h e r e q u i r e me n t s o f h i g h r e a l — t i me a n d h i g h a c c u r a c y f o r a b n o r ma l s o u n d d e t e c t i o n i n i n t e l l i g e n t s u r v e i l l a n c e

浅谈GIS设备的故障诊断与检测技术

浅谈GIS设备的故障诊断与检测技术

浅谈GIS设备的故障诊断与检测技术发表时间:2016-04-15T16:08:02.057Z 来源:《电力设备》2016年1期供稿作者:刘小军[导读] 国网湖南省电力公司怀化供电分公司 418000)与其它机器相同,将压缩空气操作机构的漏气声音,压气机、电动机等辅助机不正常旋转的声音作为预定检查的项目。

刘小军(国网湖南省电力公司怀化供电分公司 418000)摘要:GIS设备是220kv变电站应用极广的一种高压配电装置,但在长期实践过程中也不泛有运行故障的出现,为保证GIS设备运行更安全、高效,本文就GIS设备的故障诊断与检测技术进行了简单的分析。

关键词:GIS;设备;故障一、GIS 设备的巡视检查1.六氟化硫气体的压力。

维持和控制六氟化硫全封闭组合电器中气体的压力是非常重要的。

设置带有温度补偿的压力开关对于六氟化硫气体压力进行自动监视,还可以通过压力表进行辅助监视。

因此定期地监视六氟化硫气体压力,就有可能在温度补偿压力开关发出警报以前发现漏气的征兆,预防故障发生。

2.异常声音。

与其它机器相同,将压缩空气操作机构的漏气声音,压气机、电动机等辅助机不正常旋转的声音作为预定检查的项目。

一旦在金属罐内主回路中出现不正常的局部放电时,就能够听到从金属罐壁中传出来的,具有某种特征的六氟化硫气体通过的声音。

此外,由于电流通过内部导体产生的电磁力、静电力而出现的微振动,螺母松动等不正常情况,都可从金属罐中传出的声音变化反映出来。

3.发热异臭。

万一带电的内部导体接触不正常,将会在不正常部位附近的金属罐上出现发热现象。

当操作机构的控制继电器、电动机等出现发热,气味异常时,检查要点与其它设备相同。

4.生锈。

生锈表明沾水,生锈可能会导致被腐蚀、滑动不灵、接触不良的情况。

金属罐法兰的连接部分、露在外面的连接导体或操作机构部件等都是需要检查预防生锈的部件。

5.其它结构的目测检查。

检查组合电器的操作机构、连接机构的轴销、弹簧挡圈、开口销等有无损伤,有无漏气、漏油的痕迹,连杆有无变形,水是否渗入外壳,结构件有无变形,漆层有无脱落等方面,其检查要点与其它电力设备相同。

500kV变压器异常噪声与振动的原因分析

500kV变压器异常噪声与振动的原因分析

500kV变压器异常噪声与振动的原因分析摘要:通过大量的测试、分析及试验,发现了500kV电网的电压暂降、直流偏磁和变压器中性点零序谐波电流等与500kV变压器多次异常声音和振动的关系,对电压暂降引起变压器的异常声音和振动提出了相应的处理办法。

对地磁暴等干扰电网运行和引起变压器直流偏磁现象提出了监测建议。

关键词:变压器;异常噪声;电网扰动引言经济的发展,科技的进步使得电力业在原有的基础上得到了很大的发展。

无论是从供电设备上,还是从供电技术上都有了很大的进步。

但是,在某些方面仍然存在着一定的问题,在500kv变压器中,经常会出现异常的噪声与振动,这种现象严重干扰了电力行业的发展。

500kv变压器的应用与推广为电力业的发展做出了很大的贡献。

电力业在500kV变压器应用的方面,已经有了一定的经验和基础。

但是,由于500kv变压器在应用当中经常会产生一些噪音或震动,严重的影响着人们的生活,并且在一定程度上还会损坏变压器。

所以,电力业一定要加强对500kV变压器异常噪声与振动的处理,使得500kv变压器能够正常的为电力业服务。

因此,对于500kV变压器异常噪声与振动的处理应该成为电力业一个重大的研究课题之一[1]。

1变压器异常噪声与振动的原因变压器噪声是由于铁芯、绕组、油箱及冷却装置的振动产生的,即由于变压器本体的振动和冷却装置风扇的空气流动产生的。

1.1变压器本体噪音变压器本体噪音的大小,与变压器的额定容量、硅钢片的性能及额定空载时铁芯的磁通密度等因素有关。

本体噪声的主要来源有:1)硅钢片的磁致伸缩引起的铁芯振动。

2)硅钢片接缝处和叠片间,因磁通穿过叠片间而产生的电磁力,引起的铁芯振动[2]。

1.2冷却装置的噪声冷却装置的噪声,主要是潜油泵和冷却风扇运行时产生的。

国内外变压器运行时间表明,对于油浸自冷式变压器,直接安装在油箱上的自冷式散热器产生的噪声,比变压器本体噪声低得多,可以不予考虑。

对于采用强迫油循环吹风冷却方式的变压器,冷却风扇的噪声是很高的,能使变压器的合成噪声比变压器本体噪声提高4~6dB(A)。

家庭环境噪声检测系统设计与实现毕业论文

家庭环境噪声检测系统设计与实现毕业论文
2.2.1 驻极体话筒8
2.2.2音频功率放大器11
2.2.3 噪声数据采集系统13
2.3 单片机控制模块14
2.3.1 STC12C5A60S2单片机14
2.3.2 噪声信号A/D转换16
2.4 无线数据传输模块18
2.4.1 NRF24L01功能与结构18
2.4.2 NRF24L01工作模式19
为减少成本和缩小系统体积,本次设计采用基于单片机的噪声测量系统。要实现对噪声强度的测量和传输,本系统至少应包括发送端和接收端两部分,为了便于实现,应用生产实习制作的单片机板,外接噪声传感器模块便可以完成基于单片机的无线噪声检测系统。
1.3 论文结构
第1章为绪论,阐述课题研究背景和意义,讨论课题研究的主要容以及课题研究方法和设计方案。
发送端使用噪声传感器对家庭中的某个房间噪声强度进行不间断测量将噪声强度转化为一个能够代表其大小的电量值经放大器电路放大以便进行后期处理再使用ad转化器对噪声传感器所采集的模拟量转换成数字量以实现与单片机系统的兼容单片机将该数字量同时传送给液晶显示器和无线传输模块液晶显示器将代表噪声强度的数值显示出来以实现与人的交互无线传输模块将单片机送来的一组一组代表噪声强度的数据通过燕山大学里仁学院本科生毕业设计论文4无线的方式发送出去
控制家庭环境噪声的前提是研究家庭环境中噪声强度,而研究家庭环境中噪声强度最科学的手段就是对家庭环境噪声进行检测。环境检测是环境科学的一个重要分支。广义上,是在一定时期对环境因子进行重复测定, 追踪其变化;狭义上,是对环境进行定期测定,作为判断环境是否达到标准以及评价环境管理和环境控制系统效果的依据。家庭环境噪声检测是人们认识家庭环境噪声、评价家庭环境噪声,制定和执行家庭环境噪声标准,进行家庭环境决策的主要依据,是实现家庭环境管理科学化的基础,是家庭环境保护工作的重要组成部分。只有实现对噪声强度的准确测量,才能够完成对噪声强度的控制和防止噪声污染。

噪声监测仪毕业设计论文

噪声监测仪毕业设计论文

毕业设计(论文)原创性声明和使用授权说明原创性声明本人郑重承诺:所呈交的毕业设计(论文),是我个人在指导教师的指导下进行的研究工作及取得的成果。

尽我所知,除文中特别加以标注和致谢的地方外,不包含其他人或组织已经发表或公布过的研究成果,也不包含我为获得及其它教育机构的学位或学历而使用过的材料。

对本研究提供过帮助和做出过贡献的个人或集体,均已在文中作了明确的说明并表示了谢意。

作者签名:日期:指导教师签名:日期:使用授权说明本人完全了解大学关于收集、保存、使用毕业设计(论文)的规定,即:按照学校要求提交毕业设计(论文)的印刷本和电子版本;学校有权保存毕业设计(论文)的印刷本和电子版,并提供目录检索与阅览服务;学校可以采用影印、缩印、数字化或其它复制手段保存论文;在不以赢利为目的前提下,学校可以公布论文的部分或全部内容。

作者签名:日期:学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。

除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。

对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。

本人完全意识到本声明的法律后果由本人承担。

作者签名:日期:年月日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。

本人授权大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。

涉密论文按学校规定处理。

作者签名:日期:年月日导师签名:日期:年月日注意事项1.设计(论文)的内容包括:1)封面(按教务处制定的标准封面格式制作)2)原创性声明3)中文摘要(300字左右)、关键词4)外文摘要、关键词5)目次页(附件不统一编入)6)论文主体部分:引言(或绪论)、正文、结论7)参考文献8)致谢9)附录(对论文支持必要时)2.论文字数要求:理工类设计(论文)正文字数不少于1万字(不包括图纸、程序清单等),文科类论文正文字数不少于1.2万字。

肌紧张性发声障碍的诊治研究进展

肌紧张性发声障碍的诊治研究进展

.综述.肌紧张性发声障碍的诊治研究进展王莲凤1周立1梁方琪1朱睿!1DOI:10.3969/j.issn.1006—7299.202006.024网络出版时间"020/6/2217:14:31网络出版地址:https///kcms/detail/42.1391R20200622.1500.050.html【中图分类号】R767.92【文献标识码】A【文章编号】1006—7299(2020)06—0717—04肌紧张性发声障碍(muscle tension dysphonia, MTD)又称功能亢进性发声障碍、功能过强性发声障碍等12-,1983年由莫里森等首次提出匚3〜5-。

MTD是指由多种病因导致在发声过程中,喉外肌过度紧张,使喉部软骨结构紊乱,影响喉内肌组织和声带张力,从而声音异常的疾病:3,]。

该病好发于中年女性1,其病因、发病机制目前尚不十分清楚,缺乏明确诊断的客观标准2,严重影响患者语音质量和生活质量7,且临床上易与器质性嗓音疾病相混淆2%故对该病应给予早期诊断并及时干预,本文就MTD的病因及发病机制、诊断、鉴别诊断及治疗等方面研究进展进行综述,为MTD的临床诊治提供参考%1MTD的病因及发病机制MTD的喉肌组紧张而致声音异常的病理状态489。

从病因学角度分类为原发性MTD和继发性MTD〔61011-,原发性MTD是指存在发声困难症状,但不伴随器质性声带病变,其在发声过程中伴有过度、不典型或异常的喉部运动口213;原发性MTD主要发生于女性,占嗓音中心临床病例的10%〜40%口3〜5%继发性MTD是指存在潜在结构异常,如位置升高(甲状软骨)或倾斜(舌骨、环状软骨和杓状软骨等)等6,其本质是对其它影响发声功能疾病的代偿反应% MTD发病机制归纳为以下几种因素:其一,心理和/或个性因素,基于心理测量学的证据,已经发现一部分MTD患者具有内向,1316-、焦虑口8、抑郁等人格特征。

声振检测实验报告

声振检测实验报告

声振检测实验报告1. 引言声振检测是一种常见的无损检测方法,通过检测物体的声音和振动信号来评估其结构的健康状况。

声振检测被广泛应用于工程结构、机械设备以及电子产品等领域。

本实验旨在通过实际的声振检测实验,了解声振检测的原理和方法,并验证其在实际应用中的有效性。

2. 实验目的- 了解声振检测的原理和方法;- 学会使用声振检测仪器进行实验;- 验证声振检测在实际应用中的有效性。

3. 实验设备- 声振检测仪器:包括麦克风、加速度传感器等;- 计算机:用于采集和分析检测信号;- 实验样品:选取不同材料和结构的样品以进行实验。

4. 实验步骤4.1 准备工作- 将实验样品固定在实验台上,并保证其稳定性;- 连接麦克风和加速度传感器到声振检测仪器上;- 打开计算机,启动声振检测软件。

4.2 实验数据采集- 在检测软件中设置相关参数,如采样频率、采样时间等;- 选择要检测的信号类型,如声音或振动;- 开始数据采集,并记录采集的数据。

4.3 数据分析与处理- 将采集的数据导入数据分析软件中,进行初步的信号处理;- 对数据进行滤波、去噪等操作,以提取有用的信号信息;- 对处理后的数据进行频谱分析、时域分析等,得到检测结果。

4.4 结果评估与分析- 根据分析结果,评估实验样品的健康状况;- 分析可能存在的问题,提出改进意见;- 根据实验结果总结声振检测的优缺点及适用范围。

5. 实验结果与讨论在本实验中,我们选择了不同材料和结构的三个样品进行声振检测实验。

通过对采集到的数据进行分析,我们得到了以下结果:- 样品A:在频谱分析中,我们观察到了一个明显的峰值,该峰值频率低且幅度较大,说明样品A存在结构松动或损坏的情况;- 样品B:在时域分析中,我们观察到了样品B振动的周期性变化,该变化与样品的工作状态相一致,表明样品B正常工作,没有明显的结构问题;- 样品C:在声波信号分析中,我们观测到了一个明显的异常声音,该异常声音与样品的预期工作状态不一致,可能存在故障或磨损。

变电所设备异常声音的判断

变电所设备异常声音的判断
摘 要 : 绍 了 变 电所 典 型 电器 设 备 异 常声 音 的 种 类 、 介 内容 、 生 原 因 及 对 策 。 发
关 键 词 : 电所 ;电 气 声 源 ;检 测 变
中 图 分 类 号 :' 1 . ') l 2 I6 I
文 献 标 识 码 : A
文 章 编 号 : 0 —8Z ( ̄ 20 —0 1 —0 1 8 7 52 Y)8 0 3 2 0
^ U
油蕾
电脒 冲 音
: l
同期信 号i
中性 点电晕 检 测装置 脉冲 音
1 1 电气声 源 . ①静 电引起 的 振 动声 ; 电磁 引 起 的振 动声 ; ② ③
设 备 内部 局 部放 电声 。
图 l 检 测 回路
在 电脉 冲检测 中 , 测 出部 分放 电脉 冲外 , 探 除 还
检测 出电脉 冲 , 音 信 号 可 滞 后 0—4 I , 过 油 箱 声 l 通 l s
2 异常声 音 的判断
在巡 回 检 查 中 , 常 听到 从 设 备 所 发 出 习惯 的 通 声 音 不 同时 按 不 同设 备判 断其 发 生处 所 、 内容 、 声 发 的原 因及 处 置 办法 的 实例 载 于 表 1 。
( ol r aao l tQth rprdC a GopC m . th 560 C i ) Ca Pe rtnPa 。 ii Pea ol ru o p , a e140 , h a p i n ae e i n
1 变 电所设 备 的声源
变 电所 设 备 按 其 发 出声 音 状 况 可 分 为 变 压 器 、
噪 时检 . 声同 测的 方法。

记 录 仪
电抗 器等 平 时 发 出 的运 行 声音 ; 开关 、 离 开关 等 运 隔 行或操 作 时 所 发 出 的 声 音 ; 雷 器 等 正 常 时 不 发 出 避 任 何 声音 三 类 。 其次, 这些 电气设 备 所 发 出 的声 源 , 不管 是 否 是 正常 声音 , 又可 分 为 电气 声 源 和机 械 声 源两 大 类 。

变压器故障声纹检测与诊断方法

变压器故障声纹检测与诊断方法

变压器故障声纹检测与诊断方法发布时间:2022-07-13T06:05:50.702Z 来源:《福光技术》2022年15期作者:于建平[导读] 当变压器过负荷运行时,流过线圈的电流变大,导致线圈铁芯振动的力增强,变压器声音变得更加低沉响亮。

设备负荷变化剧烈,比如大负荷设备忽然启动,在高次谐波影响下会产生“咯咯”或“哇哇”的声响。

国网山西省电力公司大同供电公司山西大同 037006摘要:电力变压器的故障监测己被用来保障电力系统的正常运行,改善电源质量。

从长远来看,这还将有助于降低设备运维成本并提高设备运行的经济性。

传统的变压器检测方法包括:溶解气体分析、红外测温、局部放电在线监测、频率响应分析、振动分析等。

但对于内部放电及器件螺丝松动等故障仍存在检侧盲区。

变压器运行过程中发生故障常伴随着异响,有经验的工作人员可以凭声音判断变压器的运行状况,但传统检测方法中对于声音信号的利用比较少。

这是因为与其他在线监测方法相比,声音信号所含的信息量大,处理困难。

近两年随着语音识别技术的发展,声纹识别技术己被研宄用于轴承、内燃机、齿轮等方面的故障诊断。

声音的采集设备麦克风是非侵入性的装置,不会对变压器造成破坏,影响设备的正常运行。

基于声纹的变压器故障诊断方法已成为新的研究方向。

关键词:变压器故障;声纹检测;诊断方法1变压器可能产生的声音当变压器过负荷运行时,流过线圈的电流变大,导致线圈铁芯振动的力增强,变压器声音变得更加低沉响亮。

设备负荷变化剧烈,比如大负荷设备忽然启动,在高次谐波影响下会产生“咯咯”或“哇哇”的声响。

变压器发生短路故障时,会使电流迅速增加,导致铁芯饱和,磁通产生畸变,变压器会发出“呼啸”的声音。

变压器的铁芯接地发生断线故障时,铁芯及其金属夹件会感应出电位,电位差过大时变压器外壳会产生“噼啪”的放电声。

电网有过电压故障发生时,如发生铁磁谐振或发生单相接地故障,变压器会发出“哼哼”声或“嗡嗡”声。

变压器内夹件或螺丝松动,会使硅钢片的振动幅度变大,可能导致变压器的一些部件相互碰撞而发出异响。

一起10kV开关柜异常声音的原因分析及解决方案

一起10kV开关柜异常声音的原因分析及解决方案

冶金动力METALLURGICAL POWER2020年第6期总第244期1问题的提出某开关站运行人员点检时发现10kV 某一开路开关柜有异常声音,经分析确认异常声音为开关柜母线室产生,若异常声音不及时消除将对供电设备的安全运行带来隐患。

通过对该问题发生的原因进行总结和分类,提出了具体的解决措施和方案,减少此问题对正常运行设备的影响。

2原因分析经观察和分析异常声音为高压开关柜内发出的短促鸣笛声,调整系统无功补偿装置运行方式,在退出10kV 母线段无功补偿装置后,该开关柜异常声音消除。

经测试确认,该10kV 开关柜异常声音是由于无功补偿装置投入运行后系统内高次谐波超标,系统发生并联谐振,造成开关柜发生异常声响。

2.110kV 电容器组串联电抗器电抗率计算及原因分析现场10kV 电容器参数如下:电容器型号:BFM 11/3-100-1W单只电容:7.92-8.04μF 单只容量:100kVar 电抗器型号:CKDK 额定电流:250A 额定电感:200μH 电抗率具体计算如下:电抗率k =每相感抗÷每相容抗,即k =X L /X C ;将感抗X L ,容抗X C 代入上式,电抗率k =X L /X C =0.11%。

按照国标关于限制合闸涌流的具体规定和要求,成套整流电容器和绕组的额定涌流在输出额定电流的20倍以内,计算公式为:λ=1+(Xc /X L )式中:λ—涌流合闸量是涌流的流量倍数;X C —合闸回路中容抗;一起10kV 开关柜异常声音的原因分析及解决方案侯建强(酒钢集团能源中心动力分厂,甘肃嘉峪关735100)【摘要】针对某开关站10kV 开关柜在正常运行期间产生异常声腔音的原因进行分析,系统内由于现场无功补偿装置的选型及配置不合理等原因而引起的异常声音和系统谐振,通过对现场无功补偿装置的选型及配置的分析,对该开关站的电能质量进行检测,提出了具体的异常声音改进治理措施,解决了由于系统谐振使开关柜产生了异常声音的问题。

基于注意力机制的无监督异常声音检测方法

基于注意力机制的无监督异常声音检测方法

基于注意力机制的无监督异常声音检测方法
王超;李敬兆;张金伟
【期刊名称】《兰州工业学院学报》
【年(卷),期】2024(31)1
【摘要】针对传统的基于自编码器的无监督异常声音检测方法存在特征表达能力不足的问题,提出一种基于注意力-跳跃自编码器-生成对抗网络的无监督异常声音检测方法ASAE-GAN(Attentional Skip-connected Auto Encoder and Generative Adversarial Network)。

ASAE-GAN在跳跃自编码器和生成对抗网络的基础上,引入通道间注意力机制和时间注意力机制,增强模型的特征表达能力。

使用MIMII数据集中的pump声音数据进行实验,评价指标使用AUC分数。

结果表明:ASAE-GAN的平均AUC分数相比较于AE、UNET和Skip-GANomaly分别提升了16.27%、14.23%和6.55%,验证了其在无监督异常声音检测方面的优越性。

【总页数】5页(P1-5)
【作者】王超;李敬兆;张金伟
【作者单位】安徽理工大学人工智能学院;安徽理工大学计算机科学与工程学院【正文语种】中文
【中图分类】TP18
【相关文献】
1.一种基于注意力机制的无监督商标检索方法
2.基于频谱感知音频去噪的无监督机器异常声音检测
3.基于注意力机制的半监督日志异常检测方法
4.基于联合注意力
机制和一维卷积神经网络-双向长短期记忆网络模型的流量异常检测方法5.基于自注意力的无监督室内定位信号异常检测
因版权原因,仅展示原文概要,查看原文内容请购买。

一种基于K210的声音采集与识别系统设计

一种基于K210的声音采集与识别系统设计

一种基于K210的声音采集与识别系统设计
孙洪涛;刘春防;李望荣
【期刊名称】《计算机应用文摘》
【年(卷),期】2024(40)8
【摘要】针对传统的单片机硬件系统复杂、处理能力弱、时间延迟大等问题,文章提出了一种基于智能AI芯片K210的声音采集与识别系统设计方法。

该方法首先通过音频传感模块采集音频信号,其次通过主控模块提取MFCC特征并将其作为其声音特征,涉及预处理、快速傅里叶变换、Mel滤波器组、对数运算、离散余弦变换、动态特征提取等步骤。

MFCC在降低信噪比方面具有良好的识别性能,能较好地利用听觉模型的成果。

通过测试,文章验证了该方法的可行性及高速性,有效解决了传统方法速率低、成本高等问题。

【总页数】3页(P99-101)
【作者】孙洪涛;刘春防;李望荣
【作者单位】歌尔股份有限公司;潍坊歌尔电子有限公司
【正文语种】中文
【中图分类】TP273
【相关文献】
1.一种基于nextboard的声音采集系统设计
2.一种基于LabVIEW的声音采集与音阶识别系统
3.基于k210的无接触温度测量与身份识别系统设计
4.基于
MobileNetV2和K210的鱼类智能识别系统设计5.基于YOLOv2目标检测算法和K210芯片的智能压板状态识别系统
因版权原因,仅展示原文概要,查看原文内容请购买。

基于人工智能的广播电视安全播出监测与预警系统的构建

基于人工智能的广播电视安全播出监测与预警系统的构建

基于人工智能的广播电视安全播出监测与预警系统的构建
杜文钊
【期刊名称】《移动信息》
【年(卷),期】2024(46)4
【摘要】构建广播电视安全播出监测与预警系统,是保障广播电视行业安全稳定发展的重要任务。

然而,传统的监测与预警系统往往依赖于人力巡查和手动处理,无法
满足日益增长的监测任务需求。

因此,文中提出了一种全新的基于人工智能技术的
广播电视安全播出监测与预警系统,并综述了广播电视安全播出的背景和重要性,阐
述了目前的监测手段存在的局限性和问题。

首先,通过深度学习算法,构建了一个声
音识别系统,用于实时监测广播电视节目中的异常声音,识别出可能存在的安全隐患。

其次,针对图像恶搞等非法内容,设计了一个基于图像识别的检测系统,以实现自动识别并报警,提高安全监测的准确性和及时性。

最后,对该监测与预警系统进行了评估
和验证。

结果表明,该系统具有良好的监测准确率和报警效果,能有效提高广播电视
节目的安全性。

【总页数】3页(P170-172)
【作者】杜文钊
【作者单位】北京广播电视台
【正文语种】中文
【中图分类】TP399
【相关文献】
1.构建青海台电视播出监测预警系统的方案
2.努力构建完善安全播出运行保障体系——广播电视安全播出工作分析与思考
3.攀枝花市广播电视安全播出数字监测监管系统的构建
4.基于IP虚拟播出对广播电视安全播出工作分析与思考
5.广播电视安全播出监测系统的构建与应用研究
因版权原因,仅展示原文概要,查看原文内容请购买。

变压器运行期间声音异常处理方法探析

变压器运行期间声音异常处理方法探析

变压器运行期间声音异常处理方法探析发布时间:2021-05-27T04:56:54.449Z 来源:《中国电业》(发电)》2021年第4期作者:王新[导读] 在实际应用过程中,变压器可将某一特定数值的电流转化为多种与原本电流频率相同但数值不同的电流,从而提高整体电力资源传输效率。

国家电投江西电力工程有限公司南昌分公司江西省南昌市 330117摘要:在电力系统运行过程中,变压器为主要的组成构件。

在实际应用过程中,变压器可将某一特定数值的电流转化为多种与原本电流频率相同但数值不同的电流,从而提高整体电力资源传输效率。

关键词:变压器运行;声音异常;处理措施一、变压器运行期间声音异常的不同情况变压器运行期间,由于变压器铁芯内部存在交变的磁通在铁芯硅钢片间产生一种力的结果,会有“嗡嗡”的响声。

这种“嗡嗡”声音大小与加在变压器上的电压和电流成正比。

正常运行中,变压器铁芯声音应是均匀的。

若变压器声音变大、变尖、变得不均匀,则为发生异常情况。

当变压器处于非正常运行状态下,可能会出现不同的异常声音,如声音比平时增大很多而又声音均匀、或运行中存在“叮当或沙沙”的杂音、或有“噼啪”放电声、或有水沸的“咕噜”声、或变压器内部会有尖细的“嗡嗡”的声音等情况。

运行巡视时应及时根据声音判断可能出现的异常情况,判断是否影响变压器安全运行,必要时应停役检修处理。

二、变压器运行期间产生声音异常的原因分析2.1变压器声音比平时增大,而又均匀的情况变压器可能存在以下2种情况。

电网发生过电压。

当电网发生单相接地或产生电磁谐振过电压时,都会使变压器的声音增大。

变压器过负荷。

变压器负荷较大或满负荷、过负荷运行,铁芯硅钢片振动增加,会发出较粗的声响。

以上两种情况,可以结合变电站电压表计的指示进行综合判断。

2.2变压器运行中有“噼啪”放电声的情况变压器工作过程中产生相应的放电声时,极有可能导致变压器出现内外故障。

当变压器内部产生“噼啪”或者“吱吱”的声响时,则可能为内部接触不好或者放电问题。

基于机器学习与卷积神经网络的放电声音识别研究

基于机器学习与卷积神经网络的放电声音识别研究

基于机器学习与卷积神经网络的放电声音识别研究
孙汉文;李喆;盛戈皞;江秀臣
【期刊名称】《高压电器》
【年(卷),期】2020(56)9
【摘要】为了实现对电气设备放电声音的精准检测,文中筛选比较了多种经典的机器学习算法和新兴的卷积神经网络算法,以期得到识别效果最优的选择。

首先对音频进行预处理,再通过将放电声与环境噪声和变电站正常工况背景声混合来模拟变电站真实工作环境,并使用梅尔频率倒谱系数提取特征,最后采用支持向量机等机器学习算法与卷积神经网络算法进行识别,选取识别效果最佳的算法并考察不同采样频率、采样时长等因素对识别效果的影响。

实验结果表明,使用梅尔频率倒谱系数提取特征可以良好区分放电与环境噪声,支持向量机在一系列算法中识别放电声音能力最强,采样频率、标准化方式等因素对识别效果影响较小。

【总页数】7页(P107-113)
【关键词】放电;声音;故障诊断;机器学习;卷积神经网络
【作者】孙汉文;李喆;盛戈皞;江秀臣
【作者单位】上海交通大学电气工程系
【正文语种】中文
【中图分类】TP3
【相关文献】
1.卷积神经网络在异常声音识别中的研究
2.基于改进卷积神经网络与动态衰减学习率的\r环境声音识别算法
3.基于卷积神经网络的反无人机系统声音识别方法
4.基于放电声音识别的高压电器绝缘监测研究
5.基于深度卷积神经网络的GIS缺陷局部放电识别
因版权原因,仅展示原文概要,查看原文内容请购买。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

EVENTS DETECTION FOR AN AUDIO-BASED SURVEILLANCE SYSTEMC.Clavel1,2,T.Ehrette1,G.Richard21Thales Research and Technology France,Domaine de Corbeville,91404Orsay Cedex,France 2GET-ENST,46rue Barrault,75634Paris Cedex13,FranceABSTRACTThe present research deals with audio events detection in noisy environments for a multimedia surveillance applica-tion.In surveillance or homeland security most of the sys-tems aiming to automatically detect abnormal situations are only based on visual clues while,in some situations,it may be easier to detect a given event using the audio information. This is in particular the case for the class of sounds consid-ered in this paper,sounds produced by gun shots.The auto-matic shot detection system presented is based on a novelty detection approach which offers a solution to detect abnor-mality(abnormal audio events)in continuous audio record-ings of public places.We specifically focus on the robust-ness of the detection against variable and adverse conditions and the reduction of the false rejection rate which is partic-ularly important in surveillance applications.In particular, we take advantage of potential similarity between the acous-tic signatures of the different types of weapons by buildinga hierarchical classification system.1.INTRODUCTIONAudio events classification/detection is receiving a growing interest by the scientific community.It is especially the case in the context of audio retrieval and indexing applications but also in the context of multimedia event detection appli-cations where audio can be used as a complementary source of information[1],[4],[8].In surveillance or homeland se-curity(security of public places such as bank,subway,air-port,...)most of the systems are only based on visual clues to detect abnormal situations.Typical abnormal situations include natural damages such asfires,earthquakes,flood etc,physical or psychological threatening and aggression against human beings(kidnapping,hostages etc).In some of these situations audio conveys a more significant infor-mation than video.Our goal is then to use acoustic clues as complementary information to automatically detect and analyse abnormal situations.A complete multimedia automatic surveillance system would then consist of different modules providing informa-tion from different modalities that will be merged by an in-formation fusion system for situation analysis(seefigure1).In this targeted system,the audio module will use vocal and non vocal manifestations of abnormal situations and will deal with both emotional content[2]and typical events, such as cries,shots or explosions.In this paper we pro-pose an approach to develop an audio key-event detection system.Although our event detection system is currently limited to shot detection,the methodology and the approach followed for this system could be extended to other classes of characteristic sounds of abnormal situations in a given environment.Fig.1.Multimedia event detection system architectureOne of the major difficulties of an audio detection sys-tem is linked to the environmental noise that is often non-stationary and that may be loud compared to the audio event to detect.The shot detection system presented in this paper is based on a novelty detection approach[6].Indeed nov-elty detection offers a solution to detect abnormality(ab-normal audio events)when a given distance to a model of the normal situation(built from acoustic data of a given en-vironment)exceeds a predefined threshold.The focus of this paper is on two of the main problems of an automatic audio event detection system,namely the robustness of the detection against variable and adverse conditions and the re-duction of the false rejection rate which is particularly im-portant in surveillance applications.In particular,we take advantage of potential similarity between the acoustic sig-natures of the different types of weapons by building a hier-archical classification system.The paper is organized as follows.First,our shot de-tection system is described in section2.Then,the database and test protocol used to evaluate the system are given in section3.The different experiments and results obtained are presented in section4.Finally,we suggest some con-0-7803-9332-5/05/$20.00 ©2005 IEEEclusions and future work in section5.2.THE SHOT DETECTION SYSTEMFig.2.Gaussian mixture models detection system.The goal of our shot detection system is to segment the input audio stream into successive segments and to la-bel these segments according to the two main classes(the shot class and the normal class that represents the environ-ment acoustic characteristics).The architecture of our audio event detection system includes a feature extraction module, a training module that is used to build the model of the two classes(using Gaussian Mixture Models or GMM)and a classification module that,based on the previous models,la-bels the successive audio segments.As depicted onfigure2, the input audio stream isfirst segmented in short frames(20 ms)but a label is only given for segments of0.5second (with50%overlap).2.1.Audio features extractionFeature extraction is made on20ms analysis frames with a50%puted features are chosen among the most popular in audio processing algorithms and the more likely tofit with our classification problem.-Short time energy describes a signal energy at a given time and is alternatively referred to as loudness or volume.-Thefirst eight Mel-Frequency Cepstral Coefficients.-Thefirst two spectral statistical moments,namely the spec-tral centroid which is the mean of the power spectrum for a given time and the spectral spread.-Thefirst and second derivatives of each of the above fea-tures.Feature vector dimension is then reduced by principal com-ponent analysis procedure.We keep the13first components as significant.Each analysis frame of the input audio signal is thus represented by a13-dimensional vector.2.2.The training stepFor each class a Gaussian Mixture Model(GMM)is built. The appropriate number of Gaussian for each class is es-timated thanks to the Bayesian Information Criterion[3].The parameters of the models are estimated using the tra-ditional Expectation-Maximization algorithm[7]initialized by a basic binary splitting vector quantization algorithm. 2.3.The detection stepDetection is made using the Maximum A Posteriori(MAP) decision rule:the mean a posteriori log-probability on a 0.5-second decision window is computed for each class model (by multiplying the probability obtained for each short time analysis frame).The decision window is then classified ac-cording to the class that has the maximum a posteriori score. Silence windows are not considered and are automatically removed.3.DATABASE AND PROTOCOL3.1.DatabaseCorpora of typical audio events in ecological conditions, such as surveillance applications,are not available mainly because of the confidential nature of the data but also be-cause abnormal situations are rarely recorded.To be as close as possible to real conditions for our application,we have built artificial data from a set of multiple public places and gun shots recordings extracted from a CD of sounds for the national French public radio[5].•The shot-event database:a total of134shots(296seconds)composed by pistol(P),rifle(R),subma-chine gun(S),grenade(G)and cannonfire(C)areextracted.Description of the weapon repartition inshot class data is presented in table1.weapon R Gfiles number158duration24s28sa random moment with various local Signal to Noise Ratio (SNR).The SNR is computed for the part of the surrounding sequence where the shot is inserted and data are previously normalized before mixing.Each test sequence is30seconds long and is randomly chosen among test part of market sur-rounding sequences.For each SNR(from20to5dB)134 sequences totalling about67minutes are generated for the test corresponding to the available134shots.Such mixed test sequences provide a simulation of abnormal situation in a public place as close as possible to the reality(in the case of gun shot occurrence).Despite their artificial nature these sequences allow us to control the SNR and therefore to test the system noise robustness but also to have a ground truth annotation of the testfiles(i.e.an exact localisation of all shot events in the surrounding sequences).For different SNR conditions,the labels given by our au-tomatic event detection system are compared to the ground truth annotation.The overall results are given by computing a false rejection(FR)ratio and a false detection(FD)ratio which are defined as follows:F R=number of failed detectionsnumber of windowsWe use leave one shot out cross validation method for the training of the shot class:every shot to be detected in the test database is removed from the training database during the training step for each test sequence.4.EXPERIMENTS4.1.First experiment:noisy training database versus clean training databaseThisfirst experiment aims to better understand the effects of the noise level of the shot training database.For the shot class,a database of shots mixed with surrounding sequences segments is generated from134initial shots.Shots are in-serted for SNR going from20to5dB with5dB step.Fig-ure3provides results of shot detections for each SNR level of a group of test sequences with varying SNR levels of the training databases.As expected results rapidly degrade when the SNR con-dition of the test sequences decreases,or in other words when the shot energy decreases compared to the surround-ing sequences energy.In particular clean shot(training) databases provide insufficient results in terms of false re-jection for the noisiest test sequences.However,it can also be seen that the use of too noisy shot training databases triggers off a considerable increase of false detection rate which,in the worst case,is reaching43%(5dB SNR train-ing database and5dB SNR test sequences condition).rate for various SNR training database and test sequences. Each line corresponds to the performance of the system for a given SNR of the test sequences.This experiment illustrates the necessary trade-off be-tween false rejection and false detection when choosing the appropriate SNR level between shot and surrounding se-quences for the training database.For surveillance appli-cation,it is particularly important to keep the false rejection rate as low as possible and it appears that acceptable results are obtained in all test conditions with a20dB SNR training database(false rejection less than11%and false accepta-tion less than15%).4.2.Second experiment:4-classes hierarchical classifi-cation versus two-broad classes classificationIn the previous experiments,only two classes have been considered:shot and normal.But the shot class is defined by different types of weapon reported in table1.They all have a specific acoustic signature implying that the more different the signatures are the worst the shot model should be due to acoustic confusion.In order to reduce confusion andfinally improve our detection system performance,it is reasonable to think that more specific models could be built.The basic idea would be to split the shot data into sub-classes gathering a sufficiently high number of training items that are acoustically close.Due to the limited size of our database,it is not possible to build a specific model for each weapon class,and we therefore aim merging the classes that are close with respect to a given distance.A convenient way to represent distance between every weapon subclasses is the hierarchical classification([9]).To match with our problem and bring correlated subclasses closer,we choose anti-correlation factor(1-r Pearson)as aggregation distance.Acoustic measures of each shot were represented by their mean and standard deviation on each analysis win-dows.Results of the classification are presented infigure4. Topologic distance between two subclasses is equivalent tothe anti-correlation value(1-r).We can observe that pistol (P)and rifle(R)are very closed,just as grenade(G)and can-non(C).That means that pistol and rifle acoustic values are more correlated than pistol and grenade ones for example. One single subclass seems to be more isolated:the subma-chine gun(S),eventhough it is closer to the set(P+R).The three subclasses(P+R,S and G+C)represent the best trade-off between independence(i.e.:distance to the other sub-classes)and future model quality(i.e.:sufficient number of members for training each subclass and maximum number ofsubclasses).Fig.4.Five weapon subclasses hierarchical classification tree.The X-axis represents the aggregation distance be-tween subclasses marked out on the Y-axis.Our second experiment then consists on using a4classes (3weapon classes and the normal class)classification sys-tem and on assessing the performance of this hierarchical approach compared to the previous binary classifier.For each decision window the a posteriori probability score cor-responding to the three weapon classes is computed and compared to the a posteriori probability score of normal class.Classification shot/normal is then performed using the following decision rule applied over each classification pair P+R/normal,S/normal,G+C/normal:shot classifica-tion is decided from the moment that the decision window is not classed normal by one of the three classification pairs. Other decision rules such as the majority vote of the three classification pairs could also be chosen but lead to higher false rejection rate.Figure5shows the great enhancement provided by the hierarchical approach.The false rejection rate falls from 18%to about10%when using subclasses.In the same time false detection rate relatively increases but stays sufficiently low,less than5%even for noisy test conditions.Fig.5.False detection rate and false rejection rate with a global shot class and with three shot subclasses.5.CONCLUSION AND FURTHER WORKSIn this paper,a robust audio-based shot detection system was introduced.This system represents an essential build-ing block of a complete multimedia surveillance system.It is based on a binary classifier(shot/normal classification) and several experiments were conducted in order to reduce the false rejection and false detection rates.We show that the noise level of the training database has a significant im-pact on the performance of the system which allows to se-lect the most appropriate noise level of the training database for a targeted false rejection rate.The performance of the system was also significantly improved by considering a hi-erarchical approach.Future work will be dedicated to the extension of the current system to different types of acous-tic events that occur in abnormal situations such as shouts, cries or manifestation of fear.6.REFERENCES[1]R.Cai,L.Lu,H.-J.Zhang and L.-H.Cai,”HighlightSound Effects Detection in Audio Stream”.Proceed-ings of IEEE International Conference on Multimedia Expo.,2003.[2]C.Clavel,I.Vasilescu,L.Devillers and T.Ehrette,”Fic-tion Database for Emotion detection in Abnormal situ-ation,”International Conference on Speech and Lan-guage Processing,2004.[3]C.Fraley,A.E Raftery”How many clusters?Whichclustering method?Answers via model based cluster analysis,”Technical Report329,University of Wash-ington,Department of statistics,1998.[4]O.Gillet and G.Richard,”Automatic transcription ofDrum sequences using audiovisual features,”Proced-dings of IEEE International Conference on Acoustics, Speech and Signal Processing,2005.[5]Denis Mercier,”Sound Library,”Audivis Distribution,1989.[6]M.Markou and S.Singh,”Novelty detection:a review,”Signal Process.,V ol.83,number12,2003.[7]T.K.Moon,”The Expectation-Maximization algo-rithm,”IEEE Signal Processing Magazine,1996. [8]S.Pfeiffer,S.Fischer and W.Effelsberg,”AutomaticAudio Content Analysis,”Proceddings of4th ACM in-ternational conference on Multimedia,1996.[9]Tryon,R.C.,”Cluster Analysis,”Ann Arbor,MI:Ed-wards Brother,1939.。

相关文档
最新文档