气体传感器——外文翻译
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
本科生毕业设计
外文资料翻译
题目传感器技术
专业 **************
班级 ******** 姓名 ******* 指导教师 **************
所在学院 ************ 附件1.外文资料翻译译文;2.外文原文
多传感器数据融合的多分类器系统
一、引言
在许多应用识别和自动识别的模式中,从不同的传感器监测物理现象提供的免费信息中获得数据是很罕见的。对这类信息的适当组合通常就叫做数据或者信息的融合,而且可以提高分类决策的准确性和信赖度相对于那些基于单个数据源的任何单独的决策。
之前我们已经介绍过Learn++,一种以整体分类为基础的方法,作为一种有效的自动分类算法是能逐步学习的。该算法能够获得额外的数据,在分类系统设计好后就能变成有用的数据了。为了实现增量学习,Learn++生成一个整体的分类器(专家),其中每个分类器都是作为前面的数据库。为了认清数据融合和增量学习之间概念的相似性,我们讨论了数据融合的一些类似的方法:聘用一个正义专家,从提供的数据中训练每个数据,然后战略性的结合他们的输出。我们能发现这些系统的性能在决策应用中是很重要的而且向来是优于那些基于单一的数据源决策的决策在一些基准和真实的数据源世界。
这样一个系统中的应用很多,其中的数据是从相同的应用程序所产生的多种来源(或多个传感器)提供的可能包含补充信息中获得的。例如,在对管道做非破坏性评估时,缺陷信息可从涡流,磁泄漏的图像,超声波扫描,热成像获得,或者几个不同的诊断信息可从不同的医学检测获得,如血液分析心电图,脑电图或者医疗成像设备,如超声波,磁共振或正电子扫描等。直观的,如果来自多个来源的信息可以适当的结合起来,那么分类系统(检测是否有缺陷,或是否可以做出诊断决定)的性能可以得到改善。所以,增量学习和数据融合涉及学习不同的数据集。在增量学习中补充信息必须提取新的数据集,其中可能包含新的分类实例。而在数据融合中补充信息也必须提取新的数据集,其中可能包含代表数据使用不同的特点。
传统的方法一般是根据概率理论(叶贝斯定理,卡尔曼滤波),或登普斯特-谢弗(DS)和它的变化,其中主要用于军事上的应用开发,特别是目标检测和跟踪,如决策理论。以整体分类为基础的方法寻求一个新的和更通用的解决方案提供更广泛的应用。还应当指出的是,在一些应用中如上述的无损检测和医疗诊断等,从不同的来源获得的数据可能已产生不同的物理方式,并因此获得的功能可能是不一样的。虽然在这种情况下使用概率或者决策理论的方法会变得更加的复杂,但异构的功能可以很容易的被安置整体的系统,讨论如下。
一个集成系统结合了集中不同的分类和特定的输出。分类的多样性可以允许使用略有不
同的训练参数,如不同的训练数据集产生不同的决策边界。直觉来看,每个专家会产生不同的错误,而这些分类战略可以降低总的错误。集成系统由于各种应用的报道比单一的分类系统的优越性已在过去十年吸引了极大的关注。
认识到增量学习应用这种方法的潜力,我们最近开发了Learn++,并表明Learn++确实是有能力逐步学习新的数据。此外,该算法不要求对以前使用的数据的访问,并没有忘记以前所学的知识,还能够容纳从以前在早期培训看不见的类的实例。在Learn++中一般的方法,就像人脸检测在其他集成算法中的方法差不多,创建一个集成分类,每个分类学习数据集的一个子集。然后结合使用加权的多数表决的分类。在这方面的贡献,我们回顾了Learn++算法能适当修改数据融合的应用。从本质上讲,从不同的来源或使用不同的功能生成的每个数据集,Learn++生成新的集成分类,然后结合使用加权的多数表决。
二、LEARN ++
Learn++算法的伪码,应用于数据融合问题,见图1,并在下面的段落中详细描述。
对于每个数据库,FS k,k=1,…,K,由一组不同的特点,提出Learn++,算法的输入是:(一)m k训练数据实例的x i随着他们正确的标签y i的序列S k;(二)监督分类算法中相应的分类,生成个人分类(今后,假设);(三)一个整数T K为第k个数据库要生成的分类。
每一种假说h t,在第t个迭代算法中产生,接受不同的训练数据集。这是通过初始化一套重量训练数据,w t,和从w t(第一步)获得的一个分布D t。根据这个分布的训练子集TR t 是来自训练数据S k(步骤2)。分布D t决定更有可能被选择进入训练子集TRT训练数据的实例。TR t在步骤3中被分类,返回第t个假设h t。这一假说的错误,εt 计算在当前数据库S k 上,作为误判实例分配权重的总和(步骤4)。此错误是必须小于1/2 ,以确保最低限度的合理性能,可以从h t预计。如果是这种情况,假设h t接受,则错误归到获得规范化的错误(步骤5)。
关于数据融合的learn++算法
输入:对于每个功能集 FS k , k=1,2,…,K
● 训练数据 S k = [(x i , y i )], i=1,…,m k
● 监督算法中相应的分类。
● 整数T k ,指定的分类。
对于每一个k =1,2,…,K :
初始化w 1(i )=D1(i )=1/m k ,i ∀,i=1,2…,m k
对于每一个t=1,2,...,T k :
1、设定∑==k m i t t t i w w D 1)(
2、从D t 中画训练子集TR t .
3、通过训练数据TR t 获得h t
4、计算h t 的错误
∑≠=
i i t y x h i t
t i D )(:)(ε 对于S k .,If 2
1>t ε,丢弃h t 跳到步骤2. 5、对于()t t t εεβ-=1,通过加权的多数表决,获得的符合假说。
=t H 自变量最大值∑Ω∈=y y x h t t t )/1log()(:β
6、计算H t 的错误:
∑≠=)()(:i D E t y x H i t i i t ( ) 7.对于()t t t E E B -=1,更新权重:
{
i i t t y x H B else t t i w i w =+=)(,,11*
)()( 计算表决权重的调整系数 []k m i i i T k
m y x H k k ⎪⎪⎭⎫ ⎝⎛≠=∑=1)(α
输出最终假设: