数据驱动技术

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

支持向量机的特点
1、非线性映射是SVM方法的理论基础,SVM利 用内积核函数代替向高维空间的非线性映射; 2、对特征空间划分的最优超平面是SVM的目标, 最大化分类边际的思想是SVM方法的核心; 3、支持向量是SVM的训练结果,在SVM分类决 策中起决定作用的是支持向量。 4、SVM 是一种有坚实理论基础的新颖的小样本 学习方法。它基本上不涉及概率测度及大数定律 等,因此不同于现有的统计方法。从本质上看,它 避开了从归纳到演绎的传统过程,实现了高效的从 训练样本到预报样本的“转导推理” ,大大简化 了通常的分类和回归等问题。
①增、删非支持向量样本对模型没有影响; ②支持向量样本集具有一定的鲁棒性; ③有些成功的应用中,SVM 方法对核的选取不敏感。
致谢
Thank you!
支持向量机简介
一般的升维都会带来计算的复杂化,SVM方法 巧妙地解决了这个难题:应用核函数的展开定理 ,就不需要知道非线性映射的显式表达式;由于 是在高维特征空间中建立线性学习机,所以与线 性模型相比,不但几乎不增加计算的复杂性,而 且在某种程度上避免了“维数灾难”.这一切要 归功于核函数的展开和计算理论.
数据驱动方法
本篇论文的研究方向
1、在HVAC系统中使用数据驱动技术来进行故障诊 断和严重性估计; 2、针对汽车系统智能故障诊断的数据降维技术; 3、针对汽车系统中智能故障诊断的新颖的分类器 融合方法; 4、针对冲突和不稳定性分析的一种数据驱动分类 和预测框架; 5、在工程分析和社会系统将不同的诊断方法集成 到一个快速样机平台上。
支持向量机的特点
5、SVM 的最终决策函数只由少数的支持向量所 确定,计算的复杂性取决于支持向量的数目,而不 是样本空间的维数,这在某种意义上避免了“维 数灾难”。 6、少数支持向量决定了最终结果,这不但可以帮助 我们抓住关键样本、“剔除”大量冗余样本,而且 注定了该方法不但算法简单,而且具有较好的“ 鲁棒”性。这种“鲁棒”性主要体现在:
数据驱动技术在HVAC系统的应用
实时FDD策略的方框图
数据驱动技术在HVAC系统的应用
有噪声数据的FDD和严重性估计策略
数据驱动技术在HVAC系统的应用
有噪声数据的分类结果
数据驱动技术在HVAC系统的应用
有噪声数据的故障严重性估计结果
支持向量机简介
SVM方法是通过一个非线性映射p,把样本空间 映射到一个高维乃至无穷维的特征空间中( Hilbert空间),使得在原来的样本空间中非线性 可分的问题转化为在特征空间中的线性可分的问 题。简单地说,就是升维和线性化。升维,就是 把样本向高维空间做映射,一般情况下这会增加 计算的复杂性,甚至会引起“维数灾难”,因而 人们很少问津。但是作为分类、回归等问题来说 ,很可能在低维样本空间无法线性处理的样本集 ,在高维特征空间中却可以通过一个线性超平面 实现线性划分(或回归)。
支持向量机原理图
一个SVM分类器的原理图
支持向量机的最优分类面
SVM 是从线性可分情况下的最优分类面发展而 来的, 基本思想可用图2的两维情况说明。
图中, 方形点和圆形点代表两类样本, H 为分类线,H1, H2分别为过各类中离 分类线最近的样本且平行于分类线的 直线, 它们之间的距离叫做分类间隔 (margin)。 所谓最优分类线就是要求分类线不但 能将两类正确分开(训练错误率为0), 而且使分类间隔最大。 推广到高维空间,最优分类线就变为 最优分类面。
数据驱动技术在HVAC系统的应用
一个离心机组和系统模型的图表
数据驱动技术在HVAC系统的应用 诊断ቤተ መጻሕፍቲ ባይዱ程综述
1、故障检测:通过监测一个参数与其标称值的偏 差数量/速度来执行,该例中我们采用GLRT方法; 2、故障隔离: 模式分类技术:SVM; 多变量统计技术:PCA和PLS; 3、故障严重性估计:故障严重性估计是通过PLSR、 SVMR和PCR算法执行的。
复杂工程和社会系统的智能数据 驱动分类和过程预测
Kihoon Choi, Ph.D.
主讲人:徐浩
LOGO
内容提要
背景及现实意义
数据驱动技术与传统方法的比较
本篇论文的研究方向 SVM介绍 致谢
LOGO
背景及现实意义

随着科学技术、特别是信息科学技术的快速发展, 企业的规模越来越大,生产工艺、生产设备和生 产过程越来越复杂。相当数量的企业每天都在产 生并存储着大量的生产、设备和过程数据,这些 数据隐含着工艺变动和设备运行等信息。如何有 效利用大量的离、在线数据和知识,在难于建立 受控系统较准确机理模型的条件下,实现对生产 过程和设备的优化控制、预报和评价,已成为当 今迫切需要解决的问题。因此,发展数据驱动技 术作为过程监控措施成为新时期的必然要求,具 有重要的理论与现实意义。
数据驱动技术与传统方法的比较
过程监控措施 优点 缺点 需要建立精确的模 型、大量的传感器 信息、对系统进行 深入的了解
基于模型的方法
比较直观、容易理 解
基于知识库的方法
通用性强、只需建 立定性的模型
相对简易且适应性 强,不需要对系统 进行深入的了解
需要对系统进行深 入的了解,定性的 模型容易失效
需要可用的监控数 据
支持向量机简介
在一维空间中,没有任何一个线性函数能解 决下述划分问题(黑红各代表一类数据),可见 线性判别函数有一定的局限性。
支持向量机简介
如果建立一个二次判别函数g(x)=(x-a)(x-b),则可 以很好的解决上述分类问题。 决策规则仍是:如果g(x)>0,则判定x属于C1,如 果g(x)<0,则判定x属于C2 ,如果g(x)=0,则可以 将x任意分到某一类或者拒绝判定。
相关文档
最新文档