随机森林算法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
对每种状态电路的输出采样30个周期的信息,前10个 周期作为训练样本数据,后20个周期数据作为测试。 诊断过程: • 获取1150个样本(10周期,115种状态)相应的故障 信息特征向量 • 建立随机森林算法的决策树和分类决策器 • 按照故障分类决策步骤将2300个(20周期,115种状 态)在10%噪声情况下测试的样本输入到随机森林分类 器的决策树中。 • 进行投票,做出故障状态的判断,生成分类混淆表CM
投票过程
算法:
For t = 1, 2, …, T Do
从数据集S中取样(放回选样)
训练得到模wenku.baidu.comHt
对未知样本X分类时,每个模型Ht都得出一个分 类,得票最高的即为未知样本X的分类
也可通过得票的平均值用于连续值的预测
投票过程
x C1 c1(x) C2
C*
c*(x) = maxcntt ct(x)
基于随机森林算法的电力电子电 路故障诊断
目录
随机森林算法 决策树的生长
投票过程
基于随机森林算法的故障诊断
随机森林算法
简单地说,随机森林就是用随机的方式建立一个森 林,森林里面有很多的决策树组成,随机森林的每一棵 决策树之间是没有关联的。在得到森林之后,当有一个 新的输入样本进入的时候,就让森林中的每一棵决策树 分别进行一下判断,看看这个样本应该属于哪一类(对 于分类算法),然后看看哪一类被选择最多,就预测这 个样本为那一类。
基于随机森林算法的故障诊断
混淆表CM
谢 谢!
随机森林算法主要包括决策树的生长和投票过程
决策树的生长
生长步骤:
决策树的生长
3、分类树为了达到低偏差和高差异而要充分生长,使每个 节点的不纯度达到最小,不进行通常的剪枝操作。
投票过程
投票过程 随机森林采用Bagging方法生成多个决策树分类器。
基本思想:
• 给定一个弱学习算法,和一个训练集; • 单个弱学习算法准确率不高; • 将该学习算法使用多次,得出预测函数序列, 进行投票; • 最后结果准确率将得到提高.
c2(x) train
… …
CT
cT(x) train
train S1 S2
ST
投票过程
随机森林投票算法公式:
投票过程
C1
新数据 样本 组合得票 类预测
数据
C2
· · ·
Ct
基于随机森林算法的故障诊断
故障分类决策阶段的实现步骤:
• 装入随机森林学习阶段的有关数据;
• 输入未知故障样本,由各个决策树分别判别 这个未知故障数据所属的类别;
• 采用多数投票法,决定输入未知故障样本的 所有故障类型。
训练集 导出分类法 评估准确性
数据
测试集
基于随机森林算法的故障诊断
以12脉波可控整流电路为例,并假设变流器发生故障主 要是晶闸管开路。共有12个晶闸管,故障形式可分为11类、 115种状态。
基于随机森林算法的故障诊断
故障分类表
基于随机森林算法的故障诊断
投票过程
算法:
For t = 1, 2, …, T Do
从数据集S中取样(放回选样)
训练得到模wenku.baidu.comHt
对未知样本X分类时,每个模型Ht都得出一个分 类,得票最高的即为未知样本X的分类
也可通过得票的平均值用于连续值的预测
投票过程
x C1 c1(x) C2
C*
c*(x) = maxcntt ct(x)
基于随机森林算法的电力电子电 路故障诊断
目录
随机森林算法 决策树的生长
投票过程
基于随机森林算法的故障诊断
随机森林算法
简单地说,随机森林就是用随机的方式建立一个森 林,森林里面有很多的决策树组成,随机森林的每一棵 决策树之间是没有关联的。在得到森林之后,当有一个 新的输入样本进入的时候,就让森林中的每一棵决策树 分别进行一下判断,看看这个样本应该属于哪一类(对 于分类算法),然后看看哪一类被选择最多,就预测这 个样本为那一类。
基于随机森林算法的故障诊断
混淆表CM
谢 谢!
随机森林算法主要包括决策树的生长和投票过程
决策树的生长
生长步骤:
决策树的生长
3、分类树为了达到低偏差和高差异而要充分生长,使每个 节点的不纯度达到最小,不进行通常的剪枝操作。
投票过程
投票过程 随机森林采用Bagging方法生成多个决策树分类器。
基本思想:
• 给定一个弱学习算法,和一个训练集; • 单个弱学习算法准确率不高; • 将该学习算法使用多次,得出预测函数序列, 进行投票; • 最后结果准确率将得到提高.
c2(x) train
… …
CT
cT(x) train
train S1 S2
ST
投票过程
随机森林投票算法公式:
投票过程
C1
新数据 样本 组合得票 类预测
数据
C2
· · ·
Ct
基于随机森林算法的故障诊断
故障分类决策阶段的实现步骤:
• 装入随机森林学习阶段的有关数据;
• 输入未知故障样本,由各个决策树分别判别 这个未知故障数据所属的类别;
• 采用多数投票法,决定输入未知故障样本的 所有故障类型。
训练集 导出分类法 评估准确性
数据
测试集
基于随机森林算法的故障诊断
以12脉波可控整流电路为例,并假设变流器发生故障主 要是晶闸管开路。共有12个晶闸管,故障形式可分为11类、 115种状态。
基于随机森林算法的故障诊断
故障分类表
基于随机森林算法的故障诊断