1.特征选择问题2.特征子集的其它评价标准
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关特征(relevant feature) 有用的
周志华
什么是特征? 属性就是特征
机器学习 P247
无关特征(irellevant feature)没用的
预处理
给定的特征集合 选出 相关特征子集 特征选择过程
属于
特征选择 原因
1百度文库主要目的
二者属于 从数学模型上看 同一问题
每一个特征
都可以 看做
一个分类器
解决维数灾难 去掉不相关
一万个特征
一万个分类器的 集成问题
冗余特征
的数据
redundant feature
可以 降低难度
它包含的信息 能够从其它特征 推演出来
属于
中间结果
可能有用 也可能无用
特 征 选 择 的 知 识
为 什 么 出 现 在
集 成 学 习 里 面
?
关键问题
如何评价特征子集的好坏
多样性度量
P187
什么是?
不合度量 disagreement measure) 相关系数(correlation coefficient
周志华在P249页 说: 许多 多样性 度量
等
稍微加以调整 就可以用于
特征子集的 度量
我们的特选子集的选择结果 可以选择对我们有利的评价标准
周志华
什么是特征? 属性就是特征
机器学习 P247
无关特征(irellevant feature)没用的
预处理
给定的特征集合 选出 相关特征子集 特征选择过程
属于
特征选择 原因
1百度文库主要目的
二者属于 从数学模型上看 同一问题
每一个特征
都可以 看做
一个分类器
解决维数灾难 去掉不相关
一万个特征
一万个分类器的 集成问题
冗余特征
的数据
redundant feature
可以 降低难度
它包含的信息 能够从其它特征 推演出来
属于
中间结果
可能有用 也可能无用
特 征 选 择 的 知 识
为 什 么 出 现 在
集 成 学 习 里 面
?
关键问题
如何评价特征子集的好坏
多样性度量
P187
什么是?
不合度量 disagreement measure) 相关系数(correlation coefficient
周志华在P249页 说: 许多 多样性 度量
等
稍微加以调整 就可以用于
特征子集的 度量
我们的特选子集的选择结果 可以选择对我们有利的评价标准