普通方法实现属性约简python
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
不确定性计算作业三属性约简
一.算法描述
属性约简又称维规约或特征选择,从数学的角度考虑,就是有p维数据x=(x1,x2……xp),通过某种方法,得到新的数据x’=(x’1,x’2…… x’k) , k≤p, 新的数据在某种评判标准下,最大限度地保留原始数据的特征。属性约简主要是为了解决高维数据计算的复杂性和准确性问题。目标是消除冗余和不相关属性对计算过程和最终结果造成的影响。
二.数据描述
使用课本数据
三.算法参数
输入:属性矩阵
输出:约简后属性
四.实验流程
1.计算所有属性的划分,再求决策属性在该划分下上的下近似,作为依赖度计算分母。
2.计算每个属性对应划分依赖度
k=γP(Q)=|POSP(Q)|/|U|
3.约简可表示为
最小约简
4.若依赖度不为1,则从剩下的属性和当前属性一起求划分,重复步骤二,知道依赖
度达到最大依赖度时,停止迭代,当前属性则为最简属性
五.实验结果
六.讨论
主成分分析经常用于减少数据集的维数,同时保持数据集的对方差贡献最大的特征。这是通过保留低阶主成分,忽略高阶主成分做到的。主成分描述了数据的可变性,通过它可以模拟原始数据。主成分分析作为最重要的多元统计方法之一,在经济社会、企业管理、工业控制、模式识别等各领域有极其广泛的应用。