电子科技大学模式识别作业
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
转。计算各个群体的适应度,并排序取舍。 (4)200 次完成后, 计算最终子代中适应度最大的个体。 并找到样本中选择的特征。 B:PCA 算法 在前面的基础上,采用 SVM 分类器中的 lபைடு நூலகம்near 核函数进行分类,并计算出 SE, SP,ACC,AUC 的值,做出预测性能图像。
四,实验结论
汇总以上的实验数据,得到如下表 1 的实验结果 表 1 实验结果汇总 类内类间距离最大值 选择特征 所用类内类间距离判据
J ln | Sb | | Sw | 。
采用 PCA 对男女生样本数据中的身高,体重,喜欢数学,喜欢文学,喜欢运动, 喜欢模式识别共 6 个特征进行特征提取(自己设定选取的特征个数),并基于所 得到的特征采用 SVM 设计男女生分类器,并计算模型预测性能(包含 SE,SP,ACC 和 AUC )。 试对比分析两种特征选择/提取方法的特点。
J_max
J1 J2 J3
0.8073 0.8512 0.8426
111000 111000 111000
注:选择特征从左到右分别为“身高” “体重” “喜欢数学” “喜欢文学” “喜欢运动” “喜 欢模式识别”根据数字组合确定所选则的特征。如果为“101010”则表示“选择身高特征” “不选择体重特征”“选择喜欢数学特征”“不选择喜欢文学特征”“选择喜欢运动特征” “不选择喜欢模式识别特征”以此类推。 根据三种类内间距离判据,基本可以确定选择“身高”“体重”“喜欢数学”三个特征为 最佳选择。
模式识别实验报告(第三次)
姓名:关浩亮 学号: 201622240018 学院:电科院 时间 2016 年 11 月 6 日
一,实验目的
通过 MATLAB 仿真加深对遗传算法的认识以及对 PCA 决策等分类方式的理 解;在设计的过程中,加深和巩固对模式识别各种分类方法的认识和理解。使其 能更好的应用于社会各个领域。为以后的工作和学习打下坚实的基础。
二、实验内容
采用遗传算法对男女生样本数据中的身高,体重,喜欢数学,喜欢文学, 喜欢运动, 喜欢模式识别共 6 个特征进行特征选择,并基于所得到的最佳特征采 用 SVM 设计男女生分类器,并计算模型预测性能(包含 SE,SP,ACC 和 AUC )。 提示:可以用 6 位的 0/1 进行编码,适应度函数可以考虑类似
根据 PCA 算法得到的实验结果如下所示
SE SP ACC AUC 0.9563 0.7786 0.9526 0.9722
所得到的 ROC 图像如下所示:
通过以上数据可以预测本计算模型分类基本准确。有较好的分 类结果。和前次报告的对比可以看到。相比决策树和 BP 算法。采用 PCA 进行特征提取的方法得到的 AUC(线下面积)更大一些。也说明 对男女生分类这一问题上。本次作业的两种算法更合适一些。
当 J 当 J 当 J
1 2 3
Jd ( ) tr ( S Jd ( ) tr ( S Jd ( )
w -1 w
S b )时; S b )时; S 时
w
tr ( S b )
2,训练过程
训练过程分为一下几个步骤 (1)设定种群规模,随机产生第一代共计 6 个父本作为初始种群,计算各个群体 的适应度,进行排序后做出取舍。 (2)设置遗传 200 次停止,将得到的第二代进行交叉变异,交叉为后三位交叉率 为 0.90%。变异设定为每繁殖 10 次进行一次变异,突变位数为 1.突变方式为翻
三、实验步骤及结果 A:遗传算法
1,计算可分性判据
从直观上考虑,可以用两类中任意两两样本间的距离的平均来代表两类之间的 距离。也就是可以用男生的样本平均和女生样本的平均来代表男女生之间的距 离。 为了讨论不同类内类间的判据对分类结果的影响。这里进行了三个常见类内 类间判据。依次为一下三种情况下的分类。