基于相关性分析和遗传算法的属性选择
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
评价表现在遗传算法 中就是评价 函数 的选择问题 ,评价函数 直接影响属性子集的最终选择结果 ,基于不 同的评价函数往 往会得到不同的属性子集 。
关的冗余属性。这样 ,就可以减小 数据 的维度 ,降低假设空 间的大小 ,使算法运行速度更 快 ,效率更高…。本文 结合 相
关性分析与遗传 算法提 出了一种新颖 的属性选择策 略,这 种 方法既可以解决属性选择 中由于属性组合带来的 “ 组合爆炸” 的搜索效率 问题 ,也可 以解 决属性 之问相关性的度量 问题 。 虽然有研究者用遗传算法实现属性选择 l 但并未 发现 有与 。, 相 关性 分析相结合 的研究 。如何从属性集 中找到对给定案例 ( 似) 近 最优 的属性子集 ,是本文尝试解决的问题。
[ src]I ia mp r n s o n wld eb sdss mst slc a de aut tea r ue s la ria fco f c n ytms Ab tat ts ni ot takfr o e g —ae yt eet n vla h ti ts l saciclatr f t gss a t k e o e tb a we t aei e ’
( h o d c l n o ma i n En i e rn , h iUn v r i fT1 d to a M e i i e He e 3 0 , i ) Sc o l Me i a f r to g n e i g An u i e st o ’ ii n l d c n , f i 0 31 Ch na of I y a 2
22 遗传算法 .
第3 6卷 第 2 期 4
、0 . ,1 36
・
计
算
机
工
程
21 0 0年 1 2月
D e e be 1 cm r 20 0
NO2 .4
源自文库
Co mpu e t rEng n e i i e r ng
人 工智 能及 识 别技 术 ・
文章编号:l I 32( 1) — 17 _ 文献标识码: 0 } 48 00 4 6 0 o_ 2 2 —2 A
p ro ma c .Usn h e ei p rtro h e rhig a p o c n o rlt n lss ef r n e ig te g n tco eao fte s ac n p r a h a d c reai a ay i,wh c h r ce ie n tc Al oih GA) s te on ih c aa trz s Ge ei g rtm( ,a h
e aua in me h n s t i p p rp e e t e me h d t ee t h p i ls b e fat i t sf i e a e lb a y Ex e i n a r s l h v l t c a im, h s a e r s n s a n w t o s l c e o tma u s to tr o o t bu e or g v n c s i r r . p rme t l e u t s ow a s
Atr but sSe e to ti e lci n Ba e n Co r l to s d o r e a i nAna y i nd Ge tcAl o ih l ssa ne i g rt m
KAN J n l g LIF n -a g u - n , e gg n i
相关性分析的启发式作为评价机制 ,提出一种新颖的属性选择策略 ,用于从属性集中选择给定案例最 优的属性子集 。实验结果表 明,该方
法可以确定与分类和预测最相关的属性予集 ,同时在几乎不降低分 类准确性 的情 况下 ,极大地减小属性的表示空 间。 关健 词 :相关性分析 ; 传算法 ;属性选择 遗
wh r a a dl e r a i g t e c a sf a i n p e i i n e e s h r y d c e sn l s ii t r c s o . h c o
[ ywod |creao n ls ; e eiAloi m( ;tiue e cin Ke r s orlt naayi G n t g rh GAIa r ts l t i s c t tb se o
中 图分类 T I 号: P8
基 于相 关性 分析和 遗传 算 法的属 性 选择
阙峻岭 ,李锋 刚
( 徽 中 医 学 院 医 药 信 息 工 程 学 院 ,合 肥 2 0 3 ) 安 30 1
摘
要: 属性 的选择 和i价 足知识基系统 没计中的重要任务和影响 系统性能优 劣的关键 因素 。为此 ,利用遗传算法的遗传算子搜索机制和 平
1 概述
在 机 器 学 习和 数 据 挖 掘 研 究 领 域 ,属 性 的 选 择 和 评 价 日
评价就足依据某种评价函数 , 计算 出每个可能埔性的评价值 ,
然 后 选 择 出得 分 最 高 的若 f属 性 作 为 最 优 属 性 子 集 。属 性 的
益得到研究者的关注 。作为知识基系统设计中的重要任务 , 其核心问题是确定与给定问题最相关的属性子集 ,去除不相
ta h rp sdmeh d cnie tytenot eae u stt lsi n rdc, i e uigterpee tt n saeo h tiue h t epo oe to a d ni h ls rl d sbe o c sf a dpeit whl rd cn h e rsnai pc ftear ts t f t a y e o tb