代价敏感粗糙集研究综述
决策粗糙集理论研究现状与展望_于洪
.
粗糙集的基本思想是用可定义集合来刻画不可 定义集合 , 从而给出 一 个 概 念 的 上 近 似 集 和 下 近 似 经典粗糙集 的 近 似 是 基 于 概 念 之 间 的 定 性 集定义 . 关系 ( 即包含或相交 不 空 ) 定 义 的, 并不考虑概念相 交的程度 , 因而不适用于处理很多实际问题 . 为了解 决P 缺乏容错能力的 a w l a k 粗糙 集 模 型 过 于 严 格 、 , 问题 人们提出了各种概率型粗糙集扩展模型 .
王国胤
, 1) 2)
姚一豫
3)
1) ( 重庆邮电大学计算智能重庆市重点实验室
2) ( 中国科学院重庆绿色智能技术研究院电子信息技术研究所 3) ( 里贾纳大学计算机科学系
) 0 0 0 6 5 重庆 4 ) 0 0 7 1 4 重庆 4
4 S0 A 2 加拿大 ) 里贾纳 S
, A b s t r a c t s t h e c e n t r a l c o n c e t s i n r o u h s e t t h e o r t h e c l a s s i c a l P a w l a k l o w e r a n d u e r A p g y p p a r o x i m a t i o n s a r e e f i n e d a s e d n u a l i t a t i v e e t i n c l u s i o n n d o n e m t v e r l a i n d b o q s - a n - p p p y p p g o , , , r e l a t i o n s r e s e c t i v e l .C o n s e u e n t l t h e t h e o r s u f f e r s f r o m a n i n t o l e r a n c e o f e r r o r s w h i c h p y q y y , r e s t r i c t s i t s r e a l o r l d a l i c a t i o n s . T o o v e r c o m e t h i s l i m i t a t i o n Y a o a n d c o l l e a u e s r e a t l r o o s e d -w p p g g y p p ( ) ’ d e c i s i o n t h e o r e t i c r o u h s e t s D T R S m o d e l i n e a r l 1 9 9 0 s b i n t r o d u c i n t h e B a e s i a n a - g y y g y , d e c i s i o n t h e o r i n t o r o u h s e t s . I n r e c e n t e a r s t h e m o d e l h a s a t t r a c t e d m u c h a t t e n t i o n a n d h a s y g y ( ) a l i e d i n u n c e r t a i n i n f o r m a t i o n a i m s a t 1 p a s u r v e o f b e e n r o c e s s i n .T h i s a e r r e s e n t i n p p y p g p p g , , t h e m o t i v a t i o n s f o r i n t r o d u c i n t h e D T R S m o d e l t h e m a i n f e a t u r e s o f t h e m o d e l a n d t h e r o b l e m s g p ,( , , b e s t u d i e d i n t h e m o d e l 2) r e v i e w i n t h e f u n d a m e n t a l r e s u l t s s t a t e- o f a r t r e s e a r c h a n d t o - g , ( ) c h a l l e n e sa n d 3 p o i n t i n o u t f u t u r e e r s e c t i v e s a n d o t e n t i a l r e s e a r c h t o i c s . g g p p p p ; ; ; ; ; K e w o r d s o u h s e t s d e c i s i o n t h e o r e t i c r o u h s e t s t h r e e-w a d e c i s i o n s d a t a a n a l s i s u n c e r t a i n r - g g y y y i n t e l l i e n t i n f o r m a t i o n r o c e s s i n g p g
基于欠采样和代价敏感的不平衡数据分类算法
2021‑01‑10计算机应用,Journal of Computer Applications 2021,41(1):48-52ISSN 1001‑9081CODEN JYIIDU http ://基于欠采样和代价敏感的不平衡数据分类算法王俊红1,2*,闫家荣1,2(1.山西大学计算机与信息技术学院,太原030006;2.计算智能与中文信息处理教育部重点实验室(山西大学),太原030006)(∗通信作者电子邮箱wjhwjh@ )摘要:针对不平衡数据集中的少数类在传统分类器上预测精度低的问题,提出了一种基于欠采样和代价敏感的不平衡数据分类算法——USCBoost 。
首先在AdaBoost 算法每次迭代训练基分类器之前对多数类样本按权重由大到小进行排序,根据样本权重选取与少数类样本数量相当的多数类样本;之后将采样后的多数类样本权重归一化并与少数类样本组成临时训练集训练基分类器;其次在权重更新阶段,赋予少数类更高的误分代价,使得少数类样本权重增加更快,并且多数类样本权重增加更慢。
在10组UCI 数据集上,将USCBoost 与AdaBoost 、AdaCost 、RUSBoost 进行对比实验。
实验结果表明USCBoost 在F1-measure 和G -mean 准则下分别在6组和9组数据集获得了最高的评价指标。
可见所提算法在不平衡数据上具有更好的分类性能。
关键词:不平衡数据;分类;代价敏感;AdaBoost 算法;欠采样中图分类号:TP18文献标志码:AClassification algorithm based on undersampling andcost -sensitiveness for unbalanced dataWANG Junhong 1,2*,YAN Jiarong 1,2(1.School of Computer and Information Technology ,Shanxi University ,Taiyuan Shanxi 030006,China ;2.Key Laboratory of Computational Intelligence and Chinese Information Processing of Ministry of Education (Shanxi University ),Taiyuan Shanxi 030006,China )Abstract:Focusing on the problem that the minority class in the unbalanced dataset has low prediction accuracy bytraditional classifiers ,an unbalanced data classification algorithm based on undersampling and cost -sensitiveness ,called USCBoost (UnderSamples and Cost -sensitive Boosting ),was proposed.Firstly ,the majority class samples were sorted from large weight sample to small weight sample before base classifiers being trained by the AdaBoost (Adaptive Boosting )algorithm in each iteration ,the majority class samples with the number equal to the number of minority class samples were selected according to sample weights ,and the weights of majority class samples after sampling were normalized and a temporary training set was formed by these majority class samples and the minority class samples to train base classifiers.Secondly ,in the weight update stage ,higher misclassification cost was given to the minority class ,which made the weights of minority class samples increase faster and the weights of majority class samples increase more slowly.On ten sets of UCI datasets ,USCBoost was compared with AdaBoost ,AdaCost (Cost -sensitive AdaBoosting ),and RUSBoost (Random Under -Sampling Boosting ).Experimental results show that USCBoost has the highest evaluation indexes on six sets and nine sets of datasets under the F1-measure and G -mean criteria respectively.The proposed algorithm has better classification performance on unbalanced data.Key words:unbalanced data;classification;cost -sensitiveness;AdaBoost algorithm;undersampling引言分类是数据挖掘领域中一个重要的分支,普通的分类模型通常假设数据集中各类别的样本数量差距很小且对于每个类别的误分代价相等,而使用不平衡数据集训练传统的分类器会导致模型对于少数类的预测精度很低,因此不平衡数据学习一直是机器学习领域的研究热点[1]。
基于变精度粗糙集的信息系统数据挖掘应用
基于变精度粗糙集的信息系统数据挖掘应用
倪啸;蔡瑞英
【期刊名称】《微电子学与计算机》
【年(卷),期】2009(26)4
【摘要】变精度粗糙集模型(VPRS)是粗糙集模型的扩充,它引入了精度参数,对数据的不一致性有较好的容忍度.文中利用VPRS模型,对不一致的信息系统进行数据挖掘,运用这一方法对系统决策表进行近似约简,去除其中冗余的属性,得出了近似约简的结果以及决策规则.实例应用表明,该方法是确实可行并有效的.
【总页数】3页(P89-91)
【关键词】变精度粗糙集;数据挖掘;不一致信息;近似约简
【作者】倪啸;蔡瑞英
【作者单位】南京工业大学信息科学与工程学院
【正文语种】中文
【中图分类】TP18
【相关文献】
1.一种基于变精度粗糙集模型的数据挖掘方法 [J], 韩中华;吴成东;赵贞丽;张娜
2.基于变精度粗糙集的不完备信息系统知识约简 [J], 赵亚娣;魏立力
3.序信息系统下基于变精度与程度近似算子的组合粗糙集模型 [J], 彭霜霜;王洪春
4.基于变精度粗糙集的数据挖掘方法研究 [J], 黄朝辉
5.基于变精度粗糙集的多属性群决策信息系统安全评估 [J], 赵亮;薛质
因版权原因,仅展示原文概要,查看原文内容请购买。
基于变精度粗糙集理论在肿瘤诊断的研究
基于变精度粗糙集理论在肿瘤诊断的研究
肿瘤是一种癌症,危害人们的身体健康和生命。
尽管有很多现代医学技术进行肿瘤诊
断和治疗,但是这些技术仍然存在很多缺陷,因此需要研究新的方法来改善诊断的精确性。
其中,变精度粗糙集理论是一种有效的方法,可以用于肿瘤诊断。
变精度粗糙集理论是粗糙集理论的一个拓展,它可以有效地描述一组属性之间的关系。
在肿瘤诊断中,我们可以将量化的临床指标作为属性,建立一个属性集合。
然后,我们可
以利用变精度粗糙集理论来建立不同精度级别的决策规则,以帮助诊断肿瘤。
首先,我们需要收集一组已知肿瘤患者和非肿瘤患者的临床指标数据。
然后,利用这
些数据来建立一个属性集合,并利用变精度粗糙集理论来抽象出肿瘤患者和非肿瘤患者之
间的关系。
具体来说,可以利用变精度粗糙集理论中的核心近似概念来确定模糊规则,并
通过不同的精度级别来实现准确的肿瘤诊断。
例如,由于肿瘤的复杂性,可能需要利用高
精度的规则来识别某些类型的肿瘤。
此外,在利用变精度粗糙集理论进行肿瘤诊断的过程中,还需要考虑到一些其他因素。
例如,需要根据肿瘤的不同类型和部位来确定不同的属性集合,并考虑到患者的年龄和性
别等因素。
同时,还需要定期更新临床指标,以保持肿瘤诊断的准确性。
总之,变精度粗糙集理论在肿瘤诊断中的应用具有很大的潜力,可以帮助医生更准确
地诊断肿瘤,并提高肿瘤治疗的成功率。
粗糙集理论及其应用研究
粗糙集理论及其应用研究一、粗糙集理论概述粗糙集是一种用于解决不确定性问题的数学工具。
粗糙集理论中知识被理解为对事物进行区分的能力,在形式上表现为对论域的划分,因而通过论域上的等价关系表示。
粗糙集通过一对上、下近似算子来刻画事物,它不需要数据以外的任何先验知识,因此具有很高的客观性。
目前,粗糙集被广泛用于决策分析、机器学习、数据挖掘等领域[1~6]。
二、粗糙集中的基本概念[7]定义1 论域、概念。
设U是所需研究的对象组成的非空有限集合,称为一个论域,即论域U。
论域U的任意一个子集XU,称为论域U的一个概念。
论域U中任意一个子集簇称为关于U的知识。
定义2 知识库。
给定一个论域U和U上的一簇等价关系S,称二元组K=(U,S)是关于论域U的知识库或近似空间。
定义3 不可分辨关系。
给定一个论域U和U上的一簇等价关系S,若PS,且P≠?,则∩P仍然是论域U上的一个等价关系,称为P上的不可分辨关系,记做IND(P)。
称划分U/IND(P)为知识库K=(U,S)中关于论域U的P-基本知识。
定义4 上近似、下近似。
设有知识库K=(U,S)。
其中U为论域,S为U 上的一簇等价关系。
对于X∈U和论域U上的一个等价关系R∈IND(K),则X关于R的下近似和上近似分别为:下近似R(X)=∪{Y∈U/R|YX}上近似R(X)=∪{Y∈U/R|Y∩X=?}集合的上近似和下近似是粗糙集中最核心的概念,粗糙集的数字特征以及拓扑特征都是由它们来描述和刻画的。
当R=(X)时,称X是R-精确集;当R(X)≠(X)时,称X是R-粗糙集,即X是粗糙集。
三、粗糙集理论的优势随着人们对粗糙集理论的不断研究,它的应用领域在不断扩大,粗糙集理论的优势在于:1)他不需要专家的经验知识,而仅利用现实实例数据本身提供的信息;2)能搜索数据的最小集合,能从实例数据中获取易于证实的规则知识,最后,它同时允许使用定性和定量的数据。
近年来,粗糙集理论应用到了许多领域。
粗糙集理论及其应用研究
粗糙集理论的核心内容
知识的约简与核
知识的约简: 通过删除不重 要的知识,保 留关键信息
核的概念:核 是知识的最小 表示,包含所 有必要信息
核的性质:核 具有独立性、 完备性和最小 性
核的求取方法: 基于信息熵、 信息增益等方 法进行求取
0
0
0
0
1
2
3
4
决策表的简化
决策表:用于描述决策问题的表格 简化目标:减少决策表的规模,提高决策效率 简化方法:合并条件属性,删除冗余属性 简化效果:提高决策表的可读性和可理解性,降低决策复杂度
粗糙集理论在聚类分析中的应用:利用粗糙集理论处理不确定和不完整的数据,提高聚类 分析的准确性和效率。
聚类分析在数据挖掘中的应用:可以帮助发现数据中的模式和趋势,为决策提供支持。
粗糙集理论在其他领域的应用
决策支持系统
粗糙集理论可以帮助决策者 处理不确定性和模糊性
粗糙集理论在决策支持系统 中的应用
粗糙集理论可以提高决策支 持系统的准确性和效率
粗糙集理论在决策支持系统 中的实际应用案例分析
智能控制
粗糙集理论在模糊控制中的 应用
粗糙集理论在智能控制中的 应用
粗糙集理论在神经网络控制 中的应用
粗糙集理论在自适应控制中 的应用
模式识别
粗糙集理论在模式 识别中的应用
粗糙集理论在图像 识别中的应用
粗糙集理论在语音 识别中的应用
粗糙集理论在生物 信息学中的应用
添加标题
添加标题
ห้องสมุดไป่ตู้添加标题
添加标题
机器学习
粗糙集理论在机器学习中的应用 粗糙集理论在数据挖掘中的应用 粗糙集理论在模式识别中的应用 粗糙集理论在自然语言处理中的应用
动态三支决策研究综述及展望
1740 引言三支决策(Three-way Decisions,3WD)是姚一豫教授提出的一种分析和解决复杂决策问题的理论[1]。
其主要思想是“三分而治”和“化繁为简”,将整体分为三个独立的部分,根据收集到的信息对不同的部分采用不同的处理策略[2]。
目前,基于时间和空间两个维度,三支决策的研究可以分为静态三支决策和动态三支决策。
静态三支决策只进行一次三支决策;动态三支决策实施多阶段的三支决策,进而做出最终决策。
结合实际决策背景,如何在动态决策信息系统下建立动态三支决策模型,提高决策效率、降低决策代价是当前的热点问题。
学者们提出了序贯三支决策[3]、多粒度三支决策[4]、多分类三支决策[5]等动态三支决策模型。
在实际决策时,人们往往会随着所获信息的更替而不断改变决策方案。
尤其是在大数据时代,人们需要在尽可能短的时间内快速决策。
因此,系统地研究动态三支决策的理论、模型和应用有重要的意义。
本文对动态三支决策的基本理论、研究现状和相关应用进行综述,总结和展望其未来研究方向。
1 三支决策基本理论作为二支决策的拓展,三支决策考虑到不确定因素,引入了延迟决策。
经典三支决策模型[6]是基于贝叶斯理论进行的决策,具体描述如下:设状态空间{,}X X Θ=⌝表示对象 x 的两种不同状态,动作集合{,,}P B N A a a a =表示对 x 进行决策采取的三种不同行为,P a ,B a ,N a 分别表示对象 x 属于、不一定属于和不属于集合X 的行为。
决策时相应的损失代价函数如表1所示。
其中,PP λ,BP λ,NP λ分别表示 x 属于X 而采取行为P a ,B a ,N a 时的损失,PN λ,BN λ,NN λ分别表示 x 不属于 X 而采取行为P a ,B a ,N a 时的损失。
Pr(|[])X x 是条件概率,对于 x 来说,采取一个决策行为时的期望代价为:(|[])Pr(|[])Pr(|[])(|[])Pr(|[])Pr(|[])(|[])Pr(|[])Pr(|[])P PP PN B BP BN N NP NN R a x X x X x R a x X x X x R a x X x X x λλλλλλ=+⌝⎧⎪=+⌝⎨⎪=+⌝⎩。
多粒度三支决策研究进展
多粒度三支决策研究进展
钱进;郑明晨;周川鹏;刘财辉;岳晓冬
【期刊名称】《数据采集与处理》
【年(卷),期】2024(39)2
【摘要】多粒度三支决策利用三支决策理论,从多视角、多层次对复杂问题进行数据分析与处理,逐渐成为一种高效、可靠的智能决策方法。
本文对多粒度三支决策的研究工作进行综述,主要介绍了多粒度融合策略、多视角三支决策和多层次三支决策,以及从定性和定量两个角度探讨了多粒度三支决策,讨论了不同多粒度三支决策模型之间的关系,并指出了多粒度三支决策研究中存在的若干问题,为该领域的深入研究提供参考。
【总页数】15页(P361-375)
【作者】钱进;郑明晨;周川鹏;刘财辉;岳晓冬
【作者单位】华东交通大学软件学院;赣南师范大学数学与计算机学院;上海大学未来技术学院
【正文语种】中文
【中图分类】TP18
【相关文献】
1.不完备邻域多粒度决策理论粗糙集与三支决策
2.集对优势关系下多粒度决策粗糙集的可变三支决策模型
3.基于异常粒度及三支决策理论的城市轨道交通道岔整治
智能决策系统4.深度置信网络的代价敏感多粒度三支决策模型研究5.多粒度层次序贯三支决策模型研究
因版权原因,仅展示原文概要,查看原文内容请购买。
粗糙集理论的属性重要性评估方法及其实际应用
粗糙集理论的属性重要性评估方法及其实际应用引言:粗糙集理论是一种用于处理不确定性和模糊性问题的数学工具,它在数据挖掘、模式识别和决策分析等领域中得到了广泛的应用。
在粗糙集理论中,属性重要性评估是一个重要的问题,它能够帮助我们识别出对决策结果具有重要影响的属性,从而提高决策的准确性和可靠性。
本文将介绍一种基于粗糙集理论的属性重要性评估方法,并探讨其在实际应用中的价值。
一、粗糙集理论概述粗糙集理论是由波兰学者Pawlak于1982年提出的,它是一种处理不确定性和模糊性问题的数学工具。
粗糙集理论通过将对象的属性进行划分,将属性值之间的差异进行模糊化处理,从而实现对不完备和不精确数据的分析和决策。
粗糙集理论的核心思想是近似和约简,即通过近似的方法对数据进行简化和压缩,从而提取出最重要的信息。
二、属性重要性评估方法在粗糙集理论中,属性重要性评估是一个关键问题。
属性重要性评估的目标是确定哪些属性对决策结果的影响最大,从而帮助我们进行决策和分析。
常用的属性重要性评估方法有正域、核和约简等方法。
1. 正域方法正域方法是一种基于粗糙集的属性重要性评估方法。
它通过计算属性在正域中的覆盖度来评估属性的重要性。
正域是指在给定条件下能够唯一确定决策结果的属性取值,它反映了属性对决策结果的贡献程度。
正域方法的优点是简单直观,容易理解和计算,但它没有考虑属性之间的依赖关系。
2. 核方法核方法是一种基于粗糙集的属性重要性评估方法。
它通过计算属性在核中的约简度来评估属性的重要性。
核是指在给定条件下能够唯一确定决策结果的最小属性集合,它反映了属性对决策结果的决定性影响。
核方法考虑了属性之间的依赖关系,能够更准确地评估属性的重要性,但计算复杂度较高。
3. 约简方法约简方法是一种基于粗糙集的属性重要性评估方法。
它通过对属性集合进行约简,得到一个最小的属性子集,从而实现对属性的重要性评估。
约简方法的优点是能够同时考虑属性之间的依赖关系和决策结果的覆盖度,能够更全面地评估属性的重要性。
基于最小期望代价的汽轮机代价敏感故障诊断
第 1 2期
仪 器 仪 表 学 报
C i e e J u n lo ce t i I sr me t h n s o r a fS in i c n t f u n
Vo . .1 129 No 2 De c.2 8 00
20 0 8年 l 2月
基 于 最 小 期 望 代 价 的 汽 轮 机 代 价 敏 感 故 障 诊 断
刘 金 福 ,于 达仁
( 尔 滨工 业 大 学 能源 学 院 哈 哈尔 滨 10 0 ) 5 0 1
摘
要: 在故障诊断领域 , 粗糙集 已成 为一种有效 的不一致信息处 理工具 , 而当故障诊 断存在 明显的诊 断代价差 异时 , 然 粗糙
集方法 由于没有考虑诊断代价 , 不能取得满意 的效果。本文提出了一种基 于最小期望代价 的汽轮机故 障诊断方法 , 首先利用粗 糙集方法进 行故障诊断规 则的提取 , 然后 采用最小期望代价准则进行诊断 决策 的综合评价 , 克服 了传统方法不考虑 故障诊断代 价的不足。该方 法不仅实 现简单 , 而且通用性 强 , 能够被容易地应用 于其 他类型 的学 习器 , 而考虑诊断代价 。通 过汽轮机 振 从
Ab t a t:I h e l o u td a n ss,r u h s t a eb e o ru o lt e lwi h n o itn n r — sr c n t e r am ff l i g o i o g esh v e n a p we f lto o d a t t e i c nsse tif ma a h o t n.Ho v r i o we e ,wh n t e midig o i o t fdfe e tful r e u l o h s t a o c u r a ife e e h s a n ssc sso i r n a t a eun q a ,r ug e sc n n ta q ie as ts d r ・ f s i s i d e t n tc n i rn h midig o i o t. Th s p p r prpo e o ts n iie ful d a n ss meho o u t u o o o sde ig t e s a n ss c ss i a e o s s a c s— e st a t ig o i t d fr v se m u b n a e n mi i m x e t d c s rtro ta t r i e b s d o n mu e p ce o tc iei n.Th smeh d e ly o g e st xr c h a l a n — i t o mp o sr u h s t o e ta tt e fu tdig o ssr l sa d e ly h n mu e p c e o t c i ro o e au t h e iin ffu td a n ss i u e n mp o st e mi i m x e td c s rt in t v la e te d cso s o a l i g o i ,wh c v r e ih o e — c me h h rc mi g fte c a sc lme h d — n tc nsd rn h ig o i o t .Th r p s d me h d i i o st e s o to n s o h ls ia t 0 — o o ie i g t e d a n ss c ss e p o o e t o ssm— p e a d u ie s l n a e e sl s d i t e e r n c i e o c nsd rt e dign ssc ss l n n v ra ,a d c n b a i u e n o h rl anig ma h n st o i e h a o i o t.Ex e i n so y p rme t n t e c s—e st e fu td a n ssf rt e vb ain o t a t r n h w h twh n t e o p so a l d a n ssa e h o ts n i v a l ig o i o h i r to fa se m u bie s o t a e h utut ffu t i g o i r i i c n it n ,te meho r p s d i h s pa e s i ci e o o t u h i h c s a l a d d c e s s t e o e al n o sse t h t d p o o e n t i p r i n ln d t u p tt e h g — o t fu t n e r a e h v rl
粗糙集理论的应用领域及研究现状
粗糙集理论的应用领域及研究现状摘要:粗糙集理论是一种基于不完备信息的数学模型,具有广泛的应用领域。
本文将介绍粗糙集理论的基本概念和原理,并探讨其在数据挖掘、模式识别、决策分析等领域的应用。
同时,还将介绍粗糙集理论在实际研究中的现状和挑战。
1. 引言粗糙集理论是由波兰学者Pawlak于1982年提出的一种基于不完备信息的数学模型。
它通过将数据集划分为等价类,可以有效地处理不确定和模糊的信息。
粗糙集理论在多个学科领域中得到了广泛的应用,如数据挖掘、模式识别、决策分析等。
2. 粗糙集理论的基本概念和原理粗糙集理论的核心概念是“粗糙集”,它是指在不完备信息条件下,将数据集划分为等价类的过程。
在粗糙集理论中,等价类被称为“粗糙集”,而等价类之间的差异被称为“粗糙度”。
粗糙度越小,等价类之间的差异越小,数据集的信息越完备。
粗糙集理论的基本原理是“下近似”和“上近似”。
下近似是指用最少的信息描述数据集的特征,上近似是指用尽可能多的信息描述数据集的特征。
通过下近似和上近似的计算,可以得到数据集的粗糙集,从而实现对不完备信息的处理。
3. 粗糙集理论在数据挖掘中的应用数据挖掘是从大量数据中发现隐藏模式和知识的过程。
粗糙集理论在数据挖掘中可以用于特征选择、属性约简和规则提取等任务。
通过粗糙集理论,可以从复杂的数据集中挖掘出有用的模式和规律,帮助人们更好地理解数据集的结构和特征。
4. 粗糙集理论在模式识别中的应用模式识别是通过对数据进行分类和识别,从而实现对数据的理解和分析。
粗糙集理论在模式识别中可以用于特征选择、模式分类和模式识别等任务。
通过粗糙集理论,可以对数据进行有效的特征选择,提高模式识别的准确性和效率。
5. 粗糙集理论在决策分析中的应用决策分析是通过对决策问题进行建模和分析,从而实现对决策的优化和改进。
粗糙集理论在决策分析中可以用于决策规则的提取和决策的评估。
通过粗糙集理论,可以从决策问题中提取出有用的规则和知识,帮助人们做出更好的决策。
代价敏感学习方法综述
代价敏感学习方法综述代价敏感学习方法可以在很多实际问题中应用。
例如,在医学诊断中,将良性肿瘤误分类为恶性肿瘤的代价往往比将恶性肿瘤误分类为良性肿瘤的代价更高。
在金融领域,将正常交易误分类为欺诈交易的代价要比将欺诈交易误分类为正常交易的代价更高。
代价敏感学习方法可以根据实际问题的需求,将分类错误的代价考虑进去,以找到更加适合实际需求的分类器。
代价敏感学习方法有多种实现方式。
一种常见的方法是使用代价矩阵,其中每个元素表示将样本i分为类别j的代价。
代价矩阵可以由领域专家提供,也可以通过交叉验证等方法自动估计。
代价矩阵可以与传统的分类算法结合使用,如决策树、支持向量机、朴素贝叶斯等等,通过对算法的改进,使其考虑代价信息。
另一种常见的代价敏感学习方法是使用代价敏感的损失函数。
代价敏感的损失函数可以将错误分类的代价考虑进去,从而使得模型更加关注错误分类较高代价的样本。
例如,可以使用加权的交叉熵损失函数,其中错误分类较高代价的样本具有较高的权重。
此外,还可以使用ROC曲线下面积作为损失函数,根据不同类别的错误分类代价给予不同的权重。
除了上述方法,还有一些其他的代价敏感学习方法。
例如,可以将代价敏感学习方法与数据重采样技术相结合,通过重采样的方式增加代价较高的样本在训练集中的比例。
还可以使用代价敏感的特征选择方法,通过选择合适的特征,减少错误分类的代价。
代价敏感学习方法的研究已经有了很多成果。
一些研究表明,在一些实际问题中,代价敏感学习方法能够显著提高模型的性能。
然而,代价敏感学习方法也存在一些挑战和限制。
首先,代价敏感学习方法对代价矩阵或代价函数的设定比较敏感,需要充分考虑实际问题的需求。
其次,代价敏感学习方法往往需要更多的领域知识或专家参与,相比传统的分类方法更加复杂。
此外,由于需要考虑错误分类的代价,代价敏感学习方法往往耗费更多的计算资源和时间。
综上所述,代价敏感学习方法是一种通过考虑分类错误的代价来优化模型性能的机器学习方法。
粗糙集理论在人工智能领域中的研究现状与发展趋势分析
粗糙集理论在人工智能领域中的研究现状与发展趋势分析引言:人工智能(Artificial Intelligence,AI)作为一门新兴的学科,涉及多个领域,其中粗糙集理论在人工智能领域中起到了重要的作用。
本文将分析粗糙集理论在人工智能领域的研究现状,并探讨其未来的发展趋势。
一、粗糙集理论的基本概念和原理粗糙集理论是由波兰数学家Pawlak于1982年提出的,它是一种用于处理不完全、不确定和模糊信息的数学方法。
粗糙集理论的核心思想是通过粗糙近似来描述和处理不确定性信息,它将数据集划分为等价类,并通过属性约简来减少冗余信息,从而实现对数据的分析和决策。
二、粗糙集理论在人工智能领域的应用2.1 数据挖掘粗糙集理论在数据挖掘领域中被广泛应用。
通过粗糙集理论可以对大规模数据进行特征选择、数据降维和数据分类等任务,从而提高数据挖掘的效率和准确性。
2.2 模式识别粗糙集理论在模式识别中的应用也非常重要。
通过粗糙集理论可以对模式进行分类、聚类和识别,从而实现对复杂模式的分析和理解。
2.3 智能决策粗糙集理论在智能决策领域中的应用也十分广泛。
通过粗糙集理论可以对决策问题进行建模和求解,从而实现智能决策的目标。
三、粗糙集理论在人工智能领域中的研究现状3.1 粗糙集理论与深度学习的结合近年来,研究者们开始将粗糙集理论与深度学习相结合,以提高深度学习的可解释性和鲁棒性。
通过粗糙集理论的思想,可以对深度学习模型进行解释和理解,从而提高模型的可信度和可靠性。
3.2 粗糙集理论与强化学习的结合粗糙集理论与强化学习的结合也是当前的研究热点之一。
通过粗糙集理论的思想,可以对强化学习问题进行建模和求解,从而提高强化学习的效率和准确性。
四、粗糙集理论在人工智能领域的发展趋势4.1 粗糙集理论的扩展和改进粗糙集理论作为一种处理不确定性信息的方法,在未来的研究中将会面临更多的挑战。
研究者们将进一步扩展和改进粗糙集理论,以适应更加复杂的人工智能问题。
测试代价敏感的决策粗糙集正域约简
测试代价敏感的决策粗糙集正域约简刘偲;秦亮曦【期刊名称】《计算机科学与探索》【年(卷),期】2017(011)006【摘要】This paper studies the test-cost sensitive reduction on the positive region of decision theoretic rough sets (DTRS). Based on the traditional positive region-based reduction, this paper takes test cost into account for the pur-pose of discovering the positive region-based reduction with the minimum total test cost, and adopts the simulated annealing algorithm combined with traditional positive region-based reduction of DTRS algorithm to search for the result of the positive region-based reduction with the minimum test cost. Furthermore, this paper proposes a test-cost sensitive positive region-based reduction algorithm for DTRS (TCSPR), and analyzes the time complexity of the algorithm. The experimental results confirm the effectiveness of TCSPR that can find a positive region reduction with fewer attributes and less test cost in polynomial time, and whose solution is generally the optimum solution or second-best solution of the optimization objective, viz. the positive region-based reduction with the minimum total test cost, and whose classification ability is hardly reduced in part of the data sets.%对测试代价敏感的决策粗糙集(decision theoretic rough sets,DTRS)正域约简问题进行了研究.在传统正域约简的基础上将测试代价考虑进来,希望找到测试代价总和最小的正域约简.采用模拟退火算法结合传统决策粗糙集正域约简算法来搜索测试代价总和最小的正域约简结果.提出了一种测试代价敏感的决策粗糙集正域约简算法TCSPR(test-cost sensitive positive region-based reduction algorithm for DTRS),并分析了该算法的时间复杂度.实验结果验证了TCSPR算法的有效性,该算法能在多项式时间内找到一个属性更少、测试代价更小的正域约简,找到的解一般为优化目标的最优解或次优解,即测试代价总和最小的正域约简,并且该算法在部分数据集上的分类能力几乎不减.【总页数】7页(P1014-1020)【作者】刘偲;秦亮曦【作者单位】广西大学计算机与电子信息学院,南宁 530004;广西大学计算机与电子信息学院,南宁 530004【正文语种】中文【中图分类】TP181【相关文献】1.基于免疫量子粒子群优化的测试代价敏感属性约简算法 [J], 谢小军;俞春强;王博;何弦;徐章艳2.保正域的决策粗糙集属性约简 [J], 黄国顺3.模糊决策粗糙集代价敏感属性约简研究 [J], 刘偲;秦亮曦4.不协调决策表正域约简与其它约简的关系 [J], 杜卫锋;秦克云5.基于代价敏感和近似分类质量的决策粗糙集属性约简研究 [J], 陈婉清;秦亮曦因版权原因,仅展示原文概要,查看原文内容请购买。
【江苏省自然科学基金】_测试代价_期刊发文热词逐年推荐_20140815
推荐指数 1 1 1 1
2011年 序号 1 2 3 4 5 6 7 8 9 10
2011年 科研热词 集成测试 耦合度量 测试桩复杂度 测试序列 有向无环图 拓扑序列 子图同构 子图包含查询 图索引 启发式算法 推荐指数 1 1 1 1 1 1 1 1 1 1
2012年 序号 1 2 3 4 5 6 7 8 9
推荐指数 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
2014年 序号 1 2 3 4 5 6 7
2014年 科研热词 测试代价敏感 粗糙集 模糊 属性约简 多粒度 变精度分类粗糙集 不完备信息系统 推荐指数 2 1 1 1 1 1 1
科研热词 非接触变压器 量子计算 量子电路优化 耦合系数 磁路模型 模糊集 图像分割 可逆逻辑电路 互信息量 toffoli门 reed muller ansoft 2d
推荐指数 1 1 1 1 1 1 1 1 1 1 1 1 1
2010年 序号 1 2 3 4
科研热词 节点选择算法 性能 匿名通信 匿名度
科研热词 自适应可变长编码 码率估计 率失真优化 无线传感器网络 数据查询 数据存储发现 代价估计 h.264 c-cast
推荐指数 1 1 1 1 1 1 1 1 1
2013年 序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
科研热词 重加密 误分类代价 试件尺寸 网络结构 空间分辨率 测试代价 水泥基材料 数据中心网络 广播加密 属性约简 密文访问控制 孔隙率 失效恢复 基于属性的加密 可用性 决策粗糙集 代价敏感 云存储 x-ct
2008年 序号 1 2 3 4 5 6 7 8 9 10
粗糙集理论及其应用发展综述
粗糙集理论及其应用发展综述模糊粗糙集理论第21卷第6期Vol.21 No.6重庆工商大学学报(自然科学版)JChongqingTechnolBusinessUniv.(NatSciEd)____年12月Dec.____ 文章编号:1672-058_(____)05-0575-05粗糙集理论及其应用发展综述代春艳1,2(1.重庆工商大学计算机科学与信息工程学院,重庆400067;2重庆大学经济与工商管理学院,重庆400044)摘要:介绍了粗糙集理论的基本概念、研究对象,,并对它和模糊集、证据理论等相关理论,领域的关系进行了阐述。
关键词:粗糙集;不确定性;;中图分类号:TP粗糙集(RoughZ.Pawlak在1982年提出的,该理论是一种刻画不完整性和不确定性的数学工具,能有效地分析和处理不精确、不一致、不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律[1]。
1992年至今,每年都召开以RS为主题的国际会议,推动了RS理论的拓展和应用。
国际上成立了粗糙集学术研究会,参加的成员来自波兰、美国、加拿大、日本、挪威、俄罗斯、乌克兰和印度等国家。
目前,粗糙集这一新的数学理论已经成为信息科学领域的研究热点之一,它在机器学习、知识获取、决策分析、过程控制等许多领域得到了广泛的应用。
1 粗糙集理论的基本概念1.1 知识的含义粗糙集理论建立在分类机制的基础上,并将等价关系对空间的划分与知识等同。
粗糙集理论的主要思想是利用已知的知识库,将不精确或不确定的知识用已知的知识库中的知识来(近似)刻画。
在粗糙集理论中“,知识”被认为是一种分类能力,也就是将知识理解为对数据的划分。
用集合的概念表示就是使用等价关系集R对离散表示的空间U进行划分,知识就是R对U划分的结果。
由此,在U和R的意义 (1)下,知识库可以定义为:属于R中的所有可能的关系对U的划分,记为K=(U,R)这样给定一组数据U与等价关系集R,在R下对U的划分,称为知识,记为U/R。
粗糙集理论辅助现代医疗诊断研究综述
Science and Technology&Innovation┃科技与创新2019年第11期文章编号:2095-6835(2019)11-0025-03粗糙集理论辅助现代医疗诊断研究综述*高静,程铭(首都经济贸易大学,北京100070)摘要:传统医疗面临着信息繁杂且冗余的问题,医学图像的清晰度也达不到标准,这种情况下,传统医疗同粗糙集理论相结合,可以有效地对数据属性约简,得到利于诊断的信息;医学图像的后期处理也可保留感兴趣的图像。
近年来,对于人工智能的研究热度只增不减,粗糙集和各种数据挖掘算法相结合的思路不断应用在医学方面,对于医疗诊断提供了新的想法,也提高了诊断精度,为智能医疗提供了新的可能。
对近十年粗糙集理论应用于医学方面的研究进行比对分析与展望。
关键词:粗糙集理论;医疗诊断;医疗图像;数据挖掘中图分类号:TP18文献标识码:A DOI:10.15913/ki.kjycx.2019.11.0091前言粗糙集理论是一种数学工具,用于处理20世纪80年代早期Prof.Pawlak在波兰提出的不确定性问题,作为一种能够探索不完整、不确定的知识并有效分析这些信息的工具。
保有同样分类实力的同时,把知识减少作为基础,推理和综合推导问题决策或分类规则是其根本思想。
粗糙集分析数据的显著优势在于撇开需要处理的数据,不用提供额外其他先验知识,可以直接从需要分析的问题开始,划分问题的近似域以找出发现不确定数字时隐含的基本法则。
粗糙集理论应用于医学诊断领域已日渐成熟,由于临床诊疗信息种类多样,信息繁多,还有很强的不完整性或冗余性,对于不同病情需要的属性也不同,所以需要粗糙集理论通过属性约简,来保留有助于诊断的属性。
面对不同的疾病,粗糙集也可以选择合适的算法互相补充达到提高医疗诊断的效果。
近十年来,越来越多的国内外研究者将重点放在粗糙集上,提出了粗糙集应用在医学诊断中的种种研究想法。
2粗糙集基本理论2.1知识表达系统针对医疗信息系统(U,A,F),其中U=(x1,x2,…x n)为待训练病例样本集合,A=C∪D为所提取的病人症状特征属性集,C,D分别表示条件属性和决策属性,条件属性用于反映对象特征,决策属性用于反映对象类别,F为病例样本U与症状特征集属性A之间的映射集,也就是对于症状的描述。
多分类SVM的代价敏感加权故障诊断方法
多分类SVM的代价敏感加权故障诊断方法向阳辉;张干清;庞佑霞;郭振华【期刊名称】《振动、测试与诊断》【年(卷),期】2015(000)006【摘要】为了在支持向量机(support vector machine ,简称SVM )中合理引入代价敏感机制来降低故障误诊断的代价,提出一种多分类SVM的代价敏感加权故障诊断方法。
该方法通过对多分类SVM的硬判决得票矩阵进行代价敏感加权,将故障误诊断的代价作为权重融入SVM的硬判决,并分析硬判决的得票数和得票权重,从而构造出各故障的概率分配,最终实现多分类故障的SVM代价敏感加权诊断及概率输出。
实验结果表明,多分类SVM 代价敏感加权处理的诊断结果更趋向于高代价故障,所提方法能够有效降低故障误诊断的代价。
【总页数】7页(P1116-1122)【作者】向阳辉;张干清;庞佑霞;郭振华【作者单位】长沙学院机电工程系长沙,410003;长沙学院机电工程系长沙,410003;长沙学院机电工程系长沙,410003;宁波高博科技有限公司宁波,315400【正文语种】中文【中图分类】TP206.3;TH165.3;TH132.41【相关文献】1.基于局部图嵌入加权罚SVM的模拟电路故障诊断方法 [J], 廖剑;史贤俊;周绍磊;肖支才2.基于RS与LS-SVM多分类法的故障诊断方法及其应用 [J], 蒋少华;桂卫华;阳春华;戴贤江3.基于BT-SVM模型组合的动态加权多分类算法研究 [J], 李涛;张景肖4.基于SLRMD与多分类SVM的变压器故障诊断方法 [J], 刘宇芳; 姜斌; 易辉5.基于加权粗糙集的代价敏感故障诊断方法 [J], 刘金福;于达仁;胡清华;王伟因版权原因,仅展示原文概要,查看原文内容请购买。
代价敏感学习方法综述
代价敏感学习方法综述代价敏感学习的基本原理是在传统的分类算法中引入代价矩阵。
代价矩阵是一个二维矩阵,用于描述不同类型的错误分类所带来的代价。
例如,在医疗领域中,将一些患者本身为病人但被诊断为健康人的错误分类会导致严重的后果,而将健康人诊断为患者的错误分类则只会导致一些不必要的检查,因此这两种错误分类的代价是不同的。
通过定义代价矩阵,代价敏感学习可以根据不同类型的错误分类调整分类器的参数,以使得总的代价最小化。
代价敏感学习方法可以分为两大类:重采样方法和代价敏感算法。
重采样方法通过调整样本的权重来增加或减少对错误分类样本的关注度。
其中,过采样方法通过增加错误分类样本的复制来增加权重,而欠采样方法通过删除正确分类样本来减少权重。
代价敏感算法则通过改变分类器的参数,比如调整阈值或代价权重,来降低代价。
重采样方法中的SMOTE算法是一种扩展少数类别样本的方法。
SMOTE算法通过在少数类样本之间生成合成样本来增加少数类别样本的数量。
它首先选择一个少数类别样本,然后找到其最近邻样本,随机选择一个邻居样本,在这两个样本之间生成一个新的样本。
这个过程可以增加训练集中少数类别样本的数量,从而提高模型对少数类别的分类性能。
代价敏感算法中的AdaBoost和SVM算法是两个常用的方法。
AdaBoost算法通过对分错样本增加权重,以便下一轮进行更多的关注,从而改善分类性能。
它的基本思想是通过串行训练多个弱分类器,每个弱分类器都在前一个分类器的基础上调整权重以正确分类之前的错误样本。
SVM算法在代价敏感学习中通常使用C-SVM算法。
C-SVM算法通过引入代价矩阵中的代价权重来调整分类器的预测边界,从而最小化错误分类的代价。
除了以上介绍的方法外,还有很多其他的代价敏感学习方法。
例如,Cost-Sensitive Decision Trees(CSDT)算法、Cost-Sensitive K-Nearest Neighbors(CSKNN)算法和Cost-Sensitive Random Forest (CSRF)算法等。
基于动态误分类代价下的代价敏感属性选择
摘要:当前代价敏感算法普遍采用静态的误分类代价,而静态的误分类代价局限性很强。这主要表现在:过度拟合、 不能反映数据集真实的类分布特征。针对静态误分类代价的不足,本文首先提出一种动态误分类代价机制。该机制 根据不同的测试代价自适应生成四种不同的动态误分类代价函数,并以最小总代价为目标。其次,我们在动态误分 类下重新定义了最小总代价的属性选择问题。最后我们提出了一个模拟退火算法解决了该问题。实验结果证明,该 设计方案可有效地选出最优误分类代价,以保证所选属性集合具有最小的平均总代价。 关键词:代价敏感学习;属性选择;动态误分类代价;模拟退火算法 中图分类号:TP 文献标志码:A
然扩展。由于代价是数据的固有特性,所以代价成为数 据挖掘必然考虑的因素之一。在很多现实应用中,属性 选择的过程必须要考虑误分类代价和测试代价。其中误 分类代价是由于错误分类而产生的一种惩罚代价。而测 试代价是指获得属性的数据值时所付出的一定代价,
收稿日期:2016-10-28;修回日期:2016-11-14。 基金项目:国家自然科学基金面上项目(61379049,61379089),陕西省教育厅自然科学专项项目(16JK2015),陕西服装工程学院专项科研项 目(2016KY019)资助。 作者简介:牛军霞(1989-),女,硕士,主要研究方向为代价敏感粗糙集;王敬前(1989-),男,硕士,主要研究方向为粗糙集与粒计算。
引言
属性选择是数据挖掘中最活跃和重要的研究领域之 一。 代价敏感属性选择
[1-2]
这些代价包括金钱、时间和其它各种资源。代价敏感属 性选择的目的是在保证信息系统分类能力不变的前提下, 挑选属性,寻找使目标函数所对应的最优属性子集。 测试代价敏感粗糙集 [3-6] 在最近几年引起研究者的 广泛关注。 闵帆等人在 2009 年针对测试代价问题建立了 四个层次模型的完整理论体系,研究的内容顺序是数据 模型→计算模型→问题模型→算法模型。最近几年来, 误分类代价敏感粗糙集理论与方法也取得重要进展,其 基于它的是属性 中最有代表性的是决策粗糙集理论[7-8], 问题是经典属性选择问题的自
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
A ur e n Co ts n i v u h S t s a c S v y o s— e st eRo g e - i Re e r h
LI J a b n 1 , M I Fa U i . i , 2 N n
Gr n lr mp t g Z a g h uN r l nv ri , h n z o uin3 3 0 , i a a ua Co u i , h n z o o ma U i st Z a g h o F j 6 0 0 Chn ) n e y a
Abt a t s r c :Thi spape e i w st h or ounda i nsa rr v e het e y f to nd h t t — t e sa eo ̄t ・ r fc ts nstver gh s t he a to os— e ii ou e .Fi sl, r ty
t e mo i a i n o o ts n i v e r i g s i t o u e h o g e a h tv t f c s— e st e la n n i n r d c d t r u h x mp e .T p s o o t a e d s u s d o i ls y e f c ss r ic s e .Th e f u d t n o o ts n ii e r u h s t sp e e t d Th n t e c r e tst a i n i s m ma i e r m h o r lv l o n a i f s- e st o g e s i r s n e . e h u r n iu to s u o c v rz dfo tef u es e
21 0 1年第 4期 ( 总第 7 ) 4期
漳州师范学院学报 ( 然科学版) 自
J u n l f a g h uNo ma ie st ( t S i o r a n z o r l o Zh Unv ri y Na . c. )
N ..01 o 4 2 1 年
Ge e a . 4 nr I No 7
k y is e f e tc s- e stv o g e r i h i h e . e u so s - o ts n i e r u h s ta eh g l t d s t i g
Ke r s c s -e stv o g e a t i u e r d c i n ; e t o t; l o i m ;mo e ywo d : o ts n i e r u h s t; tr b t e u to i t s s ag rt c h dl
文章编号 : 0—86 01 401— 1 872( 1) — 70 0 2 0 0 6
代价敏感粗糙集研究综述
刘 家彬 ’ ,闵 , 一 帆
( 1 .四川民族学院 计算机科学系, 四川 康定 660;. 20 12 漳州师范学院 粒计算实验室, 福建 漳州 33 0) 600
摘 要:本文对代价敏 感粗 糙集( s s si u h e C . S 论的 内容及发展状况进行 了回顾 , c te i e og t SR ) o .n t r v s, 理 对其研
粗 糙集作 为一 种刻 画不 完整 和 不确 定性 问题 的数学工 具 ,是 由波 兰科学 院 z P wl .a a k院士 于 18 92年提
出的…I 粗糙集能有效地分析和处理不精确、不一致、不完整等各种不完备信息,在不需要任何先验知 _. 引
识的情 况 下,对数 据进 行分析 和 推理 ,从 中发现 隐含的知 识,揭 示 潜在 的规律 .从上 世纪 8 0年代 末 9 0年 代初 开始 ,经过 二十余 年 的 发展 和研 究,在 理论 和实 际应 用 中都 取得 了长足 的 发展 学 、社会科学和工程技术等领域,从实际系统 中采集到的数据往往不精确甚至不完整. 多年 来,研究人员一直在努力探索处理不完整和不确定性信息的有效途径,并提出了相关理论,如模糊理论 、
证据理论、概率论等. 但这些理论在应用到实际领域的过程中,均需要一些数据的附加信息或先验知识, 如模糊隶属函数、基本概率指派函数和有关统计概率分布等.
( . p rme t fCo u e ce c , ih a ie st o t n l is Ka g igSc u n 6 6 0 , i a 2 L bo 1 De a t n mp trS in e Sc u nUn v riyf rNai ai e, n dn ih a , 2 0 1 Chn ; . a f o o t
i cu i g t e d t d l t e c mp t t n lmo e , h r b e a d t e a g rt m.F n l , e e r h t e d n n l d n h a a mo e , h o u a i a d l t e p o l m n h l o ih o i a l r s a c r n sa d y
究方向和发展趋势进行了分析和展望. 首先介绍了代价敏感学习产生的缘由、数据挖掘过程中常见代价的分类及 代价敏感粗糙集的基本概念; 其次从数据模型、 计算模型、 题及算法四个层次上对当前的研究状况进行了总结, 问 建立了代价敏感粗糙集理论体系示意图;最后指出测试代价敏感粗糙集的发展趋势和需要重点关注的问题. 关键词:代价敏感粗糙 集 ;属性约简 ;测试代价 ;算法 ;模型