高校大学生分类管理中基于等价类的属性约简算法应用

合集下载

属性约简

属性约简

粗糙集的几种属性约简算法分析分类:默认栏目2006.6.16 10:32 作者:万富| 评论:0 | 阅读:1628陈淑珍,基于粗集的几种属性约简算法分析,武汉工业学院学报,Vol.2 4No.3,Sep .20 051.1 利用差别矩阵求最小约简差别矩阵(Discernibility Matrix)是由波兰华沙大学的著名数学家Skowron[21 提出来的,利用这个工具,可以将存在于复杂的信息系统中的全部不可区分关系表达出来。

利用差别矩阵求取最小约简的一个前提是:在数据表的预处理阶段要先对不相容的记录进行处理,即差别矩阵不处理不相容记录。

预处理的方法如将冲突的记录数除以记录总数,得到一个粗糙度的量度,该量度可以作为数据表的一个特征。

通过差别矩阵可以很方便地求取核属性,以核属性为出发点,再求取差别函数的最小析取范式,则求析取范式的运算就可以得到很大的简化。

而最后得到的每个析取分量对应着一个约简。

因此,一定可以得到最小约简。

但该算法的缺陷十分明显:首先,当论域的对象与属性的规模较大时,差别矩阵将占有大量的存储空间口(n的二次方);其次,差别函数的化简本身就是一个NP一hard问题,因此只要数据集稍大一点,就不具备可操作性。

1.2 基于属性依赖度约简算法求取所有约简是一个NP一hard问题,因此运用启发信息来简化计算以找出最优或次优约简显然是一种可取的方法。

许多启发式约简算法的基本步骤都是:由信息系统或决策表的核为起始点,然后根据属性重要性的某种测度,依次选择最重要的属性加人核中,直到满足终止条件。

便得到信息系统或决策表的一个约简(更确切的说,是包含约简的一个属性集)。

一个信息系统中的所有属性对于决策来说并不是同等重要的,在粗集理论中,属性重要性可通过相依度来体现。

决策属性D对于属性R(R属于C)的相依度y(R,D)定义为[3]:显然有,O <,y(R,D), l,y(R,D)给出了决策D对属性R之间相依性的一种测度。

基于可辨识布尔矩阵和分类系数的属性约简算法

基于可辨识布尔矩阵和分类系数的属性约简算法

2 粗 糙 集理 论 中的 主 要概 念
个信 息 系统 s可 以表示成 S=U, V f>, 中 , 表示 对 象 的非 空 有 限集 合 , 为论 域 ; A, , 其 称 A是 属性 的非 空有 限集 合 ; V= , 属 性 a的值 域 ; : 是 厂 U×A— 是 一 个 信息 函数 , 指定 中每一 个 它
可 以证 明 c ( =一 r ( ) 即 A 的核等 于 A的所 有约 简的交 集 . o A) e A , d
3 可 辨 识 布 尔 矩 阵
3 1 辨 识 布 尔 矩 阵 ห้องสมุดไป่ตู้ 定 义 .可
定义 5 设 S=( , ,) : A, 是一 个信 息 系 统 , 性集 n={ n , n } 出 的对 的 分类 为 X= 属 n , … 导 { , , 。 … } 布尔矩 阵 C=( ) 称 为 . . : s的可辨 识 布尔矩 阵 . 中 : 其
定 义 3 在信 息系统 s中 , , : 如果 i ( a ) n ( ) 则 称 属性 a多余 , n A{ } =i A , d d 否则 , a是 必 要 的 . 称 如果 A的属性都 是必要 的 , 称 A是独 立 的 . 则 A中所有 必要 属性 组成 的集合 称为 A 的核 , 为 cr( . 记 o A) e
1 引 言
粗糙集 是 由波 兰数学 家 Z.a l P wa k提 出的 一种 处理 不 精 确 、 确 定 与 不 完 全数 据 的新 的数 学理 论 . 不 其主要 思想 是 , 保 持 信 息 系 统 分 类 能 力 不 变 的 前 提 下 , 过 属 性 约 简 导 出 问 题 的 决 策 或 分 类 规 在 通 则n . 】 粗糙集 理论 中的概念 与运算 都是通 过代 数学 的等 价关 系和集 合运 算 来定 义 的 , 多概 念与 运算 的 许 直 观性较 差 , 人们不 容易理 解其本 质 , 粗糙 集方 法建 立 的属 性约 简模 型 描 述能 力 一般 , 用 目前还 没有 高 效 的属性 约简算法 . 本文 定义 了信息 系统 的可 辨 识 布 尔矩 阵 的概 念 , 讨 论 了 它与 属 性 约简 之 间 的关 并 系, 定义 了度量属 性或属 性子集 分类能 力 的分类 系数 的概念 , 出了使用 分类 系数描 述粗糙 集 中概 念与 给 运算 的方 法 . 可辨识 布 尔矩 阵上作业 , 照分类 系数 的大小 使用 贪婪算 法 , 在 依 得到 了一种新 的简 明、 高效 的属性 约简算法 .

分类算法中基于差别矩阵的属性约简方法

分类算法中基于差别矩阵的属性约简方法
收 稿 日期 :2 1 —02 00 1—2
基 金 项 目:河 北 省 自然科 学 基 金 资助 项 目 ( 2 1 0 19 ) F 00 0 2 8
作 者简 介 : 何 海 涛 (9 8) 16 一,女 ,云 南 昆 明人 ,博 士 ,教 授 , 主要 研 究 方 向为 计 算 机 智 能控 制 、计 算机 仿真 、数 据 挖 掘 ,E i m ̄l
素 的合取 范式转化为极小析取范式 , 但其 过程是相 当复杂的。
阵中非 空元 素的个数 , 利用单个属性 的不可辨识性 来计算 出现 频率最多 的属性 。 高鹏利 用基于等价类 的差别矩 阵进 行属性重要性计算 , 规则相容度 的 从 角度 出发 , 属性 约简过程可 以看作不 断剔 除论域 中 不相容规则 的过程 , 出了基于差别矩 阵和 动态划 提 分域 的属性约 简算 法 。 刘洋 口 将信 息论 定义 的属 性重要 性作为启 发 式信 息 , 并通过构造一个 条件 信息熵算子对 差别集
Байду номын сангаас
点仅 又满足点 的所有对象的个数,I ) ) 示 u l 表
满足 点6 c 满足点 或者 的所有对 象的个数 ,称劲 属
性相似度 。
为所考 虑对象 的非空有 限集合 ,称 为论域 ;A为属
u , 是屙 陛口 的取值构 成 的集 合 ,称 为a 的值 域 ;厂  ̄ :U A一陧 一 个信 息
阵, 本文 利用数据化简算法先 对数据进行处理 ,以
为信息表 的核 , 但在 定义差 别矩阵 中的每个矩 阵元 素时增加 了计算 量。

种 新的改进 的差别矩 阵及其 求核方法 对
上述 两种算 法进 行 了补充 与完善 同时有效地 降低

基于相对知识量重要度的属性约简算法

基于相对知识量重要度的属性约简算法

定义 2对于信息系统 . ( A, , ) B_ s , f . , C = 厂 A,

称 = ∈U[  ̄ x , X= ∈ lb x J B I k n 量. 如果论域 中的所有的元素只能划分为同一个等 价类 , 那么这时具有的知识量为最少. 数据库中的 X≠咖分别为 的 曰下近似集和 上近似集. 庐 ) p
属性其重要度不 同, 尤其是在现实生活中,采集到 的数据必然存在误差 , 甚至出现缺省值 的数据 , 常 表现为噪声数据和缺省值数据 , 这两种属性都会 出 现分类误差 ,直接影响约简的结果. 对于第一种属 性, 有允许一定范围误分类率的可变精度粗糙集模 型等方法来解决 ; 对于第二种属性 ,多出现在不完 备信息系统中, 通过为缺省值增加属性值 的方法来
解 决.
B 成 为 的 B正 域 , eBU一 成 为 的 负 X ng=
域 , n( = — X成为 的 边界域. 6 ) B 定义 3 对于给定的决策系统 ( , L d) 条 UC J , 件属性集合 c的一个约简是它的一个非空子集 c , 满足 :
1 W( )0 . n= ; 2 W(1 ; … ; , ;m= n, ;, ;, ; . n, , 凡 … ) (1 n … 凡 … … …
n) m; 3 .W ( ,2 … , = ( ,2 … ,m + (2 J , ‰) l , r ) W , i
重要度 属性约 简
的概念. 以属性相对知识量重要度 为启发式信息 , 出 了一种属性约简算法,通过 实例证 明 了该算法的有效性. 提 关键词 : 相对知识量 中图分 类号: P 1 T31 文献标识码 : A
P wa a lk等人提 出的粗糙 集理 论 , 为一 种处 理 作

基于差别矩阵和动态划分域的属性约简算法

基于差别矩阵和动态划分域的属性约简算法
23 2 1, 9 00 00 1( 3 )
・人 工 智 能 。
计 算 机 工程 与设 计 C m u r n i en d eg o pt E g er g n D s n e n i a i
基于差别矩阵和动态划,江 苏 常 州 2 3 0 ) 10 1
是记录 与属性 的映射 函数 , , 表示对象 e关于 属性 a的取 Aae )
值 。在 属 性 a上 取 值 为 的元 素 集 合 记 为 [ ] 。
Fia l, a x mp ei c rid o t o d mo s aet ea g r h n l y n e a l a r u e n t t l o i m. s e t r h t
Ke r s o g e; dse bl t x u l o aiit; atiuerd cin d a i at in g ywo d :ru hst ic miit mar ;r ec mp t l i y i bi y t b t u t ; y m cp rio i r e o n t n
决 策 树 的 构 造 最 后 给 出 了具 体 的 实 例 。
关键词 : 粗糙 集; 差别矩 阵;规 则相容度 ;属性 约 简;动 态划分
中 图法 分类号 :]12 1P8
文献标 识码 : A
文章编号 :0 072 (0 0 0 .0 00 10 .0 4 2 1) 92 3—4
Al o i m f t i u er d ci nb s do ic r i i t ti n y a i g r h o t b t e u t a e n d s e nb l ymarxa d d n m c t ar o i
Ab t a t Ai n t h r b e st a s t i u er d c in ag rtm al r g i u h d p i ae ee n n s r n t e sr c : mi g a ep o lm t t h mo t t b t e u t l o i ar o h C l b n m c u l t lme t d mu two k o h i n c a wh l e ii ntb e t emeh d l g f o t d c e t i u e e u t na dr l e e a in c mp e i r s n e . F r t , d s oed c so l , h t o o o yo h w r u et t b t d ci e n r t o lx t i p e e td a oe h ar r o n u g o ys isl y i—

基于差别矩阵的启发式属性约简算法及其应用

基于差别矩阵的启发式属性约简算法及其应用

O 引 言
属性 约简是粗 糙集理 论 中 的一个核 心部分 。 至 今 人 们 已 经 提 出 了基 于 S o rn差 别 矩 阵 的属 性 约 kwo
从 相 对 D 核 出发 。 用 属 性 重 要 度 将 相 对 D 核 利 扩展 为一个 属性约简 . 将其 浓缩为最佳 属性 约简. 再
c {, ()fx A () , l fx#vj Zx = o ( ) ) (

( 2 )

( ( . ) )
从 上述定 义 中易得 出 , 当差 别矩 阵的元 素 为
时 , 示 论 域 中 的两 个 对 象 所 有 属 性 值 相 同 , 决 表 但 策值 不 同 , 该两个对象对应 的决策树不相容 的 , 即 从 而该决 策表为不相容 的 ; 当 为 一 , 示 两 个 对 象 时 表 的决 策 值 相 同 ,即决 策 属 性 在 同一 个 等 价 类 中就 没
广 东技 术 师范学 院 学报 ( 自然科 学 ) 21 0 0年第 2期 Ju a o u n dn o tcncN r l nvri o r l f ag o gP l e h i oma iest n G y U y N .,0 0 o 2 1 2
基 于差别矩 阵的启发式属性 约简算法及 其应用
11决 策 表 的 差 别 矩 阵 . 是 对 象 的 一 个 非 空 有 限 集 合 则 定 义
C l l 木

设 D =UCUD V 是 一个 决 策 表 , 中 , T (, , 其 论域 。 , …x}Iln , n, = , U
水 水


终 得 到 的 最 简 规则 , 全 部 数 据 约 简 量 最 大 . 或 为 了获 得 最 佳 属 性 约 简 ,我 们 从 不 同 的角 度 人 手 对 其 进 行 研 究 .覃 政 仁 从 粗 糙 集 理 论 出 发 给 出 了 最 佳 分 割 的定 义 。使 得 应 用 粗 糙 集 理 论 对 海 量 数 据 进 行 合 理 处 理 提 供 了理 论 依 据 ; 献 [] 处 理 在 决 文 1对 策 支持 系 统 中动 态 地 添 加 一 个 新 的知 识 时 ,提 出增 量 式 属 性 约 简 算 法 ,很 好 地 处 理 了知 识 的动 态 增 长

一种改进的最小属性约简算法

一种改进的最小属性约简算法
其 中一个 核属 性 , 必会漏 选其 他 的核属性 , 所得 的 结 果就 不是正 确 的 了. 另外 , 文献 [ ] 4 中的 方法 是 对 整个 论域元 素 依 次 进行 计 算 , 就 会 出现 重 复 这 计 算 的现象 , 增加 了算 法 的复杂 度 , 降低 了效率 .
定 义 6 如果 有 相 同条 件属 性 的数 据 同时 其 决 策属性 的 值 也 相 等 , 称 该 决 策表 为相 容 决 策 则
定 义 1 设 S一 ( R, , , 于 每 个 属 性 U, F) 对
基于 正区域 的求解 算法 , 时在求解 的过程 中会 结 有 合属性 的重要性 、 信息等 ;2 基于 差别矩 阵 的求 互 ()
解算法 ;3 ( )基 于智 能 计算 的求 解 方法 , 基 于 遗 如 传算法 和神经 网络 . 着 问题 规模 的增 大 , 于 差 随 基 别矩 阵求 解算法 的缺陷会愈 加凸显. 有时在 利用 正 区域或差别 矩 阵求解 时 , 结合 属 性 的重 要性 、 常 J
第 3 6卷 第 3期 21 0 2年 6月
武 汉理 工大 学学 报 ( 交通 科学 与工 程版 )
J u n lo u a i e st fTe h o o y o r a fW h n Un v r iy o c n l g
( a s o tt nS in e& En ie r g Tr n p rai ce c o gn ei ) n
子 集 P R, 义 属 性 P 的 不 可 区 分 关 系 定
I ND( 一{ . ) P) ( , ∈U。 Vr 2 2 { ∈P, ( r 一f( 厂 ,) Y,
r )如 果 ( ) I ), z, ∈ ND( , 称 z 与 . 是 P 不 P) 则 y

基于决策规则的属性约简算法

基于决策规则的属性约简算法

2 粗糙 集基本概 念 竹
定义 1 设S (,,,) 一 =UA f 为 信息系 其中: 是 V 统, 对象的 空有限 合, = x, ) A 非 集 U {, …, ; 是 1, )
属性集合 ;V= U , 是属性 a的值域 ;f: Ux A
’ ’
是一个信息函数 , 它为每个对象的每个属性赋
HIDB Y  ̄ ,N () , N ( {l Uy DBx ) Y I j
为方便起见 ,在不产生混淆的情况下用 代替 ID(1 N B.
定义 3 设S (,,,) = UAVf 是一个决策表,A C D C , = , D= 其中c U N 为条件屙f 生 集,D为决策属
・ 通讯作者 : 李相朋 ( 9 3 ) 男 , 16 一 , 教授,研究方向: 信息系统与知识发现
第2 4卷 第 6期
2 年 1 月 01 1 2








V_ .4 NO 6 0 2 . 1
D ec. 20 11
J U RN A L O OF W U H AN TEX TI UN I LE VER SI TY
基 于决策规则 的属性约简算法
廖 倩, 李相 朋
a EA ’ ’
予一个信 息值 ,即 V ∈ ,∈ , (,) V x U a Af ∈ a。若 A可 以分 为条件属性集 C和决 策属性集 D ,即
A=CU CN ,则称该信息系统为决策系统决策表 。决策表分为一致决策表和不一致决策表 ,本文 D, D=
讨 论一 致决 策 表 。
0 -Xiy) 时 , , 不确 定 的规则 。显 然 ,- Xi , <]( ,, <1 是 t  ̄ . y ,则 是确 定规 则 。本 文讨 论一 致决 策表 ,它 c 生成 的决 策规 则都 是确 定性 规则 。

利用粗糙集理论解决无标签数据分类问题的技巧

利用粗糙集理论解决无标签数据分类问题的技巧

利用粗糙集理论解决无标签数据分类问题的技巧在机器学习领域,数据分类是一个重要的问题。

然而,当我们面对无标签数据时,即没有事先给数据打上标签的情况下,分类任务变得更加困难。

为了解决这个问题,粗糙集理论被引入并被证明在无标签数据分类中具有很好的效果。

本文将探讨利用粗糙集理论解决无标签数据分类问题的一些技巧。

首先,我们需要了解粗糙集理论的基本概念。

粗糙集理论是由波兰学者Zdzisław Pawlak于1982年提出的一种数学模型,用于处理不完全和不确定的信息。

在粗糙集理论中,数据集被表示为一个包含若干属性的表格,每个属性可以取多个不同的取值。

根据属性的取值,数据集可以被划分为不同的等价类。

等价类是指在某个属性上取值相同的数据的集合。

通过对等价类的分析,我们可以得到数据集的粗糙近似。

在无标签数据分类问题中,我们可以利用粗糙集理论的粗糙近似来进行分类。

具体而言,我们首先将无标签数据集进行属性约简,即从所有属性中选择最具有区分度的属性子集。

属性约简的目标是最大程度地减少属性的数量,同时保持数据集的分类能力。

通过属性约简,我们可以得到一个更加简化的数据集,其中只包含最重要的属性。

接下来,我们可以利用属性约简后的数据集进行粗糙集分类。

粗糙集分类的核心思想是通过计算数据集中每个数据对象与已知类别之间的相似度来进行分类。

相似度的计算可以基于属性约简后的数据集进行,也可以基于原始数据集进行。

根据相似度的计算结果,我们可以将无标签数据集中的每个数据对象划分到最相似的已知类别中。

除了属性约简和相似度计算,还有一些其他的技巧可以提高粗糙集分类的性能。

例如,我们可以利用属性间的关联性来进一步提高分类的准确性。

属性间的关联性可以通过计算属性间的互信息来衡量。

互信息可以度量两个属性之间的相关程度,从而帮助我们选择最具有区分度的属性进行分类。

此外,我们还可以利用聚类算法来辅助粗糙集分类。

聚类算法可以将数据集中的数据对象划分为不同的簇,每个簇代表一个类别。

数据约简方法的研究

数据约简方法的研究
Key words: The data reduction, RoughSets theory, the data mining, the network teaching appraisal, to calculates.

Rough Sets理论是1982年由波兰数学家Z. Pawlak提出的对不确定知识进行表示的理论。近年来,粗糙集作为一种新生的处理不确定性知识的数学工具,由于其独特的计算优势,及其在数据挖掘、机器学习、数据库知识发现、决策分析、专家系统和决策支持系统等方面的成功应用,粗糙集数据分析(RSDA)逐渐被公认为人工智能领域最具潜力的五大新兴技术(粗糙集理论、神经网络、演化计算、模糊系统及混沌系统)之一。同时,该理论还在农学、医学、化学[2]、材料学、地理学、管理科学和金融等其他学科得到成功应用。现在决策表又在决策表属性简化、决策规则的简化是粗糙集理论与实际应用的主要研究方向之一。约简是粗集理论的重要内容,通过删除知识库中多余的属性集(值),来保留知识库中的重要知识,以提高知识的质量,方便用户决策.近年来,许多学者通过不同的方法从不同的角度对决策规则获取(值约简)做了深入的研究。约简包括属性约简和属性值约简,在进行属性值约简之前我们必须先进行属性约简。目前,静态的属性约简算法主要有两类,一类是基于信息熵的算法。另一类是基于可辨识矩阵和可辨识函数构造的属性约简算法,下面据此理论进行发散研究,并将其成功运用于学校师生教学评价管理之中,提升教学管理水平。
关于U的一个划分 定义为: ={ }
其中Xi U,Xi ,Xi Xj= ,i j,i,j=1,2,…n, =U.U上的一族划分称为关于U的一个知识库(knowledge base)。
设R是U上的一个等价关系,U/R表示R的所有等价类,或U上的划分构成的集合,[X]R表示包含元素X U的R等价类。

第四章 属性值约简(决策规则约简)

第四章  属性值约简(决策规则约简)

第四章属性值约简(决策规则约简)§1 属性值约简属性约简分两类,一类是信息表约简,一类是决策表约简。

信息系统S={U,A}的约简,是对整个属性集A进行约简,要求利用最少属性的属性集能提供与原属性集A同样多的信息,在此若是冗余属性,则是将a 去掉后则A-{a}与A具有同样的分类能力,即有下面相同的等价类族:若是独立的,即中任意去掉一个属性,都将改变其分类能力,则就是A的一个约简。

A的约简是A中独立的子集P并且P与A具有同样的分类能力,而中的属性对P来说都是冗余属性。

信息表的特点是属性集不再划分为条件属性集和决策属性集。

对于决策表来说,约简的情况不同,它不是针对整个属性集A进行的,约简的只是条件属性集。

决策表的约简分两部分:第一步:属性集约简若果,满足P是关于决策属性集D独立的,并且,则P是C的D约简。

C中的所有D约简的交称为C的核,记作。

第二步:属性值约简设是一致性决策表,是C的D约简。

值约简是针对相对约简而言的,或说属性值约简是对决策表上每一条决策规则来说的。

关于决策规则中属性值约简,下面例题提供了属性值约简的理论依据。

决策表上一条决策规则的条件属性值可以被约去,当且仅当约去该属性值后,仍然保持该条规则的一致性,即不出现与该条规则不一致的规则。

约简算法的步骤为:1 约简属性集;2 约简决策规则,即属性值约简;3 从算法中消去所有过剩决策规则。

关于决策表的属性约简和决策规则的属性值约简,看下面例子。

例1 简化给定决策表,其中为条件属性集,为决策属性集第一步:约简属性集:从决策表中,将属性A中的属性逐个移去,每移去一个属性立刻检查其决策表,如果决策表中的所有决策规则不出现新的不一致,则该属性是可以被约去的,否则,该属性不能被约去,称这种方法为属性约简的数据分析法。

解法1:从条件属性集中移去c列后,决策表不出现新的不一致,所以c列可约去;从中移去a或移去b,或移去d后,决策表中都出现新的不一致,故a,b,d都不能移去,即a,b,d都是C的D核属性。

基于二进制可辨矩阵属性重要度的属性约简算法

基于二进制可辨矩阵属性重要度的属性约简算法
cas tru h at b t n rd cin n rl rd cin, e c v t n wld e n rd c n w e g . u te ls , o g t u i e u t a d ue e u t h i r o o o t x a ae k o e g a d e u e k o ld eB t h o atiuin rd cin i rbe ,n i n e s t b e l e y k o e g o l i t n meh d h t b t e ut s r o o a NP p o lm a d t e d o e r ai d b n wld e f ei t i to .T e z cao
ag r h c n g tt e s letat b tsq iky a d b e i d e s y lo tm a e h mals t ue uc l n e ra z a i .An ti rv d t e wok be i h i i r l e l d i s po e o b r a l n te
有些属性是冗余的。 约简的关键是求 出决策表的最小条件属性集 , 去掉冗余属性 , 得到简化的决策表。 文中根 据粗集理论中二进制可辨矩阵的相关概念 ,提出了一种利用二进制可辨矩阵的属性重要度实现属性约简的 算法 , 该算法能快速求得最小条件屙 陛 集且实现简单。
1相 关概 念
定义 1 设决策表 ( , , , t 1 兄, 其中: 表 相应的二进制可辨矩阵构造如下: 1 2…, R G D C = )c ( , , c D { , , , 1) = U ( nD t ;=c C …, 1; , p 12 ; =e 决策 )
W ANG Xi o y n a -a

粗糙集理论的核心算法及其在实际问题中的应用

粗糙集理论的核心算法及其在实际问题中的应用

粗糙集理论的核心算法及其在实际问题中的应用粗糙集理论是一种用于处理不确定性和模糊性问题的数学工具,它能够在信息不完备或不准确的情况下进行决策和推理。

本文将介绍粗糙集理论的核心算法,并探讨其在实际问题中的应用。

一、粗糙集理论的核心算法粗糙集理论的核心算法主要包括粗糙集近似算法和粗糙集约简算法。

粗糙集近似算法是粗糙集理论最基本的算法之一,它用于将不完备或不准确的数据集划分为若干个等价类。

该算法基于属性重要性的概念,通过计算属性的正域和反域来确定属性的重要性,从而实现数据集的划分。

粗糙集约简算法是粗糙集理论中的关键算法,它用于从原始数据集中提取出最小的、具有相同决策规则的子集。

该算法通过计算属性的依赖度来确定属性的重要性,从而实现数据集的约简。

二、粗糙集理论在实际问题中的应用粗糙集理论在实际问题中有着广泛的应用,尤其在数据挖掘、模式识别和决策支持等领域。

在数据挖掘中,粗糙集理论可以用于特征选择和数据预处理。

通过粗糙集约简算法,可以从原始数据集中提取出最重要的特征,减少数据维度,提高数据挖掘的效率和准确性。

在模式识别中,粗糙集理论可以用于特征提取和模式分类。

通过粗糙集近似算法,可以对模式进行划分和分类,从而实现对复杂模式的识别和分析。

在决策支持中,粗糙集理论可以用于决策规则的生成和评估。

通过粗糙集约简算法,可以从原始数据集中提取出最简化的决策规则,为决策制定提供支持和指导。

除了以上应用,粗糙集理论还可以用于知识发现、智能推理和不确定性推理等领域。

它的优势在于能够处理不完备或不准确的信息,提供一种有效的决策和推理方法。

总结起来,粗糙集理论的核心算法包括粗糙集近似算法和粗糙集约简算法,它们在实际问题中有着广泛的应用。

通过粗糙集理论,可以处理不完备或不准确的信息,提高数据挖掘、模式识别和决策支持等领域的效率和准确性。

粗糙集理论为我们解决实际问题提供了一种有效的数学工具。

高校大学生分类管理中基于等价类的属性约简算法应用

高校大学生分类管理中基于等价类的属性约简算法应用
Computer Science and Application 计算机科学与应用, 2020, 10(4), 665-675 Published Online April 2020 in Hans. /journal/csa https:///10.12677/csa.2020.104069
徐春明 等
高校大学生分类管理中基于等价类的属性约简 算法应用
徐春明1,林 强2,王 璨3*,杨 楠4,薄 瑜3 1大连科技学院学生处,辽宁 大连 2大连科技学院院长办公室,辽宁 大连 3大连科技学院数字技术学院,辽宁 大连 4大连科技学院经济与管理学,辽宁 大连 Email: 652196979@, *297413904@
Application of Attribute Reduction Algorithm Based on Equivalent Class in Classification Management of College Students
Chunming Xu1, Qiang Lin2, Can Wang3*, Nan Yang4, Yu Bo3 1Students’ Affairs Division, Dalian University of Science and Technology, Dalian Liaoning 2Dean’s Office, Dalian University of Science and Technology, Dalian Liaoning 3School of Digital Technology, Dalian University of Science and Technology, Dalian Liaoning 4School of Economics and Management, Dalian University of Science and Technology, Dalian Liaoning Email: 652196979@, *297413904@

基于差别函数的属性约简算法在电子商务中的应用

基于差别函数的属性约简算法在电子商务中的应用

y= )
ቤተ መጻሕፍቲ ባይዱ
, 的确定 性 因子 。 然O1≤1 为 肛为r 显 < . , t
1 , 时 称决 策 规 ̄ r l 是确 定 的 ,  ̄ r 不确定 的。 l l 否 l是 J l
^ P =(, ∈ × Va∈P (, ( ) { y l fx )
Uf Po
, , D( ) 等价 关 }I P 是 N
第9 第 l期 卷 2
2 1年 1 00 2月
软 件 导 刊
Sot r i fwae Gude
VO . o 1 19N .2
Twe 2 0 . 01
基于差别 函数 的属性 约简 算法在 电子 商务 中的应 用
金 玲玲 朱 紫焱 苏 莉 , ,
( . 南师 范大 学 数 学与 统计 学院 , 南 海 1 5 15 ;. 州大 学, 1海 海 : 7 1 8 2郑 7 河南 郑 州 4 0 0 ) 5 0 1 摘 要 : 着电子 商务 的发展 , 领域 已积 累 了大 量商务 数据 , 是 这些数 据 中往往 存在 许 多冗余 的信 息。结合粗糙 随 该 但

lU , Va∈CU , 是论 域 与属 性的 映射 函数 d () 示对 象 = 厂 o 表 x
关 于属性n的取 值 , 7 £ ⅡVa 户{ 『 ( ∈CUD } _ ) 。 定 义2 根 据定 义 1 令A=CUD, A, 决 定 了一 个 : , 若P 则
上 的不 可 分 辨 关 系I D( ) N P:
如s[] — 出s[] []f[]≠ ( c ( D 3 。 ) ),
其 中 , 基 于 属 性集 C,所 在 的等 价 类 , ( ]) 对 [ ]是 如s 是
[] 的描述 , 即对于 []各 条件 属性 的 特定取 值 。 定 义6 确 定性 因子 。根 据定 义5 对于 给定 的决策 规则r令 : , , ∈[ cY∈[ D习 么 : ], ],B

基于多决策值等价类的属性约简

基于多决策值等价类的属性约简
Ab s t r a c t :F o r t h e a t t r i b u t e r e d u c t i o n p r o b l e m o f d e c i s i o n i n f o r ma t i o n s y s t e ms ,t h e c o n c e p t o f t h e e q u i v a l e n c e c l a s s o n l y i n c l u d i n g t h e c o n d i t i o n a t t r i b u t e s i s i n t r o d u c e d . Th e n e c e s s a r y c o n d i t i o n o f i mp l e me n t i n g a t t r i b u t e r e d u c t i o n a n d t h e a t t r i b u t e r e d u c t i o n me t h o d b a s e d o n t h e e q u i v a l e n c e c l a s s e s wi t h t h e mu l t i p l e d e c i s i o n v a l u e s a r e p r e s e n t e d .Af t e r s o r t i n g t h e c o n d i t i o n a t t r i b u t e s b y
Z HANG Do n g - we n ,QI U J i — q i n g ,LI Xi a o 。
( 1 .S c h o o l o f I n f o r m a t i o n ci S e n c e a n d E n g i n e e r i n g, He b e i U n i v e r s i t y o f ci S e n c e nd a T e hn c o l o g y , S h i j i a z h u a n g 0 5 0 0 1 8 , C h i n a ; 2 .S c h o o l o f S c i e n c e s , He b e i Un i v e r s i t y o f S c i e n c e a n d T e c h n o l o g y ,S h i j i a z h u a n g 0 5 0 0 1 8 ,C h i n a )

基于Relief属性重要度的快速约简算法

基于Relief属性重要度的快速约简算法
基于Relief属性重要度的快速约简算法
林芷欣,刘遵仁,纪俊
(青岛大学计算机科学技术学院,青岛266071)
摘要:邻域粗糙集是经典Pawlak粗糙集的扩展,能够有效的处理数值型数据&因为引入了
邻域粒化的概念,使用邻域粗糙集模型计算样本邻域度量属性重要度时,需要不断反复的对
负域中的样本进行邻域划分操作,算法计算量很大&为此提出了一种基于Relief算法属性
1邻域粗糙集模型
1.1邻域粗糙集的基本概念
定义1在一给定的N维实数空间Q中,△ =RNXRN *R,则称#为RN上的一个度量,若#满足以
下条件:
1) △ ! 1 ,孔)+ 0,其中当且仅当!1 %!时等号成立,,!1— RN ;
2) △ (( 1 !2 ) %△ ! 2,!1) ,, !1,! 2 — RN ; 3) △(! 1,! 3) . △ (( 1,!2) + △ ! 2,^3) ,V !1,!2,兄3 — R. ;
重要度的快速属性约简算法,降低计算邻域的算法时间复杂性&通过和现有算法运用多组
UCI标准数据集进行比较,实验结果表明,在不降低分类精度的前提下,该算法能更快速地
得到属性约简&
关键词:邻域粗糙集;邻域计算;Relief算法;属性重要度;属性约简
中图分类号:TP181
文献标志码:A
经典的粗糙集理论是Pawlak教授在1982年提出的(1),通过等价关系将论域划分为多个等价类,运用上 下近似的概念对目标实现知识发现&但这种建立在等价关系和等价类基础上的粗糙集理论只适用于处理离 散型数据,对广泛存在于现实应用中的连续型数据却不能够直接处理 &因此,作为粗糙集理论的扩展模 型一一邻域粗糙集模型被引入并广泛应用于连续数据的处理中与经典粗糙集不同 ,邻域粗糙集中的信 息粒子需要通过度量计算来确定,这在一定程度上增加了算法的计算量,消耗运行时间&为了得到更高效的 属性约简算法,胡清华等3提出了基于前向贪心搜索的邻域粗糙集前向搜索属性约简快速算法 (FARNeMF)。Liu等⑷对Hu算法中的正域计算模块进行改进,提出了更快速地FHARA算法&通过对 FARNeMF算法和FHARA算法分析可知,两者每次在做贪心选择之前,要对所有尚未选择的属性都计算 一遍,然后选择属性重要度最大的属性并入约简集&为此,本文提出一种基于Relief5属性重要度的快速约 简算法[58],首先通过对沧近邻样本的所有属性进行加权特征选择,一次性求得属性重要度大小的排列,避免 每次贪心选择之前都要对各个待选属性重复的进行重要度计算,节省时间开销,加快了算法的运行效率&

基于位运算的属性核约简

基于位运算的属性核约简

算法的核心是 求解 U I D R 产生 的分类 数 目 . : 由 /N () 此赞 法
I ns s 口函 数来 实现 , Idp主 要 是 通 过 从 低 位 到 高位 依 次 扫 描 I1 Ins s 没有 分 过 类 的 元 素对 应 位 。 后 , 后 面 没 有 分 类 的 高 位 中查 找 然 在 与 当 前 位 C r nBt 归 为 一 类 的 后 继 元 素 , 法 是 : 当前 位 ur ti可 e 方 将 后 面 没有 归类 的元 素 对 应 位 D t ti 与当 前 位 C r nBt 过 e cBt e ur ti通 e
维普资讯
20 0 6年 第 5期
福 建 电

11 0
基 于位运算 的属性核 约简
李天志 1. , 郭长友 ・ 2 陈德山
( 1德 州 学 院计 算 机 系 山 东德 州 23 2 . 西 大学 计 算机 与 电于 信 . 院 广 西 南宁’5 00 ) 503 2 广 也学 3 O 4
位 或运 算 组 成 一 个集 合 S b,Bt然 后 . 等 价 关 系簇 中 的 所有 u 8ti e : 对 等 价 类 进 行 检 测 . 果 所 有 等 价 类 都 包 含 S beBt 合 , 说 如 usti集 则 明 这 两 个位 对 应 的元 素 可 以 归 为 一 类 . 则 . 否 只要 有 一 个 等 价 类 不 包 含 S be i集 合 .那 么 D t ti与 C r nB t 代 表 的 元 u st t B e cBt e ur ti所 c 素不能归为一类 . 不用再检测其它等价类 . 直接检测 下面一个没 有 归 类 的 位 . 果 已经 将 元 素 归 类 , 如 则将 对 应 位 置 0 这 样 每 次 , 处 理 只 是对 非 0位 进 行 . 而 减 少运 算 次 数 。 从 为 实 现 算 法 我们 需 要 如 下 预 定 义 以及 等 价 类 结 构 体 :

基于优势-等价关系的属性约简算法

基于优势-等价关系的属性约简算法

基于优势-等价关系的属性约简算法吴婷婷;李艳;郭娜娜;何强【期刊名称】《南京师大学报(自然科学版)》【年(卷),期】2017(040)003【摘要】考虑多标准分类问题,即条件属性具有偏好关系而决策属性是无序的类别,通过在条件属性上引入优势关系而决策属性仍然用等价关系来描述不同的属性.针对这类信息系统,本文提出了一种基于样例对的矩阵约简算法.区别于传统的基于辨识矩阵约简方法,该算法在不计算辨识矩阵的前提下,通过选择样例对,来找到辨识矩阵中对约简有用的属性,因此,所提算法能够明显改善计算约简的时间耗费.进一步,为了处理较大规模的数据,提出了一种近似约简算法,该算法按属性重要性添加属性到约简中,进一步缩短了求取约简的时间.最后在UCI数据集上进行大量的实验与传统的约简算法进行了对比,表明了所提出算法的可行性与有效性.%Considering multiple criteria classification problems,dominance relations and equivalence relations can be respectively introduced to condition attributes and decision attributes to describe different types of data. Based on the dominance-equivalence relations,a novel attribute reduction method based on sample pair selection is developed to deal with this kind of information systems. Instead of calculating the whole discernibility matrix,the proposed method only store the useful attributes for attribute reduction by selecting the discerned sample pairs,and therefore it can significantly improve the time costin attribute reduction. In addition,we propose an approximate reduction algorithm in order to deal withcomparative large-scale information systems. This algorithm add attributes based on attribute importance and it's time saving. Finally,the experimental results on UCI data sets demonstrate the feasibility and effectiveness of the proposed algorithms.【总页数】7页(P45-51)【作者】吴婷婷;李艳;郭娜娜;何强【作者单位】河北大学数学与信息科学学院,河北省机器学习与计算智能重点实验室,河北保定071002;河北大学数学与信息科学学院,河北省机器学习与计算智能重点实验室,河北保定071002;河北大学数学与信息科学学院,河北省机器学习与计算智能重点实验室,河北保定071002;北京建筑大学理学院,北京100044【正文语种】中文【中图分类】TP311【相关文献】1.基于优势关系粗糙集的属性约简算法 [J], 李向阳;桑林;李续武2.优势-等价关系下随机目标信息系统的属性约简 [J], 方连花;李克典3.优势-等价关系下序贯三支决策的属性约简 [J], 李艳;张丽;王雪静;陈俊芬4.基于优势关系粗糙集的属性约简算法 [J], 李向阳;桑林;李续武5.基于优势关系粗糙集的属性约简算法 [J], 向阳;桑林;李续武;因版权原因,仅展示原文概要,查看原文内容请购买。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

徐春明 等
高校大学生分类管理中基于等价类的属性约简 算法应用
徐春明1,林 强2,王 璨3*,杨 楠4,薄 瑜3 1大连科技学院学生处,辽宁 大连 2大连科技学院院长办公室,辽宁 大连 3大连科技学院数字技术学院,辽宁 大连 4大连科技学院经济与管理学院,辽宁 大连 Email: 652196979@, *297413904@
关键词
形式概念分析,等价类,属性约简
Copyright © 2020 by author(s) and Hans Publishers Inc. This work is licensed under the Creative Commons Attribution International License (CC BY 4.0). /licenses/by/4.0/
Application of Attribute Reduction Algorithm Based on Equivalent Class in Classification Management of College Students
Chunming Xu1, Qiang Lin2, Can Wang3*, Nan Yang4, Yu Bo3 1Students’ Affairs Division, Dalian University of Science and Technology, Dalian Liaoning 2Dean’s Office, Dalian University of Science and Technology, Dalian Liaoning 3School of Digital Technology, Dalian University of Science and Technology, Dalian Liaoning 4School of Economics and Management, Dalian University of Science and Technology, Dalian Liaoning Email: 652196979@, *297413904@
马垣[4]等人研究了减少多个属性的一次性渐减式概念格构造算法,该算法与减少单个属性的渐减式 算法有相同的时间复杂度,但当,减少多个属性时,单属性的渐减式算法需要反复执行多次,而该算法 只需执行一次;李进金等人[5],通过引入交式可约元的概念,给出了基于可约元的概念格生成算法。
国外学者针对属性约简的主要研究方向有两个:基于粗糙集的知识约简和利用不可辨识矩阵的属性 约简。Skowron 教授[6]提出了基于区分矩阵的求核算法,为今后对区分矩阵进行合取、析取运算,求出 形式背景的属性约简打下坚实的基础;Sabita Mahapatra [7]等利用粗糙集理论及不可辨识矩阵进行属性提 取并抽取出了决策规则,并与统计方法进行了对比。
Received: Mar. 31st, 2020; accepted: Apr. 15th, 2020; published: Apr. 22nd, 2020
Abstract
Based on the particularity of the college student group, this paper proposes to use formal concept analysis for classification management of students, which provides valuable reference for student workers. This paper applies characteristics of attribute and equivalent class to attribute reduction, puts forward judging theorems of attribute reduction with demonstration; secondly, proposes an algorithm of attribute reduction and output, applies this algorithm to classification management of college students for the first time. Specifications are as follows: first of all, establish a binary tree with attributes and obtain sequences of PreOrder, InOrder and PostOrder; delete an attribute; then perform intersection between the rest of attributes and each intent of concepts gradually, if each result contains single element, then this attribute can be removed, otherwise, skip this attribute, repeat the procedures above, consistent set can be obtained, reduction set which involves the minimum elements of consistent set can be output as well; subsequently, discusses the time complexity, this paper reduces the time complexity of reduction set output to polynomial level for the first time. Comparing with other algorithms on runtime and ability of classification, experimental results show that the proposed method approves feasibility and accuracy, in the end, draws a conclusion and discusses open issues.
Computer Science and Application 计算机科学与应用, 2020, 10(4), 665-675 Published Online April 2020 in Hans. /journal/csa https:///10.12677/csa.2020.104069
形式概念分析[3]最早由德国教授 Wille R.提出,以形式背景和形式概念为基础,开创了概念格理论 与应用研究的先河。随后形式概念分析作为一种数据和知识处理的有效工具,已被广泛应用于机器学习、 模式识别、数据挖掘、计算机推理、知识发现等领域。
随着形式背景中数据的增多,基于形式背景的概念数量会急剧增加。因此建立有效的概念格构造算 法及属性约简算法成为研究的热点。
Keywords
Formal Concept Analysis, Equivalent Class, Attribute Reduction
*通讯作者。
文章引用: 徐春明, 林强, 王璨, 杨楠, 薄瑜. 高校大学生分类管理中基于等价类的属性约简算法应用[J]. 计算机科 学与应用, 2020, 10(4): 665-675. DOI: 10.12677/csa.2020.104069
收稿日期:2020年3月31日;录用日期:2020年4月15日;发布日期:2020年4月22日
摘要
本文针对高校大学生群体的特殊性,提出利用形式概念分析进行学生分类管理,为学生工作者提供有价 值的参考依据。将属性特征与等价类的方法应用于属性约简,提出了属性约简的判定定理并予以证明; 其次提出属性约简及输出算法,首次将属性约简算法应用于高校大学生分类管理,具体做法是:根据属 性建立二叉树,调用前序、中序及后序遍历,得到相应序列,首先删掉一个属性,再将每个概念的内涵 与剩余属性求交集,若求交集的结果均为单元素集,则该属性可约,否则跳过该属性,重复以上步骤, 可以得到约简集;随后讨论了算法的时间复杂度,本文首次将约简集输出算法的时间复杂度降为多项式 级。通过实例分析,对比了其它属性约简算法的运行效率和分类能力,证明本文提出的算法具有可行性 和正确性。最后进行了总结并讨论了开放性问题。
Open Access
1. 引言
1966 年,克拉克(Clark)和特罗(Trow)从大学认同度(identification with college)和参与思想(involvement with ideas)两个维度将学生分为 4 类,分别为:学术型(academic)、社交型(collegiate)、职业型(vocational)、 不墨守成规型(nonconformist);李志峰[1]把学生分为高度匹配型、独立型、被动顺应型和排斥型等几种类 型,按照学生的不同类型形成多样化和更为自主性的管理范式,有利于调动学生学习积极性,促进学生 成长成才成功。国内研究大部分是以学生成绩、学习行为等依据进行分类,这种分类关注的是学习结果, 忽视了其他影响因素。学生分类管理,不能简单以学习成绩为依据,学习成绩好并不一定思想行为就没 有问题,分类管理的意义在于引导学生认识到一个真正优秀的人应该尽可能各方面都变得优秀。这才是 正确的教育过程。
国内学者主要以概念格属性约简为研究热点,概念格属性约简在保持形式背景中所有概念的外延集 不变的前提下,寻找极小属性子集,该属性子集依然能够完全确定形式背景上的原有概念,并保持它们 之间原有的层次结构关系。
王霞等人[8]主要研究了基于不可约元的概念格的属性约简以及属性约简集的构造,提出了一种概念 格的属性约简方法;王璨[9]等人通过设定阈值将模糊形式背景转换为经典形式背景,给出约简集的判定 定理,提出了属性约简及相对必要属性组合的输出算法;莫京兰[10]等对信息系统进行分布式处理,将子 系统的核与约简合并得到原系统的核与约简;徐怡[11]等人结合粒计算思想,提出基于属性分类的形式概 念属性约简模型,定义两个算子来划分属性之间分类关系,提出基于属性分类的形式概念约简算法,减 少了冗余计算和存储开销上述文献开创了属性约简研究的先河;Xiuyi Jia [12]等人定义了同一决策类中的 对象的类内相似度以及不同决策类之间对象的类间相似度。其次,通过最大化类内相似度和最小化类间 相似度定义基于相似度的属性约简粗糙集模型。在考虑启发式搜索策略的基础上,设计了一个属性约简 方法,实验结果表明文中提出的算法能够提高分类的性能。
相关文档
最新文档