Rough算子求解不一致信息系统的约简算法
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大数据库 中每一行记录可以看成 一个 概率事件 , 每个事件是 由各变量的一定观测值组成。利用文献
[ ]R u h算子 概 念 , 4 og 找到 了一 种测 度来 度量 该事件 的模糊 性 。如果 该测 度 记 为 k ( ) 对 任意 条 件属 D ,
性集
C 事件 D在系 统 中以程 度 k ( 依赖 于 , 么递增 式反 向求 解是 当逐 渐增 加观测 量 { 时 , , D) 那 o}
维普资讯
第2 7卷 第 6期
20 0 6年 1 2月
河 南 科 技 大 学 学 报 :自 然 科 学 版
J u n lo n n Un v ri fS in e a d T c n lg : a u a ce c o r a fHe a ie st o ce c n e h oo y N t r lS in e y
V0 _ 7 N . l2 o 6
De . c 20 6 0
文章 编号 :6 2— 8 l 2 0 ) 6— 0 7— 4 17 6 7 ( 0 6 0 0 2 0
R u h算子求解不 一致信息 系统 的约简算法 og
程玉胜 , 张佑生 胡学钢 ,
(. 1合肥工业大学 计算机与信息学院 , 安徽 合肥 2 00 ;, 30 9 2 安庆师范学院 计算 机与信息学院 , 安徽 安庆 2 6 1 ) 4 0 1
构 造递增 式反 向求 解约 简关 键是 如何选 择事 件 的最佳 观测量 , k 。( 使 。D)值 增 加最 快 , 而 用最 从 小 的代 价求 出约 简 。 主要 涉 及 到如 何定 义算 子 k (定性 事件 本 集 和不 确定性 事件 集 , 子 k( 算 D)的定 义 等 , 出了项集 的构 造 , 给 递增 式 反 向求 解 方法 等 , 并用 实 例 与
其中 o E c—B,模糊性减 少 , 赖度 k + l( )增 大 , k + l D)= 1时 , 依 ll D a 当 [l a( 事件 模糊 性为 0 因此按 条 , 件属 性集 + { o }能完全 准确 地推 导 出事 件 D, 以 + { 是 系统 的 约简 。 所 o}
=
POS
一
j , a
i 则 口是 可去 的 , 则 口 是不 可去 的 ; l 否 不难发 现如 果约简 集基 数远 小 于条件 属性集 基数 则很
难求 出 系 统 的 约 简 集 , 小 约 简 集 求 解 就 更 加 困难 。( ) kwo 最 2 So rn提 出 的 基 于 分 辨 矩 阵 法 求 解 约 简 J其矩 阵空 间复杂 度 为 O( ×m), 象 集基数 制 约 了该 方法 的应 用 。这 两 种方 法 都不 利 于 在大 , N 对 数据 库 中求解 约简集 , 因为通 常数 据库记 录数 都很 大并且 字 段数也 较多 不适 应 于处理 不一致 信息 系统 。 为此 , 多学 者提 出了各 种约 简方 法 , 张文 修提 出 的上 下分 布约 简 , 大分 布 约简等 , 可能保 持 了原 许 如 最 尽 决策 系统 的决 策分 布情况 。相 对 于经典 粗集 方法 , 文提 出 了一种 递 增 式 反 向求 解 方法 , 本 主要 思路 是 :
经典 粗 集方 法 进行 了对 比 , 明该 方法 是可 行 的。 说
1 R u h算 子 及 相 关 定 义 og
在 大数据 库 中 , 可 分辨类 可 以通 过投 影 ( 不 Ⅱ)操作 ‘ 来 实现 , B) ;1 { { } , Ⅱ( " Ⅱ b }文献 [ ]称 3 4
D在信息系统中以程度 k 0≤ k≤ 1 依赖于 c 记成 C D 其中 ( ) , 一 ,
摘要 : 为求解不一致信息系统 的属性约简 , 在经 典粗 集理论模型 的基 础上 , 多学者提 出了上 、 分布约简 等 许 下
方法 , 但是 , 些方 法尽可 能保持 了原 决策系统 的决策分布情 况并且 当数据集基数较 大时 , 这 时间空问复杂度 都 较大 。本文从 另一个视 角将 大数 据库 中记 录看 成概 率事 件 , 用粗 集理 论 导 出规则 的 模糊 性度 量方 法一 利
0 引言
假设信息系统 I S=( , , ) 其中 C为条件属性集, UCD , c={。o , o }D为决策属性集 ; 为对 口, …, ;
象集 , Ⅳ为 的基数 。 在信 息系 统 约简¨ 时 , 典 的粗 集理 论是 基于 以下两 种 方法 :1 如果 P S ( 经 () O D)
(0 6 j4 B 20 k0 0 ) 作 者 简 介 : 玉胜 ( 99一) 安 徽 桐 城 人 , 教 授 , 士 生 , 程 16 , 副 博 主要 从 事 数 据 库 与 数 据 挖 掘方 向 的研 究 .
k= cr ( S ( / ad U) ad PO c D) c r ( 定 义 1 确 定性事 件 集 、 不确 定 性事 件集
设
C, Ⅱ( 令 B)= { , , , }, D)= { 】 , , } 则 确定性 事件 集记 为 。置 … Ⅱ( y, … ,
基金项 目: 国家 自然科 学 基 金项 目( 0 7 03) 6 5 5 2 ;博 士 学科 点 专 项科 研基 金 ( 0 5 3 9 1 ; 徽 省 高 校 省 级 自然科 学 项 目 20 0 50 2) 安
R uh 子, og 算 在多数优先的原则的基础上 , 将不一致信息系统转化为一致信息 系统 , 基于此提 出了递 增式反 并
向求 解 方 法 。 这 种 反 向求 解 思 想 也 为 在 大 数据 库 中 求解 约简 提供 了可 能 。
关键词 : 粗集理论 ; 信息系统 ; 属性约简
中图 分 类 号 :P 8 T I 文 献 标 识 码 : A