基于邻域粗糙隶属函数的离群点检测
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
n e ig hbo rho od
ro u g h m em bership
fun ctions was
propos
nu m erica l, sym bolic
and
h yb rid a ttrib u te da ta
Based on
the
m ixe d distance and adaptive
2019年 2 月 第 !〇卷 第 2 期
计算机工程与设计
COMPUTER ENGINEERING ANDDESIGN
Feb. 2019 Vol.40 No.2
基于邻域粗糙隶属函数的离群点检测
杨 晓玲1 ! ,张贤勇1!:
1 四川师范大学数学与软件科学学院,四 川 成 都 610066% 2. 四川师范大学智能信息与量子信息研究所,四 川 成 都 610066)
8 引言
现 有 的 离 群 点 检 测 [ 1 ’2] 有 基 于 统 计 的 3 % 基 于 邻 近 性 的 [4] 、 基 于 聚 类 的 5 和 基 于 粗 糙 集 的 6 7 等 方 法 。 基 于 粗 糙
集 的 检 测 方 法 主 要 采 用 等 价 关 系 与 等 价 类 ,适 用 于 符 号 型
Abstract: T h e o u tlie r
d e tection m e th o d based on c la s s ic tl ro u g h sets
is
d iffic u lt to
d e tl
w ith n
th is p ro b le m , the o u tlie r de tection based on
点 检 测 研 究 较 少 (]。对 此 ,本 文 基 于 邻 域 粗 糙 集 , 推 广 与
深 化 文 献 [ 6] 的 R M F 方 法 , 采 用 “ 邻 域 粗 糙 隶 属 函 数 ”
属 性 数 据 。 特 别 地 , 文 献 [ 6] 构 建 了 基 于 粗 糙 隶 属 函 数 的 离 群 点 检 测 方 法 (R M F 方 法 ), 并 取 得 较 好 效 果 。 然 而 ,
传统粗糙集检 测 方 法 难 以 处 理 数 值 型 属 性 数 据 ,因为必要 的 数 据 离 散 化 容 易 导 致 信 息 损 失 与 精 度 偏 低 。为 了 有 效 处 理 数 值 型 属 性 数 据 ,邻 域 粗 糙 集 应 运 而 生 ,但 相 关 的 离 群
度 , 构 建 邻 域 粗 糙 离 群 因 子 实 施 离 群 点 检 测 , 设 计 相 应 的 离 群 点 检 测 算 法 N ห้องสมุดไป่ตู้ M FO D 。 U C I数 据 对 比 实 验 结 果 表 明 , N R M F O D 算 法 具 有 有 效 性 , 优 于 3 种 常 用 检 测 算 法 (R M F 、 R B D 、 D I S 算 法 )。
D IS ).
Key words: o u tlie r d e te c tio n ;n e ig h b o rh o o d ro u g h s e t; ro u g h m e m b e rs h ip fu n c tio n ; h y b r id a tt r ib u te d a ta ; d a ta m in in g
摘 要 :针 对 传 统 粗 糙 集 的 离 群 点 检 测 方 法 难 以 处 理 数 值 型 属 性 数 据 的 问 题 ,提 出 基 于 邻 域 粗 糙 隶 属 函 数 的 离 群 点 检 测 方
法 ,其 适 用 于 数 据 包 括 数 值 型 、符 号 型 与 混 合 型 。基 于 混 合 型 距 离 与 自 适 应 半 径 ,定 义 邻 域 粗 糙 隶 属 函 数 刻 画 对 象 离 群 程
o u tlie r detection a lg o rith m N R M F O D
was
designed. A c c o rd in g
m e n ts o f U C I d a ta ,th e N R M F O D a lg o r ith m is e ffe c tiv e a n d is s u p e rio r to th re e u s u t l d e te c tio n a lg o rith m s d . e. , R M F , R B D ,
关 键 词 :离群点检测%邻域粗糙集%粗糙隶属函数%混合型属性数据%数据挖掘
中 图 法 分 类 号 : TP18
文 献 标 识 号 :A
文 章 编 号 : 1000-7024 (2 0 1 9 ) 02-0533-07
doi: 10. 16 20 8 /1 . is s n l0 0 0 -7 0 2 4 . 2019. 02. 041
O utlier detection based on neighborhood rough m em bership functions
YANG Xiao-ling1,2! ZHANG Xian-yong1,2—
(1 . C o lle g e o f M a th e m a tic s and S o ftw a re S cience, S ichuan N o rm a l U n iv e r s ity , C h en gdu 61 0 0 6 6 , C h in a ; 2. In s titu te o f In te llig e n t In fo rm a tio n and Q u a n tu m In fo rm a tio n , S ichuan N o rm a l U n iv e rs ity , C hengdu 610066, C hina)
fu n c tio n was defined
to
describe the
o b e t 2 o u tlie r degree, the
n e ig hbo rho od
o u tlie r factors
o u tlie r de tection , and the corresponding