基于改进CLARANS算法的孤立点检测
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
K y w o ds o t e , e r u l r CLARANS ag r h ,C u tr g Alo t ms aa mi ig i l o t ms l se n g r h ,d t n n i i i Cl s a s Num b r TP 01 6 e 3 .
是 由 R y n . g和 J w i a amo dT N i e H n提 出的 , a 是一 种
的特例 、 观测 结果 与模型 预测值 的偏 差等 。在信 用 卡欺诈 探测 中发现 的孤立 点 可能预示 着欺诈 行 为 , 及时 发现这种 信用 卡 欺诈 行 为对 商业 银 行 而 言相
陈 宝国
( 淮南 师范学 院数学 系” 淮南
摘 要
荀 小苗
兰州 7 电子与信息工程学院 30 1 (
聚 类算 法 是 数 据 挖 掘 里 的 一 个 重 要 研 究 问 题 。 简 单 介 绍 C A A S算 法 的 基 本 思 想 , 尽 描 述 了 改 进 的 L R N 详
Ou l rDee to s d o t e t c i n Ba e n CLARANS Al o i m s i g rt h
Ch n B a g o e ou Xu a m io n Xi o a 。
( te t sd p r e t f u ia o m l nv ri , u ia 2 2 0 ) Mah ma c e at n o an nN r a U i s y H a n 3 0 1 i m H e t n ( c o l f l t nc a d Ifr a o n i e n , a z o i tn nv r t , a z o 7 0 7 ) S h o o e r i n no t n E gn r g L n h uJ o g U ies y L n h u 3 0 0 E co s m i ei ao i
种潜 在的知识 , 分 类 中 的反 常 实例 、 满 足 规 则 如 不
空 间数据 库技 术 等 。 聚类 算 法 中 C A A , B L R NS D — S A B R H等都 有 一 定 的噪 声 处 理 能 力 , 用 C N, I C 可
于孤 立点 检 测领 域 。在 此 针对 C A A S做 出一 L R N
当重 要 , 以避 免不 必 要 的经济 损 失 。 因此 , 可 孤立
基 于划 分 的聚类 算 法 , 于 k一中心 算 法 ( 属 k—m — e
d is 的变 种 。 od )
给定 n个对 象 , 找到 k 将 个簇 中心 点 的过程抽
点 的探 测和 分析就 成 了一 个有 趣 的数 据挖 掘任 务 ,
l 引 言
通过数 据挖掘 , 以从真 实数据 库 中获取数 据 可 的一般 模型 。但 是 , 并非 数据库 中所 有数据 对象 都 符合挖 掘出 的数 据模 型 。一 些 噪 声 数据 对 象 会 影 响 到数据挖 掘 的精 确度 , 甚至会 产生 很差 的挖掘 效 果 。这类数 据对 象 称 为孤 立 点 。孤 立 点 可能 是 某
即孤立 点挖掘 。常 见 的孤 立点 检测方 法分 为三类 :
Ab t a t Cl s rn g r h sa mp a n r b e i e f l f t nn .Th sp p rito u e h i d a src u t i g Alo t msi n i o a t o lm n t ed o a Mi i g e i p h i Da i a e r d c ste man i e s n
维普资讯
总 第 25期 2 20 0 8年 第 7期
计 算 机 与 数 字 工 程
Com p tr& D iia g n e n ue gt lEn i e r g i
Vo13 . 6 No. 7
l 5
基 于改进 C A A S算 法 的孤 立 点检 测 L R N
ao b utCLARANS,d s rbe he ma n i asa d t scse sa u m p o n ec i st i de n heba i tp bo ti r vig CLARA NS ago t m si ti,p ovde t u — l r h ndea l r i sisf r i te n ysson e p rmena t a d gie i h ra al i xe i tldaa, n v s a smpl u m ay a o t s f l e s i o e fels es m r b uti u e u n s n s m d . s i
C A A S算 法 的 基 本思 想 和基 本 步 骤 , 过 实验 数 据 对 其 进 行 进 一 步 分 析 , 对 其 应 用 领 域 做 出 简 单 概 要 。 L R N 通 并 关 键 词 孤 立 点 C AR NS算 法 聚 类 算 法 数据 挖 掘 L A 中图 分 类 号 T 3 16 P0 .
定 的研究 工作 , 出改 进思想 。 给出实验 分析 。 提 并
2 C A A S算 法 基 本 过 程 L R N
C A NS( ls r L re p l a o ae L RA Cut agr A pi t n b sd e ci
u o ad mie e c , p nR n o zdS a h 也称 随机 搜索 聚类 算法 ) r