利用数据挖掘工具分析上网流量
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ajs ns O ate e okrsucsnte sef i t s. d t tS t t r ore t fc n ue u me , t nw h h e i h mo i e Ke w r s a n g lw S L S re2 0 y o d : t mi n ; o ;Q ev r0 5 Da i F 主要技 术和 实 现方 法 主要技 术 :数据 挖 掘 。 ( )数 据挖 掘 的概 念 。数 据挖 掘 (a aM nn )从技 术 1 D t i ig 角度上讲就是从大量 的、不完全 的、有噪声的、模糊的、随机的 实际应用数据中,提取隐含在其 中的、人们事先不知道的、但又 是潜 在有 用 的信 息和知 识 的过程 。 ( )数据 挖掘 特 点 。数据 挖掘 技术 具有 以下特 点 : 2 处理 的数 据规 模十 分庞 大 ,达到 G 、T B B数量 级 ,甚 至 更大 。 查询 一般 是 决策制 定 者 ( 户 )提 出 的即 时随机 查询 ,往 往 用 不 能形成 精确 的 查询要 求 ,需 要靠 系统 本 身寻找 其可 能感 兴趣 的
摘 要 :本论 文 利用 S LSre20 Q e r05中的数 据挖 掘 工具 对 某单位访 问外 网的流 量及相 关信 息进 行 了分析 。通过 利 用聚 v 类 、决策树 、N  ̄e ae等模 型得 出 了影 响访 问流 量的 几 个关键属 性 。根 据 这次挖 掘 的结 果 ,网管人 员可在 时 间以及 网段 av B ys ' 等方面对流量进行一定的调整 ,从而使网络资源得到最有效的利用。 关. 词 :数据 挖 掘 ;流量 ;S re 05 t QLS vr 0 e 2
中图分类号 :T 31 P 1
文献标识码 :A 文章鳊号:i0— 59( 0 1 3 06 — 2 0 7 9 9 2 1 )1— 0 1 0
Us t i i gTo l oAn l z n e n t a c eDa aM n n o st a y eI t r e Tr f i
i fr t n wf e a ay e . h o g h s f cu trn ,e iin te s ie Ba e , cta f c h rf c mo e b an d n o mai f n lz dT r u h te u e o l sei gd cso r e , v y se . t a e t t e ta d lo ti e o f Na t h i s v r l e t iu e . c r i g t emi ig r s l , mea d n t o k a mi i ao sc n s g n ems o a f e ti e e a y a t b tsAc o d n o t nn eu t t n e r d n s t r a e me ti tr ft f c t c r n k r h si w r t n r i o a
计算 机光 盘软件 与 应用
21 0 1年第 1 3期
C m u e DS f w r n p l c t o s o p t rC o t a ea dA p ia in 工 程 技 术
利用数据挖掘工具分析上网流量
张 俊
( 州 洪泉 医院 ,江 苏江都 2 5 0 扬 2 2 0)
一
、
东西 。
在一 些应 用 ( 商业投 资等 )中 , 由于 数据 变化 迅速 ,因此 如 要求 数据 挖 掘能 快速做 出相应 反应 以随 时提 供决 策支 持 。 数据挖掘中,规则的发现基于统计规律 。因此,所发现的规 则 不必适 用 于所 有数据 , 是当达 到某 一 临界值 时 ,即认为有 效 。 而 因此 ,利 用 数据 挖掘 技术 可 能会发 现大 量 的规则 。 数据 挖 掘所 发现 的规 则 是动态 的 ,它 只反 映 了当前 状态 的数 据 库具 有 的规则 ,随着不 断 地 向数据 库 中加入 新数 据 ,需要 随 时 对 其进 行更 新 。 () 3 数据 挖掘 的主 要 算法 。 初 的数 据 挖掘 分类 应用 大多 都 最 是在这 些方 法及 基于 内存 基础 上 所构 造 的算法 。 目前数 据挖 掘方 法 都要 求具 有基 于外 存 以处 理大 规模 数据 集合 能力 且具 有可 扩展 能力 。主要 的算 法有 : 决策树
Zh n u a gJ n
Βιβλιοθήκη Baidu
(a g h uH n q a o pa,i g u 2 5 0 ,hn ) Y n z o o g u nH s i l a d 2 2 0C i tJn a
A s at h ae s Q e e20 t min ol fraui t acs etra nt r rfcadrl e bt c: i pprue S L Sr r0 5Da n gtos o nt o ces x nl e k t f n ea d r Ts v a i e wo ai t
K N法 ( - e r s e g b r N K N a e tN i h o ) Bys a e 法 二 、利用 SL Sr e2 0 进 行数 据挖 掘 O ev r0 5 ( )SA 简 介 一 SS
SA SS是 M co ot公 司的产 品 。Mc oo t O evr20 ir sf ir s f L re 0 5 S S A a y i ev c s( SS n ls s r ie SA )为商业智能应用程序提供联机分析处 S 理 (LP 0A )和数据挖掘功能。A ay i e vc s n l ssS r ie 允许用户设计、 创建和管理包含从其他数据源 ( 如关系数据库)聚合的数据的多 维结构,以实现对 O A L P的支持。而对于数据挖掘应用程序 , M co otSLSr e 0 5It ga inSr ie (S S i r s f O e v r 2 0 n e r t o e v c s S I ) Aa y i ev cs允许用户设计、创建和可视化处理那些通过 n l ssS r ie 使用各种行业标准的数据挖掘算法和根据其他数据源构造 出来的 包含完成该步骤所需的所有工具,步骤 内容包括转换到 自动执行 数 据 挖掘 模 型 。SA 是通 过 服务 器 和 客户 端技 术 的 组合 来 提供 数 据清 除和 合 并 。 SS O A 和 数据 挖 掘功 能的 。 LP 数 据可 以分散在 公 司的各 个部 门并 以不 同的格 式存储 ,或者 SA 提 供 了用 于数 据挖 掘 的工具 ,用户 可 以借助 这些 工具 识 可能包 含缺 陷项或 缺少项 之类 的不 一致 性 。 SS 别出数据中的规则和模式,SA SS创建数据挖掘解决方案时,首先 ( 四)浏 览数 据