基于校园一卡通消费数据的几种聚类算法的分析比较
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
c l u s t e r i n g a l g o r i t h m i s t h e mo s t s ui t a bl e f o r c a mp u s c a r d d a t a . Th i s pa p e r c a r r i e s o u t e x pe r i me n t s wi t h mu l t i p l e wi d e l y u s e d c l us t e r i ng a l g o r i t h ms ,o b t a i ni n g t h e mo s t a p p r o p r i a t e d a t a mi n i ng c l u s t e r i n g a l g o r i t h m f o r t h e d a t a ,a n d a na l y z e s
摘
要:随着高校 管理信 息化 的加速和 高校管理部 门对 各类校 园信息资源 需求 的不断加强,校 园一卡通被广 泛
应用于学生生 活的各个领域,并要求对其存储 的海量数据进 行挖掘分析 为各个 部 门提供决策 依据 . 聚类 算法作
为最常用 的数据挖 掘方法之一被广泛 应用于一卡通 数据挖掘,但 目前不清 楚哪种方法更适用 于一卡通数据.使
用多种 常用聚类算法对一卡通数据进行 了实验, 得 出了最适合挖掘该数据的聚类算法 , 并分析了相关 原因.
关键词 : 数据挖掘;聚类 ; 高校消费数据; 校 园一卡通
Ana l y s i s a nd Co m pa r i s o n o f S e ve r a l Cl us t e r i ng Al g o r i t h ms Ba s e d o n Ca mp us Ca r d Co ns um p t i o n Da t a
t he r e a s o n.
Ke y wo r ds : d a t a mi n i n g ; c l us t e r i n g ; u n i v e r s i t y c o ns u mp t i o n d a t a ; c a mp u s c a r d
D 0N G Xi n— Ke . ZHAN G Hui
( S c h o o l o f S c i e n c e a n d T e c h n o l o g y , Mi a n y a n g 6 2 1 0 0 0 , C h i n a )
Ab s t r a c t :W i t h t h e a c c e l e r a t i o n o f i n f o r ma t i o n t e c h n o l o g y i n un i v e r s i t y ma na g e me n t a n d t h e d e ma n d o f u n i v e r s i t y
等[ 2 】 研 究 了 校 园 卡 数 据 库 的数 据 筛 选 、聚 类 、关 联 方
对这些数据深入进行挖掘可 以为教学 、科研 、后勤 和
管理等 多个领域做 出十分有 益的贡献.
法, 并在 此基础 上分析和验证 了学生生活和学 习的关 系. 2 0 1 0 年, 李珊娜[ 3 】 以北京交通大学校 园一卡通平台 上设计和研 发的学生行为分析系统和就餐消费分析系 统为例,介绍 了对校 园一卡通系统 的数据挖 掘的初步 探索结果. 2 0 1 2 年,徐剑[ 4 1 等通过 K me a n s 算法对学生 对热水使 用情况进行 了分析,了解 学生对 热水的需求
1 引 言
近年来 , 校 园信 息化 建设 飞速 发展,…卡通 等校
园信息化 软件得到 了快速 的实施.这些信 息化软件不
但 极 大 地 方 便 了人 们 的 生活 ,而 且 积 累 了 海 量 的 信 息 .
2 相 关 工 作
2 0 0 9年,张兵兵[ 1 1 提 出了数据挖掘技术在校 园一 卡通系统 中的应用流程、 方法和作用. 2 0 1 0年,罗华群
c l u s t e r i n g a l g o r i t h ms a r e wi d e l y u s e d or f c a mp u s c a r d c o n s u mp t i o n d a t a mi n i n g . Ho we r v e , p e o p l e d o n ’ t k n o w wh i c h
i n f o m a r t i o n c o n t i n u e s t o s  ̄e n g t h e n ,t h e c a mpu s c a r d i s wi d e l y us e d i n a l l a s p e c t s o f s t u d e n t l i f e ,a n d r e q ui r e s d a t a mi n i n g a n a l y s i s f o r e a c h s e c t o r ba s i s f o r d e c i s i o n ma k i n g .As o n e o f t h e mo s t p o pu l a r d a t a mi n i n g t e c h n o l o g i e s ,
计 算 机 系 统 应 用
h t t p : / / ww w . c — S - a . o r g . c n
2 0 1 4年 第 2 3卷 第 1期
基于校园一卡通消费数据的几种聚类算法 的分析 比较①
董 新科 ,张 晖
( 西南科技大学 计算机科 学与技术学ห้องสมุดไป่ตู้,绵阳 6 2 1 0 0 0 )
摘
要:随着高校 管理信 息化 的加速和 高校管理部 门对 各类校 园信息资源 需求 的不断加强,校 园一卡通被广 泛
应用于学生生 活的各个领域,并要求对其存储 的海量数据进 行挖掘分析 为各个 部 门提供决策 依据 . 聚类 算法作
为最常用 的数据挖 掘方法之一被广泛 应用于一卡通 数据挖掘,但 目前不清 楚哪种方法更适用 于一卡通数据.使
用多种 常用聚类算法对一卡通数据进行 了实验, 得 出了最适合挖掘该数据的聚类算法 , 并分析了相关 原因.
关键词 : 数据挖掘;聚类 ; 高校消费数据; 校 园一卡通
Ana l y s i s a nd Co m pa r i s o n o f S e ve r a l Cl us t e r i ng Al g o r i t h ms Ba s e d o n Ca mp us Ca r d Co ns um p t i o n Da t a
t he r e a s o n.
Ke y wo r ds : d a t a mi n i n g ; c l us t e r i n g ; u n i v e r s i t y c o ns u mp t i o n d a t a ; c a mp u s c a r d
D 0N G Xi n— Ke . ZHAN G Hui
( S c h o o l o f S c i e n c e a n d T e c h n o l o g y , Mi a n y a n g 6 2 1 0 0 0 , C h i n a )
Ab s t r a c t :W i t h t h e a c c e l e r a t i o n o f i n f o r ma t i o n t e c h n o l o g y i n un i v e r s i t y ma na g e me n t a n d t h e d e ma n d o f u n i v e r s i t y
等[ 2 】 研 究 了 校 园 卡 数 据 库 的数 据 筛 选 、聚 类 、关 联 方
对这些数据深入进行挖掘可 以为教学 、科研 、后勤 和
管理等 多个领域做 出十分有 益的贡献.
法, 并在 此基础 上分析和验证 了学生生活和学 习的关 系. 2 0 1 0 年, 李珊娜[ 3 】 以北京交通大学校 园一卡通平台 上设计和研 发的学生行为分析系统和就餐消费分析系 统为例,介绍 了对校 园一卡通系统 的数据挖 掘的初步 探索结果. 2 0 1 2 年,徐剑[ 4 1 等通过 K me a n s 算法对学生 对热水使 用情况进行 了分析,了解 学生对 热水的需求
1 引 言
近年来 , 校 园信 息化 建设 飞速 发展,…卡通 等校
园信息化 软件得到 了快速 的实施.这些信 息化软件不
但 极 大 地 方 便 了人 们 的 生活 ,而 且 积 累 了 海 量 的 信 息 .
2 相 关 工 作
2 0 0 9年,张兵兵[ 1 1 提 出了数据挖掘技术在校 园一 卡通系统 中的应用流程、 方法和作用. 2 0 1 0年,罗华群
c l u s t e r i n g a l g o r i t h ms a r e wi d e l y u s e d or f c a mp u s c a r d c o n s u mp t i o n d a t a mi n i n g . Ho we r v e , p e o p l e d o n ’ t k n o w wh i c h
i n f o m a r t i o n c o n t i n u e s t o s  ̄e n g t h e n ,t h e c a mpu s c a r d i s wi d e l y us e d i n a l l a s p e c t s o f s t u d e n t l i f e ,a n d r e q ui r e s d a t a mi n i n g a n a l y s i s f o r e a c h s e c t o r ba s i s f o r d e c i s i o n ma k i n g .As o n e o f t h e mo s t p o pu l a r d a t a mi n i n g t e c h n o l o g i e s ,
计 算 机 系 统 应 用
h t t p : / / ww w . c — S - a . o r g . c n
2 0 1 4年 第 2 3卷 第 1期
基于校园一卡通消费数据的几种聚类算法 的分析 比较①
董 新科 ,张 晖
( 西南科技大学 计算机科 学与技术学ห้องสมุดไป่ตู้,绵阳 6 2 1 0 0 0 )