学生成绩数据挖掘的研究与实现
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
d n e 是指包 含 X 和 y 的事 务数 与包 含 X 的事 务数 之 比 , e c) 记为 c nie c ( y) 即 cnie c ( of nex d , o f n ex y) d 一
I T: { xUy T, T6D}【 T: T, /l x T∈D}I, 给定 一个 事务 集 D, 掘关 联 规 则 问题 就 是产 生 支持 度 挖
FOR a h c∈ C C c un + + ; ; ec .o t
收 稿 日期 : O O l 2 1 O 1 3
基 金项 目 : 中学 院 大学 生 创 新 性 实 验 晋 作 者简 介 : 丽 芬 ( 8) 女 。 士 , 中学 院 讲 师 , 武 17 , 硕 9 晋 主要 从 事 数 据 挖 掘 研 究
—
fe u n_ —tmstD) rq e t l i e e( ;
/ 发 现 1频 繁 集 . / 一 / /根 据 k 1频 繁 集 产 生 k候 选 集 一 一
S e ) FOR ( 一 2 I 1 0 ; + + ) { tp 2 k ; ≠ k
St p 3) e St p 4) e St p 5) e
Ck a i r n( l s p ); — pro ige Lk , u
FOR a h t D{ e c ∈
C s bs t Ck, ); : u e( t
/ 扫 描记 录集 , / 以确定 每个 候选集 的支持度 / 获得 t / 所包 含 的候选集
St p 6) e
和可信 度分别 大于用 户给 定 的最 小支持 度 ( n u p 和最小 可信 度 ( no f 的关联规 则. mis p ) mic n)
3 Ap ir 算 法 分 析 roi
Ap ir算 法多次 扫描交 易记 录集 , r i o 目的是产 生长 度 不 同 的频 繁集 . 先产 生 1频 繁 集 L , 此基 础 上 首 一 在 经过连 接 , 修剪 产生 2频繁 集 L , 一 直到 无法产 生新 的频繁 集则 算法 终止 .
1算 法如 下 : ) 算 法 1 输 入 : 易 数 据 库 D ; 小 支 持 数 mis p cu t输 出 : 以产 生 规 则 的 所 有 频 繁 项 目集 L . 交 最 n u — o n. 可 C :一 选 频 繁 集 . 是频 繁 集 . 志候 L :一
St p 1) 一 fn e I1 id
8 2
St p 7) e }
太 原 师 范 学 院 学 报( 自然 科 学 版 )
Leabharlann Baidu
第 1 卷 O
S e ) tp8
St p 9) e
L 一 { ∈C . o n s p } k e k C cu tu … ; J
R e u n L= Lk; tr
算法 1中第 S e tp3步 a r r g n L 一 ,u … ) p i i e ( k1s p 的流程 如下 : o— 算法 2 输 入 : 上一次循 环扫 描的结 果 L , 小支持 度 阀值 s p 最 u
学 生 成 绩 数 据挖 掘 的研 究 与 实现
武丽芬 孟 强
( 中学 院 , 西 晋 中 0 0 0 ) 晋 山 3 6 0
( 要 ] 文 章 从 分 析 影 响 学 生 成 绩 的 因 素 出 发 , 用 数 据 挖 掘 关 联 规 则 中 的 Ap ir 算 法 对 摘 利 r i o
2 关 联 规 则 的 形 式 化 描 述
设 , { , … . i } Ⅲ 个 项 的集合 , 是 一组 事务 集 ( 一 i i , 是 D 称之 为事 物数 据库 )D 中的 每个事 务 丁 是项 .
的集 合 , 然 满 足 T 显 , 有 一 个 唯 一 的标 识 TI 关 联 规 则 形 如 X y, 中 XC I y 二J 并 且 X ny=0. 丁 D. 其 ,( , 二
1 关 联 规 则
关 联规则 是从 大量 的数据 中或对 象 间抽取其 相互 之 间的关 联性 , 揭示数 据 间未知 的依赖 关 系 , 根据 这种 依赖关 系 , 以从 某一数 据对象 的信 息推 断 出另一数 据对象 的信 息 , 可 关联规 则挖 掘通 过支持 度 和可信度 定量
地描述 这种关 联关 系 的程度.
第 l O卷 第 1期 太 原 师 范 学 院 学 报 ( 自然 科 学版 ) 21 0 1年 3月 J OURNA1 OF TAI YUAN NORM Al UNI VERS TY ( t rlS in eEdto ) I Nau a ce c iin
Vo. 0 No 1 1 1 . M a. 2 1 r 0】
[ 键 词 ] 数 据 挖 掘 ; 联 规 则 ; ror 关 关 Ap i i算 法 ; 生 成 绩 学 [ 章 编 号 ] 1 7 0 7( 0l ) 1 0 81 03 (中 图 分 类 号 ] 文 6 22 2 2 1 0 -0 TP31 . 3 [ 献 标 识 码 ] A 1 1 文
采 集 的 学 生 数 据 集进 行 挖 掘 , 期 发 现 影 响 学 生 成 绩 的 潜 在 因 素 , 而 为 相 关 部 门 制 定 教 学 政 策 , 以 从 改 善 教 学 质 量提 供 理 论 支持 和 科 学依 据 , 而 更 好 地 开 展 教 学 工 作 , 好 地 为 学 生 服 务 . 从 更
规则 x y在 事务集 D 中的 支持度 ( u p r) 事务 集 中包 含 xUy的 事 务数 与 所有 数 之 比 , s p o t是 记为 sp o t u pr
( y) 即 s p o tx y) l T: c T, x , u p r( 一 { xUy T∈D}l D . 则 x y 在事 务 集 中 的可信 度 ( o f /l I 规 c ni —
I T: { xUy T, T6D}【 T: T, /l x T∈D}I, 给定 一个 事务 集 D, 掘关 联 规 则 问题 就 是产 生 支持 度 挖
FOR a h c∈ C C c un + + ; ; ec .o t
收 稿 日期 : O O l 2 1 O 1 3
基 金项 目 : 中学 院 大学 生 创 新 性 实 验 晋 作 者简 介 : 丽 芬 ( 8) 女 。 士 , 中学 院 讲 师 , 武 17 , 硕 9 晋 主要 从 事 数 据 挖 掘 研 究
—
fe u n_ —tmstD) rq e t l i e e( ;
/ 发 现 1频 繁 集 . / 一 / /根 据 k 1频 繁 集 产 生 k候 选 集 一 一
S e ) FOR ( 一 2 I 1 0 ; + + ) { tp 2 k ; ≠ k
St p 3) e St p 4) e St p 5) e
Ck a i r n( l s p ); — pro ige Lk , u
FOR a h t D{ e c ∈
C s bs t Ck, ); : u e( t
/ 扫 描记 录集 , / 以确定 每个 候选集 的支持度 / 获得 t / 所包 含 的候选集
St p 6) e
和可信 度分别 大于用 户给 定 的最 小支持 度 ( n u p 和最小 可信 度 ( no f 的关联规 则. mis p ) mic n)
3 Ap ir 算 法 分 析 roi
Ap ir算 法多次 扫描交 易记 录集 , r i o 目的是产 生长 度 不 同 的频 繁集 . 先产 生 1频 繁 集 L , 此基 础 上 首 一 在 经过连 接 , 修剪 产生 2频繁 集 L , 一 直到 无法产 生新 的频繁 集则 算法 终止 .
1算 法如 下 : ) 算 法 1 输 入 : 易 数 据 库 D ; 小 支 持 数 mis p cu t输 出 : 以产 生 规 则 的 所 有 频 繁 项 目集 L . 交 最 n u — o n. 可 C :一 选 频 繁 集 . 是频 繁 集 . 志候 L :一
St p 1) 一 fn e I1 id
8 2
St p 7) e }
太 原 师 范 学 院 学 报( 自然 科 学 版 )
Leabharlann Baidu
第 1 卷 O
S e ) tp8
St p 9) e
L 一 { ∈C . o n s p } k e k C cu tu … ; J
R e u n L= Lk; tr
算法 1中第 S e tp3步 a r r g n L 一 ,u … ) p i i e ( k1s p 的流程 如下 : o— 算法 2 输 入 : 上一次循 环扫 描的结 果 L , 小支持 度 阀值 s p 最 u
学 生 成 绩 数 据挖 掘 的研 究 与 实现
武丽芬 孟 强
( 中学 院 , 西 晋 中 0 0 0 ) 晋 山 3 6 0
( 要 ] 文 章 从 分 析 影 响 学 生 成 绩 的 因 素 出 发 , 用 数 据 挖 掘 关 联 规 则 中 的 Ap ir 算 法 对 摘 利 r i o
2 关 联 规 则 的 形 式 化 描 述
设 , { , … . i } Ⅲ 个 项 的集合 , 是 一组 事务 集 ( 一 i i , 是 D 称之 为事 物数 据库 )D 中的 每个事 务 丁 是项 .
的集 合 , 然 满 足 T 显 , 有 一 个 唯 一 的标 识 TI 关 联 规 则 形 如 X y, 中 XC I y 二J 并 且 X ny=0. 丁 D. 其 ,( , 二
1 关 联 规 则
关 联规则 是从 大量 的数据 中或对 象 间抽取其 相互 之 间的关 联性 , 揭示数 据 间未知 的依赖 关 系 , 根据 这种 依赖关 系 , 以从 某一数 据对象 的信 息推 断 出另一数 据对象 的信 息 , 可 关联规 则挖 掘通 过支持 度 和可信度 定量
地描述 这种关 联关 系 的程度.
第 l O卷 第 1期 太 原 师 范 学 院 学 报 ( 自然 科 学版 ) 21 0 1年 3月 J OURNA1 OF TAI YUAN NORM Al UNI VERS TY ( t rlS in eEdto ) I Nau a ce c iin
Vo. 0 No 1 1 1 . M a. 2 1 r 0】
[ 键 词 ] 数 据 挖 掘 ; 联 规 则 ; ror 关 关 Ap i i算 法 ; 生 成 绩 学 [ 章 编 号 ] 1 7 0 7( 0l ) 1 0 81 03 (中 图 分 类 号 ] 文 6 22 2 2 1 0 -0 TP31 . 3 [ 献 标 识 码 ] A 1 1 文
采 集 的 学 生 数 据 集进 行 挖 掘 , 期 发 现 影 响 学 生 成 绩 的 潜 在 因 素 , 而 为 相 关 部 门 制 定 教 学 政 策 , 以 从 改 善 教 学 质 量提 供 理 论 支持 和 科 学依 据 , 而 更 好 地 开 展 教 学 工 作 , 好 地 为 学 生 服 务 . 从 更
规则 x y在 事务集 D 中的 支持度 ( u p r) 事务 集 中包 含 xUy的 事 务数 与 所有 数 之 比 , s p o t是 记为 sp o t u pr
( y) 即 s p o tx y) l T: c T, x , u p r( 一 { xUy T∈D}l D . 则 x y 在事 务 集 中 的可信 度 ( o f /l I 规 c ni —