基于数据挖掘技术的高校管理决策支持系统
基于数据挖掘的智能决策支持系统
决策支持系统是 以现代信息技术 为手段 , 综合运 用计 算机技术 、 管理科学 、 济数学 、 经 人工智能技术等 多种学科
知识 , 对某一类型 的半 结构化 和非结 构化 决 策问题 , 针 通 过提供背景 材料协助 明确问题 、 修改 完善 模 型、 列举 可 能 方案等方式 , 为管理者做 出正确决策提供 帮助的人机交互
上 的需要 。为了有效地 为企业 和政府 的管理 与决 策过 程
提供重要 的信息 , 需要 根据决 策的需要收集来 自企业 内外
的有 关数据 , 加以适 当的组 织处 理 , 并 以形成 一个 综合 的
面向决策的环境 。数据 挖掘技 术是作 为独 立 的信息技 术
出现的。数据挖掘是通过对数据库 、 数据仓库 中的数 据进
使问题求解能力不断提高 ;
⑤综合运用人工智 能 中的各 种技术 , 整个 IS 对 D S实 行统一协调 、 理和控制。 管 3 数 据挖 掘技 术 数据挖掘 这一 概 念 是 由 G Pa t y—Sa i , J . iek ts hpo W. . r Fa l rwe y等人 在 18 99年 8月召开 的第 1 1届 国际人 工智能 学术会议上提 出的。它是数据库技术 和人 工智 能 、 数理统 计等学科相结 合的产物 , 是一个多学科相互交叉 的具有 广 泛应用前景 的新兴研究领 域 , 并利用人工智能和数理统计 中一 些较成熟 的方法和技术 , 如规则推理 、 人工神经 网络、
基 于数 据 挖 掘 的 智 能 决 策 支 持 系统
耿 正
摘 要 : 绍了数据挖掘和智 能决策支持 系统的基本概念 , 介 分析 了基 于数据挖 掘 的智 能决策 支持 系统 的
体 系结构 , 并且讨论 了数据挖掘在 实际决策支持 系统 中的应 用以及智 能决策 支持 系统的发展趋 势。
基于数据中心的决策支持系统在高校管理中的应用
中图 分类 号 : 44 G 3
一
文献 标 识 码 : A
文 章编 号 :6 3 8 5 (0 0 1— 0 3 0 17— 4 4 2 1 ) 0 3 — 2 5
息 、 师 信 息 、 教 信 息 等 对 学生 的学 习能 力 、 习效 果 、 教 评 学
科 研 能力 等 进行 评 估 . 助学 生 及 时调 整 学 习 。 策支 持 帮 决
标 志 等
信 息
专
业 信 息
班 级 信 息
系所 号 、 业代 号 、 业 名称 、 业类 别等 专 专 专
班号 、 级 名 称 、 班 所属 专业 、 属 院 系、 级 等 所 年
学 生 成绩
学号 、 学 班号 、 教 实施 日期 、 绩 ( 成 总成 绩 ) 等
策支持 系统是 通过数 据 、 型 和知识辅 助 决策 者 . 模 以
表 2 教 学信 息
信 息 类 别 信 息 表 字段
人 机交 互 方式 进 行半 结 构 化 或 非 结构 化 决 策 的 计算 机 应
用系统 , 它结 合 了数据仓 库 、 联机 分析 处理 、 据挖 掘 、 型 数 模 库、 数据 库 、 知识 库 等多 种技 术 . 现更 有 效 的辅 助 决 策 实 决策 支持 系统 在 企业 有许 多成 功 案例 . 对提 高管理 效
《 中国教 育信 息化》发行 部 : l o . u e c @m ee . y d n
数字校园
基 于 数据 中心 的决 策 支 持 系统 在 高校 管理 中 的应用
王 迎 霞
( 东师 范大 学 信 息 化 办公 室 , 海 2 0 6 ) 华 上 0 0 2
摘 要 : 文根 据 国 内许 多高校 已形 成初 具 规 模 的数 据 中心 的现 状 , 讨 如 何 根 据现 有 积 累 , 一步 从 整 本 探 进 体 上 分析 数 据 , 过 采 用数 据 仓 库 、 型设 计 、 据 挖掘 等技 术 , 通 模 数 建设 基 于数据 中心 的决 策 支持 系统 , 协助 管理
数据仓库与数据挖掘技术在企业决策支持系统中的应用
数据仓库与数据挖掘技术在企业决策支持系统中的应用第一章:引言随着信息时代的到来,企业面临着海量数据的挑战以及信息的快速发展。
为了更好地利用数据为企业决策提供支持,数据仓库和数据挖掘技术应运而生。
本文将就数据仓库和数据挖掘技术在企业决策支持系统中的应用进行探讨。
第二章:数据仓库的概念和特点2.1 数据仓库的定义和目标数据仓库是指一个用于存储和管理企业数据的集中化数据系统。
它将多个异构数据源中的数据进行集成和转换,并提供给决策者进行分析和查询。
数据仓库的目标是帮助企业更好地理解业务过程和市场情况,从而支持企业决策的制定。
2.2 数据仓库的特点数据仓库具有以下特点:(1) 面向主题:数据仓库以企业的业务主题为核心,将数据按照不同主题进行分类和组织,方便决策者进行查询和分析。
(2) 集成的:数据仓库可以将来自多个数据源的数据进行集成和转换,提供给决策者一个一致的数据视图。
(3) 非易失的:数据仓库一旦存储了数据,就会成为企业不可或缺的资产,不会因为临时的故障而导致数据的丢失。
第三章:数据仓库的架构和设计原则3.1 数据仓库的架构数据仓库通常采用三层架构,包括源数据层、数据存储层和应用层。
源数据层用于采集和清洗原始数据,数据存储层用于存储和管理数据,应用层用于查询和分析数据,并将结果展示给决策者。
3.2 数据仓库的设计原则数据仓库的设计应遵循以下原则:(1) 数据模型的设计:数据仓库的数据模型应以企业的业务需求为导向,充分体现业务过程和相关指标。
(2) 数据集成和转换:数据仓库需要对不同数据源的数据进行集成和转换,确保数据的一致性和准确性。
(3) 数据的存储和管理:数据仓库需要选择合适的存储结构和数据管理技术,提高数据的检索效率和可靠性。
第四章:数据挖掘技术的概念和方法4.1 数据挖掘的定义和目标数据挖掘是指从大量的数据中发现隐藏的规律和模式,并将其应用于决策支持和业务优化。
数据挖掘的目标是帮助企业提高决策的准确性和效率,增强企业竞争力。
管理决策支持系统
管理决策支持系统随着信息时代的到来,企业管理面临着越来越多的挑战和机遇。
为了适应市场的变化和优化决策,许多企业开始采用管理决策支持系统(Management Decision Support System, MDSS)来辅助管理层进行决策。
本文将介绍管理决策支持系统的定义、功能和应用,并探讨其在企业管理中的重要性。
一、管理决策支持系统的定义管理决策支持系统是指利用计算机技术和信息系统来提供有关决策的数据、模型和工具,以辅助管理者进行决策的系统。
它基于海量数据的积累和分析,通过数据挖掘、模型建立和智能算法等手段,为管理者提供准确、实时的决策依据。
二、管理决策支持系统的功能1. 数据整合和分析:管理决策支持系统能够自动从各个数据源中整合不同类型的数据,并进行多维度的分析。
通过对数据的挖掘,系统可以发现数据之间的关系和趋势,为管理者提供全面准确的信息。
2. 决策模型建立:管理决策支持系统可以基于历史数据和现有信息,建立各种决策模型,如线性规划模型、风险评估模型等。
这些模型可以帮助管理者定量地评估不同决策方案的效果和风险,并进行可行性分析。
3. 实时监控和预警:管理决策支持系统可以实时监控企业关键指标的动态变化,并根据设定的预警条件提供预警信息。
这样,管理者可以及时了解企业的运营情况,发现问题并采取相应措施,避免损失的发生。
4. 决策辅助工具:管理决策支持系统提供多种决策辅助工具,如数据可视化、报表生成和决策模拟等。
这些工具可以帮助管理者更直观地分析数据、生成报表和模拟决策情景,提升决策的准确性和效率。
三、管理决策支持系统的应用管理决策支持系统广泛应用于各个行业和领域,如金融、制造业、物流、零售等。
下面以金融行业为例,介绍管理决策支持系统的应用。
在金融行业,管理决策支持系统可以帮助银行和证券公司进行风险评估和资产配置。
系统可以通过对大量历史数据的分析,建立风险评估模型和资产配置模型,为机构投资者提供风险把控和投资决策的指导。
挖掘大学数字价值,建设高校决策支持
混乱 ,数 据难 以集成 ,现有 数据 无法 支持有 效的 决策支 持。 同时 , 个高校 现 实管理 中 , 各 决策支 持的理 念 尚未完全 建立 ,
主要 采用综合 查询 、0 AP ( L 数据统 计 )和数 据挖 掘等三 种建设 虽 然管 理 层 已经 开始 通 过各 种 综合 报 表 来进 行 分析 ,进 而做 出 形 式 ,从 不 同维 度 为各 种 类型 用 户 展现 相 应 的信 息 内容 ,从 而 决 策 ,但 在某 些 方面仍 然 是通 过经 验 ,而 非科 学 的分 析来 决策 , 为校 领导 层 提供 科 学合 理 的 决策 依据 ,进而 为 高校 的跨 越 式 发 再 者 , 目前 尚没有 一 套 行之 有效 的高 校 决策 支持 模 型 ,许 多高 展 起到 一个科 学的导 向作 用 。
这 些信 息 来 自不 同部 门 ,也 随着 物 质资 源在 不 同 部 门、单 位 的 使 用 ,与 其 他部 门和 人 员 的信 息 发 生交 叉 ,所 以要 进 行数 据 的 共 享 ,以减少 信息 冗余和 矛盾 数据 的产生 。 活动 信息 是学校 教学 、 理 、 管 科研 等业务 过程 中伴 随的信息 ,
I CI AN E T才 D o U
∞
uc
PE S N R O ,
'
/ %。NFra bibliotek挖 掘 大 学数 字价 值 ,建 设 高校 决 策 支 持
摘 要 :高 等 教 育 生 存和 发 展 的 现 实 需 求 ,使 高校 决 策 支
一
的 信息 标 准 。结 果 ,不 同 的应 用 系统 和 数据 不 能提 供 一 个
是 人利 用 资源进 行相 应 的业务 活动 的 记录 ,和 活动 结果 的记录 。
数据挖掘技术在教育决策支持系统中的使用方法
数据挖掘技术在教育决策支持系统中的使用方法随着教育行业的快速发展和信息技术的不断进步,教育决策支持系统(Educational Decision Support System,简称EDSS)的应用越来越受到关注。
教育决策支持系统旨在帮助决策者进行有效的决策,提高教育管理和教学质量。
在这个过程中,数据挖掘技术发挥着重要的作用。
本文将探讨数据挖掘技术在教育决策支持系统中的使用方法。
首先,数据挖掘技术可以用于收集和整理教育数据。
教育决策支持系统需要准确、全面的数据来支持决策过程。
数据挖掘技术可以通过各种方式收集各类数据,如学生的学习成绩、考试情况、参与课外活动的情况等。
数据挖掘技术可以帮助从海量数据中提取出有用的信息和模式,以便决策者能够更好地理解学生和教育环境的特征。
其次,数据挖掘技术可以应用于模式发现与预测。
数据挖掘技术可以通过分析历史数据和学生的行为模式来发现学生的学习习惯、兴趣偏好、学习进度等。
这将为决策者提供对学生学习情况的深入了解,帮助他们制定更加个性化和有效的教学计划。
此外,数据挖掘技术还可以通过分析学生的历史数据来预测学生的未来表现和发展趋势,从而提前做出相应的教育干预和支持。
第三,数据挖掘技术可以用于学生评估和个性化学习支持。
通过数据挖掘技术,教育决策支持系统可以为每个学生提供个性化的学习支持和指导。
决策者可以通过分析学生的学习数据,了解学生的强项和弱项,并根据学生的需求提供相应的学习资源和建议。
例如,通过分析学生的学习习惯和学习历史,系统可以智能推荐适合学生的学习材料、提醒学生节奏和时间管理,帮助学生提高学习效果。
第四,数据挖掘技术可以应用于学校管理和资源优化。
教育决策支持系统可以利用数据挖掘技术对学校的管理和资源进行优化。
通过分析学生的学习数据和学校的教学资源分配,系统可以发现学生的学科偏好和学科的教学需求。
决策者可以根据这些信息来调整学校的教学资源分配,提供更加贴近学生需求的教学环境。
基于数据挖掘的教育管理决策支持系统模型
Ke wo d : t i ig DW ; u ain ma a e n ; l o i m ; y r s Da a n n ; a r Ed c t n g me tA g rt VB o h
c mb n n u a o n a e n ly a h g o ema d s u s e d t n n e h o o y i u a o n g me td cso o i ig e c t n ma g me t a u e r l , 1 ic s e t aa mii g t c n lg n e c t n ma a e n e ii n d i p d h d i
随着信息时代的快速发展,外界所 带给 我们的大量信息也越 掘”,能够发现:广义知识、关联知识、分类知识、预测型知识 、 来 越 多 。大 量 信息 在给 人们 带 来 方便 的 同时 ,也 带来 了 一大 堆麻 偏差型知识,能够在数据中寻找预测性的信息,能够为我们的管 烦:信息过量难以消化,信息真假难 以辩识,信息安全难以保证, 理提供 “ 做出决策 ”的依据 ,能够有力的支持我们做出恰如其分 信息格式难以统一 。身处信 息汪洋中的我们 ,如何才能不被信 息 的选 择 。 淹没、如何从中及时发现有用的信息呢?是否存在着一种工具、 所谓教育管理 ,就是在特定的社会环境下 ,遵循教育的客观 种方 法或 者 一个 手段 使得 身 处 “ 据爆 炸 、知 识 匮乏 ”的 我们 , 规律,对各种教育资源进行合理配置,以实现教育方针和教育 目 数 能 够 以一种 轻松 的 状态 来进 行 有效 的管 理决 策 呢 ? 标的行为,教育管理是社会管理的一部分。在学校教育管理中, 数据挖掘技术是人们长期对数据库技术进行研究和开发的结 我们 引进 数据 挖掘 技术 ,正是 想针 对教 育 的海 量数 据进 行 有效 的 晶,它 为我 们提 供 了一 个非 常优 秀 的工 具 。 发掘,以期充分利用数据挖掘的长处,来发现这些海量数据中潜 数 据挖 掘 技术 在 的、 久 以 来未 被发 现 的规 则 , 长 能够 对 学 生潜 力 做 出数据 挖 掘 , 所 谓数 据 挖掘 就是 指 一个 完整 的过程 , 该过 程就 是从 海 量 的 这就为学校的招生工作提供了一定程度的参考 ,并在学生入学后 随 机应 用数 据 中,提取 分 析隐 含在 其 中的 、 们事 先 并不 知道 的 、 还可 以分析其 进步或者退步的可能原因是什么,解决学生教育导 人 还 例 但 又具 有 内在 联系 的 、有价 值 的信 息 数据 ,这 些 信息 数据 为 决策 向 的问题 ; 可 以对 学 校 管理层 比较 关 心 的 问题 进行 挖 掘 。 如 , 提供必要的支持。 在所有教职工中教师的比例有多大;一般意义上讲某位教师是否 数 据挖 掘 过程 中详 细各 个 步骤 的大 体 内容如 下 六步 : 达到 了学校 的 一般 标准 ;能够 对教 师执 教 能力 和教 师 人力 资源 优 1确 定主 题 :即做 好 需求 分析 ,清 晰地 定义 出 问题 ,并对 探 化做出分析,在教师招聘中为人力资源主管提供一般性的判断依 . 索 的 问题具 有 可预 见性 。 据 ,对所 应 聘 的教 师做 出其 潜 力及 前景 分 析 , 以便 能 够辅 助管 理 2 数据的提炼 :搜索与主题有关的数据信息,研究数据的质 层做 出 更好 的 决策 ,优 化教 育 管理 ,促进 教 育 管理 良性 发展 。 . 量 ,并 确定 将 要进 行挖 掘操 作 的类 型 。 三 、系统 架 构 的搭 建 3 数据 的 转换 :将 数据 转 换成 一个 分 析模 型 ,这 个 分析模 型 . 我们 将 分 以下 几步 来进 行 系统模 型 的 设计及 实现 : 是 针对 挖掘 算 法建 立的 。 ( )对 数 据进 行 分析 ,建 立 数据 仓库 一 4 数据挖掘:对所得到 的经过转换的数据进行挖掘,除了完 . 数据 主 要 来源 是档 案 室现 存 的档案 ,包括 教职 工 和学 生 的 , 善从选择合适的挖掘算法外,其余一切工作要都能 自动地完成。 还要动态 的添 加一些数据 如果能够得到教育院校 的支持来丰 富 5 结 果分 析 :解释 并评 估 结 果 ,其使 用 的分 析方 法一 般 应视 数据 ,那 就更 好 。这个 数据 的 要求 是大量 、真 实、准 确 。 . 对 于教职 工 的信息 ,主要 有 以下属 性 :编 号 、姓 名 、性别 、 数据 挖 掘操 作而 定 ,通 常会 用 到可 视化 技术 。 6 知识的同化:将分析所得到 的知识集成到业务信息系统的 民族、出生年月日、政治面貌、工作时间、是否为班主任、是否 . 组织 结 构 中去 。 为学 校 管理 层 、毕 业 院校 、最 高学 历 、最 高 学位 、最 高职 称 、家 二 、数 据挖 掘 与教 育管 理 决策 支持 系统 庭经 济条 件 、 教学 评估 成 绩 、所获 荣誉 、所 带班 级荣 誉 、研 究成 我们使用数据挖掘技术对我们所掌握的信息进行特定的 “ 挖 果等等,越详细对我们进行数据挖掘就越好。如下表所示。 编号 姓名 性别 民族 出生年月 政治面貌 毕业 院校 职称 教学评估 成绩
基于数据挖掘的校园一卡通决策支持系统设计与开发
识 为解决 以上 问题 . 结合本 校实 践经验 . 出整合 并 提
校 园一 卡通资 源 . 使用数 据挖 掘技 术构 建一 卡通决 并 策 支 持 系 统
2 系统 架 构
本 决策 支持 系统包 含数据 源 、数据存储 与 管理 、
1 研 究 内容
当前 校 园 一 卡 通 应 用 主 要 在 以 下 两 个 大 方 面 : 消 费应用方 面 , 如热 水消 费 、 能 电控缴 费 、 机管理 例 智 上
现
史数 据 . 用数 据仓 库 技术 进 行存 储 , 使 用联 机 分 使 并
析 处 理 技 术 进 行 分 析 . 得 十 分 必 要 联 机 处 理 分 析 显 可 以 从 多 种 角 度 、 种 粒 度 、 个 维 度 上 分 析 微 观 或 多 多
代 计 S LS re 0 5为数据仓 库和 数据挖 掘解决 方案 . Q evr2 0 总 算 机
清 洗 ( rnfr 、 载 ( od , 有 效 集 成 操 作 ( Ta s m) 装 o La )并 即 E L处 理 )按 照 主题 进行 重 新组 织 , 建 数 据仓 库 ; T , 构
联 机 分 析 处 理 f L ) 照 多 维 数 据 模 型 进 行 再 次 重 O AP 按
数 据 挖 掘 技 术 为 手 段 ,整 合 一 卡 通 应 用 系统 的 核 心 业 务 数 据 , 分 析 并 挖 掘 数 据 隐 藏 关
系 , 取 有 用信 息 , 管 理 员辅 助 决 策 , 供 其 他 应 用 系统 共 享 , 生联 动 。 提 供 并 产 关 键 词 :数 据 仓 库 ;数 据 挖 掘 ;决 策 支持 ;联 动
三
一
:
MEM基于大数据的工程管理决策支持系统研究
MEM基于大数据的工程管理决策支持系统研究在当今数字化时代,大数据已经成为各个领域的重要资源,工程管理领域也不例外。
MEM(工程管理硕士)专业旨在培养具备工程技术、管理和经济等多方面知识和能力的复合型人才。
而基于大数据的工程管理决策支持系统的出现,为工程管理提供了更高效、更准确的决策依据,有助于提升工程项目的质量、进度和成本控制水平。
一、大数据在工程管理中的应用背景随着工程项目的规模不断扩大、复杂度日益提高,传统的工程管理方法面临着诸多挑战。
例如,在项目规划阶段,需要对大量的市场数据、技术数据和历史项目数据进行分析,以确定项目的可行性和预期收益;在项目执行阶段,需要实时监控工程进度、质量和成本等指标,及时发现问题并采取措施加以解决;在项目验收阶段,需要对项目的成果进行全面评估,为后续项目提供经验教训。
大数据技术的出现为解决这些问题提供了新的思路和方法。
通过收集、存储和分析海量的数据,工程管理人员可以获取更全面、更准确的信息,从而做出更明智的决策。
二、工程管理决策支持系统的功能需求1、数据采集与整合功能系统需要能够从多个数据源采集数据,包括内部的项目管理系统、财务系统、人力资源系统等,以及外部的市场数据、行业数据和政策法规数据等。
同时,系统还需要对采集到的数据进行整合和清洗,去除重复和错误的数据,确保数据的质量和一致性。
2、数据分析与挖掘功能系统需要具备强大的数据分析和挖掘能力,能够运用数据仓库、数据挖掘、机器学习等技术,对整合后的数据进行深入分析,发现数据中的潜在规律和趋势。
例如,通过分析历史项目数据,可以预测项目的成本和进度风险;通过分析市场数据,可以了解行业的发展动态和竞争态势。
3、决策模型与算法系统需要内置各种决策模型和算法,如线性规划、动态规划、决策树等,以支持工程管理中的各种决策问题,如项目选址、资源分配、进度安排等。
同时,系统还应该能够根据实际情况对模型和算法进行优化和调整,提高决策的准确性和适应性。
数据挖掘技术在高校网络教务管理系统中的应用
数 据挖掘技术在 高校 网络教务管理 系统 中的应 用
李伟军 . 廖 志芳
( 中南 大 学 软 件 学 院 , 沙 4 0 8 ) 长 10 3
摘
要 :作 为 数 据 库 技 术 的 一 个 新 的 发展 方 向 。数 据 挖 掘 技 术 与数 据 库 技 术 的结 合 产 生的 集成 、 一 致 的 环 境 , 使 决 策者 更快 地 获 得 更 准确 的 信 息 。 在 论 述 基 于数 据仓 库 的 决 策 支持 系统 的 将
图1 S D S体 系结 构
收 稿 日期 :0 1 0 —2 21—9 3
修 稿 日期 : 0 1 O O 2 1 —1 一1
作 者 简介 : 伟 军 (9 4 ) 男 , 东兴 宁人 , 读 研 究 生 , 科 , 究 方 向 为现 代 教 育 管理 李 17一 , 广 在 本 研
@ 现 计 机 211 代 算 0 . 1o
结 合 可 以 较 好 地 解 决 传 统 决 策 支 持 系统 既需 要 处 理 大 量 数 据 又 需 要 进 行 大 量 数 值 计 算 的问 题
OL P的 多 维 数 据 分 析 主要 通 过 对 多 维 数 据 的 维 A
图 2 系统 的体 系结 构
23 系统 的 功 能模 块 设 计 .
( ) 机 分 析 处 理 技 术 2联 联 机 分 析 处 理 是 一 种 针 对 特 定 问 题 进 行 联 机 数 据
务 器 提 供 高 效 的 数 据 存 取 .安 排 后 台处 理 以及 报 表 的 预处 理 , 结 构 图如 图 2所 示 。 其
访 问和分析的技术 它是决策人员通 过对信 息的多种 可 能的观察形式进行快速 、一致和交互式 的存 取来获
数据分析与决策支持系统
数据分析与决策支持系统数据分析与决策支持系统(Decision Support System, DSS)是一种基于大数据技术的智能系统,通过收集、整理和分析各类数据,为管理者提供决策制定过程中的可靠信息和专业支持。
本文将从DSS的定义、功能、实施步骤及在各个领域中的应用等方面展开讨论。
一、DSS的定义数据分析与决策支持系统是一种集成了人工智能、计算机技术和管理理论等多学科知识的高效工具,旨在辅助管理者进行决策分析和决策制定。
它能够提供关键性的数据、模型和方法,帮助管理者快速、准确地进行决策。
二、DSS的功能数据分析与决策支持系统具有以下功能:1.数据收集与整理:通过各种方式收集和整理相关数据,为后续分析提供支持。
2.数据分析与挖掘:运用统计学、机器学习和数据挖掘等方法,对数据进行深入分析,发现数据背后的规律和趋势。
3.决策模型构建:根据分析结果,建立决策模型,帮助管理者做出更加科学和准确的决策。
4.决策辅助与评估:为管理者提供决策相关的信息和数据,同时通过评估模型对决策结果进行预测和评估。
5.决策结果可视化:将复杂的决策结果通过图表、报表等形式展示出来,直观清晰地呈现给管理者。
三、DSS的实施步骤数据分析与决策支持系统的实施通常包括以下步骤:1.需求分析:明确决策者的需求和目标,确定系统的设计和功能。
2.数据收集与整理:收集与决策相关的数据,并对其进行组织和整理。
3.数据分析与挖掘:利用统计学和数据挖掘等方法对数据进行深入分析,提取有价值的信息。
4.模型建立与评估:根据分析结果建立决策模型,并通过评估模型对决策结果进行评估和优化。
5.系统应用与维护:将系统应用到实际决策中,并进行系统的维护和更新。
四、DSS在各个领域中的应用数据分析与决策支持系统广泛应用于各个领域,如金融、医疗、物流、市场营销等,为决策者提供支持。
以下是几个具体的应用案例:1.金融行业:DSS可用于风险评估、投资决策、信贷管理等,提高金融机构的风险控制和决策效率。
高校教育中的教育管理与决策支持系统
高校教育中的教育管理与决策支持系统高等教育管理是一个广泛的领域,涉及各种各样的问题,从财务管理到学生招生和课程管理。
在今天的数字时代,许多高校都正在实施教育管理和决策支持系统以提高其效率和准确性,同时提高教育水平和学术成果。
一、教育管理系统的定义和作用教育管理系统是一个包含各种应用程序和技术的计算机程序,用于管理高校的教育活动和资源,其中包括学生记录、课程安排、成绩管理、招生管理、教职员工数据、课程信息和校园活动等。
使用教育管理系统的主要目的是简化和自动化高校的管理过程,提高教学和管理的效率和准确性。
二、决策支持系统的定义和作用决策支持系统是一种计算机应用程序,可用于帮助管理者做出合理的决策。
这些系统使用了数据挖掘技术、数据分析和数据查询,以收集、分析数据,并为管理者提供正确和及时的信息。
在高校中,决策支持系统可用于制定政策、预测趋势、评估方案和管理项目等,以便根据数据和分析结果,做出更加明智的决策。
三、教育管理和决策支持系统的应用高校使用教育管理和决策支持系统的应用非常广泛,以下是一些应用案例:1. 学生管理:教育管理系统可用于记录学生信息,包括名称、身份证号码、联系电话等,以及跟踪学生的学习进度、课程表和成绩等。
决策支持系统可用于分析学生数据、预测学生流失情况、提供课程建议等。
2. 教职员工管理:教育管理系统可包括教职员工的教学信息、工资、职务、合同、福利等。
决策支持系统可用于管理和评估教职员工绩效、支持人力资源决策等。
3. 课程管理:教育管理系统可用于管理课程信息、学生选课和教师安排等。
决策支持系统可用于分析教学成果、诊断教师缺陷、制定课程计划等。
4. 经费管理:教育管理系统可包括财务、预算、报销和捐赠等。
决策支持系统可用于分析财务数据、制定经费计划以及评价投资回报等。
四、教育管理和决策支持系统的优点1. 提高效率:教育管理和决策支持系统可自动化教育管理和决策支持过程,提高效率,并减少人力和时间的需求。
基于数据挖掘的高校教学决策支持系统设计
广东技术师范学院学报(自然科学)2012年第2期Journal of Guangdong Polytechnic Normal University No .2,2012基于数据挖掘的高校教学决策支持系统设计刘耀南(嘉应学院,广东梅州514015)摘要:为了充分有效利用高校教学管理工作多年来积累的大量数据,采用数据挖掘技术从中挖掘出有价值的信息,为学校教学管理提供决策支持,设计了一个专门的高校教学决策支持系统.该系统基于数据挖掘及数据仓库技术,采用C/S/S 和B/S/S 模式的三层体系结构,使用关联规则、决策树、聚类等方法对高校数据进行分析.通过基于预处理的改进Apriori 算法在教学评价中的应用为例,说明数据挖掘过程,分析挖掘结果.关键词:数据挖掘;数据仓库;Apriori ;教学;决策支持中图分类号:TP 311文献标识码:A文章编号:1672-402X (2012)02-0010-06收稿日期:2012-04-05基金项目:梅州市与嘉应学院联合自然科学基金重点项目(No.2011KJZ10).作者简介:刘耀南(1980-),男,广东梅州人,嘉应学院继续教育学院讲师.研究方向:数据仓库与数据挖掘、软件工程.0引言随着计算机技术、网络技术的快速发展和数据库技术的广泛应用,以及高校招生规模的扩大、教育模式的更新,各高校依托校园网构建综合教学管理系统,实现了教学的信息化、网络化,提高了工作效率,同时也产生和积累了大量的数据.但这些数据只是简单地存储在数据库中,没有被充分地挖掘利用,以帮助学校在进行决策时提供有价值的数据作为依据.鉴于社会对高等教育大众化的需求以及高校数据管理的现状,近年来,不少研究学者把数据挖掘技术应用到高校教育教学管理,对原有数据库中大量的数据进行较深层次的分析挖掘,提取出有用的信息,以指导教学、发展教育.文献[1-5]对数据挖掘技术在教育领域中的应用做了较为深入的研究,这些应用为高校的教学与管理提供了有利的帮助,发挥了积极的作用,也对数据挖掘技术应用于高校教学决策支持系统的研究提供了参考.为了有效地为学校管理和决策过程提供重要的信息,应根据决策的需要收集学校各部门的数据,融合数据挖掘常用且关键的技术进行适当地加工处理,以形成一个综合的面向决策的环境[6].1数据挖掘的概念与技术数据挖掘(Data Mining )[7-8]就是从大量的数据源(如数据库、文本、图片、万维网等)中通过加工处理,探寻出有用的、有潜在价值并且是可以被理解的模式或知识的复杂过程.数据挖掘一般分为三个步骤进行:(1)预处理.这是数据准备阶段,包含过滤有噪音和异常情况的数据,通过采用和选择特定属性来降低那些数据量庞大且含有不相关属性的数据量;(2)数据挖掘.这是挖掘操作的核心,将预处理的数据采用适当的数据挖掘方法加工处理,生成有用的信息;(3)后续处理.这是评价与反馈阶段,采用评估和可视化的技术对提取的模式进行识别,应用挖掘出的有用部分.整个数据挖掘过程是反复的、可迭代的,一般要经过多轮迭代才获得最终结果.数据挖掘是一门集成多门学科的交叉性学科,包括机器学习、数理统计、人工智能、数据库技术、神经网络、信息检索和可视化,用概念、约束、模式、规律、可视化等形式来表示挖掘出的信息,用于决策、过程控制、信息管理、查询处理等.如何从大量的数据中发现隐藏的未知的且有价值的信息,需要选择适当的数据挖掘方法,这是数据挖掘的关键.方法主要有关联规则挖掘、分类和预测、聚类分析、序列模式挖掘等,其中应用于高校教学决策支持系统的几种主要的数据挖掘技术简要介绍如下:(1)关联规则.它是Agrawal等人[9]在1993年首次提出的,是数据挖掘领域最为重要也是被广泛研究的课题,主要研究从大型数据集中挖掘隐藏的、有趣的、属性间存在的关联和规律[10].关联规则挖掘的经典例子[8]是购物篮数据分析,目的是找出顾客在超市所选购商品之间的关联,如奶酪→啤酒[支持度=10%,置信度=80%],表示10%的客户同时购买奶酪和啤酒,而在所有购买奶酪的人中有80%的人也购买了啤酒.关联规则就是找出满足给定支持度和置信度阈值的关联事件.关联规则挖掘算法一般分为两步:首先找出所有的频繁项集,然后产生有趣的关联规则[10],最为著名和经典的算法是Apriori算法[11].(2)决策树.它是分类算法中应用最广的一种技术.所谓分类就是先从数据中选出已经分好类的训练集,然后在该训练集上构造模型并分类新数据.决策树算法是一种常用的、直观的快速分类方法,它最重要的是决策树的构建,包括建树和剪枝两个阶段,其中建树是关键,建树算法是一个递归的过程,递归的对训练集进行分割,直到满足某种终止条件.决策树主要用来解决数据挖掘中的分类和预测问题.决策树有许多算法,比较著名的是归纳算法ID3版本,以及基于Quinlan的C4.5算法[12].(3)聚类分析[8].它是数据挖掘领域最常用的数据分析技术之一.所谓聚类就是一些具有相似性的数据实例被分类组织的一种集合,一个聚类中的元素彼此相似,但与其他聚类中的元素彼此不同.它与分类不同,聚类技术是一种无监督学习,没有那些分好类的训练集,它需要一个距离函数来计算两个数据点之间的距离,目的就是通过使用某个聚类算法和某个距离函数来发现数据中内在的分组结构.聚类有两种重要的方法:划分聚类(Partitional Cluster-ing)和层次聚类(Hierarchical Clustering),其中划分聚类方法最著名与最常用的是k-均值算法,而层次聚类更广泛应用的是合并(自下而上)聚类方法.2系统体系结构高校教学决策支持系统基于数据仓库技术,采用实现多维数据分析的OLAP方式,对来自数据仓库的数据进行多维化和预综合处理,系统采用先进的三层体系结构,即C/S/S(客户端/服务器/服务器)和B/S/S(浏览器/服务器/服务器)的模式,如图1所示.在C/S/S模式下,平台架构是:C++Builder+ COM/DCOM+SQL Server;在B/S/S模式下,平台架构是:Jsp+JavaBean+SQL Server.为了保证系统各组成部分之间的相互协调以及整体目标的顺利实现,在高校教学决策支持系统的开发和构建过程中,运用软件工程的理论和方法进行统一的系统分析[13].基于数据挖掘的地方高校教学决策支持系统,实现为高校中高层领导决策提供数据支持.建立系统管理子系统,对各级用户进行权限设置;建立学生分析子系统,实现查询在校生(包括成人教育学生)的学籍信息分析,如生源地分布、年龄分布、政治面貌分析、民族分布、本科生学科分析、师范生学科分析等;建立课程设置分析子系统,根据学生成绩统计和分析,挖掘出课程之间的关联与前后顺序关系,制定出适合市场需求的教学计划,实现合理设置课程安排;建立课堂分析子系统,根据学生(包括成教学生)的特征如年龄、性别、专业、生源地、学习成绩等分析它们之间的关系,挖掘出学生个体偏好的授课方式、授课内容,实现教师针对不同类型的学生选取恰当的授课方式提供指导,实施分层教学;建立专业分析子系统,实现查询各专业建设情况,学科建设分析;建立师资分析子系统,查询各图1高校教学决策支持系统体系结构图图2高校教学决策支持系统功能结构图部门、各专业各学科教师科研情况,结合学生评价,综合测评教师的教学水平,实现学校师资情况分析;建立试卷分析子系统,通过试卷分析,发现学生掌握知识水平的差异,评价试卷质量的高低,以更好地指导教师的教学.功能结构图如图2所示.3数据仓库数据仓库是一个面向主题的、集成的、时变的、非易失的数据集合,支持管理部门的决策过程[14].数据仓库与其他数据库系统有明显的区别,它是围绕特定的主题,集成了多个异种数据源,数据存储不是一成不变,是随时间的变化而改变的,并且数据是物理地分离存放.数据仓库的主要意义是为决策支持提供数据源.它的构造需要数据集成、数据管理和数据统一[7].数据仓库的体系结构包括:数据源、数据的存储与管理、OLAP 服务器和前端工具[15].高校教学决策支持系统是面向各学院、部门专门的数据管理及学校中高层领导决策为主题的,数据源来自学校各部门的数据,实际需求是为决策支持提供分析依据,设计的数据仓库体系结构展开如图3所示[7].数据仓库面向的用户主要是学校的中高层领导,主要执行决策和趋势分析类的应用,从数据仓库或数据集市中发现事实,因此,数据仓库系统的分析工具主要有三类:可视化查询、多维分析、数据挖掘.在多维分析中,数据是按维来表示的,维就是相同类数据的集合,它代表着对数据的一个特定的观察角度,例如学生信息、专业和课程等,维通常按层次组织,例如地域维的层次可以是学院、专业或班级等,时间维是一种标准维,它的层次一般为学期或学年.4数据挖掘技术在高校教学决策中的应用4.1关联规则运用关联规则对学生成绩数据库中成绩数据进行挖掘,得到课程之间的相关信息,起到指导学生选课的作用.在关联规则分析中用到学生的考试成绩、学生所属院系等基本信息以及在数据准备阶段形成的各门课程所属的分类信息,通过关联规则算法发现频繁项集,产生关联规则,设置最小支持度分析出各门课程之间的内在联系,发现教学计划中课程之间的先行后继关系,为学生在课程学习中进行有关的决策提供一定的帮助,为教学计划的制定提供依据,优化课程设置.学校每个学期都要组织学生对科任教师进行教学评价,也会对教师的科研情况进行统计,这些都积累了大量的数据,如何从这些数据中挖掘出有用的数据为教学决策提供信息支持呢?利用关联规则分析学生对教师的测评信息、教师的基本信息、教师的科研情况来综合评定一个教师的教学能力,发现教师的教学效果与教师的年龄、学历、职称、工作量、科研等信息之间的关联关系,从而促进教师改进教学,提高教学能力.该系统采用改进的Apriori 算法来实现教学评价分析与优化课程设置.4.2决策树采用决策树算法对学生学习特征及学习成绩进行分析挖掘,预测不同类型学生偏好的授课方式,实现因材施教.挖掘方法:(1)数据采集:数据源来自学生的学籍信息、学生喜好的授课方式的问卷调查以及数据库中的学生成绩库;(2)数据清理:预先剔除与目标属性关联不大的属性以及清除噪声数据;(3)数据变换:对年龄、性别、生源地、专业、成绩等数据变换成布尔量,设定目标属性;(4)运用决策树相关算法进行分析,得出预测结论.系统采用改进的算法C4.5[8]决策树算法来实现预测学生偏好的授课方式,C4.5算法利用比较各个描述性属性的gainRatio (信息增益率)值的大小,选择gainRatio 值最大的属性进行分类,如可以设授课类型为“教师中心型”与“学生中心型”两个类,把表示学生特征的年龄、专业、工作经历、学业动机、学习成绩等属性作为输入变量,计算各属性的gainRatio 值,以gainRatio 值最大为根图3高校教学决策支持系统数据仓库结构图节点,得到相应的数据集,从而分析出结果.4.3聚类分析合理科学的试卷可以考查学生掌握课程综合知识的真实水平和反应教师的教学质量与教学效果.试卷分析能帮助教师更加合理的出题,帮助教师对不同类型的学生进行辅导,使不同层次的学生成绩在原来的基础上都有提高,从而进一步提高教师的教学水平和质量.对试卷的分析主要是通过采用聚类分析技术对学生试卷成绩的分析,在进行严格的试卷试题难度和区分度分析后,对试卷试题进行分类,如分为难度较小的基础题、难度一般的中等题、难度较大的提高题,用聚类方法对学生成绩进行群体分类,划分出不同的聚类结果,如聚类结果是有一类学生试卷成绩基础题、中等题、提高题都高分的,通过聚类结果可以清楚地看到学生成绩的分布情况,为教师改进试卷质量及实施分层教学提供了数据支持.该系统选用聚类算法中最为广泛使用的k-均值算法[7-8].5实验例子分析在对学校师资进行分析时,从教师综合能力评价的数据中挖掘出有用的信息是最关键也是最重要的参考依据.采用基于改进的Apriori算法实现教学评价信息的关联规则挖掘.5.1Apriori算法在为数众多的关联规则算法中,Apriori算法是最有影响力的,是挖掘布尔关联规则频繁项集的有效算法,它是使用一种称作逐层搜索的迭代方法[16],k-项集用于探索(k+1)-项集.Apriori算法分两步进行:一是生成所有支持度大于minsup的频繁项集;二是从频繁项集中生成所有满足置信度大于min-conf的关联规则,第二步是比较容易实现的,目前大量的工作是放在第一步即如何生成所有频繁项集.Apriori算法的伪代码[8]如下:输入:事务数据库D;最小支持度阈值minsup.输出:D中所有频繁项集L.方法:C1=init-pass(D);//对事务D 进行第一轮搜索L1={f|f∈C1,f.count/n≥minsup};//n是D中事务的数目for(k=2;L k-1≠芰;k++)do//随后的各轮搜索Ck=Candidate_gen(L k-1);//产生新的候选集for each transaction t∈D do//对所有事务扫描一遍for each candidate c∈Ck do//获得t所包含的候选集if c is contained in t thenc.count++;endforendforL k={c∈C k|c.count/n≥minsup}//产生频繁数据项集endforreturn L=∪k L k;//L为D中所有频繁项目集的集合Candidate-gen(产生候选项集集合C k)函数分成两步执行:合并和剪枝,函数描述如下:输入:L k-1.输出:C k.方法:C k=芰;//初始化候选项集集合C kfor all f1,f2∈L k-1//找出所有的最后一项不同的项with f1={i1,…,i k-2,i k-1}//频繁项集对(f1,f2)and f2={i1,…,i k-2,i’k-1}and i-1<i’k-1do//根据字典序将f1和f2合并c={i1,…,i k-1,i’k-1};C k=C k∪{c};//将新项集c加入C k中for each(k-1)-subset s of c doif(s埸L k-1)then//如果存在c的(k-1)-子集delete c from C k;//是频繁项集,则将c从C k中删除endforendforreturn C k;//返回生成的C k可见,Apriori算法要多次重复扫描数据库,会产生大量的候选集,造成花费在I/O上的时间很多,导致效率比较低.5.2改进的Apriori算法为了提高Apriori算法的效率,国内外许多研究学者在Apriori算法的基础上就如何减少不必要候选项集的生成,减少扫描数据库的次数以及减少I/O消耗时间上进行了深入的研究,提出了很多基于Apriori算法的改进和优化[17].本文采用了文献[18]提出的一种基于预处理的Apriori改进算法,其基本思想是对数据库事务集进行压缩,在算法开始之前,利用视图机制对原始数据进行筛选,把符合条件的数据和有用的属性放入视图中,在产生一维频繁数据项集后,根据一维(L1)和二维(L2)中的频繁数据项集对数据库中的属性进行过滤,以达到减少数据属性的目的,从而压缩数据库中的数据,提高关联规则挖掘算法的性能.改进的Apriori算法描述如下:CREATE VIEW视图名AS SELECT用户感兴趣的属性FROM原始表WHERE筛选条件//把用户感兴趣的数据放入视图中L1={large1-itemsets};SELECT属性值NL1中的属性FROM视图名WHERE属性值NL1//利用一维频繁数据项集过滤数据For(k=2;L k-1≠芰;k++)do beginC k=apriori-gen(L k-1);//新的候选频繁集For all transactions t∈D do beginC t=subset(C k,t);//候选频繁集的每一个子集For all candidates c∈C t doc.count++;endL k={c∈C k|c.count≥minsup}//产生频繁数据项集IF k=2THENSELECT属性值NL2中的属性FROM视图名WHERE属性值NL2//利用二维频繁数据项集过滤数据endAnswer=∪k L k;5.3应用(1)数据准备教师评价要结合学生对教师的年龄、职称、学历、工作量、科研能力、教师的网上评教打分等信息的综合评定,数据源来自人事管理系统的教师基本信息、教务管理系统的学生网上评教信息、科研管理系统的教师科研信息,但并非各个数据库的所有属性都有效,只需要教师编号、年龄、学历、职称、教学方式、学生评价总分等属性,忽略其他信息,采用文献[18]基于预处理的Apriori算法思想,利用视图机制先建立视图,如试验数据表1所示,通过挖掘找出年龄、学历、职称、教学方式与学生评教的关系.(2)数据转换由于教师评价数据都是非布尔型变量,在进行挖掘关联规则之前必须对各项数据进行转换即离散化处理,将年龄分为四组Y1(23岁-30岁)、Y2(31岁-40岁)、Y3(41岁-50岁)、Y4(51岁-60岁),学历分为E1(本科)、E2(硕士)、E3(博士),职称分为P1(助教)、P2(讲师)、P3(副教授)、P4(教授),教学方式分为传统讲授为单一方式T1,多种结合方式为多样化T2表示,学生评价分为G1(60分以下)、G2(61分-70分)、G3(71分-80分)、G4(81分-90分)、G5(90分以上).通过转换,得出表2.(3)数据挖掘分析根据教学经验设定最小支持度和最小置信度(如minsup=10%,minconf=50%),采用前述基于预处理的改进的Apriori算法进行挖掘,得到学生评价为90分以上的强关联规则集.如表3所示.通过关联规则可以发现学校的整个师资情况,如年龄较大、学历较高、职称较高的教师教学经验丰富,所以教学质量较好,受到学生欢迎;年龄较小、职称不高、学历较高的教师由于知识丰富、充满激情,比较受学生欢迎年龄较小、职称不高的青年教师由于教学方式多样化,也受到学生的好评.对教师教学评价的关联规则挖掘分析,保证了教学评价的科学性,是检验教学效果和教学水平的重要途径,为学校根据实际情况制定人才培养方案提供了参考依据.6结束语数据挖掘技术在金融、电信、电子商务、生物医学等领域得到了广泛应用并取得了一定的成效,也逐渐渗透到教育领域,为教育的发展起到了重要作用.针对目前高校日益增长的数据量,利用数据挖掘技术可以充分挖掘各部门的数据,将其转化为有用的信息.设计基于数据挖掘的高校教学决策支持系统,能够发现学校客观存在的优势和不足,为学校领导进行合理的教学决策提供信息支持,完善教学与管理方法,促进教育体制的改革、发展和完善,以进一步提高学校教学质量和办学效益.参考文献:[1]杨永斌.数据挖掘技术在教育中的应用研究[J].计算机科学,2006,33(12):284-286.[2]汤志贵.关联规则挖掘在高校教育管理中的应用[J].安徽工业大学学报,2008,25(3):334-341.[3]刘美玲,李熹,李永胜.数据挖掘技术在高校教学与管理中的应用[J].计算机工程与设计,2010,31(5):1130-1133.[4]李芳,王恒山,吕丽娟.关联规则在教学管理决策支持中的应用[J].上海理工大学学报,2005,27(3):263-267.[5]魏萍萍,王翠茹,王保义,等.数据挖掘技术及其在高校教学系统中的应用[J].计算机工程,2003,29(11):87-89.[6]陈路明.基于数据挖掘的决策支持系统分析研究[J].图书馆学研究,2010,9:44-46.[7]Jiawei Han,Micheline Kamber.数据挖掘概念与技术[M].北京:机械工业出版社,2005.[8]Bing Liu.Web数据挖掘[M].北京:清华大学出版社,2009.[9]Agrawal R,Imielinski T,Swami A.Mining Association Rules between Sets of Items in Large Databases[A]Proc.ACMSIGMOD Int.Conf.Management of Data[C]Washing-ton DC,1993:207-216.[10]王平水.关联规则挖掘算法研究[J].计算机工程与应用,2010,46(30):115-116.[11]AGRWAL R,SRIKAN R.Fast algorithms for mining asso-ciation rules in large databases[A]Proceedings of the20th International Conference on Very Large Data Bases[C],San Francisco:Morgan Kaufmann Publishers,1994:487-499.[12]J.R.Q uinlan.c4.5:Program for Machine Learning.Morgan Kaufmann,1992.[13]王庆育.软件工程[M].北京:清华大学出版社,2004.[14]W.H.Inmon.Building the Data Warehouse.New York:John Wiley&Sons,1996.[15]王珊.数据仓库技术和联机分析处理[M].北京:科学出版社,1995:20-22.[16]Agrawal R,Srikant K.Fast algorithms for mining association rules[A].Proc of the1994Int Conf on Very Large Databases [C],1994:160-162.[17]刘君强,孙晓莹,潘云鹤.关联规则挖掘技术研究的新进展[J].计算机科学,2004,31(1):110-113.[18]娄兰芳,潘庆先.关联规则挖掘的一个高效预处理算法[J].烟台大学学报(自然科学与工程版),2007,20(1):44-47.Design of the Decision-Supporting System of University Teaching Based on Data MiningLiu Yaonan(Jiaying University,Meizhou514015,China)Abstract:In order to utilize the abundant data about universities education management effectively,data mining technologies are applied to mine useful information which can serve teaching management for decision-making from these data,and a special decision-supporting system of university teaching is designed.Based on data mining and data warehouse techniques,it adopts a C/S/S and B/S/S models with three layers,analyses the data by using association rules,decision tree and clustering.An application example of the preprocessing improved Apriori algorithm in teaching appraisal is given to explain the process of data mining and analyze the mining results.Key words:data mining;data warehouse;Apriori;teaching;decision-supporting。
集成数据挖掘的决策支持系统的系统结构
图 3并联式 的 D S的系统结构 S 三 、D M与三库无缝衔接的 D S的系三库结构 .一方面是因为 也 就 是不 成 为 真 正 的 D S S 。这 种 观 点实 际上 是 对 D S的误 解 .认 这就 S 睁使我们前期 的研究工作都付诸东流 . 使我们对 D S的理解 S 为只要是 为管理者提供信息的计算机系统都是 D S S。
一
、
数 据 挖掘
谈到D M的延生, 我们不得不 引用如下一些十分精辟 的描述 ” 数据过剩” “ 、 丰富的数据 . 贫乏的知识” 、 数据爆炸 . 知识贫乏” 、
” 数据 矿 山 ,知 识 金块 ” 。所 有 的描 述 都 基于 这 样 一个 事 实 一方 面 在 数据 收集 工具 的帮 助 下 . 们 积 累 了庞 大 的甚 至 是 海 量 的 数 我 据 .另一 方面 由于 缺 乏强 有 力 的 数据 分 析 工 具 的辅 助 ,我 们 不能
计新 的D S的系 统结 构 . 集 成 D S 是 M的 D S 讨 论 的 主 要 问题 。广 S要 大专 家 和 学者 对 这一 新 的系 统 结构 已经 展 开 了广 泛 的 探讨 ,并 且 建立 了很 多模 型 。 总 的来 说 .这 些 模 型 可 以分 为 三 类 1抛 弃模 型 库 与 知识 库 . 接 用D 直 M的结 果 作 为 决策 信 息 以辅 助 决 策 .王铁 宇 等 在 参 考 文献 【】 6中建 立 的 模 型就 属 于 这 种 类 型 。 这种 模 型 的典 型 结 构如 图 1 。基 于 这 种模 型 构 造 的 D S实 际 上 只 S
_ __ _ _ 一 _ 一 _ … … _ _ _ _ - I_ -_ - _ _ _ … __ _ _ 一
换成有价值的知识资源 .从而辅助人们进行科学的决策。在这一 需求的引导下 .D 便应运而生。1 5年 .在美 国计算机年会 M 9 9
基于数据挖掘技术的决策支持系统设计
1 决策 系统 的基 本结构
首先 ,需要将不 同部门级系统 中的数据综合、归类 ,并进行必要 的 抽象 ,即建立数据仓库 ( a aeos ,D ),以D dt w rhue W a W为基础进行联 机 分析处理 (nieoa s rcs n ,O A ol nl ipoes g L P)和数据挖掘 ( aamnn , n . ys i d t iig D M),为科学决策提供依据支持。 D W、O A 和D L P M是 三种相互独立 又相互关联的技术。DW是从数据 库技术发展中出现的一种 为决策服务 的数据组织 、存储技术 。D W由基 本数据 、历史数据 、综合数据和元数据组成 ,能提供综合分析 、时问趋 势分析等决策信息。0L P A 是对多维数据进行分析的技术。由于大量数据 集中于多维空 间中 ,O P 技术提供从多视角分析途径获取用户所需要的 辅助决策的分析数据 。D 对数据库或D M W中的数据使用一系列方法进行 挖掘 、分析 ,从中识别和抽取隐含 的潜存的有用信息 ,并利用这 技术 进行辅助决策 ,如图l 。
1 )分类模 式 :分类模式是一个分类 函数 ,能够把数据集 中的数据 项映射到某个给定的类 上。分类 模式往往表现为一棵分类树 ,根据数据 值从树根开始搜索 .沿 着数据满足的分 支往上走 ,走到树叶就能确定类 别 。2)回归模式 :回归模 式的函数定义与分类模式相似 ,它们的差别 在于分类模式的预测值是离散的 ,回归模式 的预测值是连续 的。3)时 间序列模式 :时间序列模式根据数据随时间变化 的趋势预测将来 的值 , 这 里 要考 虑 到 时 间 的特 殊 性 质 ,像 一些 周 期性 的 时间 定 义 如星 期 、月 、 季节 、年等 ,不同的 日子如节假 日可能造成的影响 ,日期本身 的计算方 法 ,还有一 需要特殊考虑的地方 如时间前后 的相关性等。只有充分考 虑 时 间 因素 ,利用 现有 数 据 随 时 间变 化 的 一 系 列 的值 ,才 能更 好 地 预测 将 来的值 。4)聚类模式 :聚类模式把数据划分到不同的组中 ,组之 间 的差别尽可能大 ,组 内的差别尽可能小 . .与分类模式不同,进行聚类前 并 不 知 道 将 要划 分 成 几个 组 和什 么 样 的 组 ,也 不 知 道 根据 哪一 个 数据 项 来定 义组 。一般来说 ,业务知识丰 富的人应该 可以理解这些组的含义, 如果产生的模式无法理解或不可用 ,则该模式 可能是无 意义的 ,需要 回 到 上 阶段 重 新 组织 数 据 。
基于数据仓库的高校决策支持系统设计
各 自的数据库 里 .对 这些 数 据所 隐含 的价值 以及 数据 维 数 据 组织 正 好形 成 相 互 结合 、相 互 补 充 的关 系 . 因 之 间的关 联没 有 深入 挖掘 利 用 .无法 为决 策 者提 供更 此 .将 O A L P技术 与数 据仓 库结 合可 以较 好地 解 决 决
1 决策 支持 系统 概述 、
1 . 策支 持 系统 的概念 1决
和知 识 . 现潜 在 的规律 , 决策者 提 供决 策依 据 。数 发 为 据 挖掘 与 O A L P不 同 的地 方 是 .数据 挖掘 不是 用 于验
决 策 支 持 系 统 ( S ) 是 由 电 子 数 据 处 理 系 统 证某 个假 定 的模式 的正 确性 .而 是从 数据 中 自己寻找 DS 其在 本质 上是 一个 归纳 的过程 。 据挖 掘反 过来 数 fD S 、 E P 1管理 信息 系统 ( S逐 步发 展 而来 的 , 支 持半 模式 . MI) 是 结构化 和非 结构 化决 策 ,辅 助 决策 者进 行决 策 分 析 的 又可 以为联机 分析 处理提供 分 析的模 式 人机交 互式计 算 机应 用 系统 。它为 决 策者 提供 分 析问 数 据仓 库 、联 机 分析 处理 和数 据挖 掘 技术 既相 互 题 、 立 模 型 、 拟 决 策过 程 和 方 案 的环 境 , 建 模 并调 用 各 补 充 . 相互 结合 . 不 同 的角 度 为决 策服 务 : W 用 又 从 D 种 信息 资源 和分 析工 具 .帮 助决 策 者提 高决 策水 平 和 于 数 据 的 存 储 和 组 织 : L P集 中 于数 据 的分 析 ; M OA D
14 3
福
建
电
脑
2 1 第 8期 0 0年
学校管理决策支持系统
学校管理决策支持系统学校作为培养人才的重要场所,需要高效的管理决策支持系统来提升管理水平和教学质量。
本文将介绍学校管理决策支持系统的定义、作用和实施过程。
一、定义学校管理决策支持系统(School Management Decision Support System,简称SMDSS)是指通过信息技术手段,将学校管理的各个环节与数据整合,提供给决策者科学、有效的决策依据的系统。
SMDSS 的主要目标是帮助学校管理人员更好地进行战略规划、资源配置和风险控制,以提升学校整体竞争力和教学质量。
二、作用1. 数据整合:SMDSS可以将学校各个系统的数据进行整合,形成全面的信息数据库,为决策者提供准确、可靠的数据基础。
2. 数据分析:SMDSS能够对学校的数据进行深度分析,通过统计和可视化手段,提供决策者对学校管理和教育教学的洞察和理解。
3. 决策支持:基于数据分析结果,SMDSS可以为决策者提供全面的决策支持,帮助他们进行战略规划、资源配置和风险控制等决策过程。
4. 效率提升:SMDSS的使用可以大幅提高学校管理的效率,减少决策制定的时间和成本,提高管理决策的科学性和准确性。
三、实施过程1. 需求分析:根据学校的管理需求,明确SMDSS的功能、特点和实施范围。
确定系统应用的目标和期望效果,明确决策支持系统中需要整合的数据来源。
2. 数据集成:将学校现有的信息系统与SMDSS进行系统对接,确保各个系统间数据的无缝衔接和共享。
同时,制定数据标准和数据质量控制机制,保证数据的准确性和可靠性。
3. 数据分析与建模:利用数据挖掘、分析工具和模型,对学校的现有数据进行处理、分析和建模,形成可供决策者使用的信息报表和可视化图表。
4. 决策支持与优化:根据决策者的需求,提供可视化的决策支持工具,使决策者能够通过交互操作,快速获取所需的决策分析结果。
同时,迭代优化决策支持系统,提高系统的稳定性和易用性。
5. 培训和推广:为学校管理人员提供相关培训,帮助他们掌握SMDSS的使用方法和技巧。
基于数据挖掘的网络教学决策支持系统研究
摘 要 :在现代远程教育 中,受教育对 象个性特征 的差异与传统远程教 育资源模 式的单一性产生 巨大 矛盾 ,本文提 出了个 }化远 程 学习模 型的概念 ,在 传统 网络教 学系统 中引入 爪I化技 术、数据挖掘技术 。 生 } 生 关键词 :数 据挖 掘 ;关联规则 ;个I 化 学习 系统 } 生 中图分 类号 : P 1. 文献标识码 :A 文章编号 :10— 59 o2 1- 29 0 ‘ 313 T 1 07 99  ̄ 1) 5 06- 2
《 教育规划纲要 》提 出“ 大力发展现代远程 教育,建设 以
卫星 、 电视和 互联网等为载体的远程开放 继续 教育 及公共服务 平 台,为学习者提供方便 、灵 活、个性 化的学习条件” 。
理 、作业布 置评 改、学习评测 、学生评价等 。 33 统计挖掘功能 .
统计查询功 能主要对学生的数据进行统计查询 , 建立起完 整 的学生学 习个性模 型, 行个 性化界面定制 , 进 可为用户提供 基 于这 一思想 , 我们 申报 了 “ 基于数据挖 掘的网络 教学决 策支持 系统研 究 ” 目研究课题 , 项 探索并构建 了基 于数 据挖 掘 智能化 、个性化服 务。 34 其他 . 技术 的网络 教学模式 , 并在现代远程开放 教育 实践中进 行 了应 权 限管理功 能、B BS论坛 、质量评价等 。 用 尝试 。 在我们 的平 台设计 中, 系统 开发环境 的选择要求是 目前流 今天 , 数据挖掘技术在 国外 的大 型商业 、 金融业、 保险业 、 所 民航 等大型企业 得到 了广泛应用 ,其 中,We b挖掘在 电子商 行的开发技术手段 同时又要求经济可行 ≥ 以免费开源成 了我 们的首选 。我们 系统软件环境搭建为 A ah p ce服务器+ HP P + 务上 的应用 是 目前最成功 的, 我们常 常访 问的京东、当当等大 Wix + sl n p Myq 数据库 。 型 商务 网站均能看 到数据 挖掘 的影子。We 挖掘为正确 的商 b P HP是 :H p r x rpoesr y et t e rcso( e P 超文本预处理 器) 的缩 写 , 业 决策提供 强有 力的支持和可靠 的保证 , 电子商 务不可缺少 是 的重要 工具 。 目前国 内外 远程教学 平 台在 利用数据 挖掘技术 分析学 生 访 问记 录,优化 We b站点拓扑结构 ,从而给 学生提供 动态的 个性化 的高 效率 学习支持服务方面做得 比较 少, 多数 网络 教 大 学平 台只是 简单 利用 了一些数据统计功 能等 , 对数据 的分析 不 够深入 ,不能提供 完善的个性化支持服务 。 是因为数据挖 掘 这
数据挖掘技术在决策支持系统中的应用
数据仓库技术的出现为解决上述问题提供了新思路 。它从 大量 的 事务型数据 中抽取数据 , 并将 其清理 、 转换为新的存储格式 , 为决策 既 支持 目标把数据聚合在一种特殊 的格式 中, 作为决策分析的数据基础 , 从而在理论上解决了从不 同系统的数据库中提取数据的难题 。 同时 , 利 用联机分析处 ̄(L P OA ) 技术可 以对数据仓库提供的数据进一步作深加 工。例如 , 对关键性指标数据 常常用代数方程进行处理 , 复杂的分 对更 析可建立模型进行计算 。 L P O A 技术解 决了对大量数据进行数值计算 的 问题 。 数据仓 库及 OL P技术 的出现为决策支持系统开辟了新途径。数 A 据仓库侧 重于存储 和管理 面向决策 主题 的数据 ;而 O A L P则侧 重于数 据仓库的数据分析 , 并将其转换为辅助决策信息。O A L P的一个主要特 点是多维数据分析 ,这与数 据仓库 的多维数据组织正好形成相辅相成 的关系。从而利用 O A 技术 与数据仓库 的结合较好地解决了传统决 LP 策支持系统 既需要处理大量 数据又需要进行大量数值计算的问题 。 OA L P的多维数 据分 析主要通过对多维数据 的维进行剖切 、钻 取 和旋转来实现对数据库所提供的数据进行 深入 分析 ,为决策者提供决 策支持。多维结构是决策支持的支柱, 也是 O A L P的核心 。多维结构中 的维与一般意义上的物理维( 如平面 、 立体) 是有所 区别的 , 它突破了三 维概念 , 可以有四维 、 五维甚至更多维 的数据结构 , 既超立方体和多立 方体的数据结构 。可以利用分析工具对 多维数据结构进行切片 、 切块 、 向上钻取 、向下钻取和旋转等处理得到所需的决策分析数据 。例如对 “ 区、 地 时间、 产品” 三维立方体进行切 片、 切块 处理得到三维立方体切 片 、 块 示 意 图 , 图 2所 示 : 切 如
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
收稿日期:2004-05-12作者简介:陈善柳(1975-),男,湖南衡阳人,南华大学计算机科学与技术学院讲师,中南大学信息科学与工程学院硕士研究生.主要研究方向:数据库.第18卷第3期南华大学学报(自然科学版)V ol.18N o.32004年9月Journal of Nanhua University (Science and T echnology )Sep.2004文章编号:1673-0062(2004)03-0083-05基于数据挖掘技术的高校管理决策支持系统陈善柳1,2,费洪晓1(1.中南大学信息科学与工程学院,湖南长沙410075;2.南华大学计算机科学与技术学院,湖南衡阳421001)摘 要:分析了高校MIS 的特点及DM 与O LAP 的作用与功能.提出了高校建立基于数据挖掘技术的管理决策支持系统的途径与方法,即在建立DW 基础上进行DM ,并与O LAP 相结合以提高系统辅助决策能力.关键词:数据仓库;数据挖掘;联机分析处理;联机分析挖掘;决策支持系统中图分类号:TP315 文献标识码:BH igher Education ’s Decision Support Systems B asedon Data Mining in Colleges and U niversityesCHEN Shan 2liu 1,2,FEI H ong 2xiao 1(1.C ollege of In formation Science and Engineering ,Central S outh University ,Changsha ,Hunan 410075,China ;2.School of C om puter Science and T echnolog ,Nanhua University ,Hengyang ,Hunan 421001,China )Abstract :In this paper the featwres of higher educarion ’s MIS ,and described the function of DM and O LAP and introduced the method of building highereducarion ’s DSS.The method is to build DW first and then DM based on it s o as to im prove the ability of the DSS by the way of combining with O LAP.K ey w ords :Data Warehouse ;Data Mining ;O LAP ;O LAM ;DSS0 引言近年来,随着教育事业的飞速发展,特别是高等教育的快速发展.教育管理信息化、现代化水平有了长足的进步.各高校在管理信息系统(Man 2agement In formation System ,MIS )方面已取得了可喜的成绩.如大部分高校都在使用学生成绩管理系统、学籍管理系统、学生奖惩考评管理系统、高校人事管理系统、高校学生就业管理系统、学生宿舍管理系统等.这些系统的成功实施为各高校的日常管理工作带来了很大的便利,提高了管理效率和水平.在日常的工作中也积累了越来越多的数据.目前的这些数据库系统基本上都可以实现数据的录入、修改、统计、查询等功能.这些MIS 大都是孤立的分属于不同的部门,为完成某一个具体的工作而设计.如何方便、快捷、有效的统一利用这些数据,为管理决策者提供事实依据,成为一个亟待解决的问题.同时,随着高校招生规模的逐年扩大以及再教育方式的更加灵活多样,几乎每所高等院校都面临着学生人数的急剧增加与教学资源日趋紧张的矛盾.在这样的形势下如何以最小的代价获得高校自身最大的发展,则已成为一个迫切需要研究的新课题.简单的来看,它要求高校领导层从整体的、宏观的角度去认清形势,解决问题,优化教育资源配置,提高教育资源的利用率.因此,建立一个企业级的高校管理决策支持系统(Decision Support System,DSS)则显得十分必要.这个管理决策支持系统应能满足日常简单的查询和维护,同时能够向高校决策者提供有关教育形势的瞬时变化、发展趋势以及历史数据的深层次信息,以利于决策.因此,如何建立数据仓库,更好的利用现有数据,并在此基础上进行更高层次的处理———数据挖掘(Data Mining,DM)显得尤为重要.1 系统基本结构根据目前高校MIS的特点,首先需要在较高层次上将不同信息系统中的数据综合、归类,并进行分析利用的抽象,即建立数据仓库(Data Ware2 house,DW),在DW的基础上进行联机分析处理(On Line Analysis Processing,O LAP)和数据挖掘(Data Mining,DM),为科学决策提供依据支持.DW、O LAP和DM是三种相互独立又相互关联的技术.DW是从数据库技术发展中出现的一种为决策服务的数据组织、存储技术.DW由基本数据、历史数据、综合数据和元数据组成,能提供综合分析、时间趋势分析等决策信息.O LAP是对多维数据进行分析的技术.由于大量数据集中于多维空间中,O LAP技术提供从多视角分析途径获取用户所需要的辅助决策的分析数据.DM对数据库或DW中的数据使用一系列方法进行挖掘、分析,从中识别和抽取隐含的、潜在的有用信息,并利用这些技术进行辅助决策[1].联机分析挖掘(On Line Analytical Mining,O LAM)是通过DM和O2 LAP有效结合而形成的技术.他们从各自不同的角度辅助决策.DW是基础,O LAP和DM是两种不同的分析工具.根据高校自身特点,采用DW+O LAP+DM三者结合的方式,构建决策支持系统.充分利用三者优点以提高辅助决策能力.基于以上情况,高校管理决策支持系统结构如图1所示.其中通过元数据来支持和管理系统.2 数据仓库DW作为决策支持系统的基础,它是面向主题的、集成的、稳定的、随时间变化的数据集合[2]. DW不是业务数据的简单堆积,而是从大量的事务型数据库中抽取数据,并将其清理、转换为新的存储格式,即为决策目标把数据聚合在一种特殊的格式中.随着此过程的发展和完善,这种支持决策的、特殊的数据存储即被称为DW.DW具有如下特征:1)DW是面向主题的.面向主题的组织数据是DW的基本特征,主题从逻辑意义上讲对应企业某一分析领域所分析的对象.2)DW是集成数据的统一体.DW的数据来源于事务数据库,这些数据是构成DW的基础.这些事务数据库的数据通过清洗处理后,形成整合的、结构化的、易于导航的数据,能够对决策分析快速正确地反应.3)DW是随时间而变的、持久的数据集合. DW包含大量的数据,是对事务数据库不同历史时期的数据的综合、重组、统计导出的数据集合.事务数据库需要频繁地进行增、删、改等事务操作,而在DW中更多的是增,很少有删、改,DW在一定的周期保持稳定.图1 基于DM的决策支持系统结构Fig.1 The structure of Decision SupportSystems b ased on DM48南华大学学报(自然科学版) 2004年9月DW 把高校分散的、难以访问的日常营运数据转化为集中统一、随时可用的信息,一般来说,完整的DW 具备建立、管理和使用全部成分.DW 结构上可分为:数据源、后端加工、前端服务以及数据仓库的管理.数据源为DW 提供源数据,如各种子系统数据库、联机事务处理系统的事务数据、外部数据源等都可以作为DW 的数据源.高校数据仓库的建立数据来源如图2所示.后端加工工具即数据ET L (抽取、转换、装载):其功能是从数据源中抽取数据,对数据进行检验和整理,并根据DW 的设计要求,对数据进行重新组织和加工,装载到DW 的目标数据库中,并且可以周期性地刷新DW 以反映源的变化以及将DW 中的数据作转储.数据仓库管理主要是通过元数据来实现的,元数据仓储用于存储数据模型和元数据,其中,元数据描述了DW 中源数据和目标数据本身的信息,定义了从源数据到目标数据的转换过程,这些可以通过数据建模工具管理以适应高校事务的发展,来满足高校决策和综合分析的需要;DW 监控和管理工具对DW 的运行提供监控和管理手段,包括系统资源的使用情况、用户操作的合法性、安全管理、存储管理等多方面的内容.DW 存储经检验、整理、加工和重新组织后的数据,它可以是关系数据库(RO LAP )或多维数据库(M O LAP ).前端工具主要是DM 工具和联机分析处理(O LAP )分析工具,这些工具从数据仓库获取数据通过O LAP 服务器,O LAP 服务器存储数据立方体,它是功能强大的多用户的数据操纵引擎,特别用来支持和操作多维数据结构.图2 DW 数据来源图Fig.2 The source of DW d ata3 联机分析处理利用关系数据库中的数据进行联机分析处理,往往会因查询的数据信息不是缺乏分析能力,就是因各信息系统之间相互隔离、结构各异,使信息分析及决策人员不能据此对某一主题的相关数据进行多角度的比较、分析,因而得出科学的分析结果.而基于DW 的O LAP 则很好的避免了该类问题的发生.它根据用户对企业业务理解的各种维度,或者说从用户分析企业时的各种宏观领域出发,从企业具有的各种原始数据转换出各类信息,提供给分析、管理和领导人员快速、方便、交互地访问,从不同领域、不同角度查看企业情况,获得企业信息,了解企业发展动态,从而为快速响应市场、抢占市场先机、完善企业管理、提高企业竞争力和做出有效决策提供坚实的基础.O LAP 主要有两个特点,一是在线性(On -Line ),体现为对用户请求的快速响应和交互式操作,它的实现是由C/S 这种体系结构来完成的;二是多维分析(Multi Analysis ),这也是O LAP 技术的核心所在[3].目前,针对O LAP 技术的研究领域相当活跃,对O LAP 的理解也不断深入.有人提出了O LAP 的更为简洁的定义,如Nigel Pendse 提出的FAS MI (Fast Analysis O f Shared Multidimensional In forma 2tion ).他将O LAP 所满足的特点用五个词来描述:Fast (对用户请求的快速响应),Analysis (可以应用多种统计分析工具、算法对数据进行分析),Shared (多个用户同时存取数据时,能保证系统的安全性),Multidimensional (体现了O LAP 应用多维的实质),In formation (指应用所需的数据及其导出信息).4 数据挖掘DM 是从大型数据库的数据中提取人们感兴趣的知识,这些知识是隐含的、事先未知的潜在有用信息,提取的知识可表示为概念、规律、模式、规则、约束、可视化等形式[4].DM 意味着在一些事实或观察数据的集合中寻找模式的决策支持过程,DM 的对象不仅是数据库,也可以是文件系统、数据集合或DW.基于DW 的DM 技术,其任务是发现DW 中尚未被发现的知识.对于那些决策者明确了解的信息,可以用查询、O LAP 或其它工具直接获取,而另外一些隐藏在大量数据中的关系、趋势等信息就需要DM 技术.DM 技术可从58第18卷第3期 陈善柳等:基于数据挖掘技术的高校管理决策支持系统DW中找出大量真正有价值的信息和知识,可以更好地对高校的发展历程和未来趋势做出定量分析和预测.为各高校的管理决策者提供更科学的决策依据,从而有效的提高教学质量,有针对性的加强教学管理.DM的过程也就是从数据库或数据仓库中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的高级处理过程.所谓模式,可以看作是我们所说的知识.它给出了数据的特性或数据之间的关系,是对数据包含的信息更抽象的描述.所谓处理过程是指DM是一个多步骤的对大量数据进行分析的过程,包括数据预处理、模式提取、知识评估及过程优化.DM主要提供了以下几种模式:1)分类模式:分类模式是一个分类函数(分类器),能够把数据集中的数据项映射到某个给定的类上.分类模式往往表现为一棵分类树,根据数据的值从树根开始搜索,沿着数据满足的分支往上走,走到树叶就能确定类别.2)回归模式:回归模式的函数定义与分类模式相似,它们的差别在于分类模式的预测值是离散的,回归模式的预测值是连续的.3)时间序列模式:时间序列模式根据数据随时间变化的趋势预测将来的值.这里要考虑到时间的特殊性质,像一些周期性的时间定义如星期、月、季节、年等,不同的日子如节假日可能造成的影响,日期本身的计算方法,还有一些需要特殊考虑的地方如时间前后的相关性(过去的事情对将来有多大的影响力)等.只有充分考虑时间因素,利用现有数据随时间变化的一系列的值,才能更好地预测将来的值.4)聚类模式:聚类模式把数据划分到不同的组中,组之间的差别尽可能大,组内的差别尽可能小.与分类模式不同,进行聚类前并不知道将要划分成几个组和什么样的组,也不知道根据哪一(几)个数据项来定义组.一般来说,业务知识丰富的人应该可以理解这些组的含义,如果产生的模式无法理解或不可用,则该模式可能是无意义的,需要回到上阶段重新组织数据.5)关联模式:关联模式是数据项之间的关联规则.关联规则是如下形式的一种规则A→B,但实际应用中,很少能够百分之百的出现这种规则,我们通过一个阀值来控制它,例如“在大学英语四级未通过的学生中,60%的学生的各科平均分在70分以下.”6)概念描述和比较:概念描述即在数据中,把具有共同性的数据做汇总操作,从而得到一个具有一般性的规则描述.如我们可以对学生就餐情况数据汇总,而得到每天的每个时段学生就餐人数的高峰期,从而可以考虑增派人手,提高服务质量.比较即将数据分成若干组,找出组与组之间的差别,同时可将同一组数据中的相似性找出来.根据高校目前MIS的特点,大都分为:学籍管理,成绩管理,师资管理等几大子系统,本身具有分类的特性.因此高校管理DSS的数据挖掘方法主要采用分类模式分析的方法,以分类模式分析为主线,关联模式分析为辅线结合其他的分析方法进行.5 联机分析挖掘联机在线分析挖掘可以表示为:O LAP+DM =O LAM,即DM和O LAP的有效结合,形成了联机在线分析挖掘.O LAP和DM属于两种不同的分析工具,有各自的特色和缺点,将它们结合起来,这可以充分发挥各自特色.对于决策者来说,利用O LAP工具对当前数据进行深入分析验证其提出的假设和问题之外,也可以验证DM得出的预测性结论,防止偏差.O LAP的在线性体现在与用户的交互和快速响应,多维性则体现在它建立在多维视图的基础上.用户积极参与分析过程,动态地提出分析要求、选择分析算法,对数据进行由浅及深的分析.DM与O LAP不同,主要体现在它分析数据的深入和分析过程的自动化,自动化是说,其分析过程不需要用户的参与,这是它的优点,也正是它的不足,因为在实际中,用户也希望参与到挖掘中来,如只想对数据的某一子集进行挖掘,以及对不同抽取、集成水平的数据进行挖掘,还有想根据自己的需要动态选择挖掘算法等等[5].由此可见,O LAP与DM各有所长,如果能将二者结合起来,发展一种建立在O LAP和DW基础上的新的挖掘技术,将更能适应实际的需要.而O LAM(On Line Analytical Mining或O LAP Mining),正是这种结合的产物.也是这种新型的决策工具发展的方向.但是建立在庞大数据库或DW基础上的O2 LAM在实现过程中面临的最大挑战是执行效率的提高和对用户请求的快速响应,目前还没有O2 LAM的产品出现.6 挖掘实例根据南华大学2000级学生的资料建立数据68南华大学学报(自然科学版) 2004年9月库,主要数据内容为学号,姓名,学生所在学院,高考成绩,高考外语成绩,成绩平均分,英语四级,英语四级通过的学期等.将相应字段的字符型数据经规范后,转换成数值型数据进行编码.如将学生所在学院规范成以下编码信息:字 段 值对应编码值护理学院1计算机科学与技术学院2核科学与技术学院3医学院4机械工程学院5建筑工程与资源环境学院8在此基础上采用遗传算法进行关联模式的挖掘.在本例中遗传算法采用以下运行参数:初始种群M选为1000,交叉概率P c设为85%,变异概率P m设为5%,编码串长度L设为6,终止条件是经过两代运算后,没有小于用户给定阈值的规则.经运算后在学生的资料库中发现部分关联规则如下.1)<1000>→<014>(4%support,98%con2 fidence)该规则表明护理学院的学生在第四学期通过英语四级的可信度为98%,支持度为4%也就是说护理学院的学生第四学期基本上都能通过大学英语四级考试.2)<00004>→<08>(2% support,99%con fidence)该规则表明平均分低于70分的学生到第8学期仍未通过大学英语四级的可信度为99%,支持度为2%也就是说平均分低于70分的学生基本上未通过四级考试.3)<0003>→<010>(12%support,90%con fidence)该规则表明高考外语成绩高于90分(150分制)的学生大都能通过四级考试.其可信度为90%,支持度为12%.通过以上的挖掘发现,我们可以有针对性的调整教学计划,有目的,有方向的做到因材施教,切实加强学生的素质教育,提高学生的综合能力.7 结束语DM技术已经在商业、金融业、保险业、电信业等多个领域开始得到应用,取得了令人满意的效果.在教育领域里,随着MIS数据信息的不断增长,把DM技术应用到MIS中,以建立高校管理决策支持系统,必将为高校各级领导部门的决策,提供切实可行的提高教学质量、优化教学资源的依据,为各高校在激烈的竞争中掌握主动,在未来的发展中提供更广阔的空间,发挥重要的作用.参考文献:[1]陈文伟.决策支持系统及其开发(第二版)[M].北京:清华大学出版社,2000.[2]I NM ON W H.王志海译.Building the Data Warehouse[M].北京:机械工业出版社,2000.[3]王 珊.数据仓库技术与联机分析处理[M].北京:科学出版社,1998.[4]张丽丽.数据挖掘技术的应用分析[J].山西经济管理干部学院学报,2003,11(4):75-76.[5]Scott PD.Evaluating data mining procedures:techniques forgenerating artificial data sets[J].In formation and S oftware T echnology,1999,(4):579-587.78第18卷第3期 陈善柳等:基于数据挖掘技术的高校管理决策支持系统。