基于KETTLE的高校多源异构数据集成研究及实践

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

的抽 取 、 转换 和 加 栽 。E r L模 型 自动 生 成 了以上 网行 为 事 实表 为 中 心表 , 以学 生 信 息 、 上 网信 息 、 时 间 3个 维度 表 的数
据仓库。利用 K E T T L E 能 够快 速 实现 高 校 多 源异 构 数 据 集 成 , 形 成 高质 量 的 分析 型数 据 , 为决 策 支 持服 务 。
Ab s t r a c t : T o s o l v e t h e i n t e g r a t i o n o f c o l l e g e mu l t i - - s o u r c e h e t e r o g e n e o u s d a t a . Us i n g he t o p e n - s o u r c e t o o l , KE TI I E, t o e x t r a c t ,
刘 充
( 南京 中 医药 大 学 信 息技 术 学院 , 江 苏 南京 2 1 0 0 2 3 ) 摘要 : 解 决数 字化 校 园 建设 中 的 多 源 异 构 数 据 集 成 问题 。 利 用 开 源 E T L工 具 K E T Y L E, 对 学 生 考 试 信 息 与 上 网信 息
Re s e a r c h o n i n t e g r a t i o n o f c o l l e g e mu l t i - s o u r c e h e t e r o g e n e o u s d a t a
L I U C h o n g
Ke y wo r d s : d i g i t a l c a mp u s ; h e t e r o g e n e o u s d a t a ; d a t a i n t e ra g t i o n; KE r l q ' L E; E T L
数 字 化 校 园 是 以 网 络 技 术 为 基 础 ,利 用 信 息 技 术 实 现 对教学 、 科研 、 管理 、 生 活服务 等信息 的收集 、 处理 、 整合 、 存
关键词 : 数 字 化校 园 ; 异构数据 ; 数据 集成 ; K E , I T r I . E ; E T L
中圈 分 类 号 : T N 9 1 9
文 献标 识 码 : A
文章 编 号 :1 6 7 4 — 6 2 3 6 ( 2 0 1 5 ) 1 0 — 0 0 2 4 — 0 3
教 育环境 [ 1 】 。然 而 , 由 于 高 校 信 息 化 建 设 尚 未 形 成 统 一 的 标
准 , 不同厂商 的系统 互不兼容 , 不 同 系 统 之 间 无 法 互 联 互 通
成 主 要 由转 换 ( T r a n s f o ma r t i o n ) 和作业 ( J o b ) 两部分完成 , 其 中 “ 转换” 由一 系 列 步 骤 所 组 成 的逻 辑 工作 网 络 , 每 一 个 步 骤 表
储、 传输和应 用 , 使 数 字 资 源 得 到 充 分 优 化 利 用 的 一 种 虚 拟
试 构建 高效 多 源异 构 数 据 E T来自百度文库L解 决 方案 , 实 现 异 构 数据 共 享 。
1 KE T T L E E T L简 介
K E T T L E是 一 款 用 J a v a 编写的开源 E T L工 具 ,其数 据 集
t r a n s f e r a n d l o a d d a t a f r o m t h e e x a m s y s t e m a n d t h e n e t w o r k ma n a g e me n t s y s t e m. T h e d a t a wa r e h o u s e w a s b u i l t , wh i c h wa s c o n s i s t e d o f a f a c t t a b l e a n d t h r e e d i me n s i o n t a b l e s i n c l u d i n g s t u d e n t s ’ i n f o r ma t i o n , n e wo t r k i n f o ma r t i o n a n d t i me t a b l e . I n hi t s r e s e a ch r , we f o u n d t h a t mu l t i - s o u r c e h e t e r o g e n e o u s d a t a c o u l d b e i n t e g r a t e d e ic f i e n t l y , a n d a n a l y t i c a l d a t a w a s p r e p a r e d f o r d e c i s i o n s u p p o r t f u r t h e r .
( I n s t i t u t e o fI n f o r m a t i o n a n d T e c h n o l o g y , N a n j i n g U n i v e r s o fC h i n e s e Me d i c i n e , N a n j i n g 2 1 0 0 2 3 , C h i n a )
第2 3卷 第 l 0期
V0 1 . 2 3 No . 1 0
电 子 设 计 工 程
El e c t r o n i c De s i g n Eng i ne e r i ng
2 0 1 5年 5月
Ma y .2 01 5
基于 K E T T L E的高校 多源异构 数据集成研 究及实践
相关文档
最新文档