烟草企业数据中心项目中ETL的分析和设计

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 1 牟 第9 00 期
一 一 — — — — — — — — — — — — — — — — — — — — —































_













_












—Biblioteka Baidu














_












CAI Yo g c a g n .h n
( h o a gT b coC mp n f n nP o ic ,h o a g42 0 , hn ) S ay n o ac o a yo Hu a r v eS ay n 2 00 C ia n
A s at codn o te tbco b s ese t pi a e t r etojci s hs p pr b t c:A crig t h o ac ui s ne r e dt cne po c bet e ,ti a e r n r s a r j v
的决策 提供数 据支 持这 一 整 个 过程 , 对 其 中各 个 并
环 节涉 及到 的产 品能力进行 评估 。 S bs 公 司 E L工具 D 具 有满 足 本项 目需 求 y ae T I 的功 能 。D 与 A E, I S I 为 Sb s 公 司产 品 , Q均 yae 它们
之 间互相 衔接可 以使 用 产 品本 身 的 很多 特 性 , 以 可
基 础所在 , 显得尤 为重要 。 E L E t c o —r s r t nL a i T , x at nTa f mao —odn r i no i g的缩 写 ,
1 E L过 程概 述 T
E L的 目标 就是实 现数据 从地 市及省 局业务 系 T 统 抽取 到省局 统 一清 洗 、 工 、 加 转换 、 储 并 为公 司 存
② 主数据通 过 MQ下 发到 A E数据库 中。 S
③在 A E中根据主数据对 O S缓存区的数据进行 S D
即数 据抽取 、 转换 和加载 。E L负责将 分布 的 、 构 T 异
数据 源 中的数 据如 关 系数 据 、 面数 据 文 件 等抽 取 平
清洗 、 转换并轻度汇总存入 A E数据库 O S数据区。 S D
摘 要:根据烟草商业企业数据 中心项 目建设 的 目标,结合湖南烟草信 息化 系统现状,对数据 中心项 目中数据集成部分的 E L T 过程进行详细分析和设计 ,解决了烟草数据 中心项 目中E L过 T
程 的瓶 颈 问题 。
关键词 :E L过程 ; 草数据 中心 ; T 烟 数据 库
A a s n eino T b coe tr r ed t etrpoet n l i a dd s f L i t ac nepi aacne rjc ys g E no s
很大 程度 上节省工 作量 、 高 E L过程 稳 定性 。 D 提 T I
中使 用 的 J s无法被 元数据 接 口解 析 的 问题 , 以通 可 过在 开发 中尽量使 用 S L代替 J Q s的方式来缓 解 。 数 据集成 的整 体过程 如下 :
① 从省 局 及 地 市 业 务 系 统 抽 取 数 据 进 入 省 局 A E数 据库 O S 存 区。 S D 缓
c mb n st e sau fi o main s se n Hu n tb c o,y tmaial nay e n e in e p r o i e h t t so r to y tmsi na o a c s se t ly a lz sa d d sg st a t nf c h o ft ETL p o e sf rd t n e r to fd t e tr,o v st ebot n c r b e o he r c s o aa it g ain o a ac n e S le t e e k p o l m fETL i e tb c o h l n t o a c h
etrr ed t cne r et nepi a e t po c. s a r j
Ke r s: ET prc s y wo d L o e s;tba c aa c n e ;d tba e o c o d t e tr aa s
0 引 言
数 据 中心是 以数 据 为 中心 的项 目, 数 据 的准 对 确性 、 可靠性有很 高 的要求 。数 据 中心项 目的 数据 集成需 要基于对业 务 的理解 和对行业 未来发展 的前 瞻 眭分 析 , 建立一 套科 学 、 壮 的 企业 级 业 务模 型 , 健 来 全面 的、 系统 的 、 实 的描述 出企业运 营过程 的全 真 貌 。通过企 业 级 业务 模 型 进 而 可 以建 立 一 个 系 统 的、 合理 的、 次分 明的企业 级数据 存储平 台。 层 湖南烟 草 目前 已有营销 、 叶 、 烟 专卖 、 财务 、 人力 资源 等业务 系统 , 且 形成 了一 个 简单 的应 用 集 成 并 门户 , 数据仍 然在 各 个 业务 系统 中各 自为 阵 。数 但 据 中心项 目建设 的 目标 在 于数 据 的集 中 , 而数 据集 成的根 本 又在 于 E L过 程 , T 因此 , T E L过 程 是项 目

















_





中图分类号 :P 1 .3 T 3 11
文献标 识码 : A
文章编 号:0 9— 52 2 1 )9— 0 3— 3 10 2 5 【0 0 0 0 8 0
烟 草 企 业 数 据 中心 项 目 中 E L的分 析 和 设 计 T
蔡 永 长
( 湖南省邵 阳市烟草公司 , 阳 42 0 ) 邵 2 00
相关文档
最新文档