数据映射技术在ETL过程中的应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
a p idwel nl g -c l aamir to fChn ’ o l a e tr . p le l i e s a ed g ai no iaS i d t c n e s a r t a Ke r : d t p n daa c n e so ETL; t - d l d t g ain ywo ds a ma pig; t o v r in; a me mo e ; aami to a r
Ab t a t no d rt n b eteETL s t m oe e tv c e ea y d t o v ri nb t e ee o e e sd tba e , s r c :I r e e a l o h yse t f ci ea hiv n aac n e so ewe n h tr g n ou aa s s we n e o e d a c mmo t- n me mod lf u p r e d t o v r in me d t u t mi i n a e ors p o tt a c n e so t a a c so z o .Th o g e a ay i ft e h a a at r u h t n lsso h h a p iai n o a ama pig tc nia n t e d t o v r i n e e rh h sb e o u e n t e a ta tsu y o aa p lc to fd t p n e h c li h a c n e so ,r s a c a e n f c s d o h bsr c t d fd t a ma png n e n d t e d t i d ca sfc in o a p n ,a e f r o a o v r in mea a a e n p i ,a d d f e h eal l si a o fd t ma pig nd t m fd t c n e so td t b s d o i e it a h o a a
,
பைடு நூலகம்
( ol e f o ue dIfr t nT cn lg , r esP t lu U iesyDa i 6 3 8 C i ) C l g C mp t a omai eh ooy Not at er em nvri , qn 13 1, hn e o rn n o h o t g a ( e eHag a g ayId syC , t, n a 5 0 8 C i ) H b i n un v ut o Ld Had 06 2 , hn He n r n a
此,需要通用 的数据转换元数据描述形式,及能够支撑
不 同关系数据库数据模型之 间的对应 关系;数据映射 与数据库 设计模 型等系 统知识相关 , 共分为实体映射 、 表 映射 以及属性 映射几个层次p: J ① 实体映射 :用户可 以看到 的最 高对 等图,反映 了两个数据库概念模型上 的差别 。
摘
要 :为了使 E L系统能够高效 的实现任意异构数据库之间 的数据转换 ,需要通用的元模型支撑任意数据库 T
之间数据转换元数据 的定制 。通过对数据转换 中数据 映射 应用技术分析 ,重点对 数据映射进行 了抽象研 究,定
义数据映射 的详细分类 、基于数据映射关系 的数据 转换元数据描述 形式 ,并构建支撑数据转换元数据 定制的元 模型,技术在 中国石 油数据 中心大 型数据迁移 中应用 ,取得 良好效果 。 关键词:数据映射 ;数据转 换;E L T ;元模 型;数据迁 移
dt m p i ,ul te t- o ewh hsp oto e utm tt nfr ain t a . h c ooyOs en a a p g b i a m dl i p rt s d ar so t a t T e eh l a e a n d h me c u t c o a a m o me d a h tn g b
21 0 2年 第 2 卷 第 7期 1
ht:w w cS .r. t / w . - ogc p/ —a n
计 算 机 系 统 应 用
数据 映射技 术在 E L过程 中的应 用① T
梁吉胜 ,李天阳 ,王惠霞 ,杨 锐 ,张旭 东
f 东北石油大学 计算机与信息技术学院 ,大庆 13 1) 6 3 8 ( 北 汉 光 重 工 有 限 责任 公 司 ,邯 郸 0 6 2 ) 河 50 8
Applc to f t a i a i n o a M ppi c o o y t h Da ngTe hn l g o t e ETL o e s Pr c s
LI AN G iS e g , a — n W AN G u - i2 YAN G i, J- h n LITin Ya g , H i a X Ru ZHAN G u Do g X - n2
E LE t c o .rnfr ao .o d g 是 信 息 化 T (xr t nTas m t nL a i ) ai o i n
l 数据映射分析定义与分类
数据 映射是指 同一数据领域 内,存储 相关数据的
建设过程中不可避免的数据处理过程 , 数据转换是 E L T 过程 中将抽取出来源数据转换 为 目标 数据的数据处理 过程【,是 E L实现的重点 。传统实现 E L 的 E I l 】 T T A 解 决方案 主要基 于不同数据模型之 间具 体的映射编写数 据交换代码实现特 定数据转换,不具有通用性。目前 的 高效的 E L系统要求数据转换能够基于不同的元数据 T 脱离具体数据库实现任意两数据库之间的数据转换, 因
Ab t a t no d rt n b eteETL s t m oe e tv c e ea y d t o v ri nb t e ee o e e sd tba e , s r c :I r e e a l o h yse t f ci ea hiv n aac n e so ewe n h tr g n ou aa s s we n e o e d a c mmo t- n me mod lf u p r e d t o v r in me d t u t mi i n a e ors p o tt a c n e so t a a c so z o .Th o g e a ay i ft e h a a at r u h t n lsso h h a p iai n o a ama pig tc nia n t e d t o v r i n e e rh h sb e o u e n t e a ta tsu y o aa p lc to fd t p n e h c li h a c n e so ,r s a c a e n f c s d o h bsr c t d fd t a ma png n e n d t e d t i d ca sfc in o a p n ,a e f r o a o v r in mea a a e n p i ,a d d f e h eal l si a o fd t ma pig nd t m fd t c n e so td t b s d o i e it a h o a a
,
பைடு நூலகம்
( ol e f o ue dIfr t nT cn lg , r esP t lu U iesyDa i 6 3 8 C i ) C l g C mp t a omai eh ooy Not at er em nvri , qn 13 1, hn e o rn n o h o t g a ( e eHag a g ayId syC , t, n a 5 0 8 C i ) H b i n un v ut o Ld Had 06 2 , hn He n r n a
此,需要通用 的数据转换元数据描述形式,及能够支撑
不 同关系数据库数据模型之 间的对应 关系;数据映射 与数据库 设计模 型等系 统知识相关 , 共分为实体映射 、 表 映射 以及属性 映射几个层次p: J ① 实体映射 :用户可 以看到 的最 高对 等图,反映 了两个数据库概念模型上 的差别 。
摘
要 :为了使 E L系统能够高效 的实现任意异构数据库之间 的数据转换 ,需要通用的元模型支撑任意数据库 T
之间数据转换元数据 的定制 。通过对数据转换 中数据 映射 应用技术分析 ,重点对 数据映射进行 了抽象研 究,定
义数据映射 的详细分类 、基于数据映射关系 的数据 转换元数据描述 形式 ,并构建支撑数据转换元数据 定制的元 模型,技术在 中国石 油数据 中心大 型数据迁移 中应用 ,取得 良好效果 。 关键词:数据映射 ;数据转 换;E L T ;元模 型;数据迁 移
dt m p i ,ul te t- o ewh hsp oto e utm tt nfr ain t a . h c ooyOs en a a p g b i a m dl i p rt s d ar so t a t T e eh l a e a n d h me c u t c o a a m o me d a h tn g b
21 0 2年 第 2 卷 第 7期 1
ht:w w cS .r. t / w . - ogc p/ —a n
计 算 机 系 统 应 用
数据 映射技 术在 E L过程 中的应 用① T
梁吉胜 ,李天阳 ,王惠霞 ,杨 锐 ,张旭 东
f 东北石油大学 计算机与信息技术学院 ,大庆 13 1) 6 3 8 ( 北 汉 光 重 工 有 限 责任 公 司 ,邯 郸 0 6 2 ) 河 50 8
Applc to f t a i a i n o a M ppi c o o y t h Da ngTe hn l g o t e ETL o e s Pr c s
LI AN G iS e g , a — n W AN G u - i2 YAN G i, J- h n LITin Ya g , H i a X Ru ZHAN G u Do g X - n2
E LE t c o .rnfr ao .o d g 是 信 息 化 T (xr t nTas m t nL a i ) ai o i n
l 数据映射分析定义与分类
数据 映射是指 同一数据领域 内,存储 相关数据的
建设过程中不可避免的数据处理过程 , 数据转换是 E L T 过程 中将抽取出来源数据转换 为 目标 数据的数据处理 过程【,是 E L实现的重点 。传统实现 E L 的 E I l 】 T T A 解 决方案 主要基 于不同数据模型之 间具 体的映射编写数 据交换代码实现特 定数据转换,不具有通用性。目前 的 高效的 E L系统要求数据转换能够基于不同的元数据 T 脱离具体数据库实现任意两数据库之间的数据转换, 因