企业架构(四)——联邦企业架构(FEA)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
企业架构(四)——联邦企业架构(FEA)
⽂章⽬录
⼀、FEA概述
1、背景
在CIO委员会提出了FEAF与联邦企业架构实施指南后,美国⽩宫的管理与预算办公室(OMB)接下了管理和协调联邦企业架构建设的责任,并于2002年成⽴了专门从事联邦企业架构开发的企业架构项⽬管理办公室(FEA-PMO)。
与FEAF不⼀样,FEA(Federal Enterprise Architecture,即联邦企业架构)并不是⼀种理论化的企业架构开发⽅法论,⽽是联邦政府所要建⽴的企业架构本⾝,以及在联邦企业架构的建设过程中所需要的各种管理和规划⼯具。
FEA⽤于指导联邦政府改善其对信息技术的投资,并着眼于在全联邦政府范围内共享可重⽤的信息技术资源。
2、概述
FEA的内容(OMB的《Enterprise Architecture Assessment Framework v3.0》):
FEA参考模型:核⼼内容。
提供公共的企业架构描述⽅法。
通过从五个层⾯定义参考模型(性能模型、业务模型、服务组件模型、技术模型和数据模型),FEA为各个机构提供了⼀套公共的企业架构描述⽅法,从⽽使得采⽤不同企业架构框架的机构可以使⽤相同的语⾔进⾏交流。
联邦过渡框架(The Federal Transition Framework,FTF)
管理与预算办公室(OMB) 通观全局为其他各个机构定期发布能够进⾏跨部门使⽤的各种信息技术资源。
也就是发布联邦过渡框架(TFT)的机构。
联邦过渡框架(TFT) 内容为定期发布的可被重⽤的信息技术资源(数据、应⽤或业务流程等),该资源采⽤五层参考模型的⽅式进⾏描述,以便使这些共享的信息能够被很好地集成到各个机构之中。
企业架构评估框架(OMB EA Assessment Framework,EAAF):评估和检验各个机构的企业架构建设
OMB从企业架构的完成度、使⽤情况和结果影响这三个⾓度出发,分别制定了⼀系列评估标准来衡量各机构对于联邦企业架构项⽬的执⾏情况,并且此框架还指明了这⼀评估过程的具体执⾏⽅式。
⼆、FEA参考模型
FEA参考模型作⽤:
在联邦各机构中进⾏跨部门分析;
在整个联邦政府范围内或在某个部门之中寻找重复的投资、识别差距和合作机会。
FEA参考模型形成了⼀套框架,以便使⽤通⽤且统⼀的⽅式对联邦企业架构的重要组成元素进⾏描述,从⽽实现在全联邦政府范围内改善针对信息技术资源的管理和利⽤。
按照关注点的不同,FEA的参考模型序列包含如下五种参考模型:
性能参考模型(PRM,Performance Reference Model)
业务参考模型(BRM,Business Reference Model)
服务组件参考模型(SRM/CRM,Service Component Reference Model)
技术参考模型(TRM,Technical Reference Model)
数据参考模型(DRM,Data Reference Model)
FEA五层参考模型
1、性能参考模型PRM
通过使⽤性能参考模型PRM各个机构可以在战略层⾯以业务线的⽅式裁剪和描述其任务⽬标,并且该参考模型还对业务线中各个组成部分如何进⾏性能评估提出了可供借鉴的参考指标及其定义。
(1)业务视线
性能参考模型从战略的⾓度对各个机构的业务进⾏了分类和描述,称为业务视线(line of sight)。
每条业务视线描述了各个机构相关任务的输⼊、输出以及其对外所产⽣结果之间的因果关系。
“输⼊” 指的是执⾏业务所必需的各种先决条件,例如技术等⽅⾯内容;
“输出” 指的是各个机构在⽇常活动和流程中所产⽣出的各种直接结果;
“结果” 指的是各机构⽇常活动和流程对外所提供的服务以及所产⽣的影响。
简单来说,这些视线描述了这样⼀个过程:各个机构采⽤某些输⼊,在某些业务流程和⽇常活动的⽀持下对外界提供服务,并通过这些服务对外界环境发⽣影响。
(2)性能衡量指标
除了对这些视线的定义,性能参考模型在这些视线的基础之上针对“输⼊”、“输出”和“结果”这三个⽅⾯分别提出了⼀系列性能衡量指标。
PRM采⽤层次结构对性能衡量指标进⾏分类归纳:
测量域(Measurement Area):是PRM框架针对各测量指标在最⾼层次进⾏组织的概念,与在机构和⽅案层⾯制定的性能⽬标直接相关。
PRM中包含如下六种测量域:
任务与业务结果(Mission and Business Results)
客户结果(Custom Results)
流程与活动(Processes and Activities)
⼈⼒资本(Human Capital)
技术(Technology)
其他固定资产(Other Fixed Assets)
测量分类(Measurement Category):在每个测量域中根据不同的属性⽽归纳出的不同组合。
例如,在任务与业务结果(Mission and Business Results)测量域中就包含了市民服务(Services for Citizens)、服务交付⽀持(Support Delivery of Services)和政府资源管理(Management of Government Resources)这三个测量分类。
测量分组(Measurement Grouping):在测量分类中根据测量指标的类型⽽进⾏的进⼀步分组。
测量指标(Measurement Indicator):具体的测量标准,例如⽤户满意度百分⽐等。
2、业务参考模型BRM
业务参考模型为联邦政府的各条业务线(LOB,Line-of-Business)提供了⼀个功能性的视图。
包括:各机构的内部运营⾏为(对内) 和 对公民提供的各种服务(对外)。
业务参考模型中关于机构业务的定义采⽤⼀种通⽤的⽅式对各机构的业务进⾏描述,⽽不是为每个机构量⾝定制⼀套业务模型。
业务参考模型采⽤如下的层次化组织⽅式对联邦政府的业务功能进⾏了归纳:
BRM内容组织结构
业务领域(四种):
市民服务(Services for Citizens) 业务领域:此服务是政府的最终⽬标,是其对外部公民所能提供的各种服务。
交付模式(Mode of Delivery) 业务领域:包含了政府为了达成⽬标所采⽤的机制。
服务交付⽀持(Support Delivery of Services) 业务领域:包含了⽤于⽀持政府运⾏的各种关键政策和计划与管理基础。
政府资源管理(Management of Government Resources) 业务领域:包含为了⽀持联邦政府的有效率运⾏⽽针对所有领域资源的管理功能。
按照上⾯四种业务领域进⾏对联邦政府的各条业务线进⾏归纳,从⽽形成了如下图所⽰的业务参考模型:
注意:"性能参考模型"vs"业务参考模型"中的市民服务(Services for Citizens)、服务交付⽀持(Support Delivery of Services)和政府资源管理(Management of Government Resources)
性能参考模型:纲领和指标。
三个同名测量分类中的内容表⽰的是联邦政府对这三个⽅⾯所定义的各项性能评估指标。
业务参考模型:内容。
三个业务领域被⽤来对联邦政府为了实现政府⽬标⽽采⽤的业务⾏为进⾏描述。
BRM内容⽰意
3、服务组件参考模型SRM/CRM
服务组件参考模型是⼀个业务驱动的功能性框架,它依据服务组件如何对业务和性能⽬标进⾏⽀持⽽对其进⾏分类归纳。
服务组件参考模型的定义与机构的业务功能相互独⽴,致⼒于在全联邦政府范围内对应⽤和服务组件进⾏重⽤。
注意:服务组件参考模型的英⽂缩有⽤SRM、CRM表⽰,本⽂采⽤SRM来表⽰(OMB的参考模型定义⽂档中所采⽤的)。
服务组件参考模型的具体内容通过树形层次结构来进⾏组织:
服务领域(Service Domain):服务领域为⽤于⽀持机构流程和应⽤的各种服务和能⼒提供了⼀份⾼层次视图。
根据所⾯向的业务的不同,服务组件参考模型中将服务领域定义为如下⼏种:
客户服务(Custom Services)
流程⾃动化(Process Automation)
业务管理服务(Business Management Services)
数字资产服务(Digital Asset Services)
业务分析服务(Business Analytical Services)
后台服务(Back Office Services)
⽀持服务(Support Services)
服务类型(Service Type):服务类型对服务领域进⾏了进⼀步的细化,它为具体的服务组件提供了更为详细的分类上下⽂。
组件(Component):为业务提供信息管理能⼒的构建块,即⾃包含的业务流程或服务,其预定功能是通过业务或技术接⼝来对外提供的。
SRM内容⽰意
4、技术参考模型TRM
技术参考模型(TRM) 是⼀个组件驱动的技术框架,它对⽤于⽀持服务组件和能⼒的各种技术和标准进⾏了分类归纳,同时技术参考模型还联合了各机构已经存在的技术参考模型和电⼦政府指南,从⽽可以站在整个联邦政府的⾓度上为技术和服务组件的标准化以及重⽤的提升打下基础。
组织形式:树形层次结构
服务领域(Service Area):代表⽤于⽀持服务组件的安全构建、交互和交付的⼀个技术层。
服务分类(Service Category):将技术和标准按照其所服务的业务或技术功能进⾏进⼀步的细分。
每个服务分类包含若⼲服务标准。
服务标准(Service Standard):定义了⽀持某⼀服务分类的具体技术和标准。
为了帮助各机构将⾃⾝技术情况映射到技术参考模型之上,在OMB的这份参考模型⽂档中,很多标准除了详细定义外还采⽤了说明性的应⽤或技术作为实例。
技术参考模型的内容:
TRM内容⽰意
5、数据参考模型DRM
(1)概述
⽬标:通过标准的数据描述、通⽤数据的发现以及统⼀的数据管理实践的推⼴使得联邦政府实现跨机构的信息共享和重⽤。
适⽤范围:适⽤范围⼴,例如:⼀个机构内部、在某⼀个利益共同体(COI,Community of Interest,指的是⼀组为了实现共同利益和⽬标⽽相互合作的⼈或组织,⽽为了达成这⼀⽬标,他们需要⼀个共享的词汇表来实现信息共享)内或不同利益共同体之间。
定义:采⽤了⼀种灵活的且基于标准的⽅式对数据的描述、分类和共享进⾏定义,因⽽数据参考模型的内容被划分为如下三个标准领域:
数据描述(Data Description):提供对于数据的统⼀描述⽅法,从⽽⽀持数据的发现和共享。
数据上下⽂(Data Context):采⽤某种分类法对数据进⾏归类,从⽽便于数据的发现,同时使得定义⼀个利益共同体的权威数据资产(authoritative data assets)成为可能。
数据共享(Data Sharing):⽀持数据的访问和交换。
数据访问:单次性的特定请求。
例如对于数据的查询;
数据交换:在不同团体之间经常性发⽣的针对于固定模式或需求的数据的往来交互事务。
例如库存部门和审核部门之间经常需要对库存中的货物信息进⾏核对,虽然每次交互的货物信息的内容有所不同,但是其对于⽤于描述货物信息的数据模型却是早已确定好了的。
DRM标准领域及其关系
数据参考模型作为⼀个参考模型为各机构提供了⼀套抽象的框架(标准性),⽽对于其具体实现就由各机构在符合参考模型原则的基础上⾃⾏决定了(灵活性)。
此外,由于各个机构可以将组成其数据架构的各种元素与该抽象框架相关联,从⽽使得原本隔绝的不同机构在数据⽅⾯得到了沟通途径,促进了不同机构之间的互操作。
数据参考模型所使⽤的抽象框架模型如下所⽰:
⽬标:为信息集成、互操作、发现和共享的数据架构的优化提供了⼀套架构模式。
实现⽅式:1. 对数据架构概念元素以及他们之间的关系进⾏了明确定义;2. 针对每个概念元素此抽象模型还分别定义了⼀系列的通⽤属性。
具体划分:按照上述三个标准区域被划分为三个部分,分别⽤于包含与这三个标准区域相关的概念元素及其关系。
注意:由于这三个标准相互关联,所以图中⼀些概念元素多次出现,但是只有实线边框的概念元素才是其真正的定义,⽽虚线边框的概念元素则⽤来表⽰从其他标准区域“借⽤”⽽来的意义。
DRM抽象模型
除了抽象模型之外,数据参考模型还包含了对于数据在安全和隐私⽅⾯的考虑。
强调:在这三个标准区域中都需要遵循安全和隐私⽅⾯的策略,并允许现存的联邦安全和隐私策略被应⽤到这些标准区域中。
(2)数据描述
数据描述标准区域的⽬标:为利益共同体提供关于数据结构(语法)和意义(语义)的共识。
利益共同体可基于数据参考模型的内容创建各种相关的数据描述制品。
关于数据描述标准领域的内容都已被定义在DRM抽象模型的相关部分中:
这⼀数据描述抽象模型在⼀个⾼度抽象的层次上对数据描述标准领域中涉及到的各种制品进⾏了抽象。
DRM数据描述模型
数字数据资源(Digital Data Resource) 可以分为两⼤类:
结构化数据资源:由数据模式(Data Schema)和结构化数据资源(Structured Data Resource)这两个部分组成。
数据模式(Data Schema):定义结构化数据资源的语法和语义,即结构化数据的元数据(Meta data)。
在数据描述模型中,数据模式是通过实体(Entity)、属性(Attribute)、关系(Relationship)和数据类型(Data Type) 这四个概念以及他们之间的关系来定义的。
结构化数据资源(Structured Data Resource):按照数据模式定义的实例化数据。
⾮结构化和半结构化数据资源(Unstructured / Semi-structured Data Resource):
⾮结构化数据,例如视频数据、⾳频数据等,其与结构化数据的最⼤区别在于,⾮结构化数据的语义和语法与实例数据本⾝是紧密结合在⼀起的。
半结构化数据资源:同时包含结构化数据和⾮结构化数据的数据资源。
例如⽂档(Document),其可被定义为包含各种数字数据资源的容器。
按照OMB的数据参考模型中所述,相关概念元素定义如下:
数据模式(Data Schema):对于元数据的⼀种表述,经常采⽤诸如逻辑数据模型或概念数据模型的形式。
数据模式概念组包含了与结构化数据的表述相关的各个概念元素。
⼀份数据模式为数据共享提供了独⽴于其所描述的具体数据值的语义。
数据模式与其它概念元素之间具有如下关系:
数据模式定义了结构化数据资源。
由于在数据参考模型中数据资源是⼀种信息容器的概念(通常来讲就是⽂件),所以这⾥的“结构化数据资
源”实际上指的是⽤于存放数据模式这⼀元数据信息的信息容器,例如模式⽂件等。
数据模式描述了⼀个结构化数据资产。
与数据资源类似,数据资产也是⼀个信息容器,只不过它指代的是⼀个托管容器(managed
container),在⼤多数情况下指的是关系数据库,当然它还可以代表⽹站、⽂件资源库、字典或者数据服务。
实体(Entity):针对现实世界中客观事物的抽象。
实体与其它概念元素之间具有如下关系:
实体包含若⼲属性。
实体通过“关系”观念元素与其他实体建⽴关联。
数据类型(Data Type):对于⼀个属性的物理表述的类型约束。
属性(Attribute):针对实体某⼀特性的抽象。
属性与其它概念元素之间具有如下关系:
⼀个属性的取值受约束于⼀个数据类型
关系(Relationship):⽤于描述实体间的关系。
“关系”概念元素与其它概念元素之间具有如下关系:
关系概念元素关联了参与此关系意义的各个实例。
数字数据资源(Digital Data Resource):⽤于描述⼀个信息的数字容器,⼀般来讲就是“⽂件”。
数字数据资源按照其包含的数据类型分为三类:结构化数据资源、⾮结构化数据资源和半结构化数据资源,同时由于元数据本质上也是数据,因⽽⼀个数字数据资源还可以作为元数据的容器。
数字数据资源与其它概念元素之间具有如下关系:
数字数据资源可以描述半结构化数据资产。
数字数据资源可以描述⾮结构化数据资产。
结构化数据资源(Structured Data Resource):⽤于包含结构化数据的数字数据资源。
⼀旦数据模式可知,那么被其描述的数据将可以通过⼀种统⼀且独⽴于数据值的⽅式进⾏访问。
结构化数据资源与其它概念元素之间具有如下关系:
结构化数据资源是数字数据资源的⼀种。
⾮结构化数据资源(Unstructured Data Resource):⽤于包含⾮结构化数据的数字数据资源。
⾮结构化数据是⼀系列可能被某些特定应⽤程序进⾏处理的数据值的集合。
⾮结构化数据资源与其它概念元素之间具有如下关系:
⾮结构化数据资源是数字数据资源的⼀种。
半结构化数据资源(Semi-structured Data Resource):⽤于包含半结构化数据的数字数据资源,即其包含的数据中⼀部分是结构化数据⽽另⼀部份是⾮机构化数据。
半结构化数据资源与其它概念元素之间具有如下关系:
半结构化数据资源是数字数据资源的⼀种。
⽂档(Document):⽤于指代⽤来容纳数字数据资源的⽂件。
⽂档与其它概念元素之间具有如下关系:
⽂档可以包含结构化、⾮结构化或半结构化数据资源。
⽂档可以对实体进⾏引⽤。
例如,⼀份⽂档引⽤了“⼈”这个实体,因⽽就可以进⾏这样的查询:“寻找引⽤了如下个⼈的所有⽂档”。
(3)数据上下⽂
数据上下⽂:根据使⽤数据的背景不同,数据划分划分的分类⽅式的描述和定义 构成“数据上下⽂”,从⽽便于具有不同视⾓的数据消费者对于数据的发现和使⽤。
⽰例:假设⼀个名为“⼈”的实体,它对⼈进⾏了抽象并在利益共同体内根据所有参与者的共识定义了符合所有数据消费者要求的属性,但是在使⽤过程中,可能有更关注于商业⾏为⽅⾯的数据消费者从顾客的⾓度来看待⼈,因⽽对他来说诸如头发颜⾊之类的信息并不⼀定关注,⽽对于执法机构⽅⾯的数据消费者却不然。
数据上下⽂的核⼼是分类法,相关的各种制品还包括:主题、数据专员、关系、查询点等等。
本质:分类法都可通过结构化的⽅式表述,这为不同团体之间对于分类法的语义和语法的获得共识提供了基础。
作⽤:借由经过结构化表述的分类法定义,数据消费者可识别符合⾃⼰要求的数据资产是否存在,并检测其包含的数据是否符合他对信息的要求。
与其他参考模型的关系:站在数据上下⽂的⾓度,前⾯的各个参考模型也是⼀种分类⽅法,因⽽数据上下⽂也可以看作联系数据参考模型与其他参考模型的桥梁(例如,可以将数据按照不同的业务线或⼦功能进⾏划分,从⽽将数据参考模型与业务参考模型结合在⼀起)。
DRM数据上下⽂模型
数据上下⽂,它对数据上下⽂相关制品进⾏了定义。
分类法(Taxonomy)包含若⼲主题(Topic),⽽且主题之间是具有相互联系的。
分类法被描述为结构化数据并存放于结构化数据资源中。
为了与其他参考模型建⽴联系,在此图中其他参考模型作为分类⽅法的具体实现被表述出来,当然这并不排除其他分类⽅法的定义。
每个分类法的主题被⽤来为数据资产进⾏分类,同时也可以为各种数字化数据资产、访问点和信息交换包进⾏分类。
数据专员:可以为数据资产指定⼀个数据专员。
按照OMB的数据参考模型中所述,这⼀部分模型中所涉及到的各种概念元素定义如下:
分类法(Taxonomy):⼀个通过层次结构进⾏组织的受控词汇(controlled vocabulary terms)的集合。
分类法提供了⼀种通过使⽤合理且定义良好的缔合结构对信息进⾏分类的⽅法。
分类法与其它概念元素之间具有如下关系:
分类法包含若⼲主题。
分类法被表述为结构化数据资源。
主题(Topic):分类法中的⼀个分类,它是为数据赋予上下⽂的核⼼概念元素。
主题与其它概念元素之间具有如下关系:
主题对数据资产进⾏分类。
主题可以对数字数据资源进⾏分类。
主题可以对访问点进⾏分类。
主题可以对交换信息包进⾏分类。
主题通过“关系”概念元素与别的主题建⽴关联。
关系(Relationship):⽤于描述主题间的关系。
关系概念元素与其它概念元素之间具有如下关系:
“关系”概念元素关联了参与此关系主题概念元素。
数据资产(Data Asset):⽤于代表数据的托管容器。
在很多情况下,数据资产代表着关系数据库,然⽽数据资产还可以被⽤来代表⽹站、⽂档库、字典或者数据服务。
数据资产与其它概念元素之间具有如下关系:
数据资产为数字数据资源提供管理上下⽂。
例如,⼀份被某个数据资产(例如⽂档库)存储和管理的⽂档会具有管理上下⽂,⽽此管理上下⽂
是通过与那个⽂档关联并存储于⽂档库中的元数据来提供的。
数据管理员(Data Steward):⽤来代表对数据资产的管理负责的⼈。
数据管理员与其它概念元素之间具有如下关系:
数据资产可以被数据管理员进⾏管理。
其他联邦企业架构参考模型(Other FEA Reference Model):⽤于代表其他的联邦企业架构参考模型。
通过将其他参考模型看作为具体的分类⽅法,该概念元素在数据参考模型和其他参考模型之间搭建了关联。
此概念元素与其它概念元素之间具有如下关系:
其他联邦企业架构参考模型是分类⽅法的具体类型。
(4)数据共享
在数据描述和数据上下⽂后,利益共同体就需要把精⼒放在规划和实现信息访问及相互交换⽅⾯上⾯,以实现不同的数据资产之间进⾏的信息共享,⽽数据共享标准区域为此提供参考。
信息互交换:在信息⽣产者和信息消费者之间所存在的相对固定且时常发⽣的信息交互过程。
信息访问能⼒:⽽除互交换⽅式外,信息⽣产者往往还要对外提供各种信息访问接⼝和服务,为各种不确定的外界信息消费者提供信息访问的能⼒,⽽这种通过各种信息访问接⼝和服务⽽获取信息的能⼒就是信息访问能⼒。
两者区别:
信息交换⼀般是经常性或周期性地发⽣,⽽信息访问的发⽣则更具随机性;
信息交换对于参与双⽅在交换发⽣前就已经得到了明确,更加主动;⽽信息访问则只是数据⽣产者提供信息访问的接⼝和服务,⽽对于数据的消费者却并不明确,被动⽅式。
数据提供和使⽤矩阵
① 信息交换和信息访问都是在不同的数据资产之间进⾏的信息共享过程,因⽽要对这些信息共享⽅式进⾏归纳和建模,⾸先需要明确参与信息共享的各种信息存储系统。
为了这些系统,数据共享标准领域采⽤了数据提供和消费矩阵(data supplier-to-customer matrix),从⽽将⽤于存储信息的各种数据资产进⾏了归纳整理。
此矩阵从两个维度将参与信息共享的数据资产分为四种:
这两种维度分别是:
按存储的信息类型,数据资产分为⽤于存储和操作结构化数据的资源库(图中第⼀、⼆象限)和⽤于存储和操作⾮结构化数据的资源库(如图中第三、四象限)。
按信息的操作类型,数据资产分为能够对数据进⾏全权操作(创建、更新和删除)的存储库(如图中第⼀、三象限)和仅能针对数据进⾏检索与分析的存储库(如图中第⼆、四象限)
根据这两种维度,能够参与信息共享的数据资产分类(四种):
事务数据库(Transactional Database):包含⽤于⽀持业务流程和⼯作流的结构化数据对象,并且经过精⼼的设计,这些数据库的事务性能能得到⾼度的规范化和优化。
内容:⽀持联机事务处理系统(OLTP)、企业资源管理系统(ERP),以及其他⽤于实现核⼼业务流程和⼯作流的后台系统
数据库。
特点:通常来讲,由于执⾏业务逻辑和引⽤完整性的需要,⽤户不能直接对其数据进⾏创建、读取、更新和删除操作,⽽需通
过由应⽤程序接⼝(API)提供的各种服务来实现。
分析数据库(Analytical Database):包含⽤于⽀持查询和分析的结构化数据,并且为了提⾼查询⽅便性和效率,这些结构化的数据库倾向于有⽬的性地去规范化和优化。
数据⼀般来⾃于⼀个或多个事务数据库,并且以某种结构联合在⼀起来⽀持回答与业务和/或任务利益相关的特定问题。
内容:联机分析(OLAP)、数据仓库(Data warehouse)、数据集市(Data mart),以及⽬录(例如⽀持轻量⽬录访问
协议(LDAP)或者X.500的信息库)。
特点:⼀般来讲,其数据可通过查询来直接访问,⽽针对数据的创建、更新和删除操作通常会通过间接⽅法(例如,抽取、转
换和加载(ETL)过程)来对相关的事务数据库来进⾏。
著作系统信息库(Authoring Systems Repository):著作系统范围⼴阔,⽽产物都是“⽂档”,著作系统底层的信息库也包括了各种能够保存数据对象的系统(最常见的例⼦就是⽂件系统和关系数据库)。
在数据参考模型的背景下,“⽂档”这个词的概念范围⾮常⼤,它涵盖了⼴⼤范围内的各种信息对象,例如多媒体、嵌⼊图⽚的⽂本⽂
档、XML模式或⽂档类型定义(DTD)等。
通常来讲,在这个背景下“著作系统”也同样具有⼴阔的范围。
从⼀个极端来讲,⼀个著作
系统可以是⼀个数码照相机,⽽在相反的另⼀极端,⼀个著作系统也可以是⽤于产⽣正规出版物的⼀个复杂⼯作流。
特点:与事务数据库类似,对于著作系统的底层信息库中的数据进⾏直接访问和操作是不提倡的,因为忽略业务逻辑⽽对数据
进⾏的操作往往会影响数据的完整性。
⽂档信息库(Document Repository):⽬标是为了优化信息检索⽽对数据进⾏存储,与分析数据库类似。
内容:⽹站的⽂件系统、内容管理系统之下的关系数据库,XML注册和信息库。
特点:针对此种信息库中数据的操作⼀般只倾向于对其中数据的查询,⽽创建、更新和删除操作则通常并不对最终⽤户开放,
⽽是通过⼀个由著作系统执⾏的发布功能来实现。
② 通过数据提供和消费矩阵针对上述四种数据系统的归纳,我们可以将数据交换和数据访问进⾏更进⼀步的具体化:
所谓数据交换就是在上述四种数据系统之间所进⾏的内容定义相对固定且时常发⽣的交换数据过程。
这些数据交换过程以及他们所适⽤情景描述如下:
抽取、转换和加载(从结构化数据到结构化数据):
过程:⾸先数据源中的结构化数据对象被读取(抽取,Extract)出来,然后将这些被抽取出来的数据的结构转换为符合⽬标
数据库要求的结构(转换,Transform),最后使⽤转换后的数据更新⽬标数据库(加载,Load)。
⽤于执⾏ETL过程的各
种服务可以⾮常复杂也可以是⾮常简单,同时他们也可以是其他服务的⼀个组成部分。
信息载体:结构化数据。
发布(从结构化数据或⽂档到聚集后的⽂档):
过程:“发布”是⼀个将若⼲⽂档⽚段按照需要的格式组合在⼀起,并最终存⼊⽬标数据库的过程。
信息载体:⽂档。
实体/关系抽取(从⾮结构化⽂档到结构化⽂档或结构化数据对象):
过程:从⽂档中识别并抽取出特定元素。
其中,实体指特定的⼈、地点或事物的名词,关系指实体之间的关联。
⼀般来讲,在
此过程中识别出来的实体可以作为元数据⽽合并到源⽂档之中,或被插⼊到⼀个独⽴的⽂档或结构化数据库中。