大数据中心方案设计V2.0
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据中心方案设计
Bychj
a、
系统拓扑图
b、
4.5.1 设计目标
建立一个集中分散、异构、可扩充、可集成、有统一数据模型、有多种角度视图的、可交换的和安全可靠的复合数据库系统。它将成为政府各种业务系统、政府部门之间协同工作的数据中心,是政府门户的信息中心,多媒体、文档资料和政策法规的存储中心和预测决策所需的数据仓库中心。
4.5.2 数据中心设计基础
4.5.2.1 现状分析
对于一个完整的电子政务系统来说,统一的框架和相应的数据模式是十分重要的。电子政务的构建,正经历着由以技术为中心向以数据为中心的方向转变,没有数据也就没有信息,也就没有政府及电子政府。数据中心在电子政务系统中处于中心地位,具有公共数据(信息)库、模型库、文件交换站以及发布信息的政府门户的功能,各数据源将自己的数据上传给数据中心,而各部门根据自己的需要从数据中心获取数据,实施自己的应用。
按信息的应用属性,可将电子政务的数据类型分为空间数据、基础数据、政务数据、专题数据和多媒体语音数据。整合政务信息资源,建设和改造政务数据库,并建立人口、法人机构、空间地理和自然资源、以及宏观经济四个基础数据库,将成为我国今后数年电子政务建设的关键。
由于我国政府各部门对信息化建设的深远意义认识不够,以及政务建设有一个发展过程,造成了政府各部门、城市各行业信息化发展步调不一,从而使政务信息化建设存在一些问题:
㈠、信息的共享、公开没有立发,信息采集、储存标准不统一,造成了互联互通不畅,共享程度低。
㈡、信息共享机制尚未建立,各职能部门部的信息相对封闭,产生了信息孤岛效应,造成了信息资源的巨大浪费。
㈢、大部分单位业务应用系统还未形成一个部资源共享、有效运行的整体,需要在电子政务设计建设的过场中进行整合和改造。
㈣、网络建设各自为政,结构不合理,互连互通十分困难。
㈤、安全性存在隐患,人门还不放心在网上共享数据。
基于以上问题,需要在法律、技术、设备、管理等多方面加以考虑。
政府数据资源的建设,将有助于打破各级政府和部门对信息的垄断和封闭,能
够有效整合政务信息资源,强化对信息资源的不断开发、更新和维护;从长远来说,这项工作的开展,将有助于推动政府信息资源对社会的开放,使之发挥巨大的社会效益和经济效益。
4.5.2.2 资源分类
数据中心是电子政务数据资源建设的基础,它是各类信息采集、加工和整合的平台。数据中心资源大致可分为三大类,一是元数据库、政务叙词表和分类体系与代码表,二是GIS平台,三是服务资源。
(1)元数据库
考虑到今后各职能部门的信息联接与交换,电子政务元数据库必需严格定义并向全网开放,否则将造成今后机构间数据交换无法实现。具体容请参见4.3.3和4.3.4节。
(2)政务叙词表
电子政务与电子商务的一个显著不同是前者是为主题所驱动的,而后者是交易驱动的。在主题驱动系统中,规主题词(叙词)库是至关重要的,因为它是库资源组织、管理以及库际资源交换的基础。规政务叙词表即是对所有入库资源进行科学标引、描述与分类,通过叙词严格的语义涵和位属关联,建立所有资源在主题层的映射关系,对各类信息产品和服务过程起到基准性、规性、参照性、结构性和工具性的支持作用,以实现全库资源的有序化,并提升其可用性。如"Internet"有"因特网"、"互联网"、"网际网路"等名称,仅以其中一个名称进行全文检索、关键词检索等并不能保证文献的查全率。而严格定义的叙词表会在这些表达间建立关联,同时还会给出相关同位词,如"Internet"的同位词有"Intranet"(即"部网"、"企业网"、"联网"、"特网"等),以及"Extranet"("外部网"、"外联网"、"外特网")等,上位词有"计算机网络"、"网络"以及"无线
互联网"、"移动互联网"等下位词。
资源库中所有的文献资源只有在标引并与叙词库建立映射后,才能使用户在主题查询时能进退自如。政务资源叙词表大致由如下分词表组成:机关公文主题词表、宏观经济主题词表、行业主题词表、社会事业主题词表以及科学与技术主题词表等。
(3)信息分类、代码和指标体系表
分类与代码对于库息的组织管理和服务是极其重要的,同时,随着国际经济一体化进程的加快,与国际标准信息分类体系的兼容问题也日益重要。这些分类代码体系涉及到国民经济行业分类代码、联合国及各国海关协调制度(HS)分类与代码、北美工业标准分类代码(NAICS体系)、全国行政区划分类与代码(扩展到乡镇级)、全国工农业产品/商品分类代码、各主导行业信息分类与代码以及文件格式及其结构描述规代码等。
此外,各种指标体系与格式化文件对于政府的宏观管理和决策分析也是极其重要的。此类数据常以表格形式出现,并在各级机关部门中流转生成,它们之间的交换也以表格形式进行。所以,字段统一、代码统一、格式统一、定义统一的表格是主管部门从事经济分析、数据再处理和决策支持的前提。
(4)GIS平台
几乎所有的经济、产业与社会信息都与地理空间信息相关,近年来GIS已融入IT业的主体,并成为各类数据综合可视化的基础平台。与专业数据结合的各类专题电子地图更是各地政府进行区域经济与社会发展规划、开展招商引资、比较本地与周边地区竞争优势不可缺少的工具。同时,政务数据库的资源只有在与GIS整合后,才能产生质变,真正为政府宏观调控起到决策支持的作用。
(5)服务资源
电子政务系统的服务对象有4类:政府机构、公务员、公民、企业单位。服务资源即指直接为这4类客户提供服务的信息。其中包括政府系统办公数据、各类业务数据、国家政策指令,各种政务图像、视频,还包括电子商务、工商、税务、金融、海关、法律、卫生、医疗、教育、职业等基础设施服务信息。
4.5.2.3 数据特性
(1)静态数据与动态数据
电子政务数据中心必须满足电子政务平台进行数据交换的需要,同时还必须满足在平台上建立的各业务系统进行综合业务处理的要求,并为门户系统提供各种静态和动态的数据、信息。所谓静态信息是指对电子政务的运行中不经常变化,供各个业务系统查询、处理的数据或信息:政策、法规、元数据、资料库、各种多媒体数据等,它们会随着时间而逐步增大。所谓动态数据是指随着运行而增加、修改的数据:并联审批中文件流转状态数据,反映企业、个人所处状态的数据,国民经济运行状态的数据等。动态数据同各个局委办的信息密切相关,但又是面向主题的,如社会保险这个主题,实际上同保险、工资、税务和银行密切相关;个人信用使用主题,它的数据与银行、税务、个人消费、个人收入密切相关。(2)微观应用与宏观应用的数据共享
政府业务中的信息应用有微观的应用与宏观应用之分,微观数据的应用主要是针对个案的事务处理。比如工商登记,业务申报,税务处理,个人劳保、补助、婚丧、驾照、护照、医疗等等。微观事务处理的业务既包含对社会市场秩序的监管,又包含对企业、对公众的服务。这类事务处理的工作主要是由基层的一线人员来承担的,其信息共享的特点是:由来自不同方面的信息要围绕一个主体来整合起来,比如将医疗卫生、计划生育、社会保障等信息依据人的整合起来,这就