政务信息资源目录体系建设概念及实施要点
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二块我们来讲一下在整个政务信息资源目录体系建设中的一些概念。首先 我们来了解一下政务信息资源,它是政府机构在履行职能过程中产生或使用的信 息,可以分为以下几大类。第一个是履行行政事务的职责过程中,去采集加工使 用的信息资源,第二个是部门在业务过程中产生或者生成的信息资源,第三个政 府部门投资建设的信息资源以及由政府部门直接管理的信息资源。那么我们这个 目录内容主要涉及到部门核心的信息资源包括行政许可、行政执法、公共服务、 城市管理以及这种三定方案中其他产生的信息资源。
在今年发布的《关于全面推进政务公开的意见》里面也提出说,要推进政 府数据开放,要实施政府数据资产清单的管理,要加快建设国家政府数据的统一 开放平台,来制定开放目录和数据采集标准,包括在最新的国家十三五规划中提 出说要实施国家大数据战略,推进数据资源开放共享。从上面可以看出其实这十 几年来政务信息资源目录体系建设 在国家层面是一直非常重视的。但是目前很 多城市可能都还没有开展这项工作或者说前期开展的不是很细致,不是很成功。
那么第二块我们来看一下,政府现在面临的现实需求。拿我们每个人来说 ,我们每个人有很多记录,比如像工作记录、会议记录、日常记录,这些记录随 着工作时间的增加,资料是无比多的。那怎么找到我需要的信息?怎么获取数据 ?是一件很痛苦的事情,比如五年前开过的一次会,有多少人,都是谁,我想知 道怎么办?同样的一份会议纪要,每个人理解的不同,记录的可能就不同,这些 都是有差异的,我们怎么样去规范,这就是数据标准的定义。怎么样来定义数据 ,不同的数据就有差异,没办法共通。对同样的信息,如果没有业务系统发展相 适应的话。这种特定的语义环境是很难去进行沟通的。同样写报告,谁写的好? 谁写的坏?实际上是有差异的,那怎么样去规范?为什么要规范?最重要的就是 说政府组织机构内部的技能、业务的流程怎么样去传承,需要一个标准。比如说 我们现在的政府工作,而换一个工作人员以后,对于一线技能开发和实际技术操 作人员来讲,比如说领导需要一个综合类的数据,这个数据需要去各个系统内部 挑,那就统一口径。比如说一个数据报表信息,如果他是季度的,我是月度的, 那么我们加在一起就是错的。每项业务他都有对应的一个系统有的可能还会跨系 统。比如我们要去查吃低保的五十岁以上的女性有多少人,这个可以在低保系统 中查到,但是这些女性有多少个孩子,这个就查不到了,这需要人工去查,这个 数据公安里面有,公安有血清、有户籍证,那我们问的问题就说这些数据来源于 哪个部门哪个系统里有,如果对这块业务了解的人他最清楚最快数据来源。但是 很多人不知道那怎么去查怎么去取?这是很关键的问题。
接下来跟大家介绍一下政务信息资源目录体系到底是什么,它的定位是什么。这里 有两张图,我们先看第一张,我们为什么要上京东淘宝,因为他有一个商品目录,你可 以快速定位查询到你所需要的商品,同时他有个管理,你去淘宝京东付钱以后你很放心 ,货肯Leabharlann Baidu会到你手里,从一个仓库到京东仓库,再到这个人,这个就是交换。交换的目 的是共享,共享的目的就是使用,只不过一个是你把别人的东西拿来了,那么我们说数 据交换这个东西不会缺,那么交换目录哪里做交换,我们这个图里直线的地方就是做交 换。部门的这种资源怎么样到我的这资源管理中心来。
像人口法人等基础信息资源库的数据是来源于各个业务部门的。像人口涉及 到公安民政、卫生社保等,这些部门的数据是没有经过顶层设计或者统筹规划的 ,他们存在数据不标准、不完整、重复、错误等数据质量问题。比如说一个身份 证号码可能存在不同地址。我们需要对这些数据进行梳理进行标准化的制定,使 数据在未来整合、应用的过程中能够实现统一的标准的管理。
政务信息资源目录体系建设概念及实施要点
舟山 王路燕 2016年4月12日
下面我将分三块内容跟大家交流。第一块主要关于资源目录体系建设的一个整体背景, 第二块是关于资源目录体系建设中的一些概念的解析,第三块是资源目录体系建设的实 施要点。那第一个话题就说我们为什么要开展资源目录体系的建设。
我们梳理了下近十年来国家层面的一些政策,国家信息化领导小组从2002 年开始就对政务信息资源目录体系的建设的工作提出了一系列的部署。在国家 信息化领导小组关于我国电子政务建设指导意见,也就是中办发的2002年十七 号文件中就提出说电子政务建设的主要目标和任务的重点就是研究和设计电子 政务信息资源目录体系交换体系。在2004年12月《关于加强政务信息资源开发 利用工作的若干意见》中办和国办联合发的三十四号文件中,再次提出说要依 托统一的电子政务网络平台和信息安全设施,来建设政务信息资源目录体系和 交换体系来支持这种信息的共享和业务的。
第一可供行政机关无条件共享的我们称为非受限共享类信息。涉及敏感内容只能按 照特定方式或提供给指定对象的称为受限共享类信息。法律法规不能共享的我们称之为非 共享类信息。那么第二块就通过这种资源的梳理我们其实可以了解全市信息化建设的一些 情况,哪些业务由哪些应用系统支撑,哪些数据已经建库,然后在未来促进跨部门系统集 成中,比如说我们要开发具有哪些功能的应用系统,这些系统可以由原来的哪些应用系统 合并改造或者重建,他们的这些数据怎么来?这些功能分别怎么样部署的?能够为公众提 供什么样的服务?通过资源梳理我们都能得到一定的了解。那么第三块就是说,通过这种 资源的梳理我们可以提高数据质量的建设。
你要去查有多少类的数据是没有问题的,比如说劳动部门想查公安的数据有哪几类 ,那是没有问题的,都可以告诉你,有身份证信息、交通违章信息、出入境信息,但是你 想要,对不起需要付钱,或者说你有信誉担保,那么商品是用货币来做中介的,政府信息 是以授权来做媒介的。就是说你一定要经过单位沟通签字确认的,你想拿到一个东西是通 过物流交换体系的,但这个东西在哪里是目录体系告诉你的。
可能有些地方在做的时候比如说他想买东西,要做一个资源目录体系,做 好之后他又说你要把里面具体数据给他,这个其实目录做不到的。目录只知道你 有什么,像整个京东网站它分为京东网站、物流体系、结算体系,结算体系就是 权限管理和授权体系。你要这个数据,可以,要授权的,目录体系只能告诉说你 在哪里,但是不能直接给你,目录可以做的很全面,所有东西都做进去,但是这 些数据,不一定都拿来做交换的,交换体系给你的东西一定是你真正想要的、需 要的,而且是得到授权的对方许可的。
没有目录体系可不可以做交换?可以。只是说有目录体系去做交换能够更加高效更 加标准。如果没有目录体系的话,会非常混乱。作为领导来说,他不知道到底交换了什么 ,交换给了谁,就像淘宝来说,他不知道卖的什么东西,手机和手机壳之间可能卖出去的 数据是不一致的,所以我们说资源目录这个项目很难做。为什么?因为有些下面的部门不 配合不愿意做。你做了信息资源目录体系,你的这个部门在信息资源管理中心地位会非常 高,相当于淘宝和京东控制了所有的商家,就是拿到这个综合的数据,控制就会非常大权 利会非常大会挟制到下面各个部门,所以各个部门不愿意。
那我的商品直接卖给最终用户,我可以控制住我的商品价格、数量。那我通过经销 商来卖,我就不知道卖给谁卖了多少,就不在我的控制范围内,控制力下降,权威性下 降。所以我们说什么东西在淘宝上是没有卖的?然后从来不打折的?比如说汽油卡。
我们来看一下资源目录管理的内容,那首先是元数据库。元数据库只是一个目录, 它是没有实际数据的,我们资源目录的建设只考虑到元数据库。那么基础数据库是基础 的数据,大家都要用到的数据,有唯一的标准,有权威的来源,比如婚姻的只能用民政 ,姓名、身份证只能用公安,真实存在的这种数据,这个基础数据库的数据支点就是元 数据,这些数据可以直接拿来用作应用,做大数据分析的,数据支点是我的元数据库。 那么专业数据库比如说地址,那民政可能就是你实际居住的地址,公安是你的户籍地, 元数据他是涵盖后两者,然后后两者都是用来做实际交换的。
以学生登记表单为例吧,表单上面是学生的基本信息,比如姓名、学号、 班级,表单下面就是一个列表,存放学生的选课信息,比如说课程编号、名称 、学分,对于这个表单,未来在数据库设计过程中可能会设计成两个表,一个 是学生基本信息表,一个是学生选课信息表,那么姓名、学号、班级、课程、 学分可以看作为数据源,那么这些数据源他有自己的元数据,就是来描述这个 数据的,比如长度、类型、值域,比如说姓名这个字,它的长度是什么、类型 是什么、值域是什么。
扩展元数据就是相对核心元数据的。比如说每个类他所特有的这种属性,比如说前 面的姓名、学号、班级、课程编号、名称,这个我们把它称为扩展元数据。
对于学生基础信息表而言,姓名、学号、班级其实是用来描述这个表的一个数据, 那么它就可以看作为是元数据了。同样的,对于学生选课信息表而言,课程编号、名称 、学分是描述学生选课信息表的一个数据,就是他的元数据。然后表中的每一条记录是 一个时期,表的抽象就是一个类,无论是学生信息表还是选课信息表,他都有一个共同 的属性,就是存储位置的描述。这个表中所有数据的存储位置都是一样的,就是类的基 本属性也就是表的基本属性。这个基本属性我们就称为核心元数据。核心元数据是一个 行业所有类都共有的且所有的实体都有相同值的一个数据源。
这两张图其实是很类似的,第一个其实是用来做比喻的,目录体系就是告诉 你哪个部门有哪些东西,京东首页信息列表就是资源目录,这些东西怎么样到你 手上,物流体系就是你的交换体系。比如说你要买个手机,你要去查什么牌子多 少内存什么型号,然后下单,京东网站的事情到这里就结束了。物流启动,先去 查仓库有没有这个东西,然后打包登记发给谁,再集中仓储,比如说先要寄到舟 山,那可能先从杭州仓库到舟山仓库比较快,然后到舟山仓库的时候是个大包, 再拆成小包再给快递员,这个过程是交换。
第三点就是说我们为什么要开展这项工作做这个资源目录体建设,它的意义在哪里? 我们说政 务信息资源目录体系的建设是政务管理、信息共享和信息化工作的一个基础。从几个方面来说,第 一个通过全面梳理政府信息资源,掌握了解全市的资源现状以及部门业务的情况,特别是我们的政 府部门业务信息的产生、提供和共享需求等基本情况,通过我们这种资源的梳理来形成一份完整、 统一的政务数据地图,到哪里去获取什么样的数据,哪些信息是可以向社会公开的,哪些在部门间 共享的,哪些在内部使用的,也就是我们经常说的三种。
• 那么什么是元数据?我们说元数据是描述数据的数据,可以类比为每一本书的内容是 数据,那么查找书本的线索就是元数据,这个解释可能比较抽象,包括我们在做整个 目录体系建设过程中还会碰到一些概念比如说像数据源,那数据源是最小的一个单元 ,那么数据源、元数据他们之间的区别是什么,包括可能我们做标准的时候还会涉及 比如说核心元数据、扩展元数据,这些概念到底怎样去理解。那我通过一个例子可能 可以使大家更加具体地来了解一下这些相关概念。
2006年,在国家信息化领导小组发布的国家电子政务总体框架中,把政务 信息资源目录体系交换体系定位为国家电子政务总体框架的基础设施,提出说 政务信息资源开发利用是电子政务建设的核心,要实现这种横向信息资源的横 向共享和纵向汇聚,要逐步实现政务信息按需共享。
在2007年, 国务院信息化工作办公室提出了政务信息资源目录体系建设的 标准,这个也是国家性标准,从六部分来阐述整个体系。那在2015年也连续发 布了关于政务数据方面的几个文件,第一个就是国务院办公厅关于运用大数据加 强对市场主体服务和监管的意见,里面提出说要建立政府信息资源的管理体系, 要探索建立政府信息资源的目录,统筹推进政府信息资源的建设管理和开发利用 ,那么同年促进大数据的发展行动纲要再次提出说要做好政务数据资源共享开放 工程,要制定数据资源的共享管理办法,要整合政府部门公共数据资源来促进互 联互通。
那这个大仓库就是我的交换数据库,所有东西都要送到我的交换数据库来 。比如说我不止买一样东西,我买了手机壳、膜、卡,手机是有手机厂商过来的 ,他会分批次给你,会集中在中心仓库里,就是京东的仓库,然后合在一起打包 给你。交换体系就有一个中端的数据库,我把你需要的数据整合成一个信息包交 给你,然后整个过程是属于交换体系干的事情。目录就是文件列表,有商品内容 、商品属性,不关心具体的实体,也就是说它只提供一张图片,你收到货不对版 ,那不是目录的问题,他有多少数据量你也不知道的。