政务资源目录体系
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
政务资源目录体系
1.1政务资源目录体系
1.1.1概述
对数据资源采取目录管理模式,有利于市政府领导和各委办局全面了解和利用全市数据资源和数据共享服务。
目录主要用来管理两类资源:数据资源和服务资源。
数据资源是指从各个委办局的采集的元数据。
服务资源是指可以重用的能完成数据共享应用数据,包括用服务生成器生成的服务和委办局提供的接口服务。
数据资源目录的内容包括:产生该数据资源的部门、业务系统、相关业务(参照权责清单),该数据资源的名称(中文说明,英文名称)、包含的各指标项(中文说明,英文名称,数据类型和大小,公开方式等)、分类、编码、更新周期等。
对目录分级管理,分级包括无条件公开、有条件公开、不公开;并对数据内容进行分类管理,包括主题分类、行业分类、服务分类、标签维度。
系统管理用户可以管理系统内的数据资源目录和数据服务目录,包括查询、批准并发布、拒绝等操作,指定各部门要求
报送的资源目录,更新市数据资源目录并管理其订阅、发布状态,对数据资源目录的统计分析(发布、订阅、审批、拒绝等情况)。
1.1.1.1数据资源目次架构
数据资源目次是指对政府数据资源分类后,按照一定的次序编排而成的数据资源列表,便于数据资源共享共享的检索、定位与发现。
根据对数据资源使用的方向,进一步细分数据资源目录的层次:
委办局数据资源目录:指政府部门内部的数据目录,是对业务部门所经办的业务过程中,产生的数据或者收集的数据的目录。
其中有些是涉及国家机密或涉及个人隐私,有些是可在内部共享的数据,还有些是可对公众共享的数据。
交换数据资源目次:指政府内部各部门之间用来做共享交换的目次,通过订阅、审批、服务提供等流程,实现政府内部数据资源之间的共享,使政府内部各部门之间的数据不再成为壁垒。
该目次可通过预先界说的数据等级,决定是否对公众提供服务。
共享数据资源目录:指可对公众提供数据服务的数据目录。
包括政务息公开的数据、委办局的公开明细数据等。
共享数据资源目录:指通过订阅、汇聚共享交换平台中的数据目录(数据),对这些数据进行抽象、整理、加工,形成的数据模型,例如国家基础数据库的人口基础息库、法人单位基础息、自然资源和空间地理基础息库、宏观经济息数据库,以及为专业领域设计的模型库,例如用库、交通库、环境库等各类主题库的资源目录。
数据资产库形成后,它的数据资产目录也可通过共享交换平台对其它部门提供数据服务。
本项目在数据资源目录的工作范围是协助委办局梳理形成各委办局的数据资源目录并形成数据共享资源目录。
具体服务内容是:
✓提供数据资源目次梳理工作流程指南以及一系列模板、表单,便于各委
办局完成梳理工作,统一的产出物有助于项目组统一整理合并,形成全
市数据家底;
✓提供梳理进程的疑难解答,并向息财产中心汇报整体梳理工作进度;
✓对各委办局的梳理产出物做质量评估,协助委办局进一步完善数据资源
目录;
✓组成数据共享所需要的数据资源目次;
1.1.1.2数据服务目录架构
数据服务目录是指可以重用的能完成数据共享应用数据,包括用服务生成器生成的服务和委办局提供的接口服务。
数据服务目录在用户端体现为整体统一的数据服务列表,但是根据底层物理的分布类型,区分为集中式数据服务目录和分布式数据服务。
集中式数据服务目录是数据通过共享交换平台,数据物理存储在本系统的中心数据库中,通过数据服务组件封装而成的数据服务清单。
分布式数据服务目次是数据未通过共享交换平台,而是直接通过部署于各委办局业务系统中的数据服务组件,而发生的数据服务清单。
共享数据服务目录是两类数据服务目录的并集,为用户提供统一完整的共享数据服务清单。
1.1.2数据目录梳理与编制
数据目次的编制是一项长期持续的工作,具备一定的规范性与技术专业性,需要业务人员与技术人员一同根据实际发生业务发生的息,界说实际息化系统或者手工台账中储备的息,按照统一的规范语言对这个息举行描述,最后按一定的规则对描述举行编排。
其中规范的语言是指元数据标准,本项目遵循DB52-T_1124元数据描述规范;规则是数据编目标准,本项目遵循DB52-T_1125编制工作指南。
1.1.
2.1整体业务流程
一次完整的编目工作应包括准备、调研、编目、评估四个环节的工作。
具体工作流程如下:
具体业务流程如下:
实施步骤说明:
上述实施流程图包括了所有部门在各自现状下的实施流程关键节点,以及每一节点的产出物。
各个部门负责人只需要判断以下4个条件(上图中菱形)即可明确本部门的实施路径。
4个判断条件如下:
是否有目录
是否有系统
数据是否本地化
是否有参考标准
根据各个部门是否满足上述4个判断前提的不同,有些部门只需要实施上述图中部分步骤,还有些部门要完成所有节点。
根据各部门息系统数量,数据量,业务复杂度,数据标准程度、目录建设等因素进行综合评估,将部门数据标准化实施难度大致分为难、中、易3个等级,如表4所示:
表1部门按照难度种别分类
序号
1
2
3
4
5
6
7
8
9
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
单位名称市公安局市民政局
市人社局
难度类别序号1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
单位名称市司法局市外事办市国税局市供销社市仲裁委市移民局市城管局市档案局市监察局市质监局
市投促局
难度类别
市工商局
市生态委
市河山局
市交委
市住建局
市卫计委
很难
市地税局
市国资委
市公共资源交易中心市交管局
市水务局
市访局
市统计局
市公积金中心
市安监局
市农委
市财政局
市发展改革委
市规划局
市教育局
市气象局
市政务服务中心市食品药品监管局较难
市法制局
市粮食局
市审计局
市商务局
市地方志办
办公厅金融办
市科技局
市旅发委
市文广局
市人防办
市民族宗教事务局市产业和息化委
市体育局
市直机关事务局
一般
经过前期调研,虽然各个部门上报了1000多项数据集,但是由于部门上报人员没有明确区分“数据目录”、“数据子目录”、“数据元目录”的3级目录的差异。
导致这些数据集不能汇聚到统一的维度,为后续目录梳理带来极大困难。
而后续目录梳理的标准是以业务项梳理,即“数据子目录”,这必将导致目前1000多项数据集在“数据子目录”标准下的数量变动,但最终在“数据子目录”维度下的数据集数量变的更多或更少,需要目录梳理人员对1000多项数据集逐条分析才可最终确定。
举例如下:
场景1:最终目录数量可以变的更多
工商部门上报的某项数据集如表5所示:
表2可共享数据集(业务基础息调查)
序号
1
数据目次名称
企业息
部门上报人员认为“企业息”仅仅是1项数据集,但应该在此基础上,更加精细的整理组成“企业息”这项业务的所有数据子项,即数据子目录。
如表4所示:
表3数据子目录梳理表
序号
1
2
3
.
.
.
内资公司法人
内资分公司息
外商公司法人
.
.
.
企业息数据子目次名称
可以预见,由于前期部门填表人员缺乏培训,调研的1000多项数据集包含大量比较粗糙的数据集。
如果详细分析,
很多类似的数据集可以划分出更多以“业务”为编目标准的数据目录。
这也是编目工作需要分阶段实施的重要原因。
场景2:最终目录数量可以变的更少
工商部门上报的几项数据集如表5所示:
表4可共享数据集(业务基础息调查)
中文名称
*
数据类型
*
字段
名称
值域
自定义
1内部序号
企业中文
名称
政府部门无
条件共享
政府部门无
条件共享
其他类NBXH
索引
c..12序号共享类型*界说表示格式备注2机构类QYMCc..12
部门上报人员认为“内部序号”、“企业中文名称”是2项数据集,但从编目标准以“梳理业务项”为结果的要求思考,“内部序号”、“企业中文名称”仅仅2项数据元目录,还不足以构建以“业务”为编目标准的综合画像,需要在此2项数据元目录的基础上结合更多部门上报人员误认为的“数据集”(数据元目录),才可以组成业务角度的数据集。
由此可见,前期调研的1000多项数据集包含大量过于精细的数据息,经过编目人员的分析,几条数据可能只组合出一条以“业务”为标准的数据集,甚至某条息无论如何组合都难以勾画出以“业务”为标准的数据集而被舍弃。
工作专业程度高,数据规模大。
这也是编目工作需要分阶段实施的重要原因。
判断标准
1.是否有目次
各个部门负责人判断本部门是否已有目次极其重要,极大影响项目的进展和部门工作人员的工作量。
本方案严格界说了
3种数据资源目次的级别和模板(参考表。
),为解决各部门参与人员“如何判断”的问题提供重要依据。
判断前提如下:目录(有/无)
有
判断条件
1)完全按照3级目录划分。
2)各部门已经掌握的各级目录必须至少包含提供模板的所有项
目,允许比模板提供的项目多。
3)基本满足模板提供的数据项,但缺少部分项目,只需补足缺项
即可。
目次差异分析报告:
1)委办局数据资源目录与本项目的规范目录架构的差异(2种情况:委办局目录层次多,委办局目录层次少)2)委办局数据资源目录的分类方法与本项目的规范分类方法的差异并完成映射。
3)委办局源数据描述规范与本项目的规范差异(属性数量的对比、委办局多的可保留,缺少项需要补足。
表示格式的差异并提出建议的转换方式)。
本项目的规范目录架构的差异:
委办局数据分类办法的冲突的解决办法:
委办局数据分类映射表:
标准子类
专题政策
标准子类编码描述说明
01AA专题政策指由国家政府机构为了
实现一定的计谋目标所制定的有
关科技、军事、经济、人口、外交、
政治等专题领域的方针和政策
委办局子类
名称
国家政策
委办局子类
编码
AA001专题政策01AA专题政策指由国家政府机构为了
实现一定的战略目标所制定的有
关科技、军事、经济、人口、外交、
政治等专题领域的方针和政策
地方政策AA002专题政策01AA专题政策指由国家政府机构为了
实现一定的战略目标所制定的有
关科技、军事、经济、人口、外交、
政治等专题领域的方针和政策
经济政策AA003
根据以下的GB52数据元描述规范的数据格式表示方式填写委办局数据元描述规范的映射:
基本格
式
c
cc12
c..12
a
aa3
a..3
nn
示例说明
字符,应至少撑持GB 强制部分划定的字汇
固定长度为12的字符串
最大长度为12的字符串
特指字母字符(a-z,A-Z)
固定长度为3的字母字符
最多为3位字母字符
数值型字符
基本格
式
示例
n3
n..3
n..9,n2
an
固定长度为3的数字字符
最多为3位数字字符
说明
数值型,总长度最多为9位数字字符,小数点后保留2位数
字
字母和数字字符
固定长度为3的字母数字字符
最多为3位字母数字字符
日期型,按年、月、日顺序,格式为8位定长、全数字表示
anan3
an..3
d8(YYYYMMDD)。
年用4位数字表示,月、日各用2位数字表
示,彼此之间没有分隔符
d
t
时间型,按时、分、秒顺序全数字表示,格式为6位定长、全数字表示(hhmmss)
日期时间型,按年、月、日、时、分、秒顺序全数字表示,dt
格式为14位定长、全数字表示(YYYYMMDDhhmmss),如2007
年10月11日11时34分21秒,应表示为
bb
二进制类型,用来表示图形、图像、音频、视频等非结构化
数据
3种数据资源目录的级别和模板如下(以工商为例):
1)数据目录
将业务和资源调查表中业务事项名称和资源名称通过先从各处室业务和资源调查情况举行汇总,再梳理成数据目次列表。
模板如下:
序号*
1
2
企业息
法人息
数据目次名称*所属部门
工商局
工商局
注:“序号”和“数据目录名称”为DB52/T 1124-2016贵州省地方标准已提供的基本数据项,“所属部门”为本方案编制组添加,各个部门也可以再此基础上合理添加其他数据项。
2)数据子目录
根据资源调查表中企业息中公司息为例梳理数据子目次列表。
模板如下:
序号*
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
企业息数据子目录名称*
内资公司法人
内资分公司息
外资公司法人
外资分支机构
外国(地区)企业在中国境内从事生产经营活动内资非公司企业法人
内资非公司企业法人分支机构
内资合资企业
内资合伙企业分支机构息
外商投资合资企业
外商投资合伙企业分支机构
中外合作非法人企业
内资非法人企业
个人独资企业息
个人独资企业分支机构息
农民专业合作社基本息
农民专业合作社分支机构息
个体工商户登记息
所属部门
工商局
工商局
工商局
工商局
工商局
工商局
工商局
工商局
工商局
工商局
工商局
工商局
工商局
工商局
工商局
工商局
工商局
工商局
注:“序号”和“企业息数据子目次名称”为DB52/T 1124-2016贵州省地方标准已提供的基本数据项,“所属部门”为本
方案编制组添加,各个部门也能够再次基础上合理添加其他数据项。
3)数据元目次
将业务和资源调查表中中文名称、共享类型、数据类型、字段名称、界说、值域、数据类型、备注等调查的资源通过先从各处室业务和资源调查情况举行汇总,再梳理成数据元目次列表。
中文名
序号*
1
称*
内部序
号
共享类型*
政府部门
无条件共
享
数据类名
称*
其他类
字段名
称
NBXH
界说
公司在工商
内部系统生
成的序号,自
动递增
2企业中政府部门
享
机构类QYMC公司的名称100个以内字符节
组成
c..100
值域
16个以内
字符节组
成
表示
格式*
c..24
备注
文名称无前提共
2.是否有息化系统
息化系统的现状决定了部门或部门某项业务数据资源梳理的实施路径。
有些部门所有业务都在息化系统完成;有些部门只有部分业务在息化系统;有些部门则完全不使用息化系统。
判断条件如下:
息化系统(有/无)
有
无
判断前提
1)业务管理是否利用息化设备,比方电脑,APP等。
1)电子财帐或纸质办公。
业务实体与数据字典映射
类型
委办局有专业技术人员
委办局无专业技术人员
方法
通过专业技术人员将业务实体与数据
字典进行标注,完成映射关系
1、通过业务调查表得出业务实体,对
业务实体举行去重合并,得到委办
局的关键实体,实体通常是人、物、
协议。
比如:人员息,房屋息,
合同息。
2、根据数据字典梳理出实体表,这些
实体表是外键较多,冗余度较大的,
或者通过数据关联关系找出热度最
高的表。
通过表名的解释对应到业
务实体。
3、两个实体的关联表,分别与两个业
务实体归集到同一数据子目次下。
4、检核办法,通过实体表的字段名称
与业务系统中业务实体的表单息
是否对应。
如果不对应,通过后续
的数据梳理进行再次映射。
3.是否具备数据管理权限
部门是否对数据库具备管理职能影响“数据协调获取”和“数据传输方式”等工作,例如,部门是否有
权限接触并导出数据库等操作。
判断条件如下:数据本地化(有/无)判断条件
有1)部门对数据具备管理职能。
可否直接举行操作。
4.是否有参考标准
参考标准为各个部门在判断某项业务所处的流程至关重要。
判断前提如下:参考标准(有/无)
有
判断条件
1)业务办理有可以参考的行政许可,行政执法,行业标准等文件。
2)息化系统工程扶植有可以参考国家标准、省级标准、行业标
准等文件。
3)“三定方案”规定的主要职责规定、内设机构规定、人员编制
规定。
1.1.
2.2工作准备
建立文档库
数据调研过程是一个多方协同,耗时较长,持续完善的项目,在项目运行过程中会产生大量的中间和结论文档,这些文档必须要有一个文档库管理起来,并且保存历史版本,方便项目组成员协同办公,提升工作效率,保障工作成果不会丢失。
因此,建议使用SVN来管理该项目中的文档。
其中,文档库分为市息产业中心端(总库)和委办局端(分库)。
总库文档的根目次包含以下文件夹:工作计划、调研成效、质量评估、模板文件和参考资料。
分库文档的根目录包含以下文件夹:参考模板、工作计划、业务调研、数据调研、产出物、编目过程的公函、会议纪要等。
明确调研目标
数据调研的目标一般是全面了解政府各部门政府数据资源,摸清“数据家底”。
最终的目的可能是要将各部门的所有数据进行共享(法律法规所规定的隐私数据除外),建立大数据中心,实现数据的互通共享。
确定调研团队
调研小组至少包含一名甲方(息中心)协调人员,以提升调研团队的协调性、权性和可操作性。
调研小组人员的多少,取决于调研的范围大小,以及工作的进度要求。
制定调研计划
数据调研计整齐般说清楚明了每一个被调研部门调研的开始时间、竣事时间,可以细化到每一个科室。
但具体调研时间取决于与被调研部门约定的时间,因此,实际的调研时间可能会与调研计划有偏差。
调研计划模板位置:01参考模板/模板-数据调研计划.xlsx。
委办局调研计划位置:02工作计划/ XXX单位(或委办局)-调研计划.xlsx。
1.1.
2.3确定范围
确定范围包括以下两部分:
确定编目工作范围由各级各部门分管领导牵头,业务处室(科室)数据
管理员负责提出编目范围。
调研部门的确定最好能细化到下面的科室,因为不是每一个科室都需要去调研。
在调研实施阶段,有时候需要增加科室或者部门,如果数量少的影响不大,如果数量大的话会影响到调研完成进度。
确定编目工作范围不仅要覆盖本部门本单位核心业务,而且要细化到具
体日常业务事项,业务事项的名称是数据调查和目录编制的基础,业务
事项名称应形成汇总清单。
调研的内容以数据为主,一般不用调研业务流程。
但各业务部门的数据都与其业务密切相关,并且在调研访谈中访谈对象或多或少都会提及其业务流程,所以可以将了解被调研部门的业务流程列为非必须调研内容。
在调研报告的输出中,可以只在被调研部门的职能介绍中对业务流程做简要说明。
数据调研的内容视需要可以分为调研系统数据和手工数据。
系统数据是指储备在息系统数据库中的数据,手工数据是指工作人员在日常工作中用Excel表格制作的数据。
从数据共享集中储备的角度来看,系统数据更方便通过交换平台共享,然后储备在大数据中心,但如果系统不是由被调研部门所建,比方国家、省级的垂直系统,被调研部门只是一个用户,则无法通过交换平台去获取该系统数据,只能通过系统的导出功能导出Excel格式的手工数据。
由于系统数据是储备在各个业务系统中,因此对被调研部门系统的调研十分重要。
一般需要调研系统的功能、扶植时间、开发商等息。
数据调研的内容按数据的类型还可以分为结构化数据和非结构化数据。
系统数据一般都是结构化数据(有的系统中会有图片等内容,但如果储备在传统关系型数据库中则可和结构化数据一并共享),非结构化数据则还包括word文档、图片(包括绘图工具制作的图片)、视频等。
调研的内容还包括对数据之间关系的调研和梳理,比方多个部门之间(或部门内部之间)的人口数据的关联关系,数据之间的反复与否;多个部门之间在一项业务中存在协同关联的,数据是否做到了互联互通等。
调研的内容还可以包括了解被调研部门对其他部门数据的需求。
一般情况下,确定了调研目标,才能根据调研目标确定调研范围,比方只调研系统数据,不调研非结构化数据,不调研数据之间的关联关系等。
业务预研
业务预研指熟悉被调研委办局(部门)的业务,包括日常工作、职权范围等。
业务预研的目的是在访谈调研过程中交流更顺畅,调研不会有遗漏,调研效率更高。
根据委办局权力清单,梳理所有主责办理的业务。
根据业务形态,定位息化系统的数据位置及属性。
没有息化系统的,调研手工台账或登记薄。
另外,可通过业务单位的政务公开、网上办事、在线查询、在线指南等网站来了解其相关业务,并形成文档资料已备查阅。
通过业务预研后,可组成业务预研数据,记实业务预研清单。
调研计划模板位置:模板文件/数据预研模板-业务预研清单.xlsx。
各委办局文档存放位置:调研准备/ XXX单位(或委办局)/业务预研清单.xlsx。
相同话术准备
在调研工作展开前,调研团队需要准备一套相同的话术,如称呼语,发问语气与方式,遇到相同困难时怎么打破僵局等技巧。
调研前,需要对参与调研的人员举行技术培训,以提高调研人的相同技巧,提升相同质量。
沟通话术可参考:
模板文件/相同话术指南.docx
1.1.
2.4调研实施
数据调研协调
在调研正式启动前,需要正式向被调研单位发送调研函,并在调研函中附上业务预研的成果,并将它们作为调研启动会上的讨论范围。
调研发函模板由政府提供,内容可由调研组编写,并提交主导单位负责人审核,最后并由主导单位发出。
调研函模板位置:01参考模板/模板-调研发起函.docx
委办局调研函位置:06进程文件/调研发起函-关于展开调研数据工作的函(XXX局).docx
调研启动会
初次启动对某局举行调研,在发函得到确认后,按约定的时间开一次正式调研启动会,建议这次会议将大数据产中心相关领导、被调研单位相关领导、调研项目经理,以及三方相关成员召集在一起开一次启动会,这次会议将环绕调研函中提到的数据清单来讨论,并最终圈定调研的范围和内容,并确定本次调研的各相关人员和工作计划,建立通讯录,最后以邮件的方式举行确定。
启动会材料内容包括:会议主题、干系人介绍、数据编目的基本内容和方法、项目工具介绍、编目工作计划、明确相关责任人等。