电子政务信息资源加工与使用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
针对图5-2描述的政务资源,加之其多以非结构化形态存在, 就使传统数据处理技术越来越难于支持日益扩展的电子政务 应用的需求。主要体现在三个方面:
(1)传统技术的限制
(2)多形态、跨系统间的资源无法建立关联 (3)缺乏成熟的服务模型,无法为各级用户提供个性化信 息支持
所以,解决上述问题应采用新技术支持的资源加工平台。
5.2.1政务系统中的资源形态 电子政务系统设计者在需求分析时会碰到两个问题,一 是如何区分政务系统中的数据、信息和知识,二是弄清 三者间的关系及政务应用所需的管理工具和特点等。 在大数据、虚拟现实、人工智能与深度学习等新技术支 持下,高层决策者会得到一些全新的知识视角和一些领 域的知识图谱的呈现。
5.3.1政务术语/概念标准化
1)政务术语/概念库 基础术语和概念的标准化是指如人口、空间、机构实体、经 济、社会等各类政务应用均需要数据的标准化,涉及对象概 念定义、描述方法和工具的规范化开发与管理,具体为: 术语概念标准化 术语描述标准化 术语库管理标准化
5.3.2 基础数据标准化
在政务信息资源中位于更底层,更基础的 数据的一些特殊数据,主要为元数据、数据 元素、代码等,这些数据的标准化将对政务 信息资源的整体质量、可用性、可共享性等 都起到重要作用。有关内容参见第8章。
资源格式(Format)语言(Language)资源标识 (Identifier)
显然,这一描述模型的优缺点都是十分明显。优点是通过上 述元数标注后,所有文档资源都变得比较规范,非结构化的 资源变为半结构化的资源,可用数据库管理系统方便地进行 管理。缺点是:首先;每篇文档如加上这15个数据项的话, 只能通过人工标注,对于行政机构或信息中心而言,面对海 量资源加工是极不现实的。其次,这些数据项用于描述文章 内容的只有1~7项,反映其论述内容的只有前3项,且通常情 况下,一篇文献所用的主题词或关键词只有3~5个,无法从 更细致的角度去描述其内涵;第三,该架构无法支持在自动 能力处理环境下的规模化资源加工与增值。
资源描述(Description)资源类型(Resource Type)
来源(Source)与其他资源的关系(Relation)
覆盖范围(Coverage)作者或创建者(Creator)
资源的发布者(Publisher)对资源有贡献的其他人员 (Contributors)版权管理(Rights)日期(Date)
• 电子政务系统对结构化与非结构化资源都是适用的。 • 电子政务系统应支持多渠道、多来源资源的处理。 • 电子政务系统中各资源体,代表不同信源、不同知识领域。 • 电子政务系统支持数据、信息与知识的标准化处理与整合。 • 电子政务系统整合的结果将生成新知识。 • 电子政务系统应能被方便地集成到各类政务应用系统中。 • 电子政务系统应能支持一系列的信息加工与服务功能。
5.1概述
政务信息资源(Government Information)是指政 务部门为履行管理国家行政事务和社会公共事务的职责 而采集、加工、使用的信息资源,政务部门在业务过程 中产生和生成的信息资源,由政务部门投资建设的信息 资源以及由政务部门采集、管理和使用的信息资源。
5.2 数据、信息与知识
2)政务领域的对象描述需求
都柏林核心元数据集仍是一个“文档级”的轮廓性描述架构, 不是针对文档中“概念级”的资源精细描述,故“颗粒度” 较粗,对于现实图5-3理想状态的知识管理尚不完善,其他 元数据集也有类似问题。原因是,许多元数据集都来源于图 书馆管理的需求,最初对图书的描述也只限于对其外部特征 的描述,而对内容的说明则一般限制在数个关键词内,附加 内容摘要就可。这种管理的目的,并不是要让读者通过了解 全文包含的主题词集合来了解书籍内容,而只是为读者们提 供对书籍的选择,再引导他们去阅读图书。
5.3.3 基于概念的资源描述
1)Dublin Core实例简介
非结构化文档一般以文本文档为代表,其描述有一些国际 公认的模型,如著名的Dublin Core(都柏林核心数据集)就 是代表性的文档描述规范,用于管理文档类资源,它由以下 15种元数据组成:
标题名称(Title)主题词和关键词(Subject)
3)理想的政务资源模型及实现途径
理想的政务资源架构模型如图5-3所示,它要求在一个平 台上,实现各领域、各层面、各种来源、各类形态的资源的 有序集聚与整合。
图5-3 理想的政务资源平台示意
图5-3 模型通过一个“智能数据操作层”来实现不同领域、 不同机构中数据、信息与知识的有序集聚、标准化处理与整 合,实现以下要求。
5.3 电子政务基础数据资源与标准化
实现图5-3的政务资源模式,关键是对三类资源的标准化处 理。如对不同系统的数据如空间、人口、法人、经济、交通、 社会等领域的数据集成,要从底层实施数据标准化,提升其 可用性、可再加工性与共享性。
政务数据资源标准化的主要内容为:基础层面上有各领 域政务术语/概念的标准化,数据元素标准化,元数据及其组 成的标准化等;处理层面有数据加工模式、规则与质量要求 的标准化等;应用层面上则有附加资源(如标识与描述数 据)、组合ຫໍສະໝຸດ Baidu关联资源等的标准化等。
2)政务信息资源的实际模型 图5-2显示了实际的政务信息资源模型,它是大量复 杂资源体的混合物,它们在不同机构、不同系统与 不同应用中呈杂乱关联状态。该模式反映了实际政 务资源的几大特点:
• 资源多源性 • 资源海量性 • 渠道广泛性 • 资源相关性 • 资源多态性
图5-2 多源、多态、多层面的电子政务资源聚集体示意
5.2.2 数据、信息与知识模型 1)政务信息资源概念模型
数据、信息与知识三者的内涵不同,但又彼此衔接且在一定 条件下可互相转化,如图5-1所示。
图5-1数据、信息与知识基本模型
图5-1表明数据、信息与知识之间并无绝对区别,而 是一个彼此间可互相转化,周而复始的循环升级过 程,这符合人类认识论的过程特性。即模型中的知 识通过编码、存储后可再产生新的数据、再通过加 工生成新的信息、新信息再提升为更高阶的知识。