公共资源交易数据资源体系的构建研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
公共资源交易数据资源体系的构建研究
作者:付宏燕
来源:《经济研究导刊》2024年第07期
摘要:构建开放共享的数据资源体系是公共资源交易大数据共享、流动和应用的基础,促进交易大数据价值的更大化,利于营造公开透明、竞争有序的公共资源交易市场环境。
基于对公共资源交易业务与主体行为关系、交易数据特征的分析,设计公共资源交易数据资源体系框架,涵盖从原始数据的收集和资源化,到形成统一目录对外共享应用的过程,并提出构建难点。
关键词:公共资源交易;数据资源体系;资源目录;共享应用
中图分类号:TP319 文献标志码:A 文章编号:1673-291X(2024)07-0078-03
2022年6月国务院印发了《关于加强数字政府建设的指导意见》,明确将构建开放共享的数据资源体系作为我国数字政府建设的重要任务。
同年10月,国办印发《全国一体化政务大数据体系建设指南》,提出到2025年,政务数据资源将实现有序流通、高效配置。
公共资源指由政府或被授权的组织所有或者管理的公有性、公益性资源。
公共资源交易活动是关联政府和市场的纽带,业务特征明显,属于政务公开范畴[1]。
公共资源交易数据资源体系是全国一体化政务大数据体系建设的组成部分,是对交易数据资源生命周期的统筹规划,利于数据流通共享和高质量地应用。
目前以市场化方式配置的公共资源如农村集体产权、无形资产、海洋资源等也纳入了交易平台覆盖范围,作为基础的公共资源交易大数据的资源体系急需先行。
一、公共资源交易业务关系和数据特征分析
(一)交易业务链条式关联
公共资源交易以分交易领域的项目/标段交易进展为主线,围绕入场登记、招标、投标、评标、中标、合同的业务环节,形成链条式结构化数据[2],记录交易全周期。
市场主体不仅是交易活动的组织者、发起者,也是交易行为的参与者、实现者。
交易业务与主体行为关系见图1。
(二)海量数据隐含市场资源配置规律
公共资源交易领域众多,数据海量且时效性强,不涉敏感信息,源自全国1 000多个地市或省级交易平台,涉及交易市场主体100多万家,仅工程建设招投标和政府采购领域进入平台
的年度成交项目就超120万个。
2亿多条异构多源交易数据清洗重组,由应用需求牵引流动,揭示交易行为隐含的资源配置规律,反映出交易市场的区域化融合程度。
二、公共资源交易大数据的发展现状与问题
(一)交易大数据归集稳定但未形成资源体系,缺少统一编目
地方的公共资源交易电子化数据源结构千差万别,质量参差不齐,向国家级平台提交时需按照数据规范进行内容和格式转换。
目前,工程建设招投标、政府采购、土地使用权出让、矿业权出让、国有产权交易5个领域的关键数据已完成从地方到国家的实时归集、治理和初步整合,在国家公共资源交易服务平台表现为统一格式的库表和主体成交记录接口,但没有形成统一对外的分类和目录,资源体系规划尚未形成。
(二)数据规范更新滞后仍未形成机制,数据仍有应进未进
理论上,随着交易全流程电子化要求和纳入领域的不断扩充,作为依据的数据规范应跟随修订,并反馈到交易平台软硬件系统,指导数据处理和流转。
但是由于制度、资金、技术等因素制约,配套的规范修订和落地机制均未纳入体系,规范修订后在地方的及时切换难以实现,现有交易数据应用时还需统筹考虑应进未进的完整性误差。
(三)数据资源体系研究依然停留在独立环节,无全周期考虑
数据变成资源是流通共享并发挥应用价值的前提条件。
公共资源交易数据资源体系与数据质量、规范、软硬件、应用等因素紧密相关,并与市场主体、市场环境等构成动态发展的有机整体。
近三年来,学者们对于公共资源交易数据的研究主要集中在交易数据仓库构建[2]和可视化、交易数据交换共享[3]等归集治理与建模、共享与应用,以及区块链用于交易数据的整合共享与传统级联模式的对比[4]、数据规范设计[5]等研究。
截至目前,仍保持在独立环节的设计研究,还没有全周期地将业务分析结合技术处理形成资源,并统一分类编目支撑共享应用的交易数据资源体系的整体框架研究。
三、公共资源交易数据资源体系构成
(一)可动态扩展的交易数据资源体系框架
开放、共享的公共资源交易数据资源体系框架包括数据规范体系、数据归集体系、数据资源化体系、数据资源分类体系、数据资源目录体系、数据资源共享体系、数据资源应用体系、数据安全体系,如图2所示,每个组成部分均可动态扩展。
数据规范体系、数据安全体系贯穿所有组成,指导并约束资源从归集到应用始终;每一层体系内容均为上层实现的基础和前提条件,存在依附关系。
(二)约束与扩展共存的数据规范体系
作为数据生命周期质量控制的机制和保障,数据规范体系包括三部分:一是规范数据内容和格式,明确不同领域数据所含的交易业务关系、技术约束和数据所有权,应达到技术层面易实施、业务层面可跟随政策和实际做扩展;二是规范内容在全国落地的流程和对接人要求指南,保障顺利切换;三是规范修订版本的管理制度,明示不同版本间的继承和更新内容,以及各版本实施时间、问题处理备案,减少地方运维人员频繁变动和交接缺失的风险。
(三)兼容多种技术的数据归集和资源化体系
目前,多领域交易数据从地市经省级到国家级的级联式归集体系已形成。
地方交易平台和中央范围的异构交易数据,按数据规范转换,经格式、必填项、及时性校验,归集到国家公共资源交易服务平台政务云存储。
归集体系应开放、兼容,接纳多种技术实现方式。
国家级平台实施按省考核数据的机制,对所收到的数据打标签,识别所属领域、主体性质、交易类型、交易时间等业务特征,对疑似异常的大额中标值核查治理、整合补全,形成质量较好的库表资源和接口资源。
目前,国家级平台已有140个基础库表,涉及3 000多个字段,生成了元数据及稳定的数据监測机制,但库表数据未对外开放。
(四)支撑业务应用的数据资源分类体系
数据资源分类从支撑公共资源业务应用角度考虑。
最常用的报表、统计分析、交易平台电子化都是按交易领域分类;而按交易流程分类能够精准定位招投标的重要环节,对于过程查询或监管必不可少。
交易属地、来源平台是分析不同省份和地市交易主题、数据质量的必选维度;而主体类型、主体性质定位于全国市场主体参与交易程度、交易市场一体化、区域营商环境等研究。
(五)方便检索定位的数据资源目录体系
数据资源目录从方便资源使用人检索角度进行编目,表达出库表数据之间的业务依赖、包含关系。
表现层采用交易领域、交易流程、资源来源树状结构逻辑对外,一并提供资源名称、资源描述等属性;支撑底层为统一的物理库表和接口资源。
例如,交易流程目录树划分为入场登记信息、招标公告信息、成交公示信息、交易合同信息四个一级子节点,同笔交易的一级子节点纵向跨越交易时间主线,从入场登记到交易合同,表达出一个交易周期;横向的一级、二级子节点、三级子节点之间为从招标项目到标段的业务包含关系。
(六)利用已有基础设施的数据资源共享体系
公共资源交易数据在政务系统内开放共享为非货币媒介交易,以辅助政务单位的履职应用为目的。
国家电子政务外网承担着全国交易数据的归集,也必然地成为面向政务部门资源共享的主要渠道。
全国一体化政务服务平台、全国政务信息共享平台、国家公共资源交易服务平台都是国家级数据开放平台,采用统一的资源共享机制面向全国开放,以实名认证申请资源的方式,强化资源提供方与需求方的有机连接。
(七)跨部门跨地域的数据资源应用体系
公共资源交易数据资源的流通,推动跨部门、跨地域的业务协同,破除省际间招投标的垄断分割,推动了竞争有序的全国统一大市场建设[6]。
目前,接口资源的主体信息、交易成交记录已用于实时支持南京、云南、海南等40多个地方交易系统的投标文件制作、评标业绩审核、机器管招投标、主体库等环节,简化了招投标原有流程。
部委业务协同上,为信易贷实时提供全国邮储银行中小企业融资评价服务,支撑住建部、国税等单位行业中標项目的核查监管;现有面向社会的交易公告公示日访问量达600万次,新的应用场景需要不断发掘。
(八)安全可信的数据安全体系
安全和可信贯穿交易数据的归集、资源化、共享和应用全过程。
作为政务数据资源,安全可信流通应反馈在“管得安全、查得精准、用得便捷”。
网络层面充分利用政务外网安全设备和策略做保障。
数据层面无敏感信息,但需考虑系统支撑能力以及爬取大批量数据关联时的业务价值,采用日访问量限制、IP地址限制、每分钟访问次数限制等反爬策略,保障正常业务访问,并防止数据批量外泄。
四、公共资源交易数据资源体系构建难点与建议
(一)资源化体系决定数据质量
数据资源应用成效关键在于数据的高质量,而数据的及时性、准确性、完整性是数据资源化体系的根本目的。
资源化的过程中,数据治理任重道远,如原始数据的金额单位元与万元不清、金额填成手机号码、行政区域代码填成邮编,虽有监督和考核手段,各种错误依然层出不穷,建议资源化过程中增加结构化金额数值与公告公示大文本的比对校正,以及人工抽查。
(二)数据规范体系决定数据易用程度
同笔交易在不同资源的前后串联,在不同交易环节的定位,以及分维度统计分析,是业务应用最为频繁的场景。
数据规范对于交易链条的串联约束,若采用完全依赖主键的第三范式,在海量数据且需要大量表多次深度关联的复杂依赖关系应用中,速度与效率非常低下。
因此,数据规范的设计应“既保持函数依赖”又具有“无损连接性”,考虑将关键数据项复用到不同表,
适当增加冗余换取时间效率。
再者,规范对数据权属的约束除对满足数据生产者的追踪外,需实现流转周期对数据使用者的标识。
在大数据上升为国家战略的背景下,公共资源交易数据资源体系应以服务政府和市场主体为本,打破省际物理疆界,渗透到跨部委跨省跨域的政务应用和社会应用中,利于交易数据的价值发现和价值变现,促进资源配置不断优化。
参考文献:
[1] 王丛虎.重视公共资源交易营商环境评价指标的构建[N].中国政府采购报,2019-10-01(3).
[2] 付宏燕.公共资源交易数据仓库的构建[J].现代计算机,2022,28(5):46-51.
[3] 付宏燕.公共资源交易数据交换共享的设计与实现[J].计算机时代,2022(11):92-95.
[4] 付宏燕.区块链在公共资源交易数据整合共享中的应用研究[J].现代计算机,2022(12):86-89.
[5] 付宏燕.公共资源交易平台数据规范的研制与应用[J].现代计算机,2021(29):36-40.
[6] 付宏燕.京津冀公共资源交易协同发展成效评估研究[J].中国物价,2022(8):41-43.
[责任编辑刘瑶]。