“大数据”时代社会保障信息化建设的机遇与挑战
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
“大数据”时代社会保障信息化建设的机遇与挑战
苏州市人力资源和社会保障局刘东玉
随着全球信息化的不断深入,数据量成几何系数增长,“大数据”(Big data)时代已经到来。最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”金保工程是社会保障信息化的核心项目,金保一期工程已发挥出信息化对业务的支撑和引领作用,成为支撑社会保险业务经办、提升社会保险服务水平、强化社会保险基金安全的有力保障。随着“大数据”时代的到来和金保二期工程的建设论证,可从技术上推动社保信息化工作的进一步深入。“大数据”给社会保障信息化建设带来了诸多机遇,也带来了更多挑战。
一、“大数据”基本概念
“大数据”指的是所涉及的数据量规模巨大到无法透过目前主流软件工具,在合理时间内达到获取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。“大数据”同过去的海量数据有所区别,其基本特征可以用4个V来总结:体量大、多样性、价值密度低、速度快。
第一,数据体量巨大(Volume)。从TB级别,跃升到PB级别。
第二,数据类型繁多(Variety)。如除传统结构化的数据外,还有文本、视频、图片、声音、地理位置信息等非结构化信息。
第三,价值密度低(Value)。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。
第四,处理速度快(Velocity)。“大数据”对处理速度有要求,一般要在秒级时间范围内给出分析结果,时间太长就失去价值了。最后这一点也是和传统的数据挖掘技术有着本质的不同。
二、社会保障信息的“大数据”特性
随着金保工程一期建设的完成,一个以信息网络三级互联、应用软件基本统一、数据资源集中管理为主要特征的、统一的金保工程支撑平台已在全国基本形成,全国所有地级城市和省级人社部门均已建立了数据中心,32个省级单位全部实现了与部中央数据中心的网络联结,90%以上的地市实现了与省级数据中心的联网,城域网已经联接到92.5%的社会保险经办机构和就业服务机构,并且延伸到街道、社区、乡镇和定点医疗服务机构,覆盖全国的人力资源社会保障信息网络架构初具规模。社保数据不断向上集中,参保人数几乎覆盖全国,历史数据不断积累,社会保障信息呈现出“大数据”的特性:
第一,社保数据量不断增加。以苏州市为例,仅结构化的社保数据库数据已达TB级,如果算上12333电话语音、医保药店视频监控等数据,数据已接近PB级。
第二,数据类型已不是简单的结构化数据。数据库中存储的图片信息、12333的语音信息、医保药店的视频监控信息等非结构化数据日益增多。
第三,数据价值提取困难。历史数据繁多,部分历史数据未能有效整合、全省乃至全国范围内的数据未能做到互联互通互操作,数据提取利用困难。
第四,对数据处理速度要求高。数据量的庞大、数据库的复杂势必造成了数据处理难度大,而社保经办需要实时性强,对数据处理速度提出了挑战。
三、“大数据”时代社保信息化建设面临的机遇
机遇一:降低存储成本
从社保信息化发展趋势来看,无论政策还是技术上,建设省一级集中式平台都被提到了重要日程上来。省一级的社保参保人数可达几千万甚至上亿,这么庞大的数据中心在以前是不可想象的。数据量倍增,按照传统的模式是扩充存储、增加服务器,这与目前各大互联网巨头提倡的去“IOE”(所谓去“IOE”,是对去IBM、Oracle、EMC的简称,三者均为海外IT巨头,其中IBM代表硬件以及整体解决方案服务商,Oracle代表数据库,EMC代表数据存储)趋势不符,也导致存储成本不断增加。
“大数据”和云计算技术的成熟,为省一级社保信息的集中管理提供了可能,运用云存储技术,形成逻辑上的数据中心,既能减少成本,又能保证数据逻辑上的集中存储。按照“1+X”的模式建立云数据中心:在省级有一个大的数据中心,同时保留若干个城市的二级数据中心,在应用层面将多个数据中心做成一体。另外,将来的社保数据必须是横向上能够与其他政府数据互相流动,比如与工商、税务、公安等部门或者其他行业的应用结合,基于城市级或者区域级的云平台将更适合这种模式。
机遇二:提升宏观决策和基金监管能力
宏观决策是金保工程四大功能之一,随着系统建设日趋完善和数据的不断积累,其作用越来越显得重要。目前的宏观决策支持软件是对社会保险业务的各个方面进行主题分析和数据挖掘的计算机应用系统,有助于发现社会保险业务数据隐含的信息和价值,起到事前决策、事中控制、事后反馈的作用,为人力资源社会保障部门政策制定提供决策参考。
运用“大数据”技术寻找数据背后的潜在规律是对社保信息的全新应用领域。2014年春节期间,百度公司推出了“百度迁徙”,利用“大数据”技术,对其拥有的LBS(基于地理位置的服务)“大数据”进行计算分析,并采用创新的可视化呈现方式,在业界首次实现了全程、动态、即时、直观地展现中国春节前后人口大迁徙的轨迹与特征。这种全新的“大数据”应用模式可以借鉴到社保应用,运用全市、全省乃至全国的社保数据,对养老保险、医疗保险、工伤保险、失业保险和生育保险等海量数据进行分析,对社会保险的发展趋势和状况进行定量和定性分析,并做出相应的预测。例如:可根据年征收率、历史欠费清欠率、社会工资增长比例等分析指标,预测将来某个时期养老保险基金征收的情况,为制定相关政策提供依据。
此外,可以将“大数据”技术用于医疗服务监控。利用“大数据”技术,从海量数据中筛查出可能的违规行为,并进一步支持医疗保险监控稽核工作。结合疾病关联、药品关联等数据信息的积累,支持监控能力进一步向纵深发展,有利于提高医疗保险精细管理能力,提升医疗服务监管水平,促进事后监管向事前、事中监管转变,加大对医疗服务违规行为,尤其是欺诈骗保行为的惩戒和威慑力度,保障基金安全。
机遇三:增强信息共享水平
随着金保工程实施,社保信息化正从分散建设向统一集中建设迈进。客观上中国公民