社保分析系统建设方案V1.0.1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
社保分析系统建设方案天津南大通用数据技术股份有限公司
目录
社保分析系统建设方案 (1)
目录 (1)
1 系统概述 (2)
1.1 建设背景 (2)
1.2 建设原则 (2)
2 系统解决方案 (4)
2.1 系统架构 (4)
2.2 系统特点 (4)
3 分析平台功能 (6)
3.1 数据整合管理子系统 (6)
3.2 分析型列存数据仓库系统 (6)
3.3 可视化分析展现平台 (7)
3.4 平台辅助功能 (8)
4 分析系统部分功能展示 (9)
4.1 社保总体概况 (9)
4.2 社保单位统计分析 (9)
4.3 参保人员分析 (10)
4.4 关键指标展示 (11)
5 项目预算表 (13)
1系统概述
1.1建设背景
随着信息化的发展和电子政务的展开各地社会保险经办机构投入运行了大量的社会保险业务管理系统;这些系统积累了大量的历史数据,于是就造成:一方面,要不停的增加硬件系统的投入来满足数据存储和业务扩展的需要;另一方面,管理决策层却无法从历史数据中获得决策信息,只能根据业务报表系统获得有限的信息,无法应对社会保障事业新的发展形势。
当前政府部门正在兴起学习加强执政能力重要思想新高潮,作为与人民群众切身利益密切相关的社保业务部门必须以参保人员的切身利益为重,为参保人员提供全方位的服务;业务系统所积累的海量历史数据如果能充分利用无疑是一笔宝贵的财富;而社保统计分析和辅助决策支持系统正是通过挖掘分析历史数据,为领导决策层提供丰富的信息资源,满足决策需要。
1.2建设原则
●以平台为框架,无缝集成社保业务应用系统。
在符合国家人力资源与社会保障部和行业标准的体系指导下,建设社保分析系统的数据标准,以南大通用分析平台为框架,无缝集成社保已建和新建的业务应用系统,促进数据利用的最大化。把数据交换集成、数据管理、业务数据整合、信息资源展示等都融合起来,以标准、数据、应用、用户作为重点要素为主线进行规划和建设。
●遵循全面规划、分步实施的原则,为社保数据长期分析打下良好基础。
遵循全面规划、分步实施的原则,在充分保障社保部门现有投资(业务系统、服务器设备等)下,制定社保数据的信息标准,建设社保数据分析系统的基础平台,以及各系统之间的接口标准与规范,对今后分析系统的建设与整合打下基础。
●先进性原则
系统设计采用先进的并行计算技术、数据分析与挖掘等,建设一个可持续发
展的、具有先进性、开放性的社保分析系统,满足未来社保数据不断扩展的需要和灵活定制分析需求。
●扩展性原则
系统架构设计合理,考虑对于未来的发展,设计充分考虑今后扩展的要求。包括与其它应用系统之间的互联以及系统的扩容能力等,在满足现有系统互联的前提下,能够很好的适应未来信息系统增长的需要。
●系统安全性原则
在系统软设计与建设中,充分考虑系统的安全,包括数据安全、网络安全,传输安全,管理安全等。
2 系统解决方案
2.1 系统架构
南大通用的社保分析系统包括数据分析平台和分析系统两大部分组成。其中数据分析平台由数据整合管理子系统、分析型列存数据仓库系统、可视化分析展现平台三部分组成。分析系统基于分析平台开发,支持灵活定制,满足客户多种分析统计与数据挖掘需求。具体如下图所示: Oracle 数据加载GBase 8a MPP Cluster
业务系统2业务系统1
业务系统3即席查
询交互式图表交互式报表GIS 引擎
工作桌面GBase BI
分析应用大数据分析平台
图 2-1系统架构
2.2 系统特点
1、现有业务系统和Orcale 数据库不需要进行改造,仅需要从现有Oracle 数据库导出业务数据;
2、通过数据整合与加载子系统,可以解决从Oracle 自动将数据同步至数据仓库子系统的问题,可以通过定制任务,实现数据的加载、导入;
3、数据仓库采用南大通用的分布式列存储技术的产品,系统支持PB 级别结构化数据分析与查询,后续可根据数据量的增长平滑扩容;
4、采用可视化商业智能分析平台,为用户提供对数据仓库中海量数据的分析能力,包括即席查询、图表、报表等功能;
5、基于可视化分析展现平台,可以通过简单的点击、拖拽等方式,快速的实现各类大数据分析应用,以满足客户灵活的分析需求。
3分析平台功能
建设的社保分析系统中,系统分析平台包括数据数据整合管理子系统、分析型列存数据仓库系统和可视化分析展现平台三部分。另外包含数据管理相关的平台辅助功能。
3.1数据整合管理子系统
实现从现有系统中的社保业务数据同步至分析型列存数据仓库中,提供数据同步服务和数据转换服务,其主要作用是通过对各数据源的数据进行采集,然后通过数据清洗、比对等过程,实现数据的导入,汇总并查询、展示相关数据。具体功能包括:
➢数据同步和数据迁移的功能,可以从不同的数据源抽取数据,并通过清洗插件进行数据转换,同时将清洗后的数据加载到目标库中。
➢转换和作业的功能,同时支持扩展性的转换和作业插件,可以通过界面或批处理的方式执行。通常作业或转换是在规定的时间间隔内,使用
批处理的模式运行。
3.2分析型列存数据仓库系统
是专门面向数据仓库统计、分析型应用的列存储数据库,实现对社保数据的高效存储和管理。数据仓库中保存社保信息数据仓库及业务系统支撑数据库两种类型数据。其中社保信息数据仓库包括各类型明细数据,另外,建立根据不同专题组成的专题库,包括电流专题库、电压专题库、电费专题数据库、数据整理库、异常信息库等;业务支撑库包括元数据库、共享信息库、权限数据库、系统配置等。具体的特性包括:
➢列存储架构,更适用于统计分析,先进性架构设计简洁清晰,扩展性强,变更灵活,可以根据实际业务需要灵活部署和配置。