华为税务大数据解决方案
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
标签画像分析算法模 型
3
实时风控(开票阻断)
数据驱动业务(智能 提示)
4
1
风险纳税人定期计算、 定期推送
风险事件事中提示、 快速阻断
事前
事中
申报、征收
明确事后应对的风 险事件
事后
发票 出口退税 稽查
风险 管理
纳税 信用
1 离散到全量数据
全业务领域覆盖,全业务流程打通,收集全部关联数据
2 周期到实时转变
3.数据治理体系
建设一体化数据治理工具体系 优化数据管理组织与职责,梳理数据资产,建立数据
资产管理机制,明确数据标准落地执行机制 建设数据质量管理体系,持续加强数据治理
4.统一分析工具
提供自助式BI分析和标签工具,数据潜能快速释放; 提供一站式人工智能平台,助力税务智能化转型;
5.统一数据服务
发票管理
申报征收
申报
票证
标签画像 优惠
税收优惠 认定
帖源层 核心征管
电子底账
稽查
出口退税
行政管理
数据交换平台
批量数据迁移
数据采集
数据库实时同步
实时数 据集成
数据加工 流计算 及存储 文件存储
批处理 数据仓库
对象存储 图数据库
数据分析工具
人工智能工具 AI开发平台 AI算法模型 第三方算法
数据分析工具 BI分析工具
支持税务内部等主流场景的批量、实时数 据汇聚,统一存储;
智能纳服 中心
智能分析 中心
智能风控 中心
智能稽查 中心
数据治理
数据标准 管理
数据质量
智
管理
能
数据资产
数
管理
据
数据组织与
平
职责
台
数据制度与
流程
数据服务 数据服务开发
数据服务接口
数据服务管理
数据资源服务目录
数据服务门户
集市层 指挥决策主题 专题应用主题
风控应用主题
稽查主题应用
数据 底座
整合层 户籍档案 标准层 登记
实时检索计算
在线查询 HBase
Elasticsearch
实时流计算
实时任务 数据存储
Redis
Flink
华为MRS(Hadoop)
数据 汇聚
实时数据汇聚 DRS/DIS
批量数据汇聚 DAYU-CDM
源系统
数据库
文件数据
汇聚存储
数据治理
数据分析
数据服务
应用场景
综合查询 综合查询
交互查询/ 多维分析
交互查询 MPP DLI
• 各地运维运营团队缺失,无法有效 支撑平台运营工作
税务大数据
数 据
数据汇聚
数据管理
数据服务
源
运营运维
数 据 应 用
规划统一智能数据平台,驱动税务数字化转型
渠道体验一致化
在不同渠道的应用体验一致且连续
用户渠道层
业务创新敏捷化
基于平台、框架和能力,实现创新快速落地
事项办理一站化
地方特色业务、创新业务与总局业务全面集成 税务人通过统一登陆门户访问各个内部系统
应用层
数据应用智能化
智能业务 智能分析
智能指挥 智能风控
智能纳服 智能稽查
应用支撑平台
业务应用融合化
遵循“核心微业务”理念,实现业务短链化 支持“信用 + 风险”体系,对接总局建设理念
统一智能数据平台
数据驱动能力精益化
建设智能数据平台基座 引入人工智能开发平台
完善的数据治理体系 提供可视化分析工具
数据获取效率低,数据冗余、 查询效率低
• 业务部门在进行数据分析时,获取 数据的方式比较原始,通常需要编 写脚本到数据库中查询或是通过金 三系统前台页面多次查询数据
• 缺乏数据和分析工具,不能充分释 放出基层的业务创新的潜力
运营运维体系不健全,运营挑 战大
• 数据应用、数据管控等的管理办法、 管理流程、管理规范(技术和业务 规范),有缺失
华为DWS (MPP)
IOT数据集成 ROMA –link
流式数据
方案特点
1、混搭架构: 提供MRS(Hadoop平台)+DWS(MPP), 满足离线、实时检索、交互查询、流式计算等 多种计算场景; 2、统一管理: 支数据汇聚以及存储计算组件统一管理和服务, 实现故障快速定位;所有组件全流程调度功能; 3、扩展性: 华为MRS(Hadoop平台)+DWS(MPP) 支持弹性扩展,性能弹性扩容; 4、高性能: 采用分布式架构,提供结构化数据的极致的交 互性能,满足多维关联查询实时分析需要; 5、多场景
基础架构集约化
整合现有资源
搭建私有云
基础资源层
引入公有云
外部第三方数据
数据交换归一化
外部数据获取渠道“三合一” 对外推送信息渠道唯一化
目录
1 税务大数据背景及拓展思路 2 华为税务大数据解决方案
税务整体数据架构,实现智能数据驱动业务发展
应
用 企业用户
层
中心
自然人 用户中心
智能业务 中心
智能指挥 中心
华为税务大数据解决方案
目录
1 税务大数据背景及拓展思路 2 华为税务大数据解决方案
税务大数据趋势:全量、实时、智能、精准
金税一期
1994 - 1996
业务报表
收入核算
金税二期
1998 - 2013 业务报表 收入核算
统计分析 指标预警
金税三期 &“互联网+” 2013 - 2020
决策一包(分析)& 决策二包(风险)
• 批量数据汇聚,无法满足实时数据 汇聚业务需要;
• 纳税人相关数据分散在各个模块的 不同数据表里,没有整合和关联
• 政府其他部门数据和互联网第三方 数据整合不足
• 在数据治理工具、数据治理专业服 务和数据服务能力上不足
• 缺失可视化的基础数据资产管理, 无法支撑数据血缘关系管理、业务 建模和数据可视化分析
指标模型管理 业务标签工具
数
据 源
税务内部数据
企业纳税人数据
其他相关部门数据
互联网及其他 第三方数据
建设内容
1.数据汇聚
统一税务局和其他政府部门的数据采集交换平台 提升数据接入场景能力,提供批量、实时、流式多种
数据集成方式 建立第三方数据采集通道和管理规范
2.存储计算
提供多种类型存储计算,满足批量计算、流计算、交 互式查询、实时检索等多种计算场景;
按月、季度报表分析,变为实时展示、实时分析
3 人工到智能转变
通过机器学习提升纳税人行业划分、建立防增值税专用发 票暴力虚开等算法模型。
4 粗放到精细转变
按行业、地域、业务分析,变为以纳税人为核心精确画像
税务大数据现状和挑战
数据割裂,外部数据整合不足, 智能化应用不足
缺乏统一治理,数据资产不清, 质量不高
统一数据服务管控,提供工具服务以及数据服务,实 现数据快速变现;
税务数据采集与交换架构图
汇聚存储
ຫໍສະໝຸດ Baidu
数据治理
数据分析
数据服务
应用场景
数据汇聚存储整体方案
数据 应用 数据 服务
存储 计算
在线分析 在线查询
离线任务计算
离线任务 Hive
Spark SQL
离线查询 数据分析
信息碰撞 综合查询
统一数据服务层