新一代税务行业大数据服务平台支撑数据管税解决方案-v1.2
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
新一代税务行业大数据服务平台支撑数据管税
解决方案
目录
1总体业务需求分析和整体架构概览 ...................................................... 错误!未定义书签。
1.1新时代的税务管理要求 (1)
1.2税务行业信息化建设现状 (4)
1。
3大数据服务平台整体架构概览 (4)
2理论指导数据治理之需求和技术分析................................................... 错误!未定义书签。
2.1数据治理综述 (5)
2.2定义业务问题,以指导方向 (6)
2。
3获得管理层支持,以获得组织和资源保障 (7)
2.4执行成熟度评估,以了解现状和确定将来所达目标 (8)
2。
5创建数据治理路线图 (8)
2.6建立数据治理组织蓝图 (9)
2.7创建数据字典/业务术语库 (9)
2.8理解业务和数据 (11)
2。
9创建元数据存储库 (11)
2。
10定义度量指标 (13)
2。
11主数据治理 (14)
2。
12治理分析 (15)
2。
13管理安全和隐私 (16)
2.14数据生命周期治理 (16)
2.15度量结果 (17)
3理论指导大数据服务平台建设之需求和技术分析 ................................. 错误!未定义书签。
3。
1数据对数据管税的价值 (17)
3.1.1数据对税务的价值分析 (17)
3.1。
2税务数据价值实现分析 (18)
3。
2数据挖掘方法论指导大数据服务平台建设 (19)
3。
3按业务主题和规则采集、加工数据以打好数据基础 (22)
3.3.1数据采集平台 (23)
3。
3.2数据加工平台 (23)
3。
4合理利用各种报表工具,实现报表展现服务 (24)
3.4.1固定报表实现分析 (25)
3.4.2临时报表实现分析 (26)
3。
4.3报表展示与可视化分析 (27)
3。
5灵活使用数据,实现多维分析和微创新能力 (28)
3。
5。
1多维分析技术设计 (28)
3.5.2标签体系设计 (29)
3.5.3微创新系统设计 (30)
3。
6对内对外更好的数据共享和交换,扩充能力 (31)
3。
6.1打破条线壁垒,实现数据共享 (31)
3。
6.2实现数据流通,打通上下级和税务与其他部门的数据联系 (32)
3。
7提供更好的开发模式,加速数据管税能力的提升 (32)
1.1 新时代的税务管理要求
新一代税务行业大数据服务平台的总体目标是实现“数据管税”。
新时代的税务管理要求是,以税收风险管理为主线,以现代信息化先进技术为依托,加强业务和技术的融合,优化资源配置和税源管理体系,优化服务,规范执法,不断提高税法遵从度和税收征收率,形成新一代税收征管新管理方式:
1)服务优化:税务管理部门的定位要从企业税务管理角色向企业税务服务角色转变,要利用现代化手段进行税务管理工作,在减少对企业日常经营的干扰情况下,保证税务管理工作
的有效进行,成为纳税人与国家连接的桥梁;
2)以风险管理为主线:结合先进技术和创新管理手段,降低和防范税收风险,做到事前重点防控潜在税收征管风险,事中降低税收征管风险,事后具备有效手段,查处偷漏税,营私
舞弊等违法行为;
3)数据实现省市县分级分类管理:将数据情报管理、税收风险分析、风险应对任务管理、大企业和跨境税源风险应对等重要管理事项集中调整到省局层面;市、县税务机关精简行政
管理职责,主要承担直接面向纳税人提供纳税服务、实施风险应对的职责;
4)强化税源专业化管理,探索“两个转变”:属地固定管户制到非固定管户制的转变,以及无差别管理到差别化管理的转变.
在新时代的税务管理要求下,不能继续采用原来传统方式解决问题,要采用新的技术来解决;国家税务总局局长王军指出:“大数据时代,谁能掌握好数据、谁能利用好数据,谁就能提高洞察力、占领制高点。
"大数据最重要的作用是提供了实现税务管理由“税管员管”向“大数据管”转变的技术基础。
过去,由于受到技术、思维等多方面等的限制,人类在采集和使用数据时为了节约
时间,增加准确性,更多采用了随机采样法,这个时代被称为“小数据时代".小数据时代的特点是:样本随机性、数据精确、因果关系论、结果群体化。
在大数据时代,数据收集、存储和分析工具
极大提升,这使得“样本=总体”的全数据模式得以实现,数据处理的总体特点变为:要全体不要
抽样,要效率不要精确,要相关不要因果.这颠覆了千百年来人类的思维惯例,对人类认知和与世
界交流的方式提出了全新的挑战.大数据时代中的税收管理也应当顺应时势变化,及时转变思维,提出创新举措。
目前,大数据技术主要应用在电子商务、金融、零售等领域,在实现“通过数据寻找到更多
合适的客户、以及给客户推荐合适的产品,实现精准营销,从而给企业带来更多的收入和利润"上已取得长足有效的成绩;
税务行业的大数据所需要达到的业务战略目标与其他行业企业(例如电子商务、金融、零售等)是有比较大的差异,对于税务来说,大数据所需要达到的目标的第一重点是“根据企业的生产
经营活动等各种数据,防止企业通过非法途径进行偷税漏税的风险管控,以及通过相应的数据,防
止税务业务人员内部腐败的内部风险管控”,通过这个目标来实现数据管税,以达到国家所需要进
行税务改革的这个战略目标.用大数据强化税收分析,对税收数据的分析应用将成为税务系统一项
常规的重要工作,数据管税需要达到以下目标:
(一)结合风险管理和大数据理念,将大数据税收征管模式与先进的管理理念相结合,利用
大数据技术和现有数据,对税务工作进行更好的风险管理:
1)结合大数据分析技术,让纳税评估更为准确:面对企业越来越复杂的经济业务,数量有限
的税务工作人员无法投入太多的精力去详细了解每一家企业的生产流程,通过对海量数据开展分析,探寻,发现、理解信息内容及信息与信息之间的关系,结合对企业的规模大小、对生产经营
活动成本、利润和税负率等指标的分析,对企业财务核算和纳税申报质量作出评判。
例如:在对纳税人、对税源的评估过程中,通过对纳税人或者税源长期的登记信息、历史交
易记录、海关进出口信息、水电缴费以及银行借贷记录等多种信息与特征测试的数据汇总,来进
行信用评级,从而使纳税评估更为准确;
例如:比对分析纳税人税收资质、应纳税(费)种的条件符合性、存在的风险疑点,跟踪分析后续动态变化,对风险疑点进行评估处理,并依法据实认定、调整或取消纳税人的税收资质、应纳税(费)种;
2)融合第三方涉税数据,提高税法遵从度和税收征收率:结合纳税人登记信息,申报信息、第三方涉税信息等数据,以大数据技术为基础,开展分析比对、风险识别、排序推送、风险应对,加强业务内控和遵从风险防范。
例如,将从工商、银行和统计等部门,以及互联网爬虫等途径获取的外部数据与纳税人申报数
据作比对分析,从而更为准确地判断税源状况,进一步通过税源监控、税收分析、纳税评估和税
务稽查等质量控制手段,达到堵塞漏洞、纠正偏差和提高税收质量的目的。
例如:在纳税人申报房产、土地明细时,利用房管、土管等部门信息进行比对,推进“以房控税”、“以地控税”、“车船税联网征收”等工作;
3)尝试业务系统变革,进一步防范涉税风险,提高税收征收率:如将纳税人申报缴税系统、收入系统、金融管理系统和财产系统等都纳入公民诚信系统,通过各个信息的比对,数据的分析,管控纳税人的资金流、信息流、货物流和生产经营信息,形成以数据质量管理为基础的风险识别、
等级排序、风险应对和绩效评价的闭环风险管理体系,进一步防范涉税风险,提高税收征收率。
4)防控廉政,防范内部违法风险:通过优化流程、节点控制和全程操作数据留痕,实现税收执法权的透明操作、规范运行,从源头上防控廉政和执法风险。
5)通过纳税人画像,辅助管理:采集、处理、评价纳税人的信用信息,建立纳税人画像,建立
纳税信用体系,据此实施分类服务、管理,辅助数据情报管理、税收风险分析、风险应对任务管理、大企业和跨境税源风险应对,同时还可以实现信用信息的共享。
例如:对信用好、无风险的纳税人不打扰,对低风险的纳税人予以提醒,对严重失信、高风险
的纳税人实施重点监管;
例如:对于异地税务机关评价的纳税高信用等级纳税人,本地税务机关予以认可,与本地高信用等级纳税人企业享同等待遇;对于有违法记录的低信用等级纳税人企业,,本地同等监管。
6)建立风险特征库,自动预警防控:通过风险特征库和风险监控规则建立,预警预防偷漏税
风险;
例如:将“一址多照"、“一照多址”的纳税人列入重点关注对象,设计风险触发规则,防范其
虚开增值税专用发票、骗取出口退税等风险。
(二):充分利用广泛的数据开展税源分析,用数据说话、用数据改进管理、用数据推动创新,不断提高运用大数据的技术和分析大数据的能力,解决工作中的新情况和新问题,提高税收工作的
针对性和有效性.
例如:实现根据相应企业所需要的税务管理和税务服务类型,来进行相应的税务业务人员任
务分配;达到简单的税务业务由办事大厅(例如实体的办事大厅、电子税务局)进行支撑,复杂
的税务管理和税务服务业务有专业的税务业务人员进行支撑,即实现由数据来给不同的税务业务
人员分配相应的、合适合理的任务。
(三)加强宏观、行业和微观税负数据分析,加强税收政策、经济和税收关系分析,进一步
发现税收与经济之间的关系,从而更好地预测税收走势,科学估算收入规模,增强组织收入工作
的预见性。
1.2 税务行业信息化建设现状
税务行业的信息化建设(金税工程)已经有近二十年的历史,因为技术发展的现实问题,同时由于税务组织机构职能、业务管理、规范、流程等的复杂性(其复杂性远远超过电子商务,甚至超
过金融领域在信贷、风险、杠杆等三大核心要素所需要组织机构职能、业务管理、规范、流程等),税务信息化系统不可避免的存在较为严重的零碎化、数据孤岛、应用烟囱等现象,特别是建立在《全国税收征管规范》基础之上的核心征管系统以及其他各种生产业务系统,存在如下图所示例
的一系列问题:
税务系统信息化建设中,最为突出和典型的问题包括以下三个方面:
1)数据杂乱:随着经济和技术的发展,出现越来越多的系统和数据。
包括新建业务系统产生
的数据、随着云计算和数据中心建设出现在税务系统中的外部交换数据、传统系统历史
积累的数据等等。
这些系统由于种种历史建设原因,存在采用的信息化建设规范不统一、
数据格式不一致、数据表达不连贯等种种问题。
这些问题导致每个业务系统在建设过程
中,不信任已有的其他系统的数据分析结果,而选择从生产库直接获取原始数据进行分析
和加工。
这导致了大量的业务系统在建设过程中“干重复活"、“走重复路"、“做重复事”。
严重影响地税工作效率。
2)系统各自为政:在江苏省地税信息化建设过程中,各业务系统由不同的承建单位进行建设,
缺乏统筹规划,系统之间的打通困难,数据缺乏交互碰撞.“烟囱式”系统仍然普遍存在。
业务人员面对多样的系统,需要从不同的业务系统中找到描述一个业务情形的不同阐述
角度的数据,以全面、客观地分析业务问题。
这极大地影响了业务人员的工作效率。
3)关联复杂:地税行业涉及数据众多,各地市具体情况又不完全相同,各地市依赖于省厅提
供标准数据和业务模型,但在处理本地业务时会加入地方性特征的数据并对模型进行修正。
这造成大量的相似但是有区别的数据,使得开发人员在进行数据开发时陷入判断相似数
据准确性的困惑中,影响数据的可运维性和二次开发.
1.3 大数据服务平台整体架构概览
在当前信息化现状的基础上,要达到数据管税的战略目标,需要建立以数据为核心,以大数
据技术为支撑的精确管理体系;基于税务组织机构职能、业务管理、规范、流程等的复杂性,我
们必须要通过进行前瞻性的研究,形成相应符合税务行业所需要的数据治理、数据分析挖掘所需
要的方法论体系,从而形成符合税务行业所需要的大数据平台,从而让税务行业沉睡的数据苏醒过来、发挥价值、产生效益。
因此,对新一代税务行业大数据服务平台,整体架构概览如下图所示:
一、”数据管税“业务应用体系(大数据应用体系)
➢税务人员工作流程和效率优化:税务改革以前是一个人管N多企业所有的事情,税务改革之初很多人不知道干什么事情,所以需要通过大数据应用来给合适的人安排合适的事情
➢发票分析:发票数据的应用分析,通过分析发票的数据信息,准确查找发票管理存在的问题风险,有针对性的制定征管应对措施,准确打击发票使用中的不法行为,切实促进发票管理的遵从,实现以票管税、信息管税的目标
➢纳税人信用评估:在税务大数据服务平台提供的数据以及在数据衍生出来的法人画像、自然人画像等能力的基础之上,评价纳税人的信用信息,得出纳税信用评价结果,据此实施分类服务和管理。
并且与地方政府及相关单位征信平台对接,实现纳税人信用信息在各部门间的共享利用
➢纳税人服务流程优化:税务改革以前是一个人管N多企业所有的事情,企业没得选;但是现在针对一个纳税人服务有很多环节,不同环节对应的是不同税务工作人员;所以我们需要根据数据来给企业在不同环节中提供合适的、专业的税务人员提供服务,从而让企业满意让国家满意
➢纳税人风险管控:通过相应的纳税人画像以及相应的其他数据,来防止企业通过非法手段进行偷税漏税等,并且可以起到警示作用
➢税务人员操作性风险管控:通过相应的数据能够抓出内部的腐败份子给国家所带来的损失和伤害,并且可以起到警示作用
➢收入和税源分析:通过相应的数据分析能力,从而让国家的税收任务更好的完成并且对企业不会产生更大的干扰。
➢其他:泛指各类没有说明的税务大数据分析应用。
二、税务大数据服务平台
税务大数据服务平台不是一个技术平台、更不是一个只具有一个技术功能点集合的平台,此平台是一个大数据应用支撑平台,即需要加速税务数据管税所需要的各个大数据应用能力的开发效率、开发质量的平台,也是一个能够沉淀出税务行业所需要的各个大数据业务应用所需要的各个能力资产以形成能力中心的平台。
1.4 数据治理综述
随着税务信息化建设的深入和大数据技术的不断进步,我们需要让沉睡在各个业务系统中数据
发挥出更多的价值、让数据说话以实现数据管税;并且我们已经深刻地认识到我们的税务数据我
们税务关键的资产之一,就类似于对于企业中的最关键资产是人力、资金、物资(工厂、设备)等一样。
将数据视为战略性税务资产,意味着我们的组织需要建立其现有数据的清单,就像建立物理
资产的清单一样。
而数据治理是以企业资产的形式对数据进行优化、保护和利用。
数据是税务最大的价值来源也可能会是最大的风险来源。
糟糕的数据治理常常意味着糟糕的
业务决策和提供给违规(内部税务工作人员的违规,外部企业逃税的违规)更大的暴露面,我们
必然需要通过良好的数据治理来提高数据质量(例如提高数据的可信度、完整度、可用度等),从而提供较好的业务决策和减少、控制违规等。
数据治理注定会是一项复杂的工作,涉及到对组织内的人员、流程、技术和策略的编排,从
一开始,数据治理就在协调不同的、孤立的且常常冲突的策略(可能导致数据异常)的过程中扮演着重要角色.
在这么多年的信息化建设中,我们发现数据质量问题主要受“业务、管理、技术”这三个方面的影响,并且主要由以下几大影响因素所决定:
➢缺乏科学、规范、完整的数据质量标准,并且在系统开发和实施过程中忽视数据质量:对于这方面的问题,我们必须建立全局数据模型(包括数据源视图和数据流视图)、统一的数据标准和数据口径,从而供各个应用开发团队在工作中遵循和参考、且让各个应用开发团队对税务信息系统有一个整体认识,以减少数据源调用错误和建立重复数据源的情况发生,影响数据的一致性。
如下图所示例:
企业数据模型到某应用级的数据模型
➢缺乏统一和全面的纳税人数据
➢数据多头重复采集、没有统一规范检验
➢缺乏系统的数据质量管理机制以及监控管理工具和手段:在这方面,除了技术原因外,很多是业务、管理方面的问题,所以我们在业务、管理方面制定相应的流程,即需要采用较为成熟的闭环的数据质量管理方法以及相应配套的数据治理软件平台,对数据的质量进行持续的监控和管理,及时地清除系统中的垃圾数据,减少隐患的产生。
综上所述,数据治理是大数据服务平台建设成功的核心基础和因素,没有好的数据治理会使我
们的大数据成为空谈.所以我们需要形成相应的数据治理参考流程来指导我们税务数据治理的建设,从而给大数据服务平台的建设打下一个成功的基石。
数据治理建议参考流程如下图所示,并且这个数据治理流程是一个闭环、不断优化的流程。
1.5 定义业务问题,以指导方向
数据治理是我们大数据服务平台建设是否成功的关键因素之一,数据治理失败的根源是缺乏与业务价值的链接,以及通常单纯的把数据治理当作是IT部门的事等因素.所以为了保障我们税务的
数据治理能够比较成功,我们必须保证:数据治理要能支持“数据管税"这个战略目标实现业务价值和解决业务问题,并需要制定以下所建议的准则:
1)数据治理必须由业务部门所需要的业务价值和效益为驱动;
2)数据治理必须由业务部门、信息科技部门、第三方厂商和应用开发商等多方参与;
3)数据治理必须获得江苏地税管理层的支持,任命首席数据治理官;首席数据治理官负责统一管理
和协调多方(业务部门、信息科技部门、第三方厂商和应用开发商等)力量进行数据治理工作,以保证支撑“数据管税"实现的各种业务能力所依赖的数据是“可信、可用、完整”等。
4)数据治理是一个工程项目,需要一个专业的业务人员、专业的技术人员组成的团队,根据所需
要解决的业务问题及从实现相应的业务价值出发,借助对业务的理解分析和对技术的理解分析,并在专业的产品支撑下,例如数据集成平台(采集、ETL等)、数据治理平台(元数据管理、主数据管理等等),才能够做好数据治理的相关工作.
5)数据治理是一个长期计划,而不是一个短期目标;我们是需要不断地投入相应地金钱、人力资
源才能够完成以及不断的演讲和优化。
1.6 获得管理层支持,以获得组织和资源保障
数据治理的最终目的是为了提升数据质量,让数据变得更加“可信、可用、完整";只有较高
质量的数据才能让数据说话,以达到税务管理和税务改革所需要“数据管税”这个目标;所以数据治理是牵涉到税务各个业务部门、信息科技部门、以及各个业务系统的应用开发商和产商的事情。
这就使得获得税务管理层的支持是一个非常关键核心的因素。
要保障数据治理工作的顺利开展,税
务管理层需要给予以下组织和资源保障:
1、成立数据治理工作组
此虚拟组织的成员需要有来自税务相关业务部门(例如征管和科技发展处、规划财务处、数据管理处、纳税服务处等)、核心业务应用系统的开发商(例如征管系统的开发商、发票管理系统的开发商、电子税务局系统的开发商等)、大数据服务平台的开发商等相关的业务人员和技术人员组成
2、获得相关方高层的支持
需要获得税务局管理层、相关业务部门的管理层、相关应用开发商和产商的高层支持;特别是税务局管理层的支持.
3、确定数据治理的负责人
设立首席数据治理官,此职务需要在税务管理层的支持下进行任命;由他来统一管理和协调多方(业务部门、信息科技部门、第三方厂商和应用开发商等)力量进行相应地数据治理,以提高支撑“数据管税”实现的各种业务能力所依赖的数据是“可信、可用、完整”等
1.7 执行成熟度评估,以了解现状和确定将来所达目标
如图是数据治理成熟度评估模型,按照如图所示的类别,对当前的税务数据治理成熟度进行评估,从而得出我们税务数据质量的当前所处状态,以及期望通过专业数据治理后需要达到的状态。
这11个数据治理类别可以分成4个相互关联的组:
1、成果:数据治理计划的预期结果。
即在数据风险管理和合规,以及价值创建方面需要达到相应的目标,并为“数据管税"所需要的数据能力提供“可信、可用、完整”的高质量数据支持
.
2、促成要素:数据治理需要合适的策略、合适的数据照管(即首席数据治理官所带领的团队所发挥的作用)、良好的组织结构(数据治理工作组)和认知(数据治理工作组对数据治理要做的事情和所能体现出的业务价值有共同的认知)。
3、核心准则:一个能达到相应业务价值的成功数据治理,必然需要实现一个满足业务要求、技术要求的数据质量管理、数据生命周期管理、数据安全和隐私等方面所需要的软件产品以及相应的经验能力。
4、支撑准则:要进行数据治理,我们必须建立一个较为合适、完整、可用的数据架构体系用来指导数据治理和相应的数据应用的设计和开发,并且需要建立相应的分类和元数据以及相应的审计数据日志和报告。
我们对上述4个相互关联的组中的11个数据治理类别,定义相应的能力成熟度模型(参考CMM),即现在的能力成熟度,通过这次的大数据服务平台的长期数据治理建设后,所需要达到的能力成熟度模型.下图是我们的一个建议:
上图阐述了当前(2016年)对税务数据治理在11个类别中所处的状态,以及经过1年(12个月/18个月)数据治理后所需要达到的状态;并且在后续不断的数据治理过程中最终达到第五级。
1.8 创建数据治理路线图
数据治理路线图的开发主要通过以下三方面来进行
1、总结数据治理成熟度评估的结果
即在执行成熟度评估,以了解现状和确定将来所达目标此章节所做的事情的产出的基础上,业务部门、信息科技部门、第三方(信息科技技术产商、应用开发商)在首席数据治理官的统筹安排下进行相应的评估,即对当前状态的评估以及将来想要达到状态的评估,以及当前状态与将来想要达到状态之间的偏差等;通过评估来决定后续的工作。
2、列出填补评估中强调的差距所需关键人员、流程和技术计划
这个环节非常关键,为了说明这个,我们通过下面的例子说明。
3 基于关键计划的优先级创建路线图 。