浅析“大数据”时代如何加强数据深度分析应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
浅析“大数据”时代如何加强数据深度分析应用
课题承担单位:宁阳县国家税务局
摘要:本文首先就“大数据”时代税收数据分析发展背景进行了简要说明,并提出了数据深度分析利用的理论与方法:完善的一体化税收数据分析工作体系与数据挖掘理论;其次从技术应用层面与管理层面剖析了做好数据深度分析利用的重点、关键点;最后结合实际情况,提出目前发展数据深度分析应用存在的问题及建议。
关键词:数据挖掘系统一体化数据深度分析工作体系工作流程业务重组管理机制技术应用
一、当前税收数据分析发展情况简析
近年来,国税部门结合税收工作中的热点、难点和焦点问题,不断拓展选题范围,积极探索开展数据处理分析,建立起了比较完善的数据处理分析工作运行机制,实现了税收数据的增值应用,为加强税源管理和辅助领导决策提供了重要依据。数据分析在税收管理工作中的作用初步显现。随着金税三期工程建设的实施,国税系统各主要业务应用系统已实现总局、省局集中运行,总局、省局拥有的数据量迅速增大,税收数据资源变得更加丰富,我省也建立了独立自主的数据综合分析利用平台,税收数据在税收管理和服务中的核心作用渐趋明显。但是在大数据时代的背景下,以业务操作为主要特征的信息化应用平台在数据管理和数据应用分析这一关键领域的功能缺陷日益突出,成为制约数据分析应用一个主要瓶颈。虽然省局综合数据分析利用平台实现了一定的数据分析功能,并且制定了一定量的预警分析指标,但在多行业数据采集、预测性分析、跨部门联网数据交互分析、互联网大数据分析、逻辑性分析、征管数据纵向深度分析、跨省数据交互分析以及数据取数口径准确性等方面还有待加强。本文结合当前税收信息化工作,就如何在“大数据”时代充分利用这些丰富的税收数据资源,实现税收数据的深度分析应用,从中发现税收征管工作中存在的问题和薄弱环节,发现税收管理规律,更好地为税收管理和辅助决策服务,进行了认真的思考和探索。
二、数据深度分析应用的理论与方法
所谓税收数据的深度分析应用,可以理解为:在系统整合和税收数据集中的基础上,遵从科学化、精细化管理要求,树立利用税收数据资源分析主导税收工作的理念,利用相关学科的原理、方法和模型,对海量涉税数据,包括税务系统内部数据及通过对政府、企业、居民、互联网等采集的外部数据,进行加工、处理,多层次、多角度分析和挖掘税收数据资源,再经过掌握数据分析技术与税源管理的复合型专业人才的深度加工,形成能够发现税收征管漏洞、辅助税收征管决策、监督政策执行、促进税收增长的有价值信息,为税收管理和决策提供重要依据,达到信息管税的目标,促进税收管理质量和效率的提高。开展数据深度分析应用工作,首先在工作方法上,要有明确、精准的数据分类,完善、科学的工作流程和规范、标准的岗则设计,这就要求建立一套完善的一体化数据深度分析应用工作体系;其次在技术理论上,要能够实现在海量“大数据”中排除无用数据、找出涉税数据规律并评估出有意义的数据规律或模式,就必须以先进的数据挖掘理论为指导,以多样化的数据挖掘技术为支撑。以下两部分将对一体化数据深度分析工作体系建设与数据挖掘在税收数据分析中的应用展开详细介绍。
(一)一体化数据深度分析应用工作体系建设
开展数据深度分析应用工作需要有三个条件:一是数据在总量上要达到一定规模,这里的数据总量不仅指征管数据总量,还包括其他相关的第三方数据总量。只有在数据总量上达到一定规模后,才有可能从大量的无序的数据中发现其中所蕴藏的规律性。二是数据分析技术要发展到一定程度,才能够实现对海量数据的深度分析挖掘,使有规律数据转变为有意义数据。三是通过科学有效的工作模式将分析得到的数据信息融入到稽查、征管、评估、计统等税收工作的方方面面,将数据的作用最大化,推动税收工作的“数字化”革命。目前,税收数据的高度集中,“互联网+”、“云数据”等信息化新模式的出现,促进了数据信息的快速积累,为税收数据的深度分析应用在数据总量上创造了条件;数据挖掘技术的完善,为税收数据的深度分析应用在技术上提供了可能;金税三期工程建设的实施以及增值税发票升级版系统的推行,使税收信息化步入了一个全新的发展阶段,为税收数据深度分析应用开辟了道路。新阶段、新形势、新任务都要求必须加强数据利用,税收数据深度分析应用是税收信息化建设发展到一定阶段的必然结果,也是
税收信息化发展的必然要求。因此,建立一套集多方数据采集、数据深度分析、数据充分利用的一体化数据深度分析工作体系势在必行。
(1)税收数据资源的分类收集
税收数据资源是税务部门在税收征管过程中,根据其所能收集到的与之有关的数据信息,包括各种消息数据,情报数据,资料数据等,经过筛选,加工,处理,存取,能够满足税务部门及纳税人需求的,可以反映经济活动及其发展变化情况的各种信息的集合。税收数据资源在信息系统中又可以被分为程序数据、税收业务数据和税收相关数据;按来源可分为税务系统内部数据和税务系统外部信息数据两大类,内部数据来源于两个方面:首先是纳税人,纳税人是产生数据的主体(例如申报数据、发票领购数据、税务登记数据等);其次是税务机关,税务机关内部不同部门根据各自职能围绕纳税人开展工作产生新的数据(例如稽查黑名单数据、风险预警数据、资源综合利用认定数据等);税务系统外部数据是政府职能部门及相关产业为纳税人办理审批和服务过程中产生的数据以及互联网数据(例如工商、国土、海关、建委、公安、银行、电力、石油等部门数据以及来源于网络的交易数据、物流信息、信息服务平台数据等)。
(2)一体化数据深度分析工作流程
一体化数据的分析工作一般流程为:数据的收集、数据的确认和存储、数据的加工分析、数据的传输使用、数据的交叉验证。结合日常的税务业务,得到一个完整的工作流,如图1所示。
图 1
(3)以流程为导向实施税收业务重组
实施税收业务重组,首先要从税收数据流运转的角度重新审视税收业务流程,运用信息管理的一般原理分析其本质,依托信息技术和数据流转规律建立适应税收数据流运转的统一规范的业务流程,可以实现全面的信息共享。结合实际工作,可以从下面三个方面进行流程优化:
一是尽量减少、合并人工的信息流环节,实现纳税人与税务人员单点接触,甚至零点接触,以尽量减少或排除人为因素的影响;另一方面整合、简并面向纳税人的咨询、受理、审批等涉税流程数据,提高数据质量。
二是重塑数据采集流程,提高数据共享度。重塑涉税信息的采集流程,实现各级、各部门和各行业涉税信息的广泛共享,充分利用现代信息技术,与统计、经贸、地税、工商、银行、技术监督、民政等相关部门建立横向、纵向联网体系;制定严格规范的采集制度,使采集标准和口径统一,实现一次采集,多环节共用,提高信息共享度。
三是科学设置税收信息流转工作流程。结合税收业务的要求,按流程、分环节设置,将税收信息流运转的主要环节科学分解到办税服务部门、税源管理部门、计算统计部门等各部门,各部门将各自信息初步加工后由数据处理部门整合形成数据分析报告。
(二)数据挖掘在税收数据分析中的应用
在1989年美国底特律召开的人工智能学术会议上,首次提出了“数据挖掘”的概念,此后,数据挖掘理论不断完善,数据挖掘技术飞速发展,目前数据挖掘的理论与技术已经相当成熟,金融、财务、通讯、