1、浅析“大数据”时代如何加强数据深度分析应用课题承担单位:宁阳县国家税务局摘要:本文首先就“大数据”时代税收数据分析发展背景进行了简要说明,并提出了数据深度分析利用的理论与方法:完善的一体化税收数据分析工作体系与数据挖掘理论;其次从技术应用层面与管理层面剖析了做好数据深度分析利用的重点、关键点;最后结合实际情况,提出目前发展数据深度分析应用存在的问题及建议。关键词:数据挖掘系统一体化数据深度分析工作体系工作流程业务重组管理机制技术应用一、当前税收数据分析发展情况简析近年来,国税部门结合税收工作中的热点、难点和焦点问题,不断拓展选题范围,积极探索开展数据处理分析,建立起了比较完善的数据处理分析工作
2、运行机制,实现了税收数据的增值应用,为加强税源管理和辅助领导决策提供了重要依据。数据分析在税收管理工作中的作用初步显现。随着金税三期工程建设的实施,国税系统各主要业务应用系统已实现总局、省局集中运行,总局、省局拥有的数据量迅速增大,税收数据资源变得更加丰富,我省也建立了独立自主的数据综合分析利用平台,税收数据在税收管理和服务中的核心作用渐趋明显。但是在大数据时代的背景下,以业务操作为主要特征的信息化应用平台在数据管理和数据应用分析这一关键领域的功能缺陷日益突出,成为制约数据分析应用一个主要瓶颈。虽然省局综合数据分析利用平台实现了一定的数据分析功能,并且制定了一定量的预警分析指标,但在多行业数据
4、据,包括税务系统内部数据及通过对政府、企业、居民、互联网等采集的外部数据,进行加工、处理,多层次、多角度分析和挖掘税收数据资源,再经过掌握数据分析技术与税源管理的复合型专业人才的深度加工,形成能够发现税收征管漏洞、辅助税收征管决策、监督政策执行、促进税收增长的有价值信息,为税收管理和决策提供重要依据,达到信息管税的目标,促进税收管理质量和效率的提高。开展数据深度分析应用工作,首先在工作方法上,要有明确、精准的数据分类,完善、科学的工作流程和规范、标准的岗则设计,这就要求建立一套完善的一体化数据深度分析应用工作体系;其次在技术理论上,要能够实现在海量“大数据”中排除无用数据、找出涉税数据规律并评
6、、征管、评估、计统等税收工作的方方面面,将数据的作用最大化,推动税收工作的“数字化”革命。目前,税收数据的高度集中,“互联网+”、“云数据”等信息化新模式的出现,促进了数据信息的快速积累,为税收数据的深度分析应用在数据总量上创造了条件;数据挖掘技术的完善,为税收数据的深度分析应用在技术上提供了可能;金税三期工程建设的实施以及增值税发票升级版系统的推行,使税收信息化步入了一个全新的发展阶段,为税收数据深度分析应用开辟了道路。新阶段、新形势、新任务都要求必须加强数据利用,税收数据深度分析应用是税收信息化建设发展到一定阶段的必然结果,也是税收信息化发展的必然要求。因此,建立一套集多方数据采集、数据深
9、量评曲报告图1(3)以流程为导向实施税收业务重组实施税收业务重组,首先要从税收数据流运转的角度重新审视税收业务流程,运用信息管理的一般原理分析其本质,依托信息技术和数据流转规律建立适应税收数据流运转的统一规范的业务流程,可以实现全面的信息共享。结合实际工作,可以从下面三个方面进行流程优化:一是尽量减少、合并人工的信息流环节,实现纳税人与税务人员单点接触,甚至零点接触,以尽量减少或排除人为因素的影响;另一方面整合、简并面向纳税人的咨询、受理、审批等涉税流程数据,提高数据质量。二是重塑数据采集流程,提高数据共享度。重塑涉税信息的采集流程,实现各级、各部门和各行业涉税信息的广泛共享,充分利用现代信息
12、据转换为易于进行数据挖掘的存储形式;数据掘:利用智能方法挖掘数据规律或模式;模式评估:根据一定的评估标准,从挖掘结果中筛选出有意义和价值的规律或模式;知识表示:利用可视化和知识表达技术,向用户展示挖掘成果。综合考虑我国税收信息化的建设情况以及近年来在税收信息化方面的研究成果,将数据挖掘技术全面地应用数据深度分析应用工作中,已经具备可行性。随着金税三期工程的进一步开展,税务决策支持子系统不断的完善,三方数据交互机制的建立,“互联网+”模式的进一步发展,数据挖掘技术必将使税收数据分析工作迈上新的台阶。(1)数据挖掘系统开展数据挖掘工作,首先要建立完善的、符合税收业务工作需求的数据挖掘系统。数据挖掘
14、能。二是在数据挖掘的方法方面,数据挖掘系统应具备提供描述知识、对比概念描述知识、分类知识、关联知识、趋势与演化分析知识等多种或集成的数据挖掘结果。三是在数据挖掘技术方面,应具备完全自主交互式、基于查询驱动、基于数据库与数据仓库技术、基于机器学习、统计等数据挖掘技术的整合。(2)数据挖掘算法数据挖掘算法可以将有用信息分类汇总、初步加工,让信息自动生成初步成型的逻辑关系,也是进行有效的数据分析必不可少的步骤。数据挖掘算法灵活多变,类型多种多样,下面列举几种比较常用的数据挖掘算法:统计学算法:在数据挖掘中常常会涉及一定的统计过程,通过这种过程可以从抽样分析中提取到未知的数学模型,如数据抽样和建模、判
16、的环节,而是一个互动循环的过程,是一个复杂的系统。首先通过对业务的理解,明确业务需求,即确定税收分析的目的,从而提出问题;结合问题明确分析主题,围绕主题确定需要的变量和抽样方案,根据抽样方案从集中后的数据库平台中提取数据;按照实际需要对实施方案作进一步的调整,然后构建分析模型,通过模型计算得到分析结果,将其进一步转换成可行的决策建议并付诸实施,评价实际工作中取得的成效,在此基础上提出改进建议,不断完善,得到最佳的决策方案。税收分析流程可以用下图描述。图4(2)注重数据挖掘流程标准化现行税收分析体系已经很难满足信息使用者对税务信息的一般使用要求。信息使用者往往需要自己完成对税收信息的再次加工和深
17、度挖掘。信息使用者相互之间由于资源不能共享,进行了大量重复的分析工作,造成了资源的浪费。因此从社会经济的角度出发,税收信息化的建设应该要考虑到使用者对于税务信息的需求,在税收分析模块中引入适当的数据挖掘流程。首先要对信息使用者进行深度调研,充分了解使用者的信息需求,明确税收分析的目的。根据税收分析的目的,更新税收分析体系构架,完善税收分析工作流程。(3)优化完善数据综合分析利用平台结合分析应用需求,采用数据仓库技术,开发囊括政府部门、银行、互联网等多渠道的税收信息资源接口,建立计统、税收预测、重点税源、税源调查、综合征管等税收信息资源分析集成平台,对各级税务机关和人员的业务处理、纳税人的主要涉
18、税信息进行全面分析和监控,为决策提供辅助支持。研究业务系统查询功能与专用的查询分析工具整合问题,不断优化数据应用技术体系。利用数据挖掘等技术,从集中后的统一的数据库中针对性的提取大量税收信息资源,从不同角度深层次、多维度的分析各项业务指标。其次,要开发常态税收信息资源分析模块,完善分析指标和评价体系:由业务部门提出需求,建立完善税收信息资源分析利用指标和评价体系,为基层提供指标参考标准,拓展税收信息资源分析模型,提高深度挖掘和综合分析税收信息资源的能力。开发常态税收信息资源分析模块、数据二次分析模块,实现对已分析数据的循环利用。完善业务查询统计分析功能,将相对固定成型的查询需求转化为一个分析查
19、询功能,纳入综合数据分析利用平台中管理,从而不断提高税收业务信息资源查询需求的响应效率,进一步规范分析行为,统一分析标准,提高分析效率,深化分析应用效果。(4)建立高素质数据分析人才团队无论什么工作,其有效开展的关键因素都在于人。税收信息资源深度分析应用需要使用先进的分析技术,比如数据仓库、数据挖掘技术等,这无疑给税收分析人员素质提出了更高的要求,不仅要掌握税务业务和计算机知识,还要了解数理统计,经济,管理等知识,因此为了保证税收信息资源分析应用的深入开展,必须提高人员素质,培养一支高素质的人才队伍。一方面加强对税收信息资源分析专业人员的培养,多给予税收数据分析应用工作实践及学习深造的机会,采
20、取多种形式开展培训,有针对性地对分析人员进行专业培训,使其熟练掌握税收分析应用必备的基本理论、技能和方法,提高综合素质和工作水平。另一方面建立税收分析人才库,选拔专业型、复合型人才,夯实数据处理工作的人才基础。通过内部培训和外部招聘培养一支高素质的人才队伍,为高质量地做好分析预测工作储备人才资源,他们不仅懂税收业务、计算机技术和数学分析技术,而且要有事业心和责任感,具备一定文字功底。(二)管理机制层面税收数据分析应用是一项复杂的系统性的工作,具有全局性、技术性、综合性,需要各级管理、业务和技术部门通力配合,上下一心,形成合力。为保证其高效运行,税务系统必须建立科学规范的税收信息资源深度分析应用
21、管理机制:首先要在税务系统内统一思想,明确税收分析应用的目标,强化税务管理人员的思想意识;其次,建立完善的基于税收分析应用业务流程的运行机制,健全分析应用考核评价体系。(1)强化思想意识,明确分析应用目标虽然税务系统已经开始重视税收信息资源深度分析应用,但是在整个税务系统内还存在着认识不足,认识不统一等思想问题,影响了整个税收分析应用的效率和质量,因此我们必须明确分析应用的目标,强化各税务管理人员的思想意识。以税收信息资源运用为重点,以税收信息资源质量监控为基础,以管理需求为导向,以综合平台为依托,以热点问题分析为突破,努力做到基础信息资源真实完整、信息资源数据分析模型科学合理、问题筛选准确及
22、时、分析结果深入全面、应用渠道通畅高效,用税收信息资源描述现状、预测趋势,实现税源管理的科学化与精细化,为决策服务,为管理服务,为基层服务,为公众服务。本着“循序渐进”的原则,相应制定近期短期目标和长期目标。短期目标:提出数据分析运用的业务需求和发展框架,构建"指标体系科学、数据标准规范、业务完整覆盖"的数据分析运用模型;完善"功能齐全、界面优化、操作简便"的数据分析利用平台,做到数据一次采集、多环节使用,不断提高税收管理和决策水平,减轻基层单位统计和上报报表数据的工作负担。提升对宏观税负、行业税负等指标的全面分析,继续完善相对统一的以纳税人税负预警指标
23、、税种申报纳税收入与财务报表收入比对预警指标、分地区GD际观税负预警指标、分行业宏观税负预警指标为主体框架的预警机制和纳税评估模型,强化评价征纳行为,预测税收变化趋势。长期目标:进一步对系统中积累的海量数据,运用先进的技术手段和数学模型,开展深度挖掘和增值运用,积极分析税收政策对各时期国民经济发展和产业布局的影响,不断把握税收与经济变化规律。不断挖掘税收潜力、实现征管流程再造,并进而为深化经济体制改革、优化产业布局、深化税制改革,提供较详实、准确、客观的数据分析运用报告。(2)完善绩效考核评价体系,规范税收分析工作流程按照税收信息流转环节,将各环节的工作过程和工作效果列入考核内容,比如将原始信
24、息采集录入准确率等、税收分析成果转化与应用水平、纳税评估与稽查选案效果等列入考核内容,从工作量化、工作质量、工作能力三个方面进行考核,同时将考核制度与现行征管制度衔接,如征管质量考核办法、风险管理制度、重点企业管理办法、纳税评估办法等数量化、精细化,将责任细化,并落实到基层单位和具体管理人员,进一步完善竞争激励机制。其次,对税收分析工作进行定期检查,对分析工作开展情况实行奖优罚劣;同时定期开展税收分析成果评审,对优秀的税收分析报告,比如反映问题深入、指导实践效果突出等,予以表彰、奖励,激发税收分析人员的积极性和创造性。四、发展税收数据深度分析应用存在的问题及建议(一)存在的问题近年来,各地通过
26、税人的生产经营状况、商品数量、单价、库存量等动态信息,与系统外部的部门间的信息资源交换和共享度差,与其他政府部门、银行部门、能源部门等部门的数据联网交互机制尚未建立,在互联网数据的获取方面仍存在技术短板。四是数据质量问题。从系统外部看,由于存在着纳税人纳税意识不强,纳税积极性、主动性不高等原因,一定程度地存在纳税人故意瞒报涉税信息、做假账等现象,造成纳税申报资料不实,不能正确反映纳税人的生产经营及财务状况,致使税务机关采集的纳税人涉税信息存在失真问题。从系统内部看,由于计算机操作人员人为失误导致的数据录入错误、录入信息不全等原因,导致系统中存在错误数据、垃圾数据以及数据漏洞。(二)几点建议(1)提高思想认识开展税收数据深度分析应用工作是数据大集中形势下税收信息化发展的必然要求,是提高税收工作竞争力和管理与服务水平的重要措施。谁抓住了这个机遇,谁就掌握了税收工作的主动权。因此,应统一思想,提高对税收数据深度分析应