大数据审计应用实践初探

随着大数据的产生和发展,大数据已成为一种非常重要的战略资源,并在提升产业竞争力、国情分析和社会管理等方面发挥着愈发重要的作用。同样,审计机关在执行审计监督的过程中,运用大数据审计在加快构建集中统一、全面覆盖、权威高效的审计监督体系起到了不可替代的作用。目前,大数据审计工作模式及应用已贯穿审计全过程,提升了审计跨领域、跨层级、跨系统、多思维的数据分析水平,推进了审计全覆盖。加大财务数据与业务数据、单位数据与行业数据以及跨行业、跨领域数据的综合比对和关联分析,可极大提升审计效率,使“大海捞针”变为“重点撒网”,使审计的深度、广度和精度得以实现新的拓展,推动审计工作迈向大数据审计时代。本文从大数据审计内涵及特征入手,重点通过关联分析,对大数据审计的应用做初步探讨。

一、大数据审计内涵及特征

(一)大数据审计的概念

(二)大数据审计的特征

2.技术特征。“审计全覆盖”的要求使得大数据审计的范围大大扩充,审计对象更加复杂多样。与此同时,数据跨行业、跨部门、跨领域,信息系统复杂多样,使得数据采集、预处理、分析挖掘和可视化技术应用更加复杂化、多样化、精益化和动态化。

二、大数据审计的技术方法

(一)关联分析

(二)结构分析

(三)趋势分析

(四)数据挖掘

数据挖掘是指从大量的数据中自动搜索隐藏于其中的信息的技术。审计数据挖掘是指审计人员使用离群点挖掘、孤立点检测、异常点检测、聚类分析和关联规则等方式确定审计问题的一种方法。

三、大数据审计的步骤

(一)数据采集

审计数据采集不仅会影响到对被审计单位的审计结论,还会影响审计项目资源的投入产出,因此审计数据采集是审计项目开展的重要环节。审计数据采集应满足以下原则:一是应能实现审计实施方案的审计目标,二是要在对被审计单位业务流程、信息系统充分了解基础上进行数据采集,三是不仅要采集被审计单位的内部数据,还要选择外部关联数据。在数据采集方式上可以采取联网数据共享与采集、定点采集和定期报送方式实现。

(二)数据储存

由于大数据的容量大、类型多、范围广等特点,造成审计机关采集数据储存方式难。要实现大数据的有效储存,一是做好大数据的顶层设计和统筹规划,二是加快实施“金审三期”工程,完成“审计云”建设,为下一步数据储存提供明确的方向和思路。

(三)数据清洗

数据清洗主要内容是检查、分析数据的质量,修正数据。审计数据清洗的任务是过滤不完整、错误和重复的数据,只有通过清洗与过滤得到干净完备的数据,才能通过分析与挖掘得到可用于支撑审计问题和决策的数据基础。

(四)数据分析

2.分析审计数据模型。主要是指为实现分析模型,需要哪些具体的审计数据,根据已建立的审计分析模型,确定待用的基础表,并且要对具体的数据进行研究,确定各字段、代码和业务数据具体内容代表的含义等。分析的过程中,需要综合数据词典和数据库说明等技术文档对数据的含义,对业务流程的理解等方面的认知情况,对数据产生全面、深入的认识。

3.建立分析性“中间表”。利用被审计单位数据库中的数据来实现审计分析,要对清理、转换后的基础数据按审计目的进行“再加工”,从基础数据中选择出所需要的数据,生成能完成审计分析的数据表。为了实现最终的分析,在数据分析的过程中往往需要构建多个数据表,这就是分析性“中间表”。建立审计分析性“中间表”一般是通过对选定的基本表进行“投影”“联接”等操作来实现。

4.完成审计模型分析。按照分析模型,采用一定的方式、方法,对数据进行具体的分析,得出结果,完成分析。审计的数据分析可分为三个层次:第一个层次为数据分析人员通过sql、oracle等语言来交互式地描述查询要求,对数据库中的记录进行访问和查询,实现查询型分析;第二个层次为数据分析人员先提出自己的假设,然后利用各种工具和方法进行反复递归的检索查询发现问题,实现验证型分析;第三个层次为数据分析人员通过趋势分析和行为分析,挖掘出大数据中可能被忽略的信息,为审计人员作出前瞻性的决策提供帮助,实现挖掘型分析。

(五)疑点核实

目前数据分析结果不能直接作为审计结论,必须要通过查证延伸,才能获取被审计单位的认可。也就是说,数据分析结果只是缩小审计范围,提取出“嫌疑数据”,提高延伸审计的质量,得出审计结论还是要经过审计查证这一过程。

四、大数据实践与探索--关联分析的应用

(一)纵向关联分析应用

1.资金维度数据分析。某省财政部门使用的是财政预算管理信息系统。其中,指标管理系统包含FROMCTRLID和TOCTRLID两个字段,将指标管理系统里的指标流向串联起来;该系统中包含映射表,控制可执行指标、国库集中支付和总预算会计账务系统的对应关系,跟踪资金的最终流向,确定最终收款方;该系统可以将指标、用款计划、支付申请、支付凭证、总预算会计凭证等关联起来,实现资金流向的逐层分析。如可按照项目资金流,先从指标管理系统查询项目资金下达中涉及单位及执行情况,再通过国库集中支付系统查询该项目对应资金的最终收款方,对资金流进行追踪,筛选出同一企业享受多种不同财政补助、相似项目多头申报财政补助、连续多年财政直接支付给相同个人等疑点线索,看是否存在资金沉淀、资金滞留财政及部门当年未实际支出等问题。

2.业务维度数据分析。医院管理信息系统(HIS)主要包括药库、药房、门诊、住院四个管理子系统的电子数据,存储的每一条记录都有明确含义,存在紧密的业务对应关系,因此可利用其业务关系建立审计分析模型,发现问题线索。如在医院财政财务收支审计中,审计人员可通过病人的住院天数计算出实际应按天收取的床位费、护理费、暖气费等项目,再以病人ID号为关键字进行关联,计算应收与实收的医疗费用差额,看医院是否存在多收病人医疗费的现象。

(二)横向关联分析应用

横向关联分析是指通过使用关联数据的关键字段对来自同一部门不同业务系统之间或者不同部门业务系统之间数据关联比对,实现不同数据库的整合展示,发现审计疑点线索。其中关联字段比较常用的有身份证号码、统一社会信用代码、工商登记号等。

1.同一部门不同账务系统数据分析。审计人员可借助外部数据发现关联事项,再顺藤摸瓜进行关联审计,揭示一些现象后面掩盖的真相。如通过比对被审计单位的财务账和工会账等,可发现部分房租收入列入单位工会而未做单位财务收入;部分资金,如接受捐赠、变卖资产等,长期体外循环,单位不列收列支的情况等,诸如这类违纪违法活动,单从单位财务账很难发现端倪。

2.不同部门业务系统间数据分析。不同部门间数据关联比对往往以一个数据为主,其他业务数据起到佐证作用,称为“1+N”数据模式,通常可以包含财务数据和业务数据,也可以包含多个业务数据和行业数据,例如在扶贫资金审计中,因为扶贫资金发放面广、链长、点多、量小,要做到审计监督全覆盖必须创新审计方式方法,强力推进大数据关联分析。其中各类资金发放都有相应的政策法规规定,一些还有比较严格的条件限制,而这些前提条件往往可通过其他部门业务数据间接佐证。利用多部门数据间的关联关系,以贫困人口建档立卡、危房改造、低保户信息为主,身份证号作为关键关联字段,分别与财政供养人员、工商登记、个人所得税、房产、车辆、证券、医保、死亡人员信息等数据关联比对,可发现扶贫对象、危旧房改造对象、低保户认定不精准和扶贫资金安全方面问题线索,大大提升了精准审计力度和工作效率。

3.外部数据关联分析。部分业务数据作为外部数据被广泛应用于各类审计项目中,如工商登记和税务信息等。例如通过将财政供养人员与工商登记信息比对分析,可发现公职人员经商办企业的问题;通过将企业领导干部与个人所得税信息进行比对分析,发现领导干部兼职取酬的问题。

THE END
1.4个步骤,构建一个有指导的数据挖掘模型腾讯云开发者社区这构造有指导的数据挖掘模型的过程中,首先要定义模型的结构和目标。二、增加响应建模。三、考虑模型的稳定性。四、通过预测模型、剖析模型来讨论模型的稳定性。下面我们将从具体的步骤谈起,如何构造一个有指导的数据挖掘模型。 有指导数据挖掘方法: 把业务问题转换为数据挖掘问题 https://cloud.tencent.com/developer/article/1041871
2.数据挖掘一般有哪些步骤?创新互联数据挖掘一般有哪些步骤?数据挖掘基本步骤,数据挖掘过程定义问题、建立数据挖掘库、分析数据、准备数据、建立模型、评价模型和实施。挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,作出正确的决策。下面跟小编一起来看看吧。 网站建设公司,为您提供网站建设,网站制作,网页设计及定制网站建设服务,专注于企业网站建设,高http://chengdu.cdxwcx.cn/article/ejgip.html
3.空间数据挖掘认识及其思考AET具体来说,空间数据挖掘就是在海量空间数据集中,结合确定集、模糊集、仿生学等理论,利用人工智能、模式识别等科学技术,提取出令人相信的、潜在有用的知识,发现空间数据集背后隐藏的规律、联系,为空间决策提供理论技术上的依据[1]。 1 空间数据挖掘的一般步骤http://www.chinaaet.com/article/3000015273
4.用友分析云一般步骤7篇用友分析云一般步骤7篇 很高兴能够为您带来用友分析云的使用手册。用友分析云是一款强大的数据分析工具,它可以帮助您深入挖掘数据,发现商机,实现精准决策。无论您是数据分析新手,还是经验丰富的分析师,用友分析云都能满足您的需求。接 创建时间 2024-02-26 17:38:36https://hsy.chanjet.com/wenku/wk262e523fe313.html
5.数据分析与挖掘11篇(全文)Web Mining(Web挖掘)是由Oren Etzioni在1996年首先提出的,一般地对Web数据挖掘做如下定义:从大量Web文档结构和使用的集合C中发现隐含的模式p。如果将C看作输入,p看作输出,那么挖掘的过程就是从输入到输出的一个映射:ξ:C→p。 3. Web数据挖掘的基本步骤 https://www.99xueshu.com/w/ikeyp687ycyz.html
6.数据挖掘的步骤包括以下步骤:()刷刷题APP(shuashuati.com)是专业的大学生刷题搜题拍题答疑工具,刷刷题提供数据挖掘的步骤包括以下步骤:()A.数据抽样B.数据整理C.模型构建D.模型评价的答案解析,刷刷题为用户提供专业的考试题库练习。一分钟将考试题Word文档/Excel文档/PDF文档转化为在线题库,制作自https://www.shuashuati.com/ti/7c02c30b35d44a878095e40d6ded48a0.html?fm=bd57bb8d50e5790641c9fb65691073399c
7.系统集成项目管理速记口诀1. 数据(签)迁移 2. 数据(合)合并 3. 数据(同)同步 4. 数据交换(换) 5. 数据(窗)仓库 6. 数据(帘)联邦 7.2商业智能的实现有三个层次: 口诀:挖多宝 1. 数据(挖)挖掘 2. (多)多维数据分析 3. 数据(宝)报表 7.3实施商业智能的步骤: https://developer.aliyun.com/article/1204984
8.数据挖掘技术在客户关系管理中如何应用四、客户关系管理应用数据挖掘的步骤 1.需求分析 只有确定需求,才有分析和预测的目标,然后才能提取数据、选择方法,因此,需求分析是数据挖掘的基础条件。数据挖掘的实施过程也是围绕着这个目标进行的。在确定用户的需求后,应该明确所要解决的问题属于哪种应用类型,是属于关联分析、分类、聚类及预测,还是其他应用。应对现有https://www.wenshubang.com/xingzhengguanlibiyelunwen/151599.html
9.数据挖掘的过程张杰整理数据挖掘是指一个完整的过程,该过程从大型数据库中挖掘先前未知的、有效的,可实用的信息,并使用这些信息做出决策或丰富知识。下图描述了数据挖掘的主要步骤和过程。 数据挖掘过程中各步骤的大体内容如下: 第一步:确定挖掘目的。认清数据挖掘的目的是数据挖掘的重要一步。挖掘的最后结果是不可预测的,但要探索的问题应https://maimai.cn/article/detail?fid=1405334297&efid=7lwV824VMzvaUfEhWMvd3A
10.如何用SPSS统计数据?(spss数据分析一般步骤)如何用SPSS统计数据? ( spss数据分析一般步骤 ) SPSS采用类似EXCEL表格的方式输入与管理数据,数据接口较为通用,能方便的从其他数据库中读入数据。其统计过程包括了常用的、较为成熟的统计过程,完全可以满足非统计专业人士的工作需要。输出结果十分美观,存储时则是专用的SPOhttp://www.cnjit.net/spss/61720.html
11.数据分析的步骤一般包括()数据分析的步骤一般包括() A、数据预处理B、可视化呈现C、数据建模D、数据挖掘E、数据采集正确答案:数据预处理|可视化呈现|数据建模|数据挖掘|数据采集 点击查看答案进入小程序搜题你可能喜欢x、y坐标都是对数坐标系应该输入 点击查看答案进入小程序搜题https://m.ppkao.com/wangke/daan/ac3af600c48e47adafb07ffd552ec912
12.数据挖掘五步法数据挖掘的步骤有哪些? 所谓数据挖掘就是从海量的数据中,找到隐藏在数据里有价值的信息。因为这个数据是隐式的,因此想要挖掘出来并不简单。那么,如何进行数据挖掘呢?数据挖掘的步骤有哪些呢?一般来讲,数据挖掘需要经历数据收集、数据可视化、数据预处理、准备模型输入以及训练模型五大步骤,下面让我们来详细分析一下吧!https://blog.csdn.net/weixin_51689029/article/details/128333250
13.数据挖掘的基本步骤是什么?数据挖掘的基本步骤包括: 理解业务目标:首先要明确数据挖掘的目的是什么,是为了预测销售额、识别欺诈行为还是其他目标。只有明确了业务目标,才能有针对性地进行数据挖掘分析。 数据理解:收集相关数据,理解数据的含义、格式、质量等特征。这一步通常包括数据收集、数据描述性统计、数据可视化等方法,以便更好地理解数据。 https://www.mbalib.com/ask/question-1ff33c04b2a8f83d1aff9875a50d017f.html
14.数据挖掘的六个步骤有哪些帆软数字化转型知识库数据挖掘的六个步骤分别是:问题定义、数据收集与准备、数据清洗、数据转换与特征选择、模型建立与评估、结果解释与部署。其中问题定义是数据挖掘过程的首要步骤,直接影响整个项目的成功与否。问题定义涉及明确业务目标、研究目标和所需的数据类型。只有在问题定义清晰的情况下,后续的每一步骤才能有的放矢,确保数据挖掘的结https://www.fanruan.com/blog/article/594251/
15.数据挖掘的步骤包括什么数据挖掘是一个通过特定算法对大量数据进行处理和分析,以发现数据中的模式、趋势或关联性的过程。下面详细介绍数据挖掘的步骤包括什么? 1、数据收集 首先,需要收集与待挖掘主题相关的数据。可能涉及从各种来源(如数据库、文件、网络等)获取数据,并将其清洗、整合到一个统一的格式中。 https://www.pxwy.cn/news-id-81213.html
16.北京大学R语言教程(李东风)第41章:统计学习介绍也有数据挖掘(data mining),机器学习(machine learning)等称呼。 主要目的是用一些计算机算法从大量数据中发现知识。 方兴未艾的数据科学就以统计学习为重要支柱。 方法分为有监督(supervised)学习与无监督(unsupervised)学习。 无监督学习方法如聚类问题、主成分分析、异常点识别、购物篮问题等。 https://www.9crx.com/79366.html
17.数据挖掘的步骤(1)硬声是电子发烧友旗下广受电子工程师喜爱的短视频平台,推荐 数据挖掘的步骤(1) 视频给您,在硬声你可以学习知识技能、随时展示自己的作品和产品、分享自己的经验或方案、与同行畅快交流,无论你是学生、工程师、原厂、方案商、代理商、终端商上硬声APP就够了!https://www.elecfans.com/v/438296
18.什么是数据挖掘?为什么它如此重要?数据挖掘的步骤 数据挖掘的方法取决于所问问题的类型以及提供分析原材料的数据集或数据库的内容和组织。数据挖掘涉及的步骤包括: 理解问题 企业的决策者需要对他们应该从事的领域有一个总体的了解。他们应该知道需要探索的内部和外部数据类型,并对业务和所涉及的不同功能领域有深入的了解。 https://ai.qianjia.com/html/2023-03/27_400072.html