大数据技术在医保审计中的应用初探

随着信息化时代的到来,审计机关的审计对象——被审计单位信息化程度不断提高,其财务数据尤其是业务数据日益庞大,不断呈几何倍数增长,审计人员逐步面临着处理海量大数据的难题,传统的审计技术已远远不能满足信息大爆炸下审计形势的需要,审计机关应主动了解和掌握大数据审计分析技术,充分认识提高计算机审计水平是拓展审计思路、改进审计手段、创新审计方式和方法的关键,是审计转型具体体现的理念,才能适应和满足大数据环境对审计工作提出的新变化、新要求、新形势。本文首次探索在审计署医保同步审计中采用大数据审计思路,开发利用多种大数据审计技术,取得了不菲的成效。

一、项目背景

为深化医疗保险制度改革、促进医疗保险基金加强管理、更好地保障和改善民生。2016年8月9日,根据审计署统一部署,浙江省审计厅组织全省各级审计机关开展了对全省11个地市、32个县域的医疗保险基金审计。笔者有幸参加了本次审计,亲身体验了大数据的各种新型技术在审计实践中的应用。本次医保审计充分运用大数据的多种新技术、新方法和新工具,推陈出新,切实发挥了大数据审计在提高审计质量和效率、提升审计价值方面的作用。如采用了数据挖掘技术中信息熵理论、孤立点分析、多维数据分析,以及企查查app工具、传统的分析性复核方法体系、信息系统审计等分析方式,汇集各种途径的审计思路103个,产生疑点50多万条,经核实有疑点思路46个,发现民营医院利用癌症病人、五保户或其他参保人员身份或虚假销售骗取套取医保基金,以及参保人员异地重复参保虚假报销、死亡人员报销医保费用、多报参保人数套取省级补助资金、职业药师异地挂证、重复参保等7个大类14个小类的问题,涉及金额达3397.89万,移送案件10余起。

二、创新方法,多角度、多维度、多手段拓展审计思路

(一)数据挖掘分析技术拓展审计方法

1、回归分析——信息熵理论在大数据分析中首次发挥作用

2.孤立点分析拓展大数据审计新手段

同一个县市区的发票号码由于数量不多,可能并不具备进行孤立点分析的条件,而这种通过全省汇总进行孤立点分析的方式,能够发现以往难以发现的问题。图中可见大部分发票号码都成直线聚集在图形上方,只有2个发票号码排列在图形底部,在明确这2个数据非人工输入错误后,将这样的孤立点分布作为审计延伸的重点,能够达到事半功倍的效果。

3.多维数据关联分析大展拳脚

(二)大数据审计会同企查查软件锁定重点核查单位

由于传统的SQL语言是一种图灵机不完备的查询语言,其循环和递归受限,无法对不同机构和人员之间的关联关系链进行完整的审查,因而在审查不同数据的关系方面受限制。而本次审计首次利用企查查手机app工具,可以查找不同定点医疗机构之间的关联关系,锁定重点延伸核查单位。例如在对某种药品排名靠前的几家民营医院进行分析时,审计人员利用企查查app软件,发现医保费用报销排名靠前的其中2家民营医院隶属于同一批投资人,并将这2家民营医院作为重点延伸对象,同时进驻并进行审查,发现这2家民营医院存在相同的空刷卡骗取医保基金等违法违规问题,目前案件正在审理当中。

(三)传统的分析性复核方法体系精准定位审计疑点

(四)信息系统审计提供大数据审计新思路

三、精准发力,大数据分析取得丰硕成果

(一)民营医院空刷卡大肆骗取医保基金

通过比对民营医院与公立医院药品报销价格和数量差异,发现部分民营医院报销的抗癌药物价格畸高,比公立医院高出一倍以上,而此类药物在公立医院报销的数量很少,延伸审计发现部分民营医院通过返利和回扣的形式吸引医保参保人员虚报高价抗癌药物,骗取医保基金,谋取高额利润。此外还发现部分民营非营利医院利用五保、低保人员身份,通过减免部分费用、派车接送、免费吃住等方式吸引五保、低保人员住院并设立小金库,套取、骗取医保基金等问题。

(二)医疗机构虚假销售药品、虚假进货骗取医保基金

审计人员从医保药店结算单中筛选出药店销售医保药品的报销数据,从药店电子销售系统筛选出同一时期内医保药品的销售数据,并与进行数据比对,发现部分药店的药品实际销量与其上传到社保部门的数量不符。经过延伸核实,进而证实部分药店涉嫌伪造供应商销售清单虚假进货、串换药品、大量刷卡虚假销售骗取医保基金的问题。

(三)使用虚假异地就医结算票据骗取医保资金

审计人员发现由于医保数据未实现全省联网和数据共享,各地医保部门在进行跨地区医保报销手工结算时存在较大风险,因此将跨地区异地住院的真实性作为大数据分析的重点之一。通过筛选出异地重复参保且在异地有住院信息的医保人员,并将这部分人员医保报销中的住院、出院信息、治疗费用、医保支付数据等与医院的HIS系统中的住院信息、支付数据进行对比,发现一批信息不一致的住院信息或重复报销同一笔“真”、“假”住院费用等,进而核实部分医保病人使用虚假的住院收费收据报销,骗取医保基金的问题。

(四)使用已死亡人员医保卡骗取医保资金

由于民政部门与医保部门的数据没有实现实时共享或数据交换,医保部门无法及时对已死亡参保人员的参保状态进行及时调整,导致部分已死亡参保人员的医保卡仍可正常刷卡就医。审计人员将民政部门获取的人员死亡数据与医保门诊、住院和药店结算数据进行比对,得到人员死亡后仍发生结算记录的数据作为疑点数据,并到就诊的医疗机构进行进一步延伸确认,发现部分参保人员家属违规使用死亡人员的医保卡购药、就医的情况。

(五)多报参保人数套取省级补助资金

传统手工审计模式下,医保审计的总体分析往往依赖于被审计单位提供的报表数据,存在一定的审计风险。本次医保审计通过大数据分析,从底层数据开始统计汇总,越过了被审计单位的数据调整,计算出参保总人数、职工医保、城乡居民医保和新农合等医保基金的实际参保人数,汇总全省医保参保数据后发现了部分地区实际参保人数少于申请补助人数,存在多报参保人数套取省级补助资金的问题。(蒋萍)

THE END
1.数据挖掘与数据分析:概念方法与实际应用1、数据挖掘(Data Mining): 数据挖掘是指对大规模数据进行分析,以发现其中潜在的模式、规律或关联性的过程。其目的在于从数据中提取有价值的信息,以支持决策制定、预测未来趋势等。数据挖掘涉及多种技术和方法,包括机器学习、统计分析、数据库技术等。 2、数据分析(Data Analysis): 数据分析是指对数据进行收集、清洗https://blog.csdn.net/weixin_72649242/article/details/138011398
2.数据挖掘与分析(精选十篇)数据挖掘与分析 篇1 数据挖掘, 在人工智能领域, 习惯上又称为数据库中知识发现 (Knowledge Discovery in Database, 简称为KDD) , 也有人把数据挖掘视为数据库中知识发现过程的一个基本步骤。换言之, 就是从存放在数据库、数据仓库或其他信息库中大量的数据中获取有效的、新颖的、潜在有用的、最终可理解的模式https://www.360wenmi.com/f/cnkey0oxsb1u.html
3.数据挖掘与数据分析的异同点及典型应用案例在现代数据驱动的世界中,数据挖掘和数据分析已经成为了许多行业的重要工具。尽管这两个概念经常被人混淆,但它们各自有着独特的作用和应用场景。作为一个数据分析的从业者,我也曾在入门时对这两个术语感到困惑。经过实践,我逐渐发现了它们的异同,并且这些知识也帮助我在实际工作中做出更为精准的判断。 https://www.cda.cn/view/204806.html
4.数据挖掘分析岗位职责(工作内容,是做什么的)说明:薪资一般与学历正相关,一般学历越高,工资越高。数据挖掘分析工资按学历统计,大专工资¥9.5K,想知道其他学历工资,请点击查看 招聘经验要求:3-5年最多 数据挖掘分析经验要求高吗?1-3年占20%,3-5年占31.3%……想知道其他经验占比多少,请点击查看按https://www.jobui.com/gangwei/shujuwajuefenxi/duty/
5.数据挖掘论文[3]吴秀霞,关于档案管理方面的数据挖掘分析及应用探讨[J].经营管理者,20xx:338. 数据挖掘论文 篇2 随着会计现代化的发展,会计越来越多的运用计算机技术的拓展。 一、数据挖掘 数据挖掘是从数据当中发现趋势和模式的过程,它融合了现代统计学、知识信息系统、机器学习、决策理论和数据库管理等多学科的知识。它能有效https://www.unjs.com/lunwen/f/20220924130749_5650839.html
6.数据挖掘与分析报告范文7篇.docx数据挖掘与分析报告范文第一篇可以肯定,这东西跟数学和算法有关,而且很难!既然很难,那么就要付出更大的努力去学习了,去图书馆找书,找了好久发现老师经常说的hadoop都被借完了,只好找了本《数据挖掘教程》//《dataminingatutorial-basedprimer》,看起来比较入门,借着平时空闲的时间翻阅了一下,数据挖掘,顾名思义https://www.renrendoc.com/paper/234470348.html
7.数据挖掘与分析应用课程介绍:网络 1.数据挖掘与分析应用(17集) 课程列表 【第1集】第一集 关于课程的策划.mp4(上)译 【第2集】第一集 关于课程的策划.mp4(下)译 【第3集】第二集 数据分析软件界面介绍.mp4(上)译 【第4集】第二集 数据分析软件界面介绍.mp4(下)译 https://open.163.com/newview/movie/courseintro?newurl=RHK36F8CF
8.数据挖掘:实用案例分析完整pdf扫描版[103MB]电子书下载《数据挖掘:实用案例分析》是数据挖掘实战领域颇具特色的一部作品,作者曾为10余个行业上百家大型企业提供数据挖掘服务,本书是其在数据挖掘领域探索近10年的经验总结之作。全书以实践和实用为宗旨,深度与广度兼顾,实践与理论并举。 《数据挖掘:实用案例分析》共12章,分三个部分。第一部分是基础篇(第1~4章),主要https://www.jb51.net/books/629234.html
9.网络资源:数据挖掘实战2(航空公司客户价值分析)数据挖掘实战2-航空公司客户价值分析 本次学习我们仍然遵循“什么是数据挖掘”文章中的研究方法对航空公司消费客户进行聚类。本章学习重点是如何标准化处理数据,使用k-means聚类,明白聚类和分类的区别。 问题背景:假设你是航空公司的,如何针对不同的顾客进行活动的推销,维持经常飞行的顾客,吸引新的顾客。这就需要我们对https://nonlinear.wtu.edu.cn/info/1117/1664.htm
10.社交网站的数据挖掘与分析(豆瓣)他们在讨论些什么?或者他们在哪儿?这本简洁而且具有可操作性的书将揭示如何回答这些问题甚至更多的问题。你将学到如何组合社交网络数据、分析技术,如何通过可视化帮助你找到你一直在社交世界中寻找的内容,以及你闻所未闻的有用信息。 每个独立的章节介绍了在社交网络的不同领域挖掘数据的技术,这些领域包括博客和电子邮件https://book.douban.com/subject/10344930/
11.数据挖掘数据分析师(CDA)专版数据分析培训数据分析师(CDA)专版-经管之家(原人大经济论坛)为广大数据分析师爱好者提供CDA数据分析师,数据分析培训,数据分析师认证考试咨询,数据分析师职责等相关信息,CDA数据分析师是国内数据分析培训行业具有影响力培训机构.https://bbs.pinggu.org/forum.php?mod=forumdisplay&fid=244&filter=typeid&typeid=1093
12.数据挖掘与分析的六种经典方法论6、数据挖掘与分析的“七步法” “七步法”分为七个步骤,分别是:业务理解、数据获取、数据探索、模型构建、模型评估、策略输出、应用部署。“七步法”更侧重从乙方的视角来完成用数据挖掘及其应用的闭环。 -END-https://www.niaogebiji.com/article-30475-1.html
13.数据挖掘与预测分析:第2版.pdf数据挖掘与预测分析:第2版.pdf 第1 章 数据挖掘与预测分析概述 1.1 什么是数据挖掘和预测分析 最近,计算机制造商 Dell 对提高其销售人员的工作效率非常感兴趣。为此,公司利用 数据挖掘和预测分析方法分析其潜在客户数据库,以发现那些最有可能真正成为其客户的 人群。通过利用 LinkedIn 及其他能够提供大量丰富潜在客户https://max.book118.com/html/2017/0705/120425241.shtm
14.数据挖掘和数据分析的区别随着大数据时代的到来,数据挖掘和数据分析在许多行业中变得越来越重要。然而,尽管这两个术语经常被一起使用,但它们之间存在一些明显的区别。一、数据挖掘和数据分析的区别1. 数据规模:数据分析通常处理大规模数据,而数据挖掘则更侧重于处理超大规模和复杂数据。2. 目标和目的:数据分析旨在理解数据,而数据挖掘则更注重预https://aiqicha.baidu.com/qifuknowledge/detail?id=17901039906
15.数据挖掘示例数据挖掘经典案例分析ctaxnews的技术博客数据挖掘示例 数据挖掘经典案例分析 1、算法简介 Apriori algorithm是关联规则里一项基本算法。其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集,是由Rakesh Agrawal和Ramakrishnan Srikant两位博士在1994年提出的关联规则挖掘算法。关联规则的目的就是在一个数据集中找出项与项之间的关系,也被称为https://blog.51cto.com/u_14850/8174028
16.数据挖掘有哪些帆软数字化转型知识库数据挖掘包括:分类、聚类、关联规则、回归分析、时间序列分析、异常检测、文本挖掘。分类是将数据集分成不同类别的过程,广泛应用于邮件过滤、医疗诊断等领域。分类是一种监督学习方法,它使用已知类别的训练数据来构建模型,然后对新数据进行分类。常见的分类算法包括决策树、支持向量机、朴素贝叶斯等。决策树通过递归地分割https://www.fanruan.com/blog/article/576370/
17.生信技能树Day9GEO数据挖掘差异分析腾讯云开发者社区生信技能树Day9 GEO数据挖掘 差异分析 差异分析表格 差异分析后要得到这样一张表格 二分组数据差异分析 代码语言:r 复制 #差异分析 limmalibrary(limma)design=model.matrix(~Group)# 生成模型矩阵fit=lmFit(exp,design)fit=eBayes(fit)deg=topTable(fit,coef=2,number=Inf)https://cloud.tencent.com/developer/article/2411027
18.数据分析中的数据挖掘需要哪些算法数据分析中的数据挖掘需要以下算法:一、分类算法;二、聚类算法;三、关联规则算法;四、分类与回归树算法;五、Adaboost算法;六、期望最大化算法;七、最近邻算法;八、神经网络算法。在数据分析中,数据挖掘算法可以帮助发现数据中隐藏的模式、关系、趋势和异常。 https://www.linkflowtech.com/news/1594
19.科学网—数据挖掘(Datamining)简介l气温长期变化趋势的预测[7]。将数据进行平滑,然后用高阶多项式(时间幂函数)或谐波函数(谐波分析法,类似于功率谱分析)进行拟合,得到气温变化(可用简单函数表达的)趋势,从而进行预测。 平滑和谱分析均是数据分析中常用的方法,在这里却被冠以数据挖掘的名字。 https://blog.sciencenet.cn/blog-200199-750526.html
20.数据分析网【脑图】电商类APP的数据门户/数据产品的功能框架脑图 【地图】数据分析师职业发展必备知识地图 最新文章 行业资讯 大数据 数据分析 数据挖掘 人工智能 数据产品 数据报告 数据报告 艾媒咨询:2024年中国自助餐行业消费者行为洞察数据 近年来,中国自助餐行业发展迅速,消费者行为呈现出多样化趋势。随着消费者对健康饮食和个https://www.afenxi.com/