大数据技术在医保审计中的应用初探

随着信息化时代的到来,审计机关的审计对象——被审计单位信息化程度不断提高,其财务数据尤其是业务数据日益庞大,不断呈几何倍数增长,审计人员逐步面临着处理海量大数据的难题,传统的审计技术已远远不能满足信息大爆炸下审计形势的需要,审计机关应主动了解和掌握大数据审计分析技术,充分认识提高计算机审计水平是拓展审计思路、改进审计手段、创新审计方式和方法的关键,是审计转型具体体现的理念,才能适应和满足大数据环境对审计工作提出的新变化、新要求、新形势。本文首次探索在审计署医保同步审计中采用大数据审计思路,开发利用多种大数据审计技术,取得了不菲的成效。

一、项目背景

为深化医疗保险制度改革、促进医疗保险基金加强管理、更好地保障和改善民生。2016年8月9日,根据审计署统一部署,浙江省审计厅组织全省各级审计机关开展了对全省11个地市、32个县域的医疗保险基金审计。笔者有幸参加了本次审计,亲身体验了大数据的各种新型技术在审计实践中的应用。本次医保审计充分运用大数据的多种新技术、新方法和新工具,推陈出新,切实发挥了大数据审计在提高审计质量和效率、提升审计价值方面的作用。如采用了数据挖掘技术中信息熵理论、孤立点分析、多维数据分析,以及企查查app工具、传统的分析性复核方法体系、信息系统审计等分析方式,汇集各种途径的审计思路103个,产生疑点50多万条,经核实有疑点思路46个,发现民营医院利用癌症病人、五保户或其他参保人员身份或虚假销售骗取套取医保基金,以及参保人员异地重复参保虚假报销、死亡人员报销医保费用、多报参保人数套取省级补助资金、职业药师异地挂证、重复参保等7个大类14个小类的问题,涉及金额达3397.89万,移送案件10余起。

二、创新方法,多角度、多维度、多手段拓展审计思路

(一)数据挖掘分析技术拓展审计方法

1、回归分析——信息熵理论在大数据分析中首次发挥作用

2.孤立点分析拓展大数据审计新手段

同一个县市区的发票号码由于数量不多,可能并不具备进行孤立点分析的条件,而这种通过全省汇总进行孤立点分析的方式,能够发现以往难以发现的问题。图中可见大部分发票号码都成直线聚集在图形上方,只有2个发票号码排列在图形底部,在明确这2个数据非人工输入错误后,将这样的孤立点分布作为审计延伸的重点,能够达到事半功倍的效果。

3.多维数据关联分析大展拳脚

(二)大数据审计会同企查查软件锁定重点核查单位

由于传统的SQL语言是一种图灵机不完备的查询语言,其循环和递归受限,无法对不同机构和人员之间的关联关系链进行完整的审查,因而在审查不同数据的关系方面受限制。而本次审计首次利用企查查手机app工具,可以查找不同定点医疗机构之间的关联关系,锁定重点延伸核查单位。例如在对某种药品排名靠前的几家民营医院进行分析时,审计人员利用企查查app软件,发现医保费用报销排名靠前的其中2家民营医院隶属于同一批投资人,并将这2家民营医院作为重点延伸对象,同时进驻并进行审查,发现这2家民营医院存在相同的空刷卡骗取医保基金等违法违规问题,目前案件正在审理当中。

(三)传统的分析性复核方法体系精准定位审计疑点

(四)信息系统审计提供大数据审计新思路

三、精准发力,大数据分析取得丰硕成果

(一)民营医院空刷卡大肆骗取医保基金

通过比对民营医院与公立医院药品报销价格和数量差异,发现部分民营医院报销的抗癌药物价格畸高,比公立医院高出一倍以上,而此类药物在公立医院报销的数量很少,延伸审计发现部分民营医院通过返利和回扣的形式吸引医保参保人员虚报高价抗癌药物,骗取医保基金,谋取高额利润。此外还发现部分民营非营利医院利用五保、低保人员身份,通过减免部分费用、派车接送、免费吃住等方式吸引五保、低保人员住院并设立小金库,套取、骗取医保基金等问题。

(二)医疗机构虚假销售药品、虚假进货骗取医保基金

审计人员从医保药店结算单中筛选出药店销售医保药品的报销数据,从药店电子销售系统筛选出同一时期内医保药品的销售数据,并与进行数据比对,发现部分药店的药品实际销量与其上传到社保部门的数量不符。经过延伸核实,进而证实部分药店涉嫌伪造供应商销售清单虚假进货、串换药品、大量刷卡虚假销售骗取医保基金的问题。

(三)使用虚假异地就医结算票据骗取医保资金

审计人员发现由于医保数据未实现全省联网和数据共享,各地医保部门在进行跨地区医保报销手工结算时存在较大风险,因此将跨地区异地住院的真实性作为大数据分析的重点之一。通过筛选出异地重复参保且在异地有住院信息的医保人员,并将这部分人员医保报销中的住院、出院信息、治疗费用、医保支付数据等与医院的HIS系统中的住院信息、支付数据进行对比,发现一批信息不一致的住院信息或重复报销同一笔“真”、“假”住院费用等,进而核实部分医保病人使用虚假的住院收费收据报销,骗取医保基金的问题。

(四)使用已死亡人员医保卡骗取医保资金

由于民政部门与医保部门的数据没有实现实时共享或数据交换,医保部门无法及时对已死亡参保人员的参保状态进行及时调整,导致部分已死亡参保人员的医保卡仍可正常刷卡就医。审计人员将民政部门获取的人员死亡数据与医保门诊、住院和药店结算数据进行比对,得到人员死亡后仍发生结算记录的数据作为疑点数据,并到就诊的医疗机构进行进一步延伸确认,发现部分参保人员家属违规使用死亡人员的医保卡购药、就医的情况。

(五)多报参保人数套取省级补助资金

传统手工审计模式下,医保审计的总体分析往往依赖于被审计单位提供的报表数据,存在一定的审计风险。本次医保审计通过大数据分析,从底层数据开始统计汇总,越过了被审计单位的数据调整,计算出参保总人数、职工医保、城乡居民医保和新农合等医保基金的实际参保人数,汇总全省医保参保数据后发现了部分地区实际参保人数少于申请补助人数,存在多报参保人数套取省级补助资金的问题。(蒋萍)

THE END
1.数据挖掘在商业分析中的作用是什么?cda对其从业有帮助吗?数据挖掘在商业分析中的作用主要体现在以下几个方面:市场趋势和消费者行为分析:数据挖掘可以帮助企业发现https://baijiahao.baidu.com/s?id=1818104695603826700&wfr=spider&for=pc
2.数据挖掘在企业决策中的应用与挑战数据挖掘是一个旨在从大量数据中提取隐含模式、知识和信息的过程。其发展经历了从最初的统计分析到逐渐融入机器学习和人工智能等先进技术,逐步演化成为当今数据驱动决策的重要工具。在企业决策中,数据挖掘的作用日益突显,它可以通过分析客户行为、市场趋势和内部运营数据,为企业的战略规划、营销决策和资源配置提供科学依据。https://blog.csdn.net/tiangang2024/article/details/144325395
3.入行数据挖掘你需要知道这些知识点腾讯云开发者社区数据挖掘的目的 数据挖掘的最终目的是要实现数据的价值,所以,单纯的数据挖掘是没有多大意义的。 数据挖掘的作用 从大量数据中寻找存在的规律、规则、知识以及模式、关联、变化、异常和有意义的结构。 05 数据挖掘技术产生的背景 海量的大数据已经远远超出了人类的理解能力,如果不借助强大的工具和技术,很难弄清楚大数据https://cloud.tencent.com/developer/article/1163611
4.数据挖掘的作用网易数帆为您提供数据挖掘的作用相关产品介绍、帮助文档,与数据挖掘的作用感兴趣的用户在网易数帆社区进行知识和技术交流互动。网易数帆 - 领先的数字化转型技术与服务提供商!https://m.sf.163.com/search/5pWw5o2u5oyW5o6Y55qE5L2c55So?t=website
5.数据挖掘的作用主要体现在。数据挖掘的作用主要体现在。A.客户保留B.客户服务C.客户识别D.客户回访E.跟踪服务https://www.netkao.com/shiti/825368/1900672xwqvfygjm7.html
6.数据挖掘的优缺点数据挖掘的主要作用柳随风的技术博客数据挖掘的优缺点 数据挖掘的主要作用 导读:数据挖掘过程包含数据清洗、特征提取、算法设计等多个阶段,本文将讨论这些阶段。 01 数据挖掘过程 典型数据挖掘应用的过程包含以下几个阶段。 1. 数据采集 数据采集工作可能是使用像传感器网络这样的专门硬件、手工录入的用户调查,或者如Web爬虫那样的软件工具来收集文档。虽然https://blog.51cto.com/u_14276/11822682
7.数据挖掘有哪些作用帆软数字化转型知识库数据挖掘的作用有哪些? 数据挖掘是从大规模数据中提取出潜在的、有用的信息和知识的过程。它在各个领域都发挥着重要的作用,尤其是在商业、科学和社会研究中。首先,数据挖掘能够帮助企业识别市场趋势,了解消费者行为,从而制定更有效的营销策略。通过分析客户的购买历史、偏好和反馈,企业可以实现个性化推荐,提升客户满意度https://www.fanruan.com/blog/article/575814/
8.中药治疗过敏性鼻炎的数据挖掘及作用机制研究6内 蒙古医科大学硕士研究生学位论文(2022)中药治疗过敏性鼻炎的数据挖掘及作用机制研究前 言过敏性鼻炎又称变应性鼻炎( allergic rhinitis,AR) ,是一种变态反应性疾病 ,主要发生部位为鼻粘膜,是临床常见的鼻部疾病 [1]。 AR 的主要特点为鼻粘膜反 应性 增高,症状为鼻塞、鼻痒、打喷嚏和流涕,其发病率日益升高https://www.360doc.cn/document/20654250_1076483549.html
9.领域专家知识及其在空间数据挖掘中的作用的英文翻译英语怎么说海词词典,最权威的学习词典,专业出版领域专家知识及其在空间数据挖掘中的作用的英文,领域专家知识及其在空间数据挖掘中的作用翻译,领域专家知识及其在空间数据挖掘中的作用英语怎么说等详细讲解。海词词典:学习变容易,记忆很深刻。http://dict.cn/%E9%A2%86%E5%9F%9F%E4%B8%93%E5%AE%B6%E7%9F%A5%E8%AF%86%E5%8F%8A%E5%85%B6%E5%9C%A8%E7%A9%BA%E9%97%B4%E6%95%B0%E6%8D%AE%E6%8C%96%E6%8E%98%E4%B8%AD%E7%9A%84%E4%BD%9C%E7%94%A8
10.数据挖掘在客户关系管理中的作用20210810011421.pptx数据挖掘在客户关系管理中的应用 ;议程;议程;为什么要进行客户关系管理;;客户特征描述;;;商业理解 文档;;;数据理解,数据探索性分析;计算客户价值;描述客户价值分布及随时间变化情况;; 全方位的服务 产品 培训 咨询 全球性的公司 与业界领袖的伙伴关系 ……;9、有时候读书是一种巧妙地避开思考的方法。8月-218月-https://mip.book118.com/html/2021/0810/6212052014003230.shtm
11.数据挖掘在客户关系管理中的作用数据挖掘在客户关系管理中的应用 议程 ? 客户关系管理 ?为什么要进行客户关系管理 ?客户关系管理的内容 ? 数据挖掘在客户关系管理中的应用 ?什么是数据挖掘 ?数据挖掘的典型应用 ? 针对的数据挖掘解决方案 ?数据挖掘方案简介 ?中的数据挖掘模板 议程 ? 客户关系管理 ?为什么要进行客户关系https://doc.mbalib.com/m/view/d1d4c0a2baebd272635c1365f5ac4f90.html
12.什么是用户画像,一般用户画像的作用是什么4.数据挖掘: 以用户画像为基础构建推荐系统、搜索引擎、广告投放系统,提升服务精准度 二、用户画像的作用主要有以下几个方面: 1.广告投放 在做用户增长的例子中, 我们需要在外部的一些渠道上进行广告投放, 对可能的潜在用户进行拉新, 比如B站在抖音上投广告。我们在选择平台进行投放的时候, 有了用户画像分析, 我们https://www.linkflowtech.com/news/140
13.C++聚类算法在数据挖掘中的关键作用编程语言C++聚类算法在数据挖掘中扮演着关键角色,主要用于将相似的数据点分组在一起,从而发现数据中的内在结构和模式。以下是C++聚类算法在数据挖掘中的几个关键作用: 数据预处理:C++聚类算法可以对原始数据进行预处理,包括数据清洗、特征提取和数据标准化等。这些操作有助于提高聚类算法的性能和准确性。 自动发现数据结构:聚类https://m.yisu.com/zixun/921009.html
14.数据挖掘在管理会计中的重要意义【摘要】数据挖掘是从海量数据中发现和提取知识和信息的过程。在管理会计领域中运用数据挖掘技术,寻求和发现更多的企业顾客、供应商、市场以及内部流程优化的信息,将为企业决策者提供更为广泛而有效的决策依据,提高企业战略竞争能力。本文简要介绍了数据挖掘的基本概念和方法,在此基础上重点分析了数据挖掘技术在作用成本和https://www.jy135.com/guanli/327644.html
15.人工智能视域下的宽度学习及在教育中的应用三、宽度学习通过数据挖掘作用于教育领域 多年来,网络学习资源的增加、互联网教育的兴起以及学生信息数据库的建立等,为促进教育发展提供了大量、巨型的资料库数据,这在促进教育信息化发展的同时,也导致了现今教育界面临的最大挑战,即教育数据呈指数型增长和如何对这些数据进行高效的分析与利用问题。早在2012年,美国教育http://epc.swu.edu.cn/info/1119/2937.htm
16.多元回归分析在数据挖掘中有何作用?多元回归分析在数据挖掘中发挥着重要的作用。数据挖掘是指从大量数据中提取有价值的信息和模式的过程,而多元回归分析则是一种用于建立变量之间关系的统计方法。通过将这两个领域结合起来,可以帮助我们理解数据中的复杂关系、预测未来趋势以及进行决策支持。 多元回归分析可以帮助我们理解变量之间的关系。在数据挖掘中,我们https://www.cda.cn/view/203846.html
17.数据挖掘论文(一)数据挖掘技术。数据挖掘是指从大量的、不规则、乱序的数据中,进行分析归纳,得到隐藏的,未知的,但同时又含有较大价值的信息和知识。它主要对确定目标的有关信息,使用自动化和统计学等方法对信息进行预测、偏差分析和关联分析等,从而得到合理的结论。在档案管理中使用数据挖掘技术,能够充分地发挥档案管理的作用,从https://www.unjs.com/lunwen/f/20220924130749_5650839.html
18.基于数据挖掘探究溪黄草药用成分及潜在抗癌的作用机制本研究利用多个大数据分析平台对溪黄草的有效成分进行筛选分析,结合相关数据库的疾病信息,得出溪黄草作用于癌症的靶点及机制,构建“药物-靶标-疾病”网络,为后续溪黄草辅助治疗癌症的作用机制提供理论参考。 1、资料与方法 1.1 溪黄草成分的筛选 通过中国知网检索关键词“溪黄草”,并结合BATMAN-TCM数据库和CancerHSPhttps://www.91xueshu.com/l-zyzllw/90232.html
19.生信技术分享:SNV瀑布图有什么作用#数据挖掘#R语言#生信分析#生信技术分享:SNV瀑布图有什么作用 #数据挖掘 #R语言 #生信分析 #生信人 #SCI - 生信人于20230903发布在抖音,已经收获了4.0万个喜欢,来抖音,记录美好生活!https://www.douyin.com/video/7273303182078397736