大数据挖掘怎样赋能医保基金监管?大余县信息公开

数据挖掘技术是指从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的,但又是潜在有用的信息和知识的过程。数据挖掘技术在医保监管中具有重要的应用价值,通过对医保大数据的处理和分析,可以发现各种隐蔽性的欺诈骗保行为,从而提供有效的监管手段。此外,数据挖掘技术还可以帮助建立个体化监管模型,对医疗服务方进行精准监管,确保医保基金的合理合法使用。因此,充分应用医保大数据挖掘新技术实施全过程智能监管是解决医保监管痛点和难点的关键,是实现医保高质量发展必不可少的技术手段。

大数据挖掘应用下的医保监管案例分析——上海市医保医师画像模型

1.医保医师画像模型建立的背景

2.医保医师画像模型应用数据挖掘新技术的方法

利用医保大数据优势,结合门诊医师的基本信息、接诊信息以及接诊病人的人群特征信息等指标,上海市医保部门应用数据挖掘技术新方法,对医师画像进行深入分析,筛选出疑点医生并建立预警级别。

该模型主要采用以下方法。

(1)标准化:对数据特征进行归一化处理,消除不同指标之间的量纲影响,以确保它们具有可比性和可解释性。

(3)K均值聚类:将给定的数据集划分为K个不重叠的簇,基于数据点之间的距离来确定簇的分配,并通过迭代的方式优化簇的中心位置。

(4)逻辑回归:将医保医师根据不同特征划分为多个不同类别,且各个类别之间无明确的次序关系。

(5)决策树模型:自上而下对样本数据进行树形分类。每个节点代表一个属性或特征,每个分支代表该属性的不同取值,每个叶节点代表一个类别或一个预测结果。

(6)层次分析(analytichierarchyprocess,AHP):计算出变量权重,并对医保医师进行打分。可以将主观判断量化,并提供一种系统化的方法进行决策。

3.医保医师画像模型的建立步骤

本研究纳入11699名医保医师,通过数据分析和专家意见对其进行多维度全方位的行为研究,确定了30个模型变量,包括接诊信息、“治疗三费”、专家意见三个维度的指标。其中,接诊信息包括当月医生接诊数量及接诊费用、当月医生日均接诊数量及接诊费用、当月医生日接诊最多病人数及最高费用;“治疗三费”即当月医生康复治疗、理疗、中医治疗费用占所有费用的比重;专家意见是将中医、康复专家观点转化为医生开具诊疗项目的数量(单次超量)、频次(频繁开具)、项目间的关联(组合收费)。

第二步,采用无监督机器学习算法,根据降维得到的10个指标变量对医师进行分类,得出每一类医师的特征。选择K均值聚类算法将被观测医师分为无重叠的15类,每个医生都有对应的类别标签。选用无序多分类逻辑回归模型对医师分类结果进行验证,结果显示预测标签一致率较高。

第四步,根据疑点医生分数的分布情况,建立疑点医生的红橙黄三级预警机制。从医生分值的上四分位数到最大值为红色预警,下四分位数到上四分位数为橙色预警,最小值到下四分位数为黄色预警。针对疑点医生进行实地核验,反馈的结果用于优化模型。

4.医保医师画像模型的应用

应用模型确定疑点医师名单,约谈疑点医师,对违反医保规定的执业医师作出暂停医保结算等行政处理,对医保医师能够起到较好的警示作用。医师画像模型提升了医保医师信用体系建设的水平,为规范医师行为提供帮助,对保障医保基金安全具有重要意义。

大数据挖掘新技术在医保监管中的成果与效益

1.医保智能监管系统

上海市建成了覆盖各医保险种和监管对象的全流程、全方位、立体化的医保智能监管系统。该系统涵盖了总览、智能监控、行政执法、信用监管和综合评价五大版块,贯穿线索发现、调查取证、违规处理、结果应用四大环节,具备事前提醒、事中控制、事后追踪三大功能。

该系统具备预警监控、监控案件管理、综合查询、规则筛查等功能,其中最核心的预警监控功能下又分为多卡聚集、三费预警、人床分离、人卡分离、异常检验、一脸多卡、区块链进销存等十多个大数据主题预警模型。截至2023年6月,一脸多卡模型已经覆盖848家药店,上海市医保部门运用三费预警模型将预警医生列为约谈对象,区块链进销存模型已覆盖297家定点机构,对医疗机构和药店进行风险排名。这些模型可以通过大数据、人工智能等技术,在海量医保基金结算信息中自动抓取疑点,并进行智能研判和快速预警。当执法人员在监管系统中看到预警后,便会循着线索前往医院核查,在大数据的助力下让违规行为无处遁形,实现了对医保违规的精准定位、定性和定量管理。

2.医保信息智能监控知识库

上海市建立了医保智能监控知识库,包括基识库、监控规则库、分析指标库和大数据主题模型库,目前已完善优化了24万条监控知识库和6万条规则库。针对长护险居家护理、“互联网+”医疗、DRG/DIP付费等医保新业态,市医保部门探索打造数字化转型场景新应用。结合上海市开展DRG/DIP支付试点,将1.4万余个标准病组、近900个DRG分组库纳入知识库统一管理。将实际检查工作中运用的近200条规则纳入监控规则库,将对民办医疗机构预警检查中运用的近400条指标优化后纳入分析指标库,并扩展使用范围至全市所有的定点医疗机构。

上海医保智能监管系统构成一张“天网”,医保基金监管队伍组成一张“地网”,基金安全“防护网”更加织密扎牢。医保部门应用知识图谱和无监督机器学习等方法构建基于知识图谱的规则逻辑风控预警模型,形成了全市共享和动态更新机制,实现了数据监控和疑点排查100%全覆盖。2021年,通过智能监管系统筛查出8900万余条定点医药机构疑点数据、49.2万就诊购药异常的参保人员。2019年—2023年,上海市医保局对11575家违规定点机构追款5.5亿余元,对11696人次违规参保个人追款2000余万元,共追回医保基金近6亿元。

大数据挖掘新技术应用于医保监管的经验与思考

上海市医保智能监管为其他地区推广医保大数据挖掘与应用、推进医保信息化建设提供了参考经验。然而也存在一些问题与挑战,比如当地医保信息平台与国家医保信息平台对接不及时,数据挖掘的深度及广度有限等。因此,提出以下思考。

1.完善法规及政策,为医保监管提供制度保障

2.加强医保大数据平台建设,及时对接国家平台

目前,上海市医保信息平台数据比较混乱,未做到数据的规范统一和完整,不能及时与国家信息平台对接。医保信息平台的建设应规范数据采集和录入流程,建立数据清洗和校验机制,排除数据中的错误和重复信息等,提高数据可信度和可用性,推进医保平台标准化建设。建议依托全国统一大平台,从完整度、准确性、标准化、可用性、安全性等方面持续对医保大数据开展动态治理。

4.加强多部门协作,让有需求的应用尽快落地

医保监管保障了医保基金的安全性和可持续性,同时对于优化医疗资源配置、提升医疗服务质量以及保障患者权益等具有重要的意义。通过应用大数据分析技术和智能监管手段,提高了监管效率和精细化水平,推动了医保管理的现代化进程。上海市医保智能监管的建设与发展提供了成功的范例,通过充分应用医保大数据挖掘技术,建立医保安全和数据模型,实现了医保数据质量的提升和监管水平的精细化。下一步,上海市应继续强化监管力度,丰富智能化监管手段,进一步深化部门协作,不断提高医保监管效能,推动医保事业高质量可持续发展。(ZGYB-2023.10)

原标题:《数据挖掘技术赋能医保监管——基于上海市医保监管实践》

THE END
1.数据挖掘(计算机科学)发现知识的方法可以是数字的、非数字的,也可以是归纳的。最终被发现的知识可以用于信息管理、查询优化、决策支持及数据自身的维护等。数据挖掘步骤 在实施数据挖掘之前,先制定采取什么样的步骤,每一步都做什么,达到什么样的目标是必要的,有了好的计划才能保证数据挖掘有条不紊地实施并取得成功。很多软件供应商和https://baike.baidu.com/item/%E6%95%B0%E6%8D%AE%E6%8C%96%E6%8E%98/216477
2.数据挖掘的四种基本方法数据挖掘的四种基本方法 东奥美国注册管理会计师 2024-12-06 14:51:12 遗传算法 遗传算法是一种依据微生物自然选择学说与基因遗传原理的恣意优化算法,是一种仿生技能全局性提升办法。遗传算法具有的暗含并行性、便于和其他实体模型交融等特性促使它在数据发掘中被多方面运用。https://www.dongao.com/cma/zy/202406204447292.html
3.数据挖掘七种常用的方法汇总数据挖掘基本方法数据挖掘七种常用的方法汇总 数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。这个定义包括几层含义:数据源必须是真实的、大量的、含噪声的;发现的是用户感兴趣的知识;发现的知识要可接受、可理解https://blog.csdn.net/api_ok/article/details/132065941
4.数据挖掘的几种方法有哪些帆软数字化转型知识库数据挖掘的方法包括分类、聚类、回归、关联规则、序列模式、异常检测和降维技术等。其中,分类是一种常见且重要的数据挖掘方法,通过对数据进行标记,帮助识别数据所属的类别。分类算法包括决策树、支持向量机和神经网络等。分类算法的核心在于通过训练集来生成分类模型,再用这个模型对新数据进行分类。比如在电子邮件分类中,https://www.fanruan.com/blog/article/594745/
5.商战数据挖掘:你需要了解的数据科学与分析思维分类模型、回归模型和因果模型通常用有监督方法构建;相似匹配、链路预测和数据整理采用两种方法皆可;聚类、共现分组和画像分析则通常用无监督方法解决。这些分析方法的基础就是我们要展开讨论的数据科学的基本原理。 回归与分类是两类有监督型数据挖掘方法,两者的区别在于目标变量的类型不同。回归的目标变量是数值型,而https://www.ituring.com.cn/book/tupubarticle/28952
6.数据挖掘VS机器学习,你了解多少?如今,获取数据比以往任何时候都更容易,但从数据中生成见解和信息正变得更具挑战性。企业经常发现自己处于一种情况,他们拥有的数据远远超过他们所知道的数据,这可能会适得其反,导致无所作为。 数据挖掘和机器学习是企业将这些庞大的数据库转化为有用信息的两种主要方法。 https://www.fromgeek.com/telecom/509859.html
7.数据挖掘论文2.EineSet是由SGI公司开发的,它也提供了多种数据挖掘方法,包括关联分析和分类以及高级统计和可视化工具。特色是它具有的强大的图形工具,包括规则可视化工具、树可视化工具、地图可视化工具和多维数据分散可视化工具,它们用于实现数据和数据挖掘结果的可视化。 3.Clementine是由ISL公司开发的,它为终端用户和开发者提供提供了https://www.unjs.com/lunwen/f/20220924130749_5650839.html
8.数据挖掘与分析的六种经典方法论最近梳理了一下数据挖掘与分析的常用方法论,这里简要介绍6种模型。 1、CRISP-DM 模型 CRISP-DM是CrossIndustry Standard Process for Data Mining(跨行业数据挖掘标准流程)的字母缩写。CRISP-DM是由一家欧洲财团(时称SIG组织)在20世纪90年代中后期提出来的,是一套用于开放的数据挖掘项目的标准化方法,也是业内公认https://www.niaogebiji.com/article-30475-1.html
9.数据挖掘及其在金融中的应用主要是采用人工智能相关方法作出预测,它能够实现统计回归预测和统计时间序列预测的功能,并且假设条件要比统计预测要宽松得多,甚至有些没有什么假设条件,精度上也与他们相当甚至比它们要好。 数据挖掘的类型,可能还不止这些,以上仅是一般的界定,正因为我们对数据挖掘的类型作出了界定,不同的类型也有对应的挖掘模型与算法https://www.jianshu.com/p/474504df2bdd
10.科学网—时空视频数据挖掘:让罪犯无所遁迹时空数据挖掘的方法丰富多彩,主要有数学统计方法、归纳方法、聚类方法、Rough集方法和云理论。以上方法不是孤立应用的,为了发现某类知识常常要综合应用这些方法。知识发现方法还要与常规的数据库技术充分结合,如在时空数据库中挖掘空间演变规则时,首先可利用空间数据库的叠置分析等方法提取出变化了的数据,再综合统计方法和https://blog.sciencenet.cn/blog-528739-858610.html
11.数据挖掘(3.1)频繁项集挖掘方法关联规则挖掘是数据挖掘领域中研究最为广泛的也最为活跃的方法之一 关联规则反应了一个事物和其他事物之间的相互依存性和关联性 如果存在一定的关联关系,其中一个事物就可以通过其他事物预测到 最小支持度:就是说当支持度达到一定的阈值后,某种数据才有被挖掘的潜力这个阈值就是最小支持度计数(min_sup)。 https://open.alipay.com/portal/forum/post/128201013
12.测试和验证(数据挖掘)MicrosoftLearn所有这些方法在数据挖掘方法中都非常有用,在创建、测试和优化模型来解决特定问题时可以反复使用这些方法。 没有一个全面的规则可以说明什么时候模型已足够好,或者什么时候具有足够的数据。 验证数据挖掘模型的条件的定义 数据挖掘的度量通常分为以下三类:准确性、可靠性和有用性。 https://docs.microsoft.com/zh-cn/sql/analysis-services/data-mining/testing-and-validation-data-mining
13.数据挖掘频繁项集挖掘方法中AprioriFPApriori算法是Agrawal和Srikant于1994年提出,是布尔关联规则挖掘频繁项集的原创性算法,通过限制候选产生发现频繁项集。Apriori算法使用一种称为逐层搜索的迭代方法,其中k项集用于探索(k+1)项集。具体过程描述如下:首先扫描数据库,累计每个项的计数,并收集满足最小支持度的项找出频繁1项集记为L1。然后使用L1找出频繁https://developer.aliyun.com/article/1400152
14.数据处理方法有哪些,掌握这些技巧让你轻松应对数据分析问题1.预处理方法:这种方法主要是在数据采集之后进行的,目的是减少数据所包含的噪声成分和冗余信息,提高结果的准确性。预处理方法一般包括数据清洗、数据采样、数据变换等。 2.数据挖掘方法:数据挖掘是从大量数据中发现隐藏在其中的有价值的信息的过程。数据挖掘方法包括分类、聚类、关联规则挖掘、异常检测等。 https://www.jiandaoyun.com/fe/sjclffynxz/
15.摩托车半热熔胎使用时需要注意哪些事项?适用于高速行驶的场合基于数据挖掘方法,对摩托车半热熔胎市场消费者的偏好进行了分析,通过网络爬虫技术收集了大量摩托车半热熔胎相关的数据,并进行了数据清洗和预处理。 利用关联规则挖掘方法,分析了消费者对半热熔胎品牌、性能、价格等方面的偏好,并建立了相应的模型,根据分析结果提出了相应的市场营销建议。 https://www.dongchedi.com/article/7233349793031045647
16.数据分析的三大方法是什么3.数据挖掘:通过发现大数据集中隐藏的有价值的信息,来支持决策和业务发展的方法。数据挖掘可以通过寻找不同数据之间的关联性与规律,来发现有用的信息和趋势。例如,通过分析用户浏览和购买的商品等数据,可以为企业提供更精准的营销策略和产品优化建议。数据挖掘的一些应用场景包括:智能推荐、反欺诈、市场营销等。https://www.linkflowtech.com/news/2717
17.数据挖掘常用的方法数据挖掘常用的方法 在大数据时代,数据挖掘是最关键的工作。大数据的挖掘是从海量、不完全的、有噪声的、模糊的、随机的大型数据库中发现隐含在其中有价值的、潜在有用的信息和知识的过程,也是一种决策支持过程。其主要基于人工智能,机器学习,模式学习,统计学等。通过对大数据高度自动化地分析,做出归纳性的推理,从中https://www.cda.cn/view/124702.html
18.数据挖掘知多少?常用的数据挖掘方法有哪些?常用的数据挖掘方法有哪些? 什么是数据挖掘 数据挖掘是从大量数据中自动发现隐含的信息和知识的过程,属于主动分析方法,不需要分析者的先验假设,可以发现未知的知识 常用的分析方法包括 分类、聚类、关联分析、数值预测、序列分析、社会网络分析等 数据挖掘融合了多个https://mp.weixin.qq.com/s?__biz=MzI1NzczMDIwNw==&mid=2247484137&idx=1&sn=6fe15e4610cb117a02cfcf0809f9a647&chksm=ea13b119dd64380f2a011a63fbc398b09b41b4f2a46d3958ffdddf2f45e5de0a436df50fe387&scene=27