大数据挖掘怎样赋能医保基金监管?大余县信息公开

数据挖掘技术是指从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的,但又是潜在有用的信息和知识的过程。数据挖掘技术在医保监管中具有重要的应用价值,通过对医保大数据的处理和分析,可以发现各种隐蔽性的欺诈骗保行为,从而提供有效的监管手段。此外,数据挖掘技术还可以帮助建立个体化监管模型,对医疗服务方进行精准监管,确保医保基金的合理合法使用。因此,充分应用医保大数据挖掘新技术实施全过程智能监管是解决医保监管痛点和难点的关键,是实现医保高质量发展必不可少的技术手段。

大数据挖掘应用下的医保监管案例分析——上海市医保医师画像模型

1.医保医师画像模型建立的背景

2.医保医师画像模型应用数据挖掘新技术的方法

利用医保大数据优势,结合门诊医师的基本信息、接诊信息以及接诊病人的人群特征信息等指标,上海市医保部门应用数据挖掘技术新方法,对医师画像进行深入分析,筛选出疑点医生并建立预警级别。

该模型主要采用以下方法。

(1)标准化:对数据特征进行归一化处理,消除不同指标之间的量纲影响,以确保它们具有可比性和可解释性。

(3)K均值聚类:将给定的数据集划分为K个不重叠的簇,基于数据点之间的距离来确定簇的分配,并通过迭代的方式优化簇的中心位置。

(4)逻辑回归:将医保医师根据不同特征划分为多个不同类别,且各个类别之间无明确的次序关系。

(5)决策树模型:自上而下对样本数据进行树形分类。每个节点代表一个属性或特征,每个分支代表该属性的不同取值,每个叶节点代表一个类别或一个预测结果。

(6)层次分析(analytichierarchyprocess,AHP):计算出变量权重,并对医保医师进行打分。可以将主观判断量化,并提供一种系统化的方法进行决策。

3.医保医师画像模型的建立步骤

本研究纳入11699名医保医师,通过数据分析和专家意见对其进行多维度全方位的行为研究,确定了30个模型变量,包括接诊信息、“治疗三费”、专家意见三个维度的指标。其中,接诊信息包括当月医生接诊数量及接诊费用、当月医生日均接诊数量及接诊费用、当月医生日接诊最多病人数及最高费用;“治疗三费”即当月医生康复治疗、理疗、中医治疗费用占所有费用的比重;专家意见是将中医、康复专家观点转化为医生开具诊疗项目的数量(单次超量)、频次(频繁开具)、项目间的关联(组合收费)。

第二步,采用无监督机器学习算法,根据降维得到的10个指标变量对医师进行分类,得出每一类医师的特征。选择K均值聚类算法将被观测医师分为无重叠的15类,每个医生都有对应的类别标签。选用无序多分类逻辑回归模型对医师分类结果进行验证,结果显示预测标签一致率较高。

第四步,根据疑点医生分数的分布情况,建立疑点医生的红橙黄三级预警机制。从医生分值的上四分位数到最大值为红色预警,下四分位数到上四分位数为橙色预警,最小值到下四分位数为黄色预警。针对疑点医生进行实地核验,反馈的结果用于优化模型。

4.医保医师画像模型的应用

应用模型确定疑点医师名单,约谈疑点医师,对违反医保规定的执业医师作出暂停医保结算等行政处理,对医保医师能够起到较好的警示作用。医师画像模型提升了医保医师信用体系建设的水平,为规范医师行为提供帮助,对保障医保基金安全具有重要意义。

大数据挖掘新技术在医保监管中的成果与效益

1.医保智能监管系统

上海市建成了覆盖各医保险种和监管对象的全流程、全方位、立体化的医保智能监管系统。该系统涵盖了总览、智能监控、行政执法、信用监管和综合评价五大版块,贯穿线索发现、调查取证、违规处理、结果应用四大环节,具备事前提醒、事中控制、事后追踪三大功能。

该系统具备预警监控、监控案件管理、综合查询、规则筛查等功能,其中最核心的预警监控功能下又分为多卡聚集、三费预警、人床分离、人卡分离、异常检验、一脸多卡、区块链进销存等十多个大数据主题预警模型。截至2023年6月,一脸多卡模型已经覆盖848家药店,上海市医保部门运用三费预警模型将预警医生列为约谈对象,区块链进销存模型已覆盖297家定点机构,对医疗机构和药店进行风险排名。这些模型可以通过大数据、人工智能等技术,在海量医保基金结算信息中自动抓取疑点,并进行智能研判和快速预警。当执法人员在监管系统中看到预警后,便会循着线索前往医院核查,在大数据的助力下让违规行为无处遁形,实现了对医保违规的精准定位、定性和定量管理。

2.医保信息智能监控知识库

上海市建立了医保智能监控知识库,包括基识库、监控规则库、分析指标库和大数据主题模型库,目前已完善优化了24万条监控知识库和6万条规则库。针对长护险居家护理、“互联网+”医疗、DRG/DIP付费等医保新业态,市医保部门探索打造数字化转型场景新应用。结合上海市开展DRG/DIP支付试点,将1.4万余个标准病组、近900个DRG分组库纳入知识库统一管理。将实际检查工作中运用的近200条规则纳入监控规则库,将对民办医疗机构预警检查中运用的近400条指标优化后纳入分析指标库,并扩展使用范围至全市所有的定点医疗机构。

上海医保智能监管系统构成一张“天网”,医保基金监管队伍组成一张“地网”,基金安全“防护网”更加织密扎牢。医保部门应用知识图谱和无监督机器学习等方法构建基于知识图谱的规则逻辑风控预警模型,形成了全市共享和动态更新机制,实现了数据监控和疑点排查100%全覆盖。2021年,通过智能监管系统筛查出8900万余条定点医药机构疑点数据、49.2万就诊购药异常的参保人员。2019年—2023年,上海市医保局对11575家违规定点机构追款5.5亿余元,对11696人次违规参保个人追款2000余万元,共追回医保基金近6亿元。

大数据挖掘新技术应用于医保监管的经验与思考

上海市医保智能监管为其他地区推广医保大数据挖掘与应用、推进医保信息化建设提供了参考经验。然而也存在一些问题与挑战,比如当地医保信息平台与国家医保信息平台对接不及时,数据挖掘的深度及广度有限等。因此,提出以下思考。

1.完善法规及政策,为医保监管提供制度保障

2.加强医保大数据平台建设,及时对接国家平台

目前,上海市医保信息平台数据比较混乱,未做到数据的规范统一和完整,不能及时与国家信息平台对接。医保信息平台的建设应规范数据采集和录入流程,建立数据清洗和校验机制,排除数据中的错误和重复信息等,提高数据可信度和可用性,推进医保平台标准化建设。建议依托全国统一大平台,从完整度、准确性、标准化、可用性、安全性等方面持续对医保大数据开展动态治理。

4.加强多部门协作,让有需求的应用尽快落地

医保监管保障了医保基金的安全性和可持续性,同时对于优化医疗资源配置、提升医疗服务质量以及保障患者权益等具有重要的意义。通过应用大数据分析技术和智能监管手段,提高了监管效率和精细化水平,推动了医保管理的现代化进程。上海市医保智能监管的建设与发展提供了成功的范例,通过充分应用医保大数据挖掘技术,建立医保安全和数据模型,实现了医保数据质量的提升和监管水平的精细化。下一步,上海市应继续强化监管力度,丰富智能化监管手段,进一步深化部门协作,不断提高医保监管效能,推动医保事业高质量可持续发展。(ZGYB-2023.10)

原标题:《数据挖掘技术赋能医保监管——基于上海市医保监管实践》

THE END
1.大数据挖掘的步骤是怎样的呢?大数据挖掘流程大数据挖掘是一个复杂而系统的过程,它利用计算机科学的方法和技术,对大量、多样化、高速增长的数据进行深入挖掘,以发现有价值的信息和知识。以下是大数据挖掘的主要步骤和方法: 一、大数据挖掘的步骤 数据收集: 从各种数据源中采集数据,包括结构化数据(如数据库中的表格)、半结构化数据(如XML、JSON等格式的数据)和非https://blog.csdn.net/weixin_54503231/article/details/141565108
2.什么是大数据挖掘方法帆软数字化转型知识库大数据挖掘方法是指通过使用各种技术和工具,从庞大的数据集中提取有价值的模式、知识和洞察的过程。大数据挖掘方法包括:数据预处理、数据清洗、数据集成、数据变换、数据挖掘、模式评估、知识表示。其中,数据预处理是大数据挖掘过程中至关重要的一步,涉及对原始数据进行清洗、转换和准备,以确保其质量和一致性。数据预处理https://www.fanruan.com/blog/article/602183/
3.数据挖掘论文精选5篇论文3.2 大数据挖掘方法 大数据时代缺的不是数据, 而是方法。大数据在旅游行业的应用前景非常广阔, 但是面对大量的数据, 不懂如何收集有用的数据、不懂如何对数据进行挖掘和利用, 那么“大数据”犹如矿山之中的废石。旅游行业所涉及的结构化与非结构化数据, 通过云计算技术, 对数据的收集、存储都较为容易, 但对数据的https://www.ruiwen.com/lunwen/1801458.html
4.《大数据挖掘:系统方法与实例分析》(周英卓金武卞月青)简介MATLAB官方(MathWorks)资深大数据挖掘专家撰写,MathWorks官方及多位专家鼎力推荐。从技术、方法、案例、*实践4个维度循序渐进地讲解了大数据挖掘技的流程、方法和原理。 作者:周英 卓金武 卞月青出版社:机械工业出版社出版时间:2016年05月 手机专享价 ¥ 当当价 降价通知 ¥57.00 定价 ¥79.00 配送http://product.dangdang.com/23955674.html
5.北京大学—化柏林:大数据分析与挖掘技术主讲人介绍:化柏林,博士,北京大学信息管理系助理教授、研究员、硕士生导师。主要从事大数据情报分析与知识抽取研究。主持国家自然科学基金项目、国家社科基金等课题5项,出版著作2部,发表论文50余篇。 (通讯员 李玉媛)2018年11月23日15:30,我院邀请北京大学化柏林教授来我院918会议室开展题为《大数据分析与挖掘方法》https://sim.ccnu.edu.cn/info/1047/6862.htm
6.大数据金融第二章大数据相关技术数据挖掘的任务:关联分析、聚类分析、分类、回归、预测、序列和偏差分析。 五 数据解释 数据解释是一个面向用户的过程,它是指将大数据挖掘及分析结果在显示终端以友好、形象、易于理解的形式呈现给用户。 (一) 数据可视化 数据可视化技术主要是通过图形化方法进行清晰、有效的数据传递。 https://www.jianshu.com/p/d68251554c66
7.大数据的数据挖掘方案有哪些?大数据的数据挖掘方案有:1、神经网络方法;2、遗传算法;3、决策树方法;4、粗糙集方法;5、覆盖正例排斥反例方法;6、统计分析方法;7、模糊集方法。关于数据挖掘,你必须知道的几个主要方法数据挖掘是一门交叉性的新兴学科,它将数据可视化、数据库技术、高性能计算机、统计学、机器学习、模式识别、人工智能等多个范畴的https://www.linkflowtech.com/news/1986
8.什么是工业大数据常用的五种大数据分析方法星云联动大数据分析的理论核心就是数据挖掘算法,各种数据挖掘的算法基于不同的数据类型和格式才能更加科学的呈现出数据本身具备的特点,也正是因为这些被全世界统计学家所公认的各种统计方法才能深入数据内部,挖掘出公认的价值。 语义引擎 我们知道由于非结构化数据的多样性带来了数据分析的新的挑战,我们需要一系列的工具去解析,https://www.istarscloud.com/electricity/3403.html
9.数据挖掘技术方法(精选十篇)大数据是下一个社会阶段的金矿和石油[3]。这对于审计人员既是挑战又是机遇。作为审计的核心方法———数据分析,能否有效地从各种超大规模的数据集中提取、挖掘有价值的信息,这将直接关乎审计效率。 1.3.2 全数据模式可以增加审计数据分析工作的精准性 在传统审计工作中,由于数据的繁杂,一般采用数据抽样分析。而大数据https://www.360wenmi.com/f/cnkeyg31vygx.html
10.数据挖掘与分析的六种经典方法论最近梳理了一下数据挖掘与分析的常用方法论,这里简要介绍6种模型。 1、CRISP-DM 模型 CRISP-DM是CrossIndustry Standard Process for Data Mining(跨行业数据挖掘标准流程)的字母缩写。CRISP-DM是由一家欧洲财团(时称SIG组织)在20世纪90年代中后期提出来的,是一套用于开放的数据挖掘项目的标准化方法,也是业内公认https://www.niaogebiji.com/article-30475-1.html
11.空间数据挖掘常用的17种方法腾讯云开发者社区PPV课大数据学习社区如果你对大数据感兴趣;如果你想转行做大数据;如果你想了解大数据是怎么改变我们生活,请点标题下蓝字关注PPV课大数据 问题1:空间数据挖掘有哪些常用方法,举例说明一种方法的原理及应用. 答:空间数据挖掘的常用方法有:统计法,聚类方法,关联规则发掘方法,Rough集方法,神经网络方法,云理论,证据理论,模糊https://cloud.tencent.com/developer/article/1101337
12.华为认证大数据方向(HCIE通过HCIE-Big Data认证,将证明您系统理解并掌握大型并行处理数据仓库平台的架构原理、分布式关系型数据库的设计和优化及应用开发;掌握大数据挖掘的基本原理,常用算法、常用挖掘方法、对华为大数据挖掘解决方案FusionInsight Miner和华为云机器学习服务MLS的熟练使用,胜任数据仓库开发、大数据分析、大数据数据挖掘和人工智能的相关http://m.edufly.cn/huawei/hcie/549.html
13.胡焕庸线存在性的大数据分析——中国人口分布特征的生态学及新由此可见, 这个数据体系由于其数据量和和数据源的多样性, 构成了一个大数据集合, 构成使用大数据挖掘方法分析的科学基础。由于缺少我国台湾地区的数据,所以在图中采用虚线表示我国台湾地区的疆域。 1.2 胡焕庸线的计算 根据胡焕庸线的表述, 胡焕庸线是从爱辉(今黑龙江黑河)到云南腾冲的一条直线, 在图1中绘制了https://www.ecologica.cn/stxb/ch/html/2019/14/stxb201812212776.htm