数据挖掘技术是指从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的,但又是潜在有用的信息和知识的过程。数据挖掘技术在医保监管中具有重要的应用价值,通过对医保大数据的处理和分析,可以发现各种隐蔽性的欺诈骗保行为,从而提供有效的监管手段。此外,数据挖掘技术还可以帮助建立个体化监管模型,对医疗服务方进行精准监管,确保医保基金的合理合法使用。因此,充分应用医保大数据挖掘新技术实施全过程智能监管是解决医保监管痛点和难点的关键,是实现医保高质量发展必不可少的技术手段。
大数据挖掘应用下的医保监管案例分析——上海市医保医师画像模型
1.医保医师画像模型建立的背景
2.医保医师画像模型应用数据挖掘新技术的方法
利用医保大数据优势,结合门诊医师的基本信息、接诊信息以及接诊病人的人群特征信息等指标,上海市医保部门应用数据挖掘技术新方法,对医师画像进行深入分析,筛选出疑点医生并建立预警级别。
该模型主要采用以下方法。
(1)标准化:对数据特征进行归一化处理,消除不同指标之间的量纲影响,以确保它们具有可比性和可解释性。
(3)K均值聚类:将给定的数据集划分为K个不重叠的簇,基于数据点之间的距离来确定簇的分配,并通过迭代的方式优化簇的中心位置。
(4)逻辑回归:将医保医师根据不同特征划分为多个不同类别,且各个类别之间无明确的次序关系。
(5)决策树模型:自上而下对样本数据进行树形分类。每个节点代表一个属性或特征,每个分支代表该属性的不同取值,每个叶节点代表一个类别或一个预测结果。
(6)层次分析(analytichierarchyprocess,AHP):计算出变量权重,并对医保医师进行打分。可以将主观判断量化,并提供一种系统化的方法进行决策。
3.医保医师画像模型的建立步骤
本研究纳入11699名医保医师,通过数据分析和专家意见对其进行多维度全方位的行为研究,确定了30个模型变量,包括接诊信息、“治疗三费”、专家意见三个维度的指标。其中,接诊信息包括当月医生接诊数量及接诊费用、当月医生日均接诊数量及接诊费用、当月医生日接诊最多病人数及最高费用;“治疗三费”即当月医生康复治疗、理疗、中医治疗费用占所有费用的比重;专家意见是将中医、康复专家观点转化为医生开具诊疗项目的数量(单次超量)、频次(频繁开具)、项目间的关联(组合收费)。
第二步,采用无监督机器学习算法,根据降维得到的10个指标变量对医师进行分类,得出每一类医师的特征。选择K均值聚类算法将被观测医师分为无重叠的15类,每个医生都有对应的类别标签。选用无序多分类逻辑回归模型对医师分类结果进行验证,结果显示预测标签一致率较高。
第四步,根据疑点医生分数的分布情况,建立疑点医生的红橙黄三级预警机制。从医生分值的上四分位数到最大值为红色预警,下四分位数到上四分位数为橙色预警,最小值到下四分位数为黄色预警。针对疑点医生进行实地核验,反馈的结果用于优化模型。
4.医保医师画像模型的应用
应用模型确定疑点医师名单,约谈疑点医师,对违反医保规定的执业医师作出暂停医保结算等行政处理,对医保医师能够起到较好的警示作用。医师画像模型提升了医保医师信用体系建设的水平,为规范医师行为提供帮助,对保障医保基金安全具有重要意义。
大数据挖掘新技术在医保监管中的成果与效益
1.医保智能监管系统
上海市建成了覆盖各医保险种和监管对象的全流程、全方位、立体化的医保智能监管系统。该系统涵盖了总览、智能监控、行政执法、信用监管和综合评价五大版块,贯穿线索发现、调查取证、违规处理、结果应用四大环节,具备事前提醒、事中控制、事后追踪三大功能。
该系统具备预警监控、监控案件管理、综合查询、规则筛查等功能,其中最核心的预警监控功能下又分为多卡聚集、三费预警、人床分离、人卡分离、异常检验、一脸多卡、区块链进销存等十多个大数据主题预警模型。截至2023年6月,一脸多卡模型已经覆盖848家药店,上海市医保部门运用三费预警模型将预警医生列为约谈对象,区块链进销存模型已覆盖297家定点机构,对医疗机构和药店进行风险排名。这些模型可以通过大数据、人工智能等技术,在海量医保基金结算信息中自动抓取疑点,并进行智能研判和快速预警。当执法人员在监管系统中看到预警后,便会循着线索前往医院核查,在大数据的助力下让违规行为无处遁形,实现了对医保违规的精准定位、定性和定量管理。
2.医保信息智能监控知识库
上海市建立了医保智能监控知识库,包括基识库、监控规则库、分析指标库和大数据主题模型库,目前已完善优化了24万条监控知识库和6万条规则库。针对长护险居家护理、“互联网+”医疗、DRG/DIP付费等医保新业态,市医保部门探索打造数字化转型场景新应用。结合上海市开展DRG/DIP支付试点,将1.4万余个标准病组、近900个DRG分组库纳入知识库统一管理。将实际检查工作中运用的近200条规则纳入监控规则库,将对民办医疗机构预警检查中运用的近400条指标优化后纳入分析指标库,并扩展使用范围至全市所有的定点医疗机构。
上海医保智能监管系统构成一张“天网”,医保基金监管队伍组成一张“地网”,基金安全“防护网”更加织密扎牢。医保部门应用知识图谱和无监督机器学习等方法构建基于知识图谱的规则逻辑风控预警模型,形成了全市共享和动态更新机制,实现了数据监控和疑点排查100%全覆盖。2021年,通过智能监管系统筛查出8900万余条定点医药机构疑点数据、49.2万就诊购药异常的参保人员。2019年—2023年,上海市医保局对11575家违规定点机构追款5.5亿余元,对11696人次违规参保个人追款2000余万元,共追回医保基金近6亿元。
大数据挖掘新技术应用于医保监管的经验与思考
上海市医保智能监管为其他地区推广医保大数据挖掘与应用、推进医保信息化建设提供了参考经验。然而也存在一些问题与挑战,比如当地医保信息平台与国家医保信息平台对接不及时,数据挖掘的深度及广度有限等。因此,提出以下思考。
1.完善法规及政策,为医保监管提供制度保障
2.加强医保大数据平台建设,及时对接国家平台
目前,上海市医保信息平台数据比较混乱,未做到数据的规范统一和完整,不能及时与国家信息平台对接。医保信息平台的建设应规范数据采集和录入流程,建立数据清洗和校验机制,排除数据中的错误和重复信息等,提高数据可信度和可用性,推进医保平台标准化建设。建议依托全国统一大平台,从完整度、准确性、标准化、可用性、安全性等方面持续对医保大数据开展动态治理。
4.加强多部门协作,让有需求的应用尽快落地
医保监管保障了医保基金的安全性和可持续性,同时对于优化医疗资源配置、提升医疗服务质量以及保障患者权益等具有重要的意义。通过应用大数据分析技术和智能监管手段,提高了监管效率和精细化水平,推动了医保管理的现代化进程。上海市医保智能监管的建设与发展提供了成功的范例,通过充分应用医保大数据挖掘技术,建立医保安全和数据模型,实现了医保数据质量的提升和监管水平的精细化。下一步,上海市应继续强化监管力度,丰富智能化监管手段,进一步深化部门协作,不断提高医保监管效能,推动医保事业高质量可持续发展。(ZGYB-2023.10)
原标题:《数据挖掘技术赋能医保监管——基于上海市医保监管实践》