大数据挖掘怎样赋能医保基金监管?大余县信息公开

数据挖掘技术是指从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的,但又是潜在有用的信息和知识的过程。数据挖掘技术在医保监管中具有重要的应用价值,通过对医保大数据的处理和分析,可以发现各种隐蔽性的欺诈骗保行为,从而提供有效的监管手段。此外,数据挖掘技术还可以帮助建立个体化监管模型,对医疗服务方进行精准监管,确保医保基金的合理合法使用。因此,充分应用医保大数据挖掘新技术实施全过程智能监管是解决医保监管痛点和难点的关键,是实现医保高质量发展必不可少的技术手段。

大数据挖掘应用下的医保监管案例分析——上海市医保医师画像模型

1.医保医师画像模型建立的背景

2.医保医师画像模型应用数据挖掘新技术的方法

利用医保大数据优势,结合门诊医师的基本信息、接诊信息以及接诊病人的人群特征信息等指标,上海市医保部门应用数据挖掘技术新方法,对医师画像进行深入分析,筛选出疑点医生并建立预警级别。

该模型主要采用以下方法。

(1)标准化:对数据特征进行归一化处理,消除不同指标之间的量纲影响,以确保它们具有可比性和可解释性。

(3)K均值聚类:将给定的数据集划分为K个不重叠的簇,基于数据点之间的距离来确定簇的分配,并通过迭代的方式优化簇的中心位置。

(4)逻辑回归:将医保医师根据不同特征划分为多个不同类别,且各个类别之间无明确的次序关系。

(5)决策树模型:自上而下对样本数据进行树形分类。每个节点代表一个属性或特征,每个分支代表该属性的不同取值,每个叶节点代表一个类别或一个预测结果。

(6)层次分析(analytichierarchyprocess,AHP):计算出变量权重,并对医保医师进行打分。可以将主观判断量化,并提供一种系统化的方法进行决策。

3.医保医师画像模型的建立步骤

本研究纳入11699名医保医师,通过数据分析和专家意见对其进行多维度全方位的行为研究,确定了30个模型变量,包括接诊信息、“治疗三费”、专家意见三个维度的指标。其中,接诊信息包括当月医生接诊数量及接诊费用、当月医生日均接诊数量及接诊费用、当月医生日接诊最多病人数及最高费用;“治疗三费”即当月医生康复治疗、理疗、中医治疗费用占所有费用的比重;专家意见是将中医、康复专家观点转化为医生开具诊疗项目的数量(单次超量)、频次(频繁开具)、项目间的关联(组合收费)。

第二步,采用无监督机器学习算法,根据降维得到的10个指标变量对医师进行分类,得出每一类医师的特征。选择K均值聚类算法将被观测医师分为无重叠的15类,每个医生都有对应的类别标签。选用无序多分类逻辑回归模型对医师分类结果进行验证,结果显示预测标签一致率较高。

第四步,根据疑点医生分数的分布情况,建立疑点医生的红橙黄三级预警机制。从医生分值的上四分位数到最大值为红色预警,下四分位数到上四分位数为橙色预警,最小值到下四分位数为黄色预警。针对疑点医生进行实地核验,反馈的结果用于优化模型。

4.医保医师画像模型的应用

应用模型确定疑点医师名单,约谈疑点医师,对违反医保规定的执业医师作出暂停医保结算等行政处理,对医保医师能够起到较好的警示作用。医师画像模型提升了医保医师信用体系建设的水平,为规范医师行为提供帮助,对保障医保基金安全具有重要意义。

大数据挖掘新技术在医保监管中的成果与效益

1.医保智能监管系统

上海市建成了覆盖各医保险种和监管对象的全流程、全方位、立体化的医保智能监管系统。该系统涵盖了总览、智能监控、行政执法、信用监管和综合评价五大版块,贯穿线索发现、调查取证、违规处理、结果应用四大环节,具备事前提醒、事中控制、事后追踪三大功能。

该系统具备预警监控、监控案件管理、综合查询、规则筛查等功能,其中最核心的预警监控功能下又分为多卡聚集、三费预警、人床分离、人卡分离、异常检验、一脸多卡、区块链进销存等十多个大数据主题预警模型。截至2023年6月,一脸多卡模型已经覆盖848家药店,上海市医保部门运用三费预警模型将预警医生列为约谈对象,区块链进销存模型已覆盖297家定点机构,对医疗机构和药店进行风险排名。这些模型可以通过大数据、人工智能等技术,在海量医保基金结算信息中自动抓取疑点,并进行智能研判和快速预警。当执法人员在监管系统中看到预警后,便会循着线索前往医院核查,在大数据的助力下让违规行为无处遁形,实现了对医保违规的精准定位、定性和定量管理。

2.医保信息智能监控知识库

上海市建立了医保智能监控知识库,包括基识库、监控规则库、分析指标库和大数据主题模型库,目前已完善优化了24万条监控知识库和6万条规则库。针对长护险居家护理、“互联网+”医疗、DRG/DIP付费等医保新业态,市医保部门探索打造数字化转型场景新应用。结合上海市开展DRG/DIP支付试点,将1.4万余个标准病组、近900个DRG分组库纳入知识库统一管理。将实际检查工作中运用的近200条规则纳入监控规则库,将对民办医疗机构预警检查中运用的近400条指标优化后纳入分析指标库,并扩展使用范围至全市所有的定点医疗机构。

上海医保智能监管系统构成一张“天网”,医保基金监管队伍组成一张“地网”,基金安全“防护网”更加织密扎牢。医保部门应用知识图谱和无监督机器学习等方法构建基于知识图谱的规则逻辑风控预警模型,形成了全市共享和动态更新机制,实现了数据监控和疑点排查100%全覆盖。2021年,通过智能监管系统筛查出8900万余条定点医药机构疑点数据、49.2万就诊购药异常的参保人员。2019年—2023年,上海市医保局对11575家违规定点机构追款5.5亿余元,对11696人次违规参保个人追款2000余万元,共追回医保基金近6亿元。

大数据挖掘新技术应用于医保监管的经验与思考

上海市医保智能监管为其他地区推广医保大数据挖掘与应用、推进医保信息化建设提供了参考经验。然而也存在一些问题与挑战,比如当地医保信息平台与国家医保信息平台对接不及时,数据挖掘的深度及广度有限等。因此,提出以下思考。

1.完善法规及政策,为医保监管提供制度保障

2.加强医保大数据平台建设,及时对接国家平台

目前,上海市医保信息平台数据比较混乱,未做到数据的规范统一和完整,不能及时与国家信息平台对接。医保信息平台的建设应规范数据采集和录入流程,建立数据清洗和校验机制,排除数据中的错误和重复信息等,提高数据可信度和可用性,推进医保平台标准化建设。建议依托全国统一大平台,从完整度、准确性、标准化、可用性、安全性等方面持续对医保大数据开展动态治理。

4.加强多部门协作,让有需求的应用尽快落地

医保监管保障了医保基金的安全性和可持续性,同时对于优化医疗资源配置、提升医疗服务质量以及保障患者权益等具有重要的意义。通过应用大数据分析技术和智能监管手段,提高了监管效率和精细化水平,推动了医保管理的现代化进程。上海市医保智能监管的建设与发展提供了成功的范例,通过充分应用医保大数据挖掘技术,建立医保安全和数据模型,实现了医保数据质量的提升和监管水平的精细化。下一步,上海市应继续强化监管力度,丰富智能化监管手段,进一步深化部门协作,不断提高医保监管效能,推动医保事业高质量可持续发展。(ZGYB-2023.10)

原标题:《数据挖掘技术赋能医保监管——基于上海市医保监管实践》

THE END
1.数据挖掘的分析方法可以划分为关联分析序列模式分析分类分析和数据挖掘是从大量数据中提取有用信息的方法,主要分为四种分析方式:关联分析、序列模式分析、分类分析和聚类分析。在本指南中,我们将详细介绍这四种方法的实现过程,并提供相应的代码示例。 数据挖掘流程 首先,我们需要明确数据挖掘的基本流程,如下表所示: 流程图 https://blog.51cto.com/u_16213297/12863680
2.数据挖掘机器之心数据挖掘的方法包括监督式学习、非监督式学习、半监督学习、增强学习。监督式学习包括:分类、估计、预测等。非监督式学习包括:聚类,关联规则分析等。 举例来说,零售公司往往会跟踪客户的购买情况,假如其发现某个客户购买了大量的真丝衬衣,这时数据挖掘系统就在此客户和真丝衬衣之间创建关系。销售部门就会看到此信息,直接https://www.jiqizhixin.com/graph/technologies/7904de1e-5ab5-4f0a-aa60-693cb2978766
3.数据挖掘的四种基本方法数据挖掘的四种基本方法 东奥美国注册管理会计师 2024-12-06 14:51:12 遗传算法 遗传算法是一种依据微生物自然选择学说与基因遗传原理的恣意优化算法,是一种仿生技能全局性提升办法。遗传算法具有的暗含并行性、便于和其他实体模型交融等特性促使它在数据发掘中被多方面运用。https://www.dongao.com/cma/zy/202406204447292.html
4.数据挖掘七种常用的方法汇总数据挖掘基本方法数据挖掘七种常用的方法汇总 数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。这个定义包括几层含义:数据源必须是真实的、大量的、含噪声的;发现的是用户感兴趣的知识;发现的知识要可接受、可理解https://blog.csdn.net/api_ok/article/details/132065941
5.数据挖掘的几种方法有哪些帆软数字化转型知识库数据挖掘的方法包括分类、聚类、回归、关联规则、序列模式、异常检测和降维技术等。其中,分类是一种常见且重要的数据挖掘方法,通过对数据进行标记,帮助识别数据所属的类别。分类算法包括决策树、支持向量机和神经网络等。分类算法的核心在于通过训练集来生成分类模型,再用这个模型对新数据进行分类。比如在电子邮件分类中,https://www.fanruan.com/blog/article/594745/
6.常见的数据挖掘方法包括()。常见的数据挖掘方法包括( )。 A、监督学习 B、半结构化数据 C、无监督学习 D、半监督学习 E、非结构化数据 查看答案解析 点击进入“每日一练——免费在线测试”>> 中级经济师:每日一练《中级人力》(03.01) 中级经济师:每日一练《中级工商》(03.01) 中级经济师:每日一练《中级财政税收》(03.01) 中https://www.chinaacc.com/zhongjijingjishi/shiti/zh20230301084337.shtml
7.数据挖掘技术主要包括哪些?数据挖掘的技术,可分为:统计方法、机器学习方法、神经网络方法和数据库方法。统计方法,可细分为:回归https://m.imooc.com/wenda/detail/508957
8.数据挖掘与分析的六种经典方法论3、DMAIC方法 六西格玛(Six Sigma,6 Sigma)是一种项以数据为基础,追求“零缺陷”的质量管理方法。六西格玛在商业中应用是DMAIC,包括五个步骤:定义(Define)、度量(Measure)、分析(Analyze)、改进(Improve)和控制(Control)。DMAIC方法在商业领域和环境中已得到了成功应用,它在数据挖掘项目中也能寻得一席之地。 https://www.niaogebiji.com/article-30475-1.html
9.数据挖掘常用方法有几类?(1)分类分析:分类是指按照某种分类模型将具有相同特征的数据对象划分为同一类。 (2)聚类分析:聚类分析是一种创建数据对象集合的方法,这种数据集合也称为簇(Cluster),聚类分析力求使得同簇成员尽可能相似,异簇成员尽可能相异 (3)关联分析:关联分析是指找出多个事物之间具有的规律性(关联),这一概念最早是由Rakesh https://easylearn.baidu.com/edu-page/tiangong/bgkdetail?id=74e89e39eefdc8d376ee32df&fr=search
10.商战数据挖掘:你需要了解的数据科学与分析思维分类模型、回归模型和因果模型通常用有监督方法构建;相似匹配、链路预测和数据整理采用两种方法皆可;聚类、共现分组和画像分析则通常用无监督方法解决。这些分析方法的基础就是我们要展开讨论的数据科学的基本原理。 回归与分类是两类有监督型数据挖掘方法,两者的区别在于目标变量的类型不同。回归的目标变量是数值型,而https://www.ituring.com.cn/book/tupubarticle/28952
11.数据资产价值挖掘的主要方法和技术信息技术信息技术机器学习与数据挖掘 未来展望 一、数据资产的定义与价值 1. 数据资产的内涵 数据资产是指组织在经营过程中收集、存储、管理和使用的各种数据,包括结构化数据(如数据库、电子表格等)和非结构化数据(如文本、图像、音视频等)。这些数据蕴含着巨大的商业价值,已经成为现代企业不可或缺的战略资源。 https://www.zgcsswdx.cn/info/10361.html
12.科学网—时空视频数据挖掘:让罪犯无所遁迹基于训练数据学习事件模型的事件检测方法在提取特征之后,采用隐Markov模型或者动态贝叶斯网络等方法来分析各个关键帧特征值之间的关系,进而挖掘各个镜头之间的语义关系并检测出一些典型的事件。基于聚类分析的事件检测方法包括时空衍生和协同嵌入式原型等,都是通过对权重矩阵进行谱图分割来检测出事件片断,权重矩阵通过计算视频https://blog.sciencenet.cn/blog-528739-858610.html
13.数据处理方法有哪些,掌握这些技巧让你轻松应对数据分析问题1.预处理方法:这种方法主要是在数据采集之后进行的,目的是减少数据所包含的噪声成分和冗余信息,提高结果的准确性。预处理方法一般包括数据清洗、数据采样、数据变换等。 2.数据挖掘方法:数据挖掘是从大量数据中发现隐藏在其中的有价值的信息的过程。数据挖掘方法包括分类、聚类、关联规则挖掘、异常检测等。 https://www.jiandaoyun.com/fe/sjclffynxz/
14.研究生课程简介本课程以引导学生掌握实际数据挖掘技术为目标,让学生从基本数据操作入手,逐步练习数据挖掘技术的各个环节,包括数据预探索、数据清洗、数据分析和建模、结果可视化等。将理论紧密融入实际操作,扎实掌握数据挖掘中的各项技能,最后应用于商务智能领域。 《优化理论与决策方法》https://it.uibe.edu.cn/yjsjx/pyfa_yjs/9e574703ee89482896894472223a3e3c.htm
15.数据挖掘及其在金融中的应用主要是采用人工智能相关方法作出预测,它能够实现统计回归预测和统计时间序列预测的功能,并且假设条件要比统计预测要宽松得多,甚至有些没有什么假设条件,精度上也与他们相当甚至比它们要好。 数据挖掘的类型,可能还不止这些,以上仅是一般的界定,正因为我们对数据挖掘的类型作出了界定,不同的类型也有对应的挖掘模型与算法https://www.jianshu.com/p/474504df2bdd
16.网络营销全部A.独立访客数B.人均购买量C.货周转率D.网站登录次数【注释】:第九章第九节 第269页 客户视角考核指标包括20项,但不包括货周转率 59.数据挖掘分析方法中,聚类分析的主要目的是()。 A.找出数据之间的属性联系,形成关联规则B.把一组个体按照相似性归成若干类别,形成新的类标识C.把数据的关联性与时间联系起来,https://www.wjx.cn/xz/261160017.aspx
17.测试和验证(数据挖掘)MicrosoftLearn创建将财务收益或成本与使用挖掘模型相关联的“利润图”,以便评估建议的值。 这些度量不能准确回答数据挖掘模型是否能解决商业问题等之类的问题;但它们提供了可用于评估预测性分析的可靠性的目标度量值,并指导您是否在开发流程中使用特定遍历的决策。 本节中的主题提供了每个方法的概述,并引导您使用 SQL Server 数据挖https://msdn.microsoft.com/zh-cn/library/ms174493.aspx
18.数据挖掘频繁项集挖掘方法中AprioriFPApriori算法是Agrawal和Srikant于1994年提出,是布尔关联规则挖掘频繁项集的原创性算法,通过限制候选产生发现频繁项集。Apriori算法使用一种称为逐层搜索的迭代方法,其中k项集用于探索(k+1)项集。具体过程描述如下:首先扫描数据库,累计每个项的计数,并收集满足最小支持度的项找出频繁1项集记为L1。然后使用L1找出频繁https://developer.aliyun.com/article/1400152
19.摩托车半热熔胎使用时需要注意哪些事项?适用于高速行驶的场合基于数据挖掘方法,对摩托车半热熔轮胎市场消费者的偏好进行了分析,通过对消费者的品牌、性能、价格等方面的偏好进行分析,可以为厂家提供市场营销方面的参考,有助于提高半热熔轮胎的市场竞争力。 本文利用网络爬虫技术,从互联网上收集了大量的与摩托车半热熔轮胎相关的数据,数据包括半热熔轮胎的品牌、型号、价格、性能参https://www.dongchedi.com/article/7233349793031045647
20.常见的数据挖掘方法有()中级经济师考试题库常见的数据挖掘方法有()。 多选题常见的数据挖掘方法有()。 A 、结构化学习 B 、半监督学习 C 、监督学习 D 、无监督学习 E 、非结构化学习 扫码下载亿题库 精准题库快速提分 参考答案 【正确答案:B,C,D】 数据挖掘以解决实际问题为出发点,融合了多学科领域的知识,核心任务是对数据关系和特征进行探索。https://www.bkw.cn/tiku/Zdjbo.html
21.数据挖掘常用的方法通过对大数据高度自动化地分析,做出归纳性的推理,从中挖掘出潜在的模式,可以帮助企业、商家、用户调整市场政策、减少风险、理性面对市场,并做出正确的决策。目前,在很多领域尤其是在商业领域如银行、电信、电商等,数据挖掘可以解决很多问题,包括市场营销策略制定、背景分析、企业管理危机等。大数据的挖掘常用的方法有分类、https://www.cda.cn/view/124702.html