产品干货:医疗大数据平台建设实践数据仓库建设指南工作流

在过去的2010-2020的十年里,国内大力投资于医疗系统信息化建设,产生并积累了大量医疗数据,迫切需要通过人工智能及大数据等技术来挖掘和实现数据价值,需要整合更加先进的技术基础设施以更有效的方式进行数据集成、数据标准化以及数据分析,最终实现医疗大数据更有效的应用。2020年新冠疫情爆发进一步推动了国内医疗健康产业的数字革命,AI、大数据、数字孪生等技术与医疗健康产业不断结合,促使医疗健康产业对于数据的利用又上了一个新的台阶。

同时,来自不同方面的要素也在推动着医疗大数据产品市场的发展。医院方面,公立医院转型压力与日俱增,需要引入数字化医疗管理解决方案发挥电子病历(EMR)的潜力以提高临床研究效率、降低人工成本、提高疾病诊断和治疗质量、更好地管理病人。

医院正逐渐推出创新业务模式,注重学术研究、临床治疗、转化医学及患者管理,推升了对医疗数据集成及应用的需求;许多大型三甲医院已引入先进医疗系统以提升医院管理效率,缓解中国医疗资源的短缺和分配不均。政府投资将进一步流入医院细分市场,支持其继续升级系统,提升与多个监管机构平台的数据互连性。

区域卫健方面,经过全民信息健康平台的初步建设,积累了大量的数据,这些数据如何产生更大的应用价值,如何在区域里面互联互认,如何跨区域互联互认方面有明确的需求。医保局方面,管理每年数万亿的医保「钱袋子」,对于如何使用数据来更好地管理医保基金有强烈的需求。疾控方面,随着全球疫情的频繁爆发,如何使用数据来更加快速、精准的进行疫情风险的管控有强烈的需求。

二、场景和需求分析

我们可以从数据流转的方向分析医疗大数据不同类型的应用和场景。在医疗行业,绝大部分数据产生于医疗机构内,例如我们去医院的检验、检查、门诊、住院、医保结算等数据都在医院里面产生,数据最直接的流转是在医疗机构内流动。除了医院使用数据以外,数据也会通过数据上报或者采集的形式流动到对应的政府机构,包括、卫健委、医保局以及疾控中心等。

因此,医疗大数据平台面向的主要场景括医疗机构(各类公立、民营的医院和医疗集团)、卫健委、疾控中心和医保局。对于不同的场景,其数据的处理方式会存在一些差异。下面按照四个场景进行分析。

1.医疗机构场景

在医疗健康大数据与电子病历评级等政策的强驱动下,各级医院对于医疗大数据平台的采购有比较切实的需求。信息化程度高的三级医院(尤其是三甲)出于电子病历评级、科研论文发表与临床应用的需求来使用大数据平台。对于医院来说,在数据治理和使用方面以下三个问题[2]。

2.区域卫健场景

在2016年,国家发布了《国务院办公厅关于促进和规范健康医疗大数据应用发展的指导意见》明确要实施全民健康保障信息化工程,要全面建成互通共享的国家、省、市、县四级人口健康信息平台。

同年,国家卫生计生委规划与信息司和国家卫生计生委统计信息中心发布了《省统筹区人口健康信息平台应用功能指引》明确了全面健康信息平台的核心功能,其中明确要建设数据采集交换、数据规范上报、大数据应用支撑和健康档案服务等内容。2020年国家卫健委发布了医院信息互联互通标准化成熟度评测方案。

目前区域卫健的全民健康信息平台各地都有一些基础的建设,例如三大库数据完成了一轮采集、有了初步的协同服务、也有了一些例如综合监管和健康档案的数据应用。但整体来看也存在部分问题。

针对以上问题,医疗大数据平台应该解决的问题主要有三点:数据治理、数据协同和更快的数据洞察。

3.疾控中心场景

新冠疫情的爆发在疾控场景开辟了数据应用的新战场,也让医疗健康行业对数据应用走向了新的阶段。例如我们每天的健康码、核酸检测、疫苗以及在医院的就诊都会产生大量的数据,这些数据需要在疾控中心和卫健委等系统中进行上报、集成、标准化、治理、匹配融合等等数据加工操作,这些操作都是对应的大数据平台上进行。

在疾控场景下,数据的处理和应用有独特的特点。

4.医保场景

2018年5月31日,国家医疗保障局正式挂牌。2020年7月国家医疗保障局印发了《医疗保障信息平台数据归集技术规范》等四部规范的通知,其中《医疗保障信息平台数据中台建设及应用指南》中将数据中台的建设标准规范进行了详细的定义。建设内容包括医保数据数仓建设、数据的归集建设,数据模型管理、数据质量管理、数据共享管理、数据分析等服务的建设。

相对于医疗机构、区域和疾控等医疗场景,由于国家医保局的统一规划,医保信息平台和大数据平台的建设更为靠前,在建设指南出台前期就有阿里、腾讯等互联网公司参与了建设指南的输出,从指南的名字包含”数据中台”可以看到有互联网公司大数据平台建设的印记,建设的范围和模式跟互联网公司的大数据平台更加贴紧。因此,在医保大数据平台这个赛道,对于互联网公司更为有利。

对于省级医保数据中台的建设,主要的需求有以下几点:

三、产品建设实践1.产品洞察分析

基于以上四大目标场景的分析,我们可以得出以下洞察和的对应的产品和服务方案。

(1)四大场景基础的数据治理场景类似,上层的数据应用存在场景化差异

在以上四个不同的场景里面整体的需求有相似、相通之处,可以总结为底层的大数据引擎、医疗数据治理层,数据应用支撑和上层的数据应用部分。

数据治理及以下部分的功能类似,针对不同的场景内容和配置的方式可能有差异。例如,数据仓库建模的工具是可以复用的,数据质控平台的工具是可以复用的,数据加工的工作流工具也是可以复用的,但是针对不同的场景数据建模的方法、数据质控的内容、数据加工的流转逻辑是有差异的。

上层的数据应用部分,因为都是针对了具体的场景,都有自己的不同之处。例如,医保场景有基金收支洞察,医院和区域卫健场景有健康档案,疾控场景有重点人群管控等。这些应用基于数据的应用,那使用的数据还是底层治理的数据,因此对于上层应用部分可以结合下层的数据和一些应用搭建工具来组装,当然部分应用还需要定制化的开发。通过数据服务模块和可视化的报表搭建工具可以完成一些数据应用的快速开发和配置。

因此,整个医疗大数据产品的产品矩阵分为四个部分:大数据引擎、医疗数据治理套件、数据应用支撑、数据应用。

在以上的四个场景中,绝大部分医疗机构都没有数据部门。部分医院逐渐的开始在信息科中有一些做数据开发和分析的角色,而其他运用主体都没有对应角色的人来操作大数据的平台。在这种情况下,运用主体需要的产品不光是平台和工具,而是基于平台和工具的场景化数据服务。有一个形象的比喻叫做『交钥匙工程』。提供数据质控工具只是服务的一部分,提供数据治理服务和提升数据治理效果才更契合实际需求。

(3)抽象医疗数据处理流程,使之产品化

既然要提供大数据平台+规则+服务的模式,通用的大数据平台提供的主要是代码和流程的编辑工具,对于医疗数据规则的积累无法很好的产品化。将医疗数据处理的的过程抽象成可配置化的、面向场景的医疗数据处理步骤是一个不错的方案。从更直观的角度来看,可以把这种配置叫做医疗数据加工的算子,每一个算子不单单是通用的数据过滤、数据关联等操作,而是一个有业务含义的数据处理过程。

例如,把数据质控抽象成一个算子,在工作流中配置一个算子就可以完成整个表的质控;将患者主索引抽象成一个算子,配置患者主索引算子就可以完成主索引数据合并的配置;将医保数据转码抽象成一个算子,在工作流中用一个算子就可以完成医保数据从地方码转换为国家标准编码。这种经过抽象过的可视化配置算子一方面在产品层面沉淀了医疗数据处理的方法,一方面降低了产品的实施和维护成本。

(4)一体化的大数据平台

由于医疗数据的处理基于上游的数据采集标准和面向数据应用的数据应用标准。标准的变动会影响到数据处理流程全链路的变动,例如标准变更以后对应的数据模型表、数据工作流、数据指标、展示层的BI报表都需要做一些变更。

在这种情况下,割裂的数据平台和工具会带来很高的数据治理和运维成本,为医疗数据的使用套上不必要的枷锁。因此,提供一体化的大数据平台可以更有效地降低数据治理和运维成本。例如数据标准的变更可以借助于数据资产计算的血缘关系,自动通知到下游的数据工作流、数据指标和报表的变更,进一步降低数据治理的成本,提高数据的可用性。

2.核心模块功能特性

基于以上的分析和在具体项目中的实践,医疗数据中台提供了四层产品,分别是以下模块。

(1)大数据处理引擎层

大数据处理引擎:腾讯集团已经有比较成熟的大数据能力和平台产品套件,包括云Spark、Flink、Hive、数据湖基础能力。

数据工作流:将医疗数据处理抽象成具体的可视化配置算子(例如数据质控算子、患者主索引算子、医保转码算子等),通过表和算子的向导配置完成数据工作流的组装,同时基于TBDS调度和任务运行的能力,生成对应的Spark、Shell、HiveSQL任务下发到TBDS执行。

另外,针对数据工作流提供了更加全面和细致的监控功能。例如每个算子每次实例的数据条数,每个算子的任务运行状态等。内容沉淀方面,针对具体场景沉淀数据工作流的模板,方便后期在具体项目实施中一键配置。

标准管理平台:提供了医疗数据标准的管理和维护能力。跟下游的数据工作流、数据质控打通。定义好的数据标准可以直接用于质控规则的生成,避免多次配置,保证规则的一致性。内容沉淀方面,沉淀具体场景下的数据标准,积累各类医学数据标准。

数据质量平台:跟数据标准和数据工作流打通。建表后自动创建默认的质量规则,同时提供多种规则模板。配置的质控规则可以在数据工作流中用算子的方式调用,让数据质控可以在工作流的任何节点以任何频率发起。

同时,由于医疗场景下的很多数据都不是直接去读业务的备库,是有专门的厂商整理好数据到前置机,然后再从前置机同步数据,势必会造成数据的不一致,所以数据的一致性对账尤为重要。因此,数据质量平台提供了从数据接入对账、到数据接入趋势监控到医疗机构质量评分三个阶段的数据质量保障。

根据标准自动生成的质控规则配置

在数据质控的展现层面提供面向不同场景的质控Dashboard,做到一份质控数据根据场景的需要按照不同方式展示。内容沉淀方面,沉淀和内置面向场景的质控规则。例如,国家医保的数据质控规则。

医疗机构场景下源表-接入表对账监控

疾控场景下源表-接入表对账监控

数据资产平台:通过从数据工作流、指标管理平台、数据服务平台中获取元数据,通过元数据的计算来生成全链路的血缘关系。为数据变更影响分析提供有利的依据。同时,数据资产基于不同的场景提供资产的分类,沉淀场景化的数据资产目录。

指标管理平台:指标管理平台提供原子指标、维度、衍生指标的定义。同时指标的运行会跟数据工作流互通。指标管理平台的核心在于沉淀各个场景下的常用指标。例如,结合医保数据仓库,沉淀医保运行检测等数据应用的指标。

(3)数据应用支撑层

数据服务平台:数据服务平台处理提供最常见的数据查询服务以外,也提供了医疗场景下常用的XML数据写入服务,支持共享文档等内容可以通过数据服务的方式进行配置。同时,数据资产也可以采集到数据服务的内容,可以分析潜在的数据变更对数据服务的影响。另外,数据服务平台作为数据应用的开发方式之一,沉淀了健康档案等数据应用常用的数据查询服务。

数据可视化平台:数据可视化平台包括数据分析平台和3D可视化数字孪生平台。数据可视化平台结合医疗数据中台的能力,提供了政府监管、医疗运营分析可视化等模板。3D可视化数字孪生平台基于领先的3D可视化能力,结合医疗数据中台的数据和智能的AI算法,提供了医疗场景下3D的可视化产品能力。

(4)数据应用层

数据应用面向不同的场景,结合数据应用支撑层开发面向行业的数据应用。例如360患者浏览器、医保基金收支洞察等。

四、未来规划

当前医疗数据中台产品已经在大型医有一些项目在逐步落地,随着项目的落地产品的能力也在逐渐的补全。未来的产品规划大概会从以下几个方面发力:

参考资料:

[1,2]安信证券.从医渡科技赴港上市看医疗大数据解决方案行业潜力如何?

作者:jayshi,腾讯CSIG产品;公众号:腾讯大讲堂

本文由@腾讯大讲堂原创发布于人人都是产品经理,未经许可,禁止转载

THE END
1.精准医疗的突破:全新降数据管理平台助力疾病预防与治疗健康数据管理平台是专门用于管理、集成和分析健康数据的软件解决方案。 这些平台通过提供数据收集、存储、处理和分析工具,促进高效的数据处理、遵守法规以及改善医疗保健结果。 据QYResearch调研团队最新报告“全球健康数据管理平台市场报告2024-2030”显示,预计2030年全球健康数据管理平台市场规模将达到14.2亿美元,未来几年年https://blog.csdn.net/2401_89472157/article/details/144346119
2.降医疗大数据北方中心主体今落成降医疗国家健康医疗大数据北方中心主体今落成 齐鲁壹点 2020-01-17 15:09:54 免费咨询 1月17日,汇集中国北方地区约6亿人口的健康医疗数据,全国行业规模最大的国家健康医疗大数据北方中心,主体落成。 该数据中心由济南城市投资集团有限公司全资子公司山东新泉城置业有限公司投资建设,中建八局二公司承建,目前1栋科研楼、3栋https://aiqicha.baidu.com/qifuknowledge/detail?id=10028892634
3.区域降医疗大数据平台整体解决方案健康医疗大数据具有规模巨大、类型多样、增长迅速等特征, 如何绕开层层障碍,实现健康医疗大数据的高效汇聚、 有效治理,并实现基于大数据分析的决策支持、 医药研发与健康管理等业务开展,是区域健康医疗信息化建设面临的重要挑战。 方案概述 区域健康医疗大数据平台整体解决方案以区域内各类医疗机构健康医疗数据采集与互联互通为https://www.bonc.com.cn/medical-qyjkyl
4.医保大数据平台平台旨在深入聚焦医保医改领域重大政策和改革任务,开展前瞻性和战略性的研究,充分发挥大数据和互联网+的力量,组建公共卫生、临床医学、信息技术等多学科交叉团队,着力开展智慧应用、公共政策评估和医疗服务评价等方面的工作,打造我国医疗保障事业的一流智库、一流实验室、一流平台,围绕医疗保障和生命健康大数据的采集模式优https://nihds.zju.edu.cn/ybdsjzx/list.htm
5.降医疗大数据浪潮健康是浪潮集团下属子公司,是国内领先的健康医疗大数据平台服务运营商,依托自主研发健康医疗大数据平台(HDSP 2.0),以及领先的大数据标准、成熟的服务运营体系和“平台+生态”合作发展模式,已经与济南、天津、内蒙古、南宁、中南大学等大型医教研集团开展战略合作,形成全国布局。 https://www.inspur.com/lcjtww/jkyldsj/index.html
6.智慧医疗大数据平台有哪些类型帆软数字化转型知识库智慧医疗大数据平台主要有以下几种类型:1、临床数据平台 2、健康管理平台 3、远程医疗平台 4、医学影像数据平台 5、科研数据平台。临床数据平台主要用于记录和管理病人的所有临床数据,例如病历、诊断和治疗方案等。这类平台能够帮助医疗机构提高诊疗效率并确保数据的准确性和完整性,进而为医生提供重要的决策支持。通过整合https://www.fanruan.com/blog/article/1263/
7.医疗大数据医疗信息化医疗大数据解决方案“移动云”是中国移动基于自研的先进技术打造的安全智慧云品牌,充分发挥“央企保障、安全智慧、算网一体、属地服务”优势,为客户提供行业领先的云计算、大数据、人工智能等产品和专业服务,上线自研产品超230款,属地机构覆盖全国31省,提供7*24小时服务。https://ecloud.10086.cn/portal/solution/medical/database
8.医疗大数据平台这些信息孤岛造成各系统间信息共享差、利用率低,给临床科研、医院管理和患者服务造成很大障碍。 基于医疗大数据平台存储数据,开发多个方向的应用系统,比如医疗数据智能搜索应用、患者服务应用和医院运营应用。能更好的帮助医生进行医疗数据的深入挖掘分析利用。打通信息孤岛,实现对病历文书的检索、研究、统计。http://www.tri-stones.com/s3.html
9.解决方案降医疗大数据平台在医疗健康数据治理与互联互通的基础上,打造全方位健康医疗大数据平台,对区域内分散的健康档案、电子病历、医学影像、基因等多元化健康医疗大数据进行规范安全的采集治理、共享交换、存储计算、数据管控,并通过探索式数据分析及数据挖掘,支撑综合管理决策、医疗科研和公共卫生等方向的大数据应用研究,服务居民、医生、科研机构、https://www.ruisoft.com/solution-regional-02.html
10.医疗行业医疗大数据平台建设方案.doc医疗行业医疗大数据平台建设方案TOC\o"1-2"\h\u1489第一章:概述 23481.1项目背景 393831.2项目目标 3232171.3项目意义 329636第二章:医疗大数据平台架构设计 3261482.1技术架构 3186002.2数据架构 4237792.3应用架构 429384第三章:数据采集与整合 5265063.1数据采集方式 570163.2数据整合策略 5268973.3数据清洗与预处理 69531第https://www.renrendoc.com/paper/349288907.html
11.医疗降大数据平台医疗健康大数据平台 数据采集 数据治理 数据应用 产业赋能 产品描述 东软医疗健康大数据平台,由数据中台、AI应用框架和基于大数据的智慧应用三大部分组成,通过平台汇聚各类医疗健康数据,形成完整的大数据体系,实现基于大数据和AI的智慧应用创新,赋能惠民、惠医、惠政和惠业。https://www.neusoft.com/cn/products/2557/
12.打造降医疗大数据平台通过“医疗健康大数据 物联网 在线穿戴监测设备 互联网医疗”,优化医疗资源合作供给,建立医疗健康大数据与患者个人之间连接与沟通的平台,开启精准健康医疗大数据的全新入口。 重庆联通大渡口分公司相关负责人表示,通过此次签约,公司将进一步加强与重庆万家燕健康产业集团的交流与合作,尽全力协助重庆万家燕健康产业集团在医疗https://wap.cqcb.com/shangyou_news/NewsDetail?classId=886&newsId=2747043
13.黄伟红:看湘雅医院如何搭建医疗大数据平台@MedSci湘雅医院医疗大数据平台建设实践 湘雅医院“移动医疗”教育部实验室是教育部唯一设在医院里面的医疗信息化实验室,主要探索交叉学科如何走向科研和技术前沿,以及成果转化的思路。 2014年开始,着眼于提高患者就诊体验与质量、提升医生工作效率和能力、助力医疗改革深化模式升级、孵化重大医疗信息化成果、支撑健康医疗大数据产业应https://m.medsci.cn/article/show_article.do?id=b9db10354386
14.王持,李超,陈旭,等.面向医疗临床科研的大数据平台[J].集成5 期王? 持,等:面向医疗临床科研的大数据平台 91 3.4? 数据安全 医疗大数据平台所存储的数据内容具有特殊 性,且存在各种形式的泄露危险[23],因而医疗大 数据平台的数据安全部分需要着重设计.本文在 平台中使用到的数据安全关键技术有身份认证, 数据隔离,访问控制,数据去隐私. 3.4.1 身份认证 用于大数据平台https://jcjs.siat.ac.cn/jcjs/article/pdf/201905009
15.降医疗大数据领域的痛难点分析及医疗大数据平台建设方案—艾艺以上就是关于健康医疗大数据领域的痛难点分析及医疗大数据平台建设方案内容。如您需要医疗行业软件开发服务,欢迎找艾艺客服:17702199087(同微信),艾艺提供健康医疗大数据可视化开发、APP开发、小程序开发、公众号开发、网站开发等服务,艾艺为企业量身定制软件开发解决方案,助力传统医疗信息化企业应积极布局转型。https://www.adinnet.cn/bloginfo/2020_01/blog_4247.html
16.山西构建医疗大数据基础平台山西晚报讯(记者 张勇)信息时代瞬息万变,医疗行业也面临海量数据下的安全挑战。记者9月27日了解到:为了推动医疗大数据开发利用和安全管控,由临汾市委指导,山西、江苏、河北及北京多省市专家强强联手,开发的山西省医疗大数据基础平台,有效支撑了山西省医疗领域采集、存储、处理和开放运营等全流程工作。 http://epaper.sxrb.com/wap/sxwb/20230928/911276.shtml
17.北大医疗信息系统有限公司医信数智承担了科技部国家重点研发计划慢病专项课题任务,集结高精尖人才形成大数据团队,作为课题二承担单位负责“国家神经变性病大数据共享平台”搭 了解详情 贵州省科研临床管理平台 贵州省科研临床管理平台是在199家贵州省级电子病历共享平台的数据汇聚基础之上,专门针对科研设计的大数据平台,其中运用了数据挖掘、关联分http://www.pku-hit.com/CaseSharing/yldsj/index.html
18.中国肾脏病大数据平台2018年12月由中国科学院侯凡凡院士经科技部授权建立。国家肾脏病临床医学研究中心与中国疾病预防控制中心慢性非传染性疾病预防控制中心牵头成立了中国肾脏病大数据协作网,共同建立国家医疗与健康大数据平台。神州医疗作为专业型第三方企业,承接了该平台的建设及维护工作。 http://www.dhctech.com/shenzangping.html
19.医疗降大数据:应用实例与系统分析从大数据和医疗健康大数据的介绍出发,首先阐述了医疗健康行业所面临的挑战和大数据对医疗健康行业的促进作用;然后介绍了大数据和医疗健康行业的背景知识;之后举例说明了大数据在医疗健康行业的应用以及医疗健康大数据系统和关键技术。 1 概述 随着信息技术和物联网技术的发展、个人电脑和智能手机的普及以及社交网络的兴起,人类https://www.51cto.com/article/493383.html
20.降医疗大数据实训平台健康医疗大数据综合实训平台 该平台基于脱敏的病人肺部CT影像数据集,应用深度学习技术,构建智能肺结节检测模型和肺癌诊断模型,从而为早期肺癌提供自动诊断支持。通过该项目的动手实践,可以熟练使用Python中的SimpleITK和Pydicom工具,对医学影像格式数据进行处理和分析。 https://www.youruancx.com/jkyldsjsxpt