徐美兰:深度应用驱动的医学知识图谱构建

数研院医学知识图谱构建:模型建立、“七巧板”本体术语集构建、“汇知”图谱构建

医学知识图谱应用案例

01

1.知识图谱概念

知识图谱广义概念:作为一种技术体系,指大数据知识工程的一系列代表性技术的总称。

知识图谱狭义概念:作为一种知识表示形式,知识图谱是一种大规模语义网络,包含实体、概念及其之间的各种语义关系。如下图中的二甲双胍知识图谱片段。

2.国外医学知识图谱

UMLS:由美国国家医学图书馆自1986年起研究和开发的一体化医学语言系统,包含超级词表、语义网络、专业词典和词汇处理工具。其规模:语义网络包含133种语义类型,54中语义关系。超级叙词表包含300多万概念,1300多万概念名称。

SNOMEDCT:2002年1月,SNOMED首次发布,它由两大医学术语SNOMEDRT与CTV3合并而来,国际版SNOMEDCT在每年的1月和7月更新一次。SNOMEDCT核心构建是概念、描述(术语)和关系。其规模:目前包含19种语义类型,50多种语义关系,35万概念,120万描述(术语),110万关系。

3.国内医学知识图谱

CUMLS:由中国医学科学院医学信息研究所基于UMLS开发的中文一体化医学语言系统,包含医学词表、语义网、构建工具与平台。其规模:共收录医学主题词3万余条、入口词3万余条、医学术语10万余条、医学词汇素材30万余条。

医药卫生知识服务系统:由中国医学科学院医学信息研究所承建,通过对资源的深度挖掘和关联分析,建设了知识图谱、知识脉络分析等特色知识服务和应用。其规模:已发布疾病和药品领域知识图谱,其中疾病涵盖心脑血管疾病、呼吸系统疾病、免疫系统疾病、消化系统疾病、肿瘤等。

中医药知识图谱:中国中医科学院中医药信息研究所依托中医药学语言系统(TCMLS)构建了中医药知识图谱。其类型包括:基于中医药学语言系统的知识图谱、中医美容知识图谱、中医养生知识图谱、中国临床知识图谱。

OpenKG:由中国中文信息学会倡导的中文领域开放知识图谱社区项目,主要工作内容包括:OpenKG.CN(开放图谱资源库)、cnSchema(中文开放图谱Schema)和Openbae(开放知识图谱众包平台)。

02

1.医学知识的特点

医学术语多样性:不同知识源对同一个概念采用了不同术语进行表达。比如:糖尿病又可称为消渴症、消渴、DM等。

精度要求高:医学知识专业性强,医学应用场景容错率低,因此医学知识图谱的精确度要求高。

复杂度高:医学是经验总结的科学,医学概念的内涵往往比较丰富,且有些医学知识复杂很难用简单三元组表达。

2.医学知识图谱应用场景

医学知识图谱的不同应用场景需求侧重点也有所不同,需要最大化的满足才能提高图谱的适用性。如下所示:

3.定制化解决方案

为满足行业深度应用需求,医学知识图谱构建时需引入更多定制化解决方案,如下所示:

03

数研院医学知识图谱构建

1.模型建立

医学领域的知识图谱由于其知识专业性强,行业通常采用自上而下的方式,先构建Schema,再抽取知识。

2.“七巧板”本体术语集构建

本体术语集的构建整体有6个步骤,依次如下所示:

Step1:确定领域范畴。当前我们以满足临床诊疗需求为切入点,开始尝试构建医学知识图谱。主要涉及范围:疾病、症状、体征,手术操作、检验检查,药品,人体形态结构,基因,医疗器械。

Step2:选取合适的知识源。充分收录行业现行标准、教科书、指南等权威知识源,并同时补充临床病历、互联网诊疗中的术语等。

Step4:建立关系。“七巧板”医学本体术语集的核心构建包括:概念、术语、关系及映射。如下图所示:

充分保留知识源中的已有层级关系,通过机器推理、人工添加的方式进行优化。挖掘知识源中的属性关系,并通过机器推荐、人工添加进行补充。制定明确的映射规则,采用机器推荐、专家审核的方式建立映射。

Step5:存储和浏览。采用关系型数据库,分为概念表、术语表、关系表、映射表进行存储,且保留历史痕迹。术语浏览器实现术语集构建的快速查找,并可按需实现子集定制。如查看关系操作如下所示:

Step6:平台及工具支撑。自研的知识库维护平台(CoWork),内嵌术语集研制规则,支持多人共同协作。CoWork中“七巧板”的功能如下所示:

CoWork中术语集编辑器可实现概念层面的编辑功能需求,并支持多人同时在线协作,协作方式为不创建分支,采用编辑锁。术语映射工具利用算法推荐,调高映射效率。目前“七巧板”术语集收录97万概念、123万术语和292万关系,包含疾病、操作、药品等语义类型。我们在持续进行更新维护,按季度发布,每季度第一个月20号发布新版本。

3.“汇知”图谱构建

“汇知”知识图谱的构建有五个步骤,分别如下:

Step1:选取合适的知识源。选取临床指南、临床路径、医学书籍文献等权威知识源,并同时补充医学百科类知识。简言之,即非结构化知识源+半结构化知识源+结构化知识源。

Step2:知识抽取。具体内容包括:实体识别和关系抽取。

实体识别通过基于规则的命名实体识别+专家审核提高标注效率,产生的标注数据用于训练深度学习模型。具体流程如下所示:

关系抽取基于实体识别的结果,专家标注关系,产生的标注数据用于句法规则总结和半监督学习。具体流程如下所示:

Step3:知识融合。最大化地将“汇知”图谱与“七巧板”术语集融合,可为图谱的深度应用打下基础。其过程大致包括实体归一、实体对齐、关系融合等阶段。具体操作如下所示:

Step5:平台及工具支撑。自研知识库维护平台(CoWork),内嵌知识图谱集研制规则,支持多人共同协作。CoWork中“汇知”的功能描述如下:

用户可创建多种自定义标注方案,批量上传和分配任务,在基于brat的文本标注工具上,各地志愿者可合作共建知识图谱。“汇知”图谱目前已发布7个领域,共计约11万实体,82万三元组,每个季度第二个月20号发布新版本。前述7个领域如下所示:

最后,数研院发起的知识图谱协作项目已持续开展5年,已有百名个人志愿者、多家优秀企业参与。贡献榜如下所示:

04

1.智能预警

知识图谱作为底层支撑,辅以更多规则,实现更全面的临床诊疗推理。如下低钾案例所示:

此外,还可基于知识图谱进行推理,实现实验室危急结果的预警和处方异常预警。如下胸痛案例所示:

2.指南推荐

基于医学本体层级关系推理后进行推荐,使推荐结果更丰富。如下科塔尔综合征案例所示:

另外,还可根据患者信息,推荐相似病历、临床路径、指南等,辅助医生制定治疗计划、规范治疗流程。如下案例所示:

3.数据直报

将医学知识图谱中的部分内容作为信息模型中的值集,实现医疗数据与医学知识之间的绑定。术语绑定指:将医学术语集中的概念分配临床信息模型中的具体数据单元,从而实现医学术语和临床信息模型的联系和赋予某种程度上的语义。读者可参考下图理解:

也可在信息系统中提前设定相应规则,基于“法定传染病”子集,进行传染病直报判断与提示。如下图所示:

THE END
1.一文带你了解智能诊疗的基础:医疗知识图谱知识图谱概述 本质上,知识图谱是是用来描述真实世界中存在的各种实体和概念,以及他们之间的关联,可以被认为是一种语义网络。其基本组成单位是“实体-关系-实体”三元组,如下图。实体间通过关系相互联结,构成…https://zhuanlan.zhihu.com/p/575051133
2.综述:《医疗知识图谱:资源应用和前景》本文系统地探讨了医疗知识图谱在医疗保健领域的应用、构建方法以及未来发展潜力。文章首先介绍了知识图谱的概念及其在不同领域的应用,然后重点阐述了医疗知识图谱的定义、构建方法和利用方式,并对现有的医疗知识图谱资源进行了总结和分类,最后展望了医疗知识图谱在大语言模型(LLMs)时代的发展机遇。 https://blog.csdn.net/xx_nm98/article/details/143894220
3.医学知识图谱是什么星环科技为您提供医学知识图谱是什么相关内容,帮助您快速了解医学知识图谱是什么。如果想了解更多医学知识图谱是什么资讯,请访问星环科技官网(www.transwarp.cn)查看更多丰富医学知识图谱是什么内容。https://www.transwarp.cn/keyword-detail/61423-1
4.谈谈构建医疗知识图谱的三个阶段腾讯云开发者社区随着人工智能技术的迅猛发展,构建医疗知识图谱成为了现代医学领域的重要任务之一。医疗知识图谱是一个结构化的知识存储和表示框架,在医学研究和临床实践中扮演着重要的角色。构建医疗知识图谱可以帮助医生更好地理解和应用医学知识,提高疾病的诊断和治疗效果。本文将介绍构建医疗知识图谱的三个阶段,包括机器自动抽取医学知识https://cloud.tencent.com/developer/news/1190557
5.知识图谱在医疗领域的应用随着医疗领域的不断发展和技术的不断进步,知识图谱在医疗领域的应用也将不断发展和完善。今后,知识图谱将更加注重个性化的服务,为每个患者提供满足其个性化需求的诊疗方案。同时,知识图谱还将与新兴技术如医学影像、基因检测等进行深度融合,以更好地服务于人类健康。 七、结论 本文介绍了知识图谱在医疗领域的应用,分析https://wenku.baidu.com/view/5b714a71ff4ffe4733687e21af45b307e871f9d8.html
6.科学网—[转载]医学知识图谱构建关键技术及研究进展目前,医学是知识图谱应用较广的垂直领域之一,也是目前国内外人工智能领域研究的热点。医学知识图谱在临床诊断、治疗、预后等方面均可发挥较大的作用。高效地将知识图谱应用于医学领域将给人类的医疗卫生带来革命性的变化。由于医学领域数据的特殊性,医学知识图谱的构建也面临不少机遇与挑战。 https://blog.sciencenet.cn/blog-3472670-1302733.html
7.医学知识图谱的构建研究杨江[7]在现有知识图谱的构建基础上,构建了以影像检查为中心的医疗知识图谱,并根据构建完成的医疗影响知识图谱进行了应用平台的搭建,为用户提供了相应的医疗影像知识查询以及疑似疾病推断等功能,促进了医疗影像知识的应用。 2 医学知识图谱的构建 知识图谱的构建是利用知识表示、知识抽取、知识融合、知识推理和知识存储等https://www.fx361.com/page/2022/1012/11470069.shtml
8.知识图谱在医学领域的应用:从诊断到治疗51CTO博客随着人工智能技术的不断发展,知识图谱(Knowledge Graph, KG)在各个领域的应用也逐渐成为主流。医学领域也不例外。知识图谱是一种以实体(Entity)和关系(Relation)为核心的数据结构,它能够表示实际世界中的复杂关系,为人工智能提供了一种高效的表示和推理方式。在医学领域,知识图谱可以用于诊断、治疗、药物研发等方面。本https://blog.51cto.com/universsky/9143718