在线增量学习机制的疾病知识图谱智能构建系统及方法与流程

本发明属于数据挖掘、人工智能化,具体涉及一种基于在线增量学习机制的疾病知识图谱智能构建系统及其构建方法。

背景技术:

2、目前存在的疾病知识图谱智能构建系统,在应用于基于中文医学文本构建疾病知识图谱时主要存在着以下问题:(1)虽然可配置自动标注医学文本中医学概念的模型,但缺少在线增量学习机制,不能使得模型随着用户的标注进程不断进化;(2)机器学习模型的自动标注能力主要是体现在医学命名实体层次,但对医学实体关联的属性定义和属性识别能力尚不足;(3)缺少对医学概念标准化的智能支持;(4)缺少对医学概念及其关联属性的有效定义。正是由于这些问题的存在,使得在应用brat、tagtog、markup构建疾病医学知识图谱时,面临着所构建的疾病知识图谱规范化、标准化程度不够高等问题。

技术实现思路

1、为了解决现有技术的不足,本发明提供了一种基于在线增量学习机制的疾病知识图谱智能构建系统及其构建方法。在线增量学习(onlineincrementallearning)是指一个学习系统能不断地从新样本中学习新的知识,并实时快速地对机器学习模型进行调整。通过引入在线增量学习机制,本发明所构建的疾病知识图谱系统将能实时地从专家标注的疾病知识图谱中学习,不断调整底层的模型参数,提升自动标注医学概念和属性的准确度,使得疾病知识图谱的自动标注过程越来越准确、越来越智能。

2、本发明的目的通过以下技术方案来实现:

3、在线增量学习机制的疾病知识图谱智能构建系统,包括电性连接的,

4、知识表征模块:用于结构化表征疾病知识的语义信息模型;

6、人机交互模块:用于可视化展示和交互校对知识抽提算法的结果;知识融合模块:用于标准化知识图谱中的生物医学术语;

7、自动学习模块:用于基于专家制作的高质量知识图谱自动更新知识抽提算法的参数。

8、优选地,以上所述的在线增量学习机制的疾病知识图谱智能构建系统的构建方法,包括如下步骤:

9、s1、定义用于结构化表征疾病知识的语义信息模型形成知识表征模块,所述语义信息模型包括实体类型、实体属性和实体间关系;

10、s2、以给定生物医学文本为输入,利用知识抽提模块对文本中的主题疾病信息,以及与该疾病关联的基因、表型、检查和治疗实体及其关联属性信息进行知识抽提算法后输出;

11、s3、通过人机交互模块将文本中算法自动抽提出的疾病主题信息、实体及其关联属性信息进行高亮显示,并标记出其对应的实体类型信息进行交回,进行实体、属性的增加、删除、修改、关联等交互操作进行校正;

13、s5、利用自动学习模块通过自动在线增量学习机制,在专家完成算法自动抽提结果的校对后,将专家校对后的疾病知识图谱传递给用于知识抽提的机器学习模型,更新机器学习模型的参数,使系统随着专家校对的知识图谱不断积累完善。

14、优选地,所述实体属性包括且不限于为疾病实体类型、基因实体类型、表型实体类型、检查实体类型和治疗实体类型。

16、优选地,所述s2中知识抽提算法包括如下步骤:

17、s21,基于规则分析输入文本所描述的疾病主题;

18、s22、基于知识库和机器学习方法扫描输入文本中的实体信息和属性信息;

19、s23、基于机器学习方法识别实体关联的属性信息。

20、6、如权利要求5所述的在线增量学习机制的疾病知识图谱智能构建系统的构建方法,其特征在于:s21中的规则为:寻找文本中出现次数最多的疾病名称,或离提示疾病主题的关键词最近的疾病名称。

21、优选地,s22包括如下步骤:

22、基于知识库,使用最大正向匹配法扫描文本中出现的生物医学实体信息,其中,所述知识库为实体词典信息构成,包括国际疾病分类第十次修订本、人类表型本体、中国药典词典;

23、通过机器学习方法进行基于知识库方法的补充,识别未被词典收录的生物医学实体信息,所述识别采用序列标注方法。

24、优选地,s5中机器学习模型由预训练语言模型bert和条件随机场的组合构建。

25、本发明的有益效果体现在:本发明所述的构建方法能够有机地整合专家智能和机器智能的力量,通过引入在线增量学习机制推动底层机器学习模型不断进化,提升机器学习模型自动标注疾病知识图谱的能力,使得专家构建疾病知识图谱的效率越来越高。

THE END
1.《数据流驱动:C++构建AI模型持续学习新范式》在人工智能领域不断发展演进的浪潮中,数据的持续流入和模型的适应性学习成为了新的焦点。传统的人工智能模型训练往往基于固定的数据集,在模型训练完成后难以有效地处理新到达的数据并持续提升性能。而基于数据流的人工智能模型持续学习系统则能够打破这种局限,让模型在动https://cloud.tencent.com/developer/article/2478635
2.基于在线增量学习支持向量机的径流预测在线增量学习SVM 径流预测 SVM模型https://www.cnki.com.cn/Article/CJFDTotal-SLKY201707004.htm
3.数据样本较少无法有效分析怎么办呢帆软数字化转型知识库增量学习和在线学习是处理小样本数据的一种有效方法,通过逐步增加数据量和更新模型来提高分析的准确性。以下是增量学习和在线学习的主要步骤: 初始模型训练:在现有的小样本数据上训练初始模型,建立初步的预测和分析能力。 增量数据获取:逐步获取新的数据样本,扩展数据集。新数据可以通过实验、观测、网络抓取等途径获取。https://www.fanruan.com/blog/article/339467/
4.面向流数据分类的在线学习综述?的流式数据中增量学习一个从输入变量到类标变量的映射函数,以便对 随时到达的测试数据进行准确分类.在线学习范式作为一种增量式的机器学习技术,是流数据分类的有效工具.主要 从在线学习的角度对流数据分类算法的研究现状进行综述.具体地,首先介绍在线学习的基本框架和性能评估方法, 然后着重介绍在线学习算法在一般流数据https://jos.org.cn/jos/article/pdf/5916
5.在线学习和增量学习的区别增量学习:指在已有知识的基础上,逐步增加新的知识点和技能的学习方式。增量学习不是一次性学习所有的知识点,而是在不断积累和提高的过程中逐步学习和掌握新的知识和技能。 总的来说,在线学习和增量学习都是为了提高自己的学习能力和知识水平,但在线学习更注重远程教学和学习的方式,而增量学习更注重在已有知识的基础上https://wenku.csdn.net/answer/16d1a2da58dd48f89098116650df3197
6.《NCX》软件是否提供了在线学习和增量学习的功能?《NCX》软件是一款广泛应用于数据分析和数据处理领域的工具。随着技术的不断进步,软件的学习与提升成为许多用户关注的焦点。本文将探讨《NCX》软件是否提供了在线学习和增量学习的功能,以及这些功能如何帮助用户提升技能和效率。 二、在线学习功能 《NCX》软件的在线学习功能是其一大特色,为用户提供了丰富的资源,帮助他https://www.sousou.com/wd/517044.html
7.在线自主学习,Self运用RBF神经网络结构和最近邻聚类算法,对导弹系统逆动力学系统进行动态模型辨识,并以辨识模型为控制器与BTT导弹控制系统串联构成一个动态伪线性系统,进而应用逆系统方法设计了一种用于解决BTT导弹非线性控制问题的经典控制与神经网络在线自学习相结合的控制方案,实现了导弹三通道的线性化控制和输出的渐近无差跟踪。 3. http://www.dictall.com/indu/264/26304906F68.htm
8.人工智能中小样本问题相关的系列(四):知识蒸馏增量学习Hinton等人提出的框架是在模型最后的预测端,让student模型学习到与teacher模型的知识,这可以称之为直接使用优化目标进行驱动的框架,类似的还有ProjectionNet。 PrjojectNet同时训练一个大模型和一个小模型,两者的输入都是样本,其中大模型就是普通的CNN网络,而小模型会对输入首先进行特征投影。每一个投影矩阵P都对应了一https://m.nowcoder.com/discuss/353156472483815424
9.实时个性化推荐(三十五)触屏技术的发展,让用户与产品交互更加方便快捷,交互可以在瞬间完成,毫无障碍,无任何学习成本。快捷的交互自然要求产品可以进行快速的响应,这也间接催生了实时推荐技术的出现、发展和普及。 22.1.4 人天生喜欢动态变化的东西、人的需求也越来越主动 移动互联网时代,用户每时每刻都在线。人的大脑是无法停下来的(即使是https://xie.infoq.cn/article/ff5a21f6d7597ffd211fa8426
10.大模型的实时知识更新算法常见的大模型实时知识更新算法包括增量学习、在线学习和迁移学习等。 增量学习是指在已有模型的基础上,通过持续训练和学习新的数据来更新模型。具体而言,增量学习通常包括以下步骤: 1.数据收集:根据实时场景中的数据变化,收集新的训练数据。 2.特征提取与转换:对新的训练数据进行特征提取和转换,将其转换为模型能够处理https://wenku.baidu.com/view/3daf9d94c181e53a580216fc700abb68a882add9.html
11.机器学习顶刊汇总:EESNat.Commun.EnSMACSAMIES&T等成果图1. 用于SOH估计的建议基准、增强和增量学习方法 接下来,作者使用来自在两种温度和电流倍率下循环的16个可植入级锂离子电池的长期(3.5年)循环实验数据对所提出的方法进行了全面评估。四重交叉验证研究的结果表明,与纯粹的数据驱动方法相比,所提出的基于物理信息的机器学习模型能够将电池容量和三种主要退化模式状态的估https://www.shangyexinzhi.com/article/5029661.html
12.信息流广告SEM教程学习平台艾奇在线是业内权威的信息流广告和SEM视频教程学习与培训平台,内容涉及百度SEM账户优化,信息流优化,竞价数据分析,优化师面试招聘求职等;课程包括信息流广告投放培训,竞价排名培训,APP推广,SEO优化,电商运营等互联网广告系统教程,助力广告优化师的职业成长。https://www.27sem.com/
13.增量学习定义:在获得新的训练样本后,不需抛弃已有学习器进行重新训练,只对已有学习器进行少量更新的机器学习过程。 学科:计算机科学技术_人工智能_机器学习 相关名词:联想学习 在线学习 【延伸阅读】 增量学习是一种适应现代数据需求(流动性高、更新频繁)的机器学习技术。其核心在于系统能够持续地从新的训练样本中吸收和融合新https://www.xakpw.com/single/33704
14.上海市育鹰学校“基于“基于教学改革融合信息技术的新型教与学坚持落实立德树人根本任务,以学生发展为中心,以服务教师教学、服务学生学习、服务学校管理为目标,积极探索新形势下将信息技术全面融入教学过程的路径、方式和方法,努力创造适合每一个学生发展需求的教学活动,充分利用信息化服务学生学习、服务教师改进教学、服务全面提高教育质量,以教育信息化带动教育现代化。 http://www.yuying.edu.sh.cn/info/1076/8592.htm