科学网语义网笔记:本体与知识图谱之辨

不是,本体,图谱,元数据是三个概念。可以理解为,图谱是一个简单缺少强逻辑关系的本体

鲍:元数据,本体,图谱,链接数据,这几个词都是结构化数据在不同历史时期的营销名词。他们本身的ontologicaldifference与其说是基于内涵定义出来的,不如说是结构化数据在不同历史时期外延不同表现出来的。十多年前,当本体和现在的知识图谱一样火的时候,人人皆称本体,各种研究数据库、逻辑、词汇表等等,都自称本体。现在则是所有和结构化数据有关的应用,都自称知识图谱。所以我以为,无需细究两者之间的内涵区别。过三五年,自然会有新词出来再取代它们。

赵:本体论本身是有问题的,并不存在一个独立于人的思维之外的客观知识体系,知识都是具体的,被特定的人认知的,带有一定主观性的体系

本体作为元知识反映的是常识或相对恒定的知识它不具有情报价值,而通常所谓知识图谱则是情报挖掘的结果。这个区分极端重要因为这两种知识在如何形成何处使用等方面非常不同。

wordnethownet还有cyc这类知识都属于本体,它们是专家多年手工编制的其知识内涵有稳定性无情报性。也有自动形成本体或领域本体的工作这个工作叫知识习得(knowledgeacquisition),而不是一般意义的知识图谱所使用术语信息抽取(informationextraction)因为抽取的要点在于情报性在于提供具体实体及其关系和事件的流动性。文本挖掘textmining也被混用得不行。但最基本的理解还是指的信息抽取基础上的情报挖掘而不是本体的acquisition

撇开术语被混用这种区别的关键在于对于自然语言理解而言本体知识是一个支持性的知识而图谱所反映的情报则是结果。换句话说前者是帮助理解的后者是理解后的输出。当句法知识(也可以看成是语言学层面的元知识形式语言理论里面叫元语言)不够用或者单单的句法不能排歧的时候语言理解往往需要借力本体。譬如“鸡我吃了”与“我鸡吃了”,谁吃了谁句法上无法区分,本体里面的常识开始发力。“鸡”常常作为“人”的食品。“人”作为鸡的食品除了童话或狡辩外是站不住的。语言理解以后的信息抽取实体whowhat等发生何种关系relationships以及事件关涉到那些实体Whodidwhattowhomwherewhenhowandwhy,回答这类问题的情报知识可以从知识图谱来。班门弄斧一下。请知识大佬和后学批评。

鲍:李老师说的很对。只是在实践中,大多数公司和研究paper里提到的本体和知识图谱,都没有这么精确,大家基本是把任何结构化数据都套上这个词。细分并不容易,因为概念建模对大多数研究生和程序员就和天书一样。

Me:对混用很严重。概念区分很重要。特别是后学进入这个领域这个区分是基本的。深究起来还有灰色。但总体的分野是分明的。叫什么术语另说。

鲍:geneontology到底是本体还是数据?到底如何支持语义推理?计算机科学家研究了很多,可是生物学家也听不懂,依然按他们理解的方式用,他们就这这个当词汇表用,也一样好用。jimhendler曾做过统计,rdf和owl的实际使用,大部分都是“错”的。所以这里有一个工程师视角和科学家视角。其实还有一个商人视角。倒是图谱更加混杂有表示情报的有表示本体的。我们在媒体上读到的,大部分是商人视角。

Me:不过很少有人拿本体表示情报。常识和情报的分野是根。做本体不需要太多人上即便存在本体的领域化。做情报的图谱则不同,无时无刻没有情报产生因此需要不断抽取挖掘和整合以满足情报需求。难度也不一样做本体的是对人类常识和经验的概括,非大师不能。即便从大数据去习得本体(ontologyacquisition),定义本体,也是需要高度。情报性知识图谱则不同,任何产品经理,在了解客户需求后都可以定义。然后就是抽取挖掘。注意,学界对这两个动作用的是不同的术语前者叫习得(acquisition),后者叫抽取(extraction)。

鲍:比如现在,大家把schema.org称为知识图谱,把dbpedia称为知识图谱,把图数据库称为知识图谱,把工商注册信息也称为知识图谱。把名词列表称为知识图谱,把分类树称为知识图谱。到底什么是知识图谱呢?我觉得,就从众好了。在学术界,我们还是沿用tbox和abox那个肯定不会被滥用。

Me:

三巨人中菲尔默的Framenet最尴尬,它反映的知识性质耐人寻味。里面所定义的frames很像是信息抽取领域的templates但是它是跨领域的自上而下成体系的Frames之间也具有hierarchy,这与ie领域或产品经理定义的信息模版有所不同后者是领域的情报零散的。说它尴尬是因为这个framenet是从本体的角度概括情报结构,本来是想充当最终的领域情报的元知识组织者。但实际上几乎所有的领域情报信息抽取都绕过了它只是学界有人以这个标准组织竞赛和研究。业界不买账也有其道理因为情报知识图谱的元结构里面的hierarchy,只有在信息抽取框架数量繁多需要规整成系统实现资源继承和共享的时候,才可能体现价值。而知识图谱的研发还没有到那个规模,需要这种支持。

另一方面企图在文本挖掘中利用framenet里面的frames的抽取作为通向领域或产品情报的模版的思路理论上可以缩短到达应用层面的距离实践中不如直接从nlp的支持包括parsing的支持抽取来得简洁有效。

THE END
1.知识图谱的表示方式有哪些种类知识图谱,英文为 Knowledge Graph,是指把各类概念、实体和关系通过数学模型构建成的网络。知识图谱的表示方式主要有两种:一种是知识图谱本体(Ontology),一种是关系表示。 在知识图谱中,本体(Ontology)是指对客观世界中实体的定义,其将各种事物抽象成一种共同的特性,这些特性能够用于描述概念之间的关系;关系表示(Relationhttps://www.yueshu.com.cn/posts/Knowledge%20-Graph-Ontology
2.图谱的基石:理解本体和数据模型知识图谱中的本体概念本体(Ontology)在计算机科学和信息科学中,尤其是在知识图谱领域,扮演着重要的角色。它提供了一种形式化的描述知识领域的方法,由一组表示概念、概念之间关系以及规则的集合组成。在知识图谱中,本体用于定义和分类数据的结构,为数据之间的语义关系提供了一个共有的框架。这种结构化和语义化的表达方式不仅增强了数据的可理https://blog.csdn.net/fanjianglin/article/details/137345379
3.知识图谱初步学习(一)——本体+Protege新手学习在开始学习知识图谱的过程中,首先就是要了解什么是本体(ontology)。 1.本体概念 本体的概念最初源自于哲学领域,在哲学中的定义为“对世界上客观事物的系统描述,即存在论”。哲学中的本体关心的是客观现实的抽象本质。而在计算机领域,本体是可以在语义的层次上来对知识进行描述,可以看做是某一个领域知识的通用模型。https://www.kuazhi.com/post/179679.html
4.基础知识服务介绍在知识图谱服务中,需要通过输入实体类型、抽取函数及抽取前后的数据字段,或创建信息抽取模型来配置信息抽取。 知识映射 知识映射是建立从基础数据抽取出的结构化信息与知识图谱本体的映射关系,例如抽取出的有关电影结构化信息与图谱本体映射关系如图2所示。 图2实体电影的知识映射关系 https://support.developer.huaweicloud.com/doc/development/AI-Guides/zh-cn_topic_0000001400921230-0000001400921230
5.知识图谱:构建与应用的深度探索知识图谱作为一种新型的知识表示和推理工具,可以帮助我们更好地组织和利用知识,因此受到广泛欢迎。本文将详细介绍知识图谱的构建流程,包括本体构建、知识抽取、知识表示和知识存储等关键步骤,并探讨如何将这些技术应用于实际问题中。一、本体构建本体是知识图谱的核心组成部分,它定义了领域内实体和实体之间的关系。在构建https://developer.baidu.com/article/detail.html?id=2866687
6.知识图谱的主要组成部分是什么?本体是一种对实体、属性和关系进行分类和定义的方法。本体通常包括一个分类层次结构,用于描述实体之间的层次关系和相互关系。本体还可以定义实体的属性和关系的约束条件,从而提高知识图谱的准确性和可靠性。 语义(Semantics) 语义是指实体、属性和关系的含义和语义。知识图谱中的语义可以通过本体来定义和描述,从而提高知识https://cloud.tencent.com/developer/techpedia/1765/12279
7.本体知识图谱本体就是对那些可能相对于某一智能体(agent)或智能体群体而存在的概念和关系的一种描述。 ——汤姆·格鲁伯——《迈向知识共享型本体的设计原则》。 本体从schema的角度来定义(自上向下),而知识图谱其实更强调的是数据层(自底向上)来构建。对于领域或垂直行业的知识图谱,一般都需要有本体层。而实https://maimai.cn/article/detail?fid=1511796444&efid=Qt5bP6R6brUaUDz1pXgeLQ
8.知识图谱构建(概念,工具,实例调研)AIGCStudio的技术博客知识图谱的构建方法主要有两种:自底向上和自顶而下。 1.开放域知识图谱的本体构建通常用自底向上的方法,自动地从知识图谱中抽取概念、概念层次和概念之间的关系。 2.领域知识图谱多采用自顶向下的方法来构建本体。一方面,相对于开放域知识图谱,领域知识图谱涉及的概念和范围都是固定或者可控的;另一方面,对于领域知识https://blog.51cto.com/u_16658015/10285476
9.2知识图谱体系架构其中,本体层由实体类型和其属性、 实体类型间关系类型、规则等本体相关知识元素构成;实例层是对本体层的实例化,由实体类型对应 的实体及其属性以及实体间关系等实体相关知识元素构成。 上图中知识图谱概念模式的主体是实体。实体是真实对象的抽象,实体类型是某类实体的进一 步抽象。基于不同层次的抽象,图中的本体层https://www.jianshu.com/p/64124219e725
10.知识图谱入门——认识知识图谱1.什么是知识图谱 1.1知识图谱的概念 知识图谱(Knowledge Graph)是人工智能的重要分支技术,它在2012年由谷歌提出,是结构化的语义知识库,用于以符号形式描述物理世界中的概念及其相互关系,其基本组成单位是“实体—关系—实体”三元组,以及实体及其相关属性—值对,实体间通过关系相互联结,构成网状的知识结构。 “图”的https://www.wejoysoft.com/m/news.aspx?id=3158
11.知识图谱人工智能之知识图谱的详细介绍数据收集:知识图谱的构建需要大量的数据作为支撑,这些数据可以来自于各种来源,如文本、图像、视频等。 实体识别:实体识别是知识图谱构建的关键步骤之一,旨在从文本中识别出具有特定意义的实体,如人名、地名、组织名等。这通常依赖于命名实体识别(NER)技术。 https://developer.aliyun.com/article/1588767