知识图谱的信息可视化设计方法算法视图知识库

知识图谱作为语义网络,其技术算法研究被广泛应用在人工智能和大数据等领域。

通常,知识图谱的运转过程是由数据模型完成,用户可见的只是计算后的结果,其数据的可视化也仅停留在对结果的可读性展示上。

但其实,图谱之间的关系、数据计算的过程,也具备分析价值和潜在的机会信息。将知识图谱转化为可视化信息图,能帮助用户更好的理解和利用数据及其关系,但对于没有技术背景的界面设计师来讲,从技术架构、计算函数等技术视角去理解知识图谱概念和应用相对困难。

一、什么是知识图谱1.基本概念

2012年,Google公司为实现更智能的搜索引擎,提出知识图谱的概念,2013年后在行业内和学术界开始普及。

知识图谱的定义:是结构化的语义知识库,本质上是一个语义网络(SemanticNetwork),用于描述物理世界中的概念及其相互关系。

在技术层面,通过对错综复杂数据的有效加工、处理、整合,转化为数据关系来聚合大量知识,从而实现知识的快速响应和推理;在可视化的应用中,知识图谱表现为多关系图(Multi-relationalGraph),在图形化界面中可让用户查看和互动。

2.知识图谱的特点:

其特点主要包含以下两方面内容:

(1)它是由“节点”和“边”构成的三元组

三元组是知识图谱的基本单位,由节点和边构成。

其中节点代表实体,是指具有区别性且独立存在的客观事物,如:图1中的马云、华谊兄弟传媒有限公司,图3中的美国、平方公里数等;边代表两个实体间的关系,是指客观存在或推理得到的实体间的联系,如图1中的董事、监视、投资,图3中的面积、人口、首都等。

(2)它的数据以知识的角度呈现

知识是一种人类对于客观世界的认知,包括事实、信息描述或教育实践中获得的结果的综合。

三元组也被称为“一条语句”,或知识图谱中的一条知识。在图4的国家信息关系三元组中,我们就可以读出一条语句(或是知识)为:“中国的土地面积有9,634,057平方公理”。

知识图谱可以集成Web上大量的数据及数据关系,通过有效的加工、整合和处理,将其转化为易于计算和理解的语义知识库,可用于描述客观世界中的概念及相互关系。

3.知识图谱的作用4.为什么需要对知识图谱进行可视化

知识图谱的技术架构-侧重在数据关系模型和机器学习,普通用户很难读取和理解。

知识图谱的核心技术逻辑,是由整体的“数据输入-数据处理-知识图谱生成”三个大环节构成。

数据输入环节包含“结构化数据、半结构化数据、非结构化数据”;数据构建环节包含“信息抽取、知识融合、知识加工”;知识图谱系统的生成环节,是整个技术架构往复迭代、不断更新和积累,慢慢形成的结果。数据输入是对数据源的挖掘,数据构建是底层的模型算法应用,知识图谱生成是数据处理结果的呈现。

这个过程在底层数据模型中运转,对用户可见的往往是最终的结果。比如:搜索引擎中,用户看不到搜索过程,但可得到最匹配的搜索结果;在音乐平台中,看不到内容匹配逻辑,但可以被推荐感兴趣的歌曲。如果想利用过程数据为用户提供服务,就需要进行可视化处理。

传统的信息可视化-侧重在数据结果的展示和筛选,较少涉及数据关系的干预。

传统信息可视化的方法,在设计侧更多强调数据信息与图像、色彩的信息传达上。其方法通常集中在“如何对已经确定的数据进行图形映射”和“如何处理信息层级”的视觉表现上,较少参与设计数据关系或影响数据结构。

然而,这让用户知道数据“是什么”,却不能呈现数据“为什么”。知识图谱的可视化,可以让数据处理过程被用户可见、可用,从而更好的分析和使用数据。

知识图谱的可视化-侧重在数据关系构建和处理过程的可视化。

知识图谱技术广泛应用在情报学、检索引擎、自动问答、金融反欺诈等领域。

目前已扩展到智能医疗、证券投资、大数据风控、聊天机器人、个性化推荐系统等更多方向。

这种关系语义网络也逐渐从技术底层应用向可视化用户界面上发展,各行各业也在探索如何时其在终端界面中被用户可读和可用。

比如:在文化研究领域,图谱呈现更有助于用户对于文化知识的理解和再创造;在商品市场领域,视觉化的图谱可让商家洞察更多“人-货-场”之间的内在联系。

对知识图谱信息的可视化,重心落在数据信息的提取和关系构建上,将数据信息的编译过程呈现给用户。知识图谱信息可视化和传统信息可视化方法之间的关系,如图6。

二、知识图谱的可视化设计方法

知识图谱在底层算法和数据模型上提供有效的技术逻辑,进而构建丰富庞大的语义网络,但如果要在具体应用场景中给用户可见的模式,则需要图形化界面的呈现。

在实际工作中,设计侧的核心任务是“多关系图”的信息可视化。结合知识图谱的特征、技术原理和传统信息可视化方法,可以将知识图谱可视化的过程,归纳为“确定知识主题(主题层)-处理与分析数据(数据层)-构建数据三元组(关系层)-进行可视化映射(可视层)”四个步骤。

1.【主题层】确定知识主题/可视化目标

确定主题的过程,也是定义核心概念或目标的过程,这一环节是是知识图谱可视化的出发点和落脚点。传统可视化为了可视而可视,只是让用户更好的读取数据,而较少考虑读到后有什么用,怎么用。

没有主题的数据是无意义的,任何一类知识的描述,都需要围绕某一特定主题展开。

在项目实践角度,也可以将其视为梳理业务核心诉求或定义设计目标的过程,如确定要阐述什么类型的知识、最终的可视化效果对目标用户有什么价值、业务要利用数据达到什么目的,所有数据的设计都将围绕着主题展开。

确定主题的方法有很多,包括传统的用户需求分析方法、文献综述、行业研究等,可根据不同的项目诉求,选择合适的方法和工具。

如,要做电商行业的知识图谱,通过行业研究、对用户特征和行为动机的分析,发现电商领域用户最关心人货场的知识,人和货特征及其关系就是核心要表达的主题。

再如,老师想了解网络时代的大学生都具备怎样的社交特征,通过对学生学习、娱乐、社交等不同生活要素分类调研,选择“学生使用社交软件的行为特征”作为主题。

同时,主题要清晰明确,避免模糊和过于宏大。以文化领域为例,如想呈现京剧之美,这个概念就大而泛,很难去组织数据,就有创作者将其主题拆分为:历史之美、剧目之美、舞台意向之美、传承之美等几个主题。然后再逐一分析每个主题的数据。

2.【数据层】对数据进行提取与加工

(1)数据提取-围绕知识主题进行数据信息的提取

如,围绕“学生使用社交软件的行为特征”这一主题,可归纳出“好友关系、互动行为、在线状态、信息发布”等特征。

数据收集一般通过桌面研究的手工收集、数据爬虫两种方式。归纳和拆解数据可以使用卡片分类、思维导图的方式。

(2)数据加工-进行知识语义加工

数据加工的过程,就是将罗列出的数据进行分类和筛选,确定最能够表现知识主题的描述纬度或数据类型。

通过分析影响因素的关联程度,选择具备直接影响因素的数据,或划定数据范围后,再进行细分。

可以利用卡诺模型、波士顿矩阵等方法找到数据对主题影响程度的优先级,具体的挑选方法无定式,只要能整理出适合的数据类型。

(3)数据清洗-进行数据筛选和最终确认

定义出有用的数据类型后,并不是所有数据都能完美符合我们的诉求,比如数据挖掘能力限制,不能挖到更精准的数据或有数据缺失;比如数据解析能力不足,数据类型混杂,或有错误数据等。

排除不足量、精准度差、错误率高等不可用的数据,盘点出能够被应用于可视化的最终数据。

在实际工作中,需要跟团队的数据挖掘工程师、或业务产品负责人明确数据能力和质量。

例如,“京剧传承之美”的数据选择过程中,作者对京剧艺术传承上存在的“流派师承、艺学家传、科班教育等”多种方式进行进行分类和筛选,最终提取了京剧51个流派的创始人数据、师徒数据、家族成员数据。

3.【关系层】构建数据关系三元组

在知识图谱的技术架构中,这一环节体现在本体构建上,本体是个专业概念,本体构建也有多种可用的成熟模型,属于技术侧内容,本文不展开论述,仅阐述设计层面的思路。技术是让数据更精准,而面向用户的设计是让数据更有用和好用。

设计数据的关系层,也就是给不同数据类型建立关系的过程,通过确定节点和边的内容来构建能够解释主题和符合其逻辑关系的三元组。

数据关系的建立一般主要围绕两个层面,一是能够阐述知识主题,二是通过关系三元组可推理得到更多的知识内容。

比如,在“学生使用社交软件的行为特征”这个主题中,可定义“学生(实体)-网络社交特征(属性)-具体行为(属性值)“是一组关系结构,体现在数据为“张三-在线时长-5小时/天”,描述成知识语意为:张三同学社交软件每天会在线亮起5个小时;

又如,围绕“商品销售信息”这一主题,“产品(实体)-集合(关系)-商品(实体)”是一组关系结构,体现在具体数据为“手机-包含-华为手机”,描述成知识语义为:华为手机是众多手机中的一种。

当我们定义了这种数据关系,独立的数据就变成了可描述的知识语意,当这些语义联系在一起,用户通过一段段知识洞察到不同的现象,或解读出不同的结论。

这种知识语义的可视化,或者说这种数据关系结构的可视化,能够帮助用户了解业务现象,或产品底层看不到但却有用的信息。

比如京剧文化中师承的演变,可以通过不同人物之间的关系脉络,构建出“师承关系、家族关系、联姻关系”几种三元组模式,从相同节点中解读到某个京剧演员擅长某个角色的师承因素。

4.【可视层】可视化图形语义转换/可视化映射

当关系构建好以后,简单的三元组是容易读取的,但众多三元组集成在一起,也会涉及到信息读取效率的问题,就需要将关系结构图形化,这一步骤也是传统信息可视化方法中的必然环节。

根据已经构建好的数据关系结构,可通过“图表映射”和“视图设计”两种方式,进行可视化的语义转换。

(1)可视化图表映射

可视化图表,是指具备通用性的标准化图表。总体分为统计类图表和关系类图表,本文主要阐述关系类图表。关系类图表又可分为网状关系和层次关系。

网状关系图包括:关系图、弦图、弧长链接图等;层次关系图包括:树图、旭日图、矩形树图等。详细的标准化图表,可以借助E-chart、TableauPublic、Smartbi等软件进行参考选择(如图9)。

如果数据关系比较清晰简单,能够被这两类标准化图表所覆盖,则可以直接选择把节点和关系直接映射其中。如果你的数据关系比较复杂,或个性化,则可对标准化图标进行组合或变化,或设计个性化视图。

例如,在北京邮电大学彭国雁的论文《面向京剧知识图谱的信息可视化研究与设计》的案例中,“京剧传承之美”这一主题,“师承关系、家族关系、联姻关系”的三元组关系较复杂,如果直接用可视化图表映射来展示,会产生易读性差和页面布局难以控制的问题。

于是论文作者采用不同图表相结合的方式,并将图形的视觉元素进行改造:

(2)可视化视图设计

经过以上四个步骤,就完成了对知识图谱数据进行可视化。它不是单纯的以视觉效果展示数据信息,而是从数据关系提取到关系呈现为一体的设计过程。

三、结语

与传统数据信息可视化相比,知识图谱可视化更倾向于数据之间三元组关系的视觉表达,所谓“整体大于局部之和”,有了关系的建立,则更能够发现单一数据之外的延展信息和潜在机会。希望能够通过设计的力量,让普通用户也能更好的使用数据和洞察数据。

本文由@腾讯CDC体验设计原创发布于人人都是产品经理,未经许可,禁止转载。

THE END
1.知识图谱数据可视化怎么做帆软数字化转型知识库知识图谱数据可视化可以通过使用FineBI、FineReport、FineVis等工具来实现,步骤包括数据集成、图谱构建和可视化展示。FineBI提供强大的数据分析能力,使得数据处理更加高效;FineReport则在报表设计和展示方面有着突出的表现;FineVis专注于数据可视化,能够将复杂的数据关系通过图形化方式直观呈现。通过FineVis进行知识图谱数据可视化https://www.fanruan.com/blog/article/131137/
2.dirKGUI:NebulaGraph的可视化,前后端完全打通nebula前端展示dirKG_UI:NebulaGraph的可视化,前后端完全打通 前言 1.含义: dir:代表“directory”(目录),指的是文件目录或文件夹。 KG:代表“Knowledge Graph”(知识图谱),用于表示和处理数据关系。 UI:代表“User Interface”(用户界面),用于用户与软件系统交互。 总体来说,dirKG_UI是一个用于展示和交互文件目录知识图谱的https://blog.csdn.net/qq_47753695/article/details/140290916
3.知识图谱可视化.pptx知识图谱可视化简介1.知识图谱可视化是将知识图谱中的信息以图形、图像、动画等视觉形式展示出来的过程,以帮助用户更好地理解和利用知识。2.知识图谱可视化可以借助交互技术和数据挖掘技术,让用户能够更方便地进行信息探索和分析,从而发现隐藏在数据背后的规律和趋势。3.知识图谱可视化在多个领域都有广泛的应用,比如人工智https://max.book118.com/html/2024/0115/5010240043011042.shtm
4.可视化“三驾马车”:知识图谱知识可视化与信息可视化可视化“三驾马车”:知识图谱、知识可视化与信息可视化 可视化是将大量的数据、信息和知识转化为一种人类的视觉形式,直观、形象地表现、解释、分析、模拟、发现或揭示隐藏在数据内部的特征和规律,提高人类对事物的观察、记忆和理解能力及整体概念的形成。 可视化研究发展的境脉大致遵循着科学计算可视化、数据可视化、信息https://blog.sciencenet.cn/blog-415-931560.html
5.知识图谱可视化:揭示知识的结构与关联文章摘要:在大数据时代,知识图谱作为一种结构化的知识表示方式,已经成为了数据分析和信息检索的重要工具。然而,知识图谱的数据规模庞大、关系复杂,如何有效地呈现其结构和关联成为了一个挑战。知识图谱可视化作为解决这一挑战的关键技术,正逐渐受到研究者和实践者的关注。 https://www.udesk.cn/ucm/report/58629
6.知识图谱的构建及知识图谱可视化知识图谱具有非结构化、可扩展性强、可解释性强、高度抽象等特点,是一种全新的知识呈现方式,是人工智能技术发展到一定阶段的产物,它打破了传统的数据库形式,将结构化信息以更为抽象的方式呈现出来,从而为人类认知世界提供了全新的视角和更大的想象空间。并通过知识图谱可视化,将数据和信息以可视化的方式呈现,更直观更https://yueshu.com.cn/posts/construction-and-visualization-of-kg
7.知识图谱可视化一、知识图谱可视化概述知识图谱是一种基于语义网络的可视化知识表示方法,通过图形化的方式将复杂的知识结构进行清晰、直观的表达。知识图谱可视化可以帮助人们更好地理解和掌握知识,同时还能发现和挖掘知识之间的关联和规律。知识图谱可视化技术的主要特点包括:1. 可视化表达:可视化表达是知识图谱的核心,它通过图形化的方式https://aiqicha.baidu.com/qifuknowledge/detail?id=10030783001
8.知识图谱可视化知识图谱可视化是一项重要的技术,它能够将庞大而复杂的知识图谱以直观的方式展现给用户。知识图谱(knowledge graph)是一种用于组织和表示结构化知识的图形数据库模型,它将现实世界中的事物、概念、关系等信息以图形的形式进行建模,并使用图形数据库技术来存储和查询这些数据。 https://www.huaweicloud.com/zhishi/smart-18525863.html
9.领域知识图谱构建可视化流程我的毕设是做领域知识图谱,知识图谱的构建主要有一下几步:数据采集、数据处理、数据存储以及可视化。知识图谱的可视化功能是很强的,因此我根据网上基于vue和d3.js可视化程序,改造为了我的知识图谱可视化方案。 简介 系统的总体架构分为知识存储层和知识图谱应用层。知识图谱的知识存储层主要涉及到对数据的采集、处理https://zhuanlan.zhihu.com/p/494300250
10.什么是知识图谱可视化工具?这篇文章带你深入探索!知识图谱作为一种强大的信息组织和表达方式,已经在多个领域得到广泛应用。而知识图谱可视化工具则是将复杂的知识图谱数据以直观、可交互的方式展现给用户,帮助人们更好地理解和利用知识图谱。本文将介绍知识图谱可视化工具的优势及其在不同领域的应用案例,带你一同探索其魅力所在。 https://www.finebi.com/visualization/smszhshtpkshh
11.知识图谱可视化是什么初闻这个名词,我是迷惑的,知识图谱是后端的东西,它常用的图形存储数据库就能够将它很好滴可视化,那为什么还要放到前端呢?要怎么放? 讲知识图谱存储到图形数据库,前端从接口调数据库里的数据,然后可视化展现,那知识图谱用在了哪一步呢? 然后我发现其实知识图谱的可视化也就是数据的可视化,也是用可视化的工具比如echarthttps://www.jianshu.com/p/1a9fb28db768
12.知识图谱可视化工具:数据洞察的新视角通过使用沃丰科技的知识图谱可视化工具,企业可以更有效地挖掘和利用自己的数据资源,从而在激烈的市场竞争中占据优势。这一工具不仅提高了数据分析的效率,还提升了企业决策的质量。随着数据驱动决策在商业环境中变得越来越重要,沃丰科技的知识图谱可视化工具无疑将成为众多企业不可或缺的伙伴。 https://chuangke.aliyun.com/info/1067920.html