知识图谱的信息可视化设计方法算法视图知识库

知识图谱作为语义网络,其技术算法研究被广泛应用在人工智能和大数据等领域。

通常,知识图谱的运转过程是由数据模型完成,用户可见的只是计算后的结果,其数据的可视化也仅停留在对结果的可读性展示上。

但其实,图谱之间的关系、数据计算的过程,也具备分析价值和潜在的机会信息。将知识图谱转化为可视化信息图,能帮助用户更好的理解和利用数据及其关系,但对于没有技术背景的界面设计师来讲,从技术架构、计算函数等技术视角去理解知识图谱概念和应用相对困难。

一、什么是知识图谱1.基本概念

2012年,Google公司为实现更智能的搜索引擎,提出知识图谱的概念,2013年后在行业内和学术界开始普及。

知识图谱的定义:是结构化的语义知识库,本质上是一个语义网络(SemanticNetwork),用于描述物理世界中的概念及其相互关系。

在技术层面,通过对错综复杂数据的有效加工、处理、整合,转化为数据关系来聚合大量知识,从而实现知识的快速响应和推理;在可视化的应用中,知识图谱表现为多关系图(Multi-relationalGraph),在图形化界面中可让用户查看和互动。

2.知识图谱的特点:

其特点主要包含以下两方面内容:

(1)它是由“节点”和“边”构成的三元组

三元组是知识图谱的基本单位,由节点和边构成。

其中节点代表实体,是指具有区别性且独立存在的客观事物,如:图1中的马云、华谊兄弟传媒有限公司,图3中的美国、平方公里数等;边代表两个实体间的关系,是指客观存在或推理得到的实体间的联系,如图1中的董事、监视、投资,图3中的面积、人口、首都等。

(2)它的数据以知识的角度呈现

知识是一种人类对于客观世界的认知,包括事实、信息描述或教育实践中获得的结果的综合。

三元组也被称为“一条语句”,或知识图谱中的一条知识。在图4的国家信息关系三元组中,我们就可以读出一条语句(或是知识)为:“中国的土地面积有9,634,057平方公理”。

知识图谱可以集成Web上大量的数据及数据关系,通过有效的加工、整合和处理,将其转化为易于计算和理解的语义知识库,可用于描述客观世界中的概念及相互关系。

3.知识图谱的作用4.为什么需要对知识图谱进行可视化

知识图谱的技术架构-侧重在数据关系模型和机器学习,普通用户很难读取和理解。

知识图谱的核心技术逻辑,是由整体的“数据输入-数据处理-知识图谱生成”三个大环节构成。

数据输入环节包含“结构化数据、半结构化数据、非结构化数据”;数据构建环节包含“信息抽取、知识融合、知识加工”;知识图谱系统的生成环节,是整个技术架构往复迭代、不断更新和积累,慢慢形成的结果。数据输入是对数据源的挖掘,数据构建是底层的模型算法应用,知识图谱生成是数据处理结果的呈现。

这个过程在底层数据模型中运转,对用户可见的往往是最终的结果。比如:搜索引擎中,用户看不到搜索过程,但可得到最匹配的搜索结果;在音乐平台中,看不到内容匹配逻辑,但可以被推荐感兴趣的歌曲。如果想利用过程数据为用户提供服务,就需要进行可视化处理。

传统的信息可视化-侧重在数据结果的展示和筛选,较少涉及数据关系的干预。

传统信息可视化的方法,在设计侧更多强调数据信息与图像、色彩的信息传达上。其方法通常集中在“如何对已经确定的数据进行图形映射”和“如何处理信息层级”的视觉表现上,较少参与设计数据关系或影响数据结构。

然而,这让用户知道数据“是什么”,却不能呈现数据“为什么”。知识图谱的可视化,可以让数据处理过程被用户可见、可用,从而更好的分析和使用数据。

知识图谱的可视化-侧重在数据关系构建和处理过程的可视化。

知识图谱技术广泛应用在情报学、检索引擎、自动问答、金融反欺诈等领域。

目前已扩展到智能医疗、证券投资、大数据风控、聊天机器人、个性化推荐系统等更多方向。

这种关系语义网络也逐渐从技术底层应用向可视化用户界面上发展,各行各业也在探索如何时其在终端界面中被用户可读和可用。

比如:在文化研究领域,图谱呈现更有助于用户对于文化知识的理解和再创造;在商品市场领域,视觉化的图谱可让商家洞察更多“人-货-场”之间的内在联系。

对知识图谱信息的可视化,重心落在数据信息的提取和关系构建上,将数据信息的编译过程呈现给用户。知识图谱信息可视化和传统信息可视化方法之间的关系,如图6。

二、知识图谱的可视化设计方法

知识图谱在底层算法和数据模型上提供有效的技术逻辑,进而构建丰富庞大的语义网络,但如果要在具体应用场景中给用户可见的模式,则需要图形化界面的呈现。

在实际工作中,设计侧的核心任务是“多关系图”的信息可视化。结合知识图谱的特征、技术原理和传统信息可视化方法,可以将知识图谱可视化的过程,归纳为“确定知识主题(主题层)-处理与分析数据(数据层)-构建数据三元组(关系层)-进行可视化映射(可视层)”四个步骤。

1.【主题层】确定知识主题/可视化目标

确定主题的过程,也是定义核心概念或目标的过程,这一环节是是知识图谱可视化的出发点和落脚点。传统可视化为了可视而可视,只是让用户更好的读取数据,而较少考虑读到后有什么用,怎么用。

没有主题的数据是无意义的,任何一类知识的描述,都需要围绕某一特定主题展开。

在项目实践角度,也可以将其视为梳理业务核心诉求或定义设计目标的过程,如确定要阐述什么类型的知识、最终的可视化效果对目标用户有什么价值、业务要利用数据达到什么目的,所有数据的设计都将围绕着主题展开。

确定主题的方法有很多,包括传统的用户需求分析方法、文献综述、行业研究等,可根据不同的项目诉求,选择合适的方法和工具。

如,要做电商行业的知识图谱,通过行业研究、对用户特征和行为动机的分析,发现电商领域用户最关心人货场的知识,人和货特征及其关系就是核心要表达的主题。

再如,老师想了解网络时代的大学生都具备怎样的社交特征,通过对学生学习、娱乐、社交等不同生活要素分类调研,选择“学生使用社交软件的行为特征”作为主题。

同时,主题要清晰明确,避免模糊和过于宏大。以文化领域为例,如想呈现京剧之美,这个概念就大而泛,很难去组织数据,就有创作者将其主题拆分为:历史之美、剧目之美、舞台意向之美、传承之美等几个主题。然后再逐一分析每个主题的数据。

2.【数据层】对数据进行提取与加工

(1)数据提取-围绕知识主题进行数据信息的提取

如,围绕“学生使用社交软件的行为特征”这一主题,可归纳出“好友关系、互动行为、在线状态、信息发布”等特征。

数据收集一般通过桌面研究的手工收集、数据爬虫两种方式。归纳和拆解数据可以使用卡片分类、思维导图的方式。

(2)数据加工-进行知识语义加工

数据加工的过程,就是将罗列出的数据进行分类和筛选,确定最能够表现知识主题的描述纬度或数据类型。

通过分析影响因素的关联程度,选择具备直接影响因素的数据,或划定数据范围后,再进行细分。

可以利用卡诺模型、波士顿矩阵等方法找到数据对主题影响程度的优先级,具体的挑选方法无定式,只要能整理出适合的数据类型。

(3)数据清洗-进行数据筛选和最终确认

定义出有用的数据类型后,并不是所有数据都能完美符合我们的诉求,比如数据挖掘能力限制,不能挖到更精准的数据或有数据缺失;比如数据解析能力不足,数据类型混杂,或有错误数据等。

排除不足量、精准度差、错误率高等不可用的数据,盘点出能够被应用于可视化的最终数据。

在实际工作中,需要跟团队的数据挖掘工程师、或业务产品负责人明确数据能力和质量。

例如,“京剧传承之美”的数据选择过程中,作者对京剧艺术传承上存在的“流派师承、艺学家传、科班教育等”多种方式进行进行分类和筛选,最终提取了京剧51个流派的创始人数据、师徒数据、家族成员数据。

3.【关系层】构建数据关系三元组

在知识图谱的技术架构中,这一环节体现在本体构建上,本体是个专业概念,本体构建也有多种可用的成熟模型,属于技术侧内容,本文不展开论述,仅阐述设计层面的思路。技术是让数据更精准,而面向用户的设计是让数据更有用和好用。

设计数据的关系层,也就是给不同数据类型建立关系的过程,通过确定节点和边的内容来构建能够解释主题和符合其逻辑关系的三元组。

数据关系的建立一般主要围绕两个层面,一是能够阐述知识主题,二是通过关系三元组可推理得到更多的知识内容。

比如,在“学生使用社交软件的行为特征”这个主题中,可定义“学生(实体)-网络社交特征(属性)-具体行为(属性值)“是一组关系结构,体现在数据为“张三-在线时长-5小时/天”,描述成知识语意为:张三同学社交软件每天会在线亮起5个小时;

又如,围绕“商品销售信息”这一主题,“产品(实体)-集合(关系)-商品(实体)”是一组关系结构,体现在具体数据为“手机-包含-华为手机”,描述成知识语义为:华为手机是众多手机中的一种。

当我们定义了这种数据关系,独立的数据就变成了可描述的知识语意,当这些语义联系在一起,用户通过一段段知识洞察到不同的现象,或解读出不同的结论。

这种知识语义的可视化,或者说这种数据关系结构的可视化,能够帮助用户了解业务现象,或产品底层看不到但却有用的信息。

比如京剧文化中师承的演变,可以通过不同人物之间的关系脉络,构建出“师承关系、家族关系、联姻关系”几种三元组模式,从相同节点中解读到某个京剧演员擅长某个角色的师承因素。

4.【可视层】可视化图形语义转换/可视化映射

当关系构建好以后,简单的三元组是容易读取的,但众多三元组集成在一起,也会涉及到信息读取效率的问题,就需要将关系结构图形化,这一步骤也是传统信息可视化方法中的必然环节。

根据已经构建好的数据关系结构,可通过“图表映射”和“视图设计”两种方式,进行可视化的语义转换。

(1)可视化图表映射

可视化图表,是指具备通用性的标准化图表。总体分为统计类图表和关系类图表,本文主要阐述关系类图表。关系类图表又可分为网状关系和层次关系。

网状关系图包括:关系图、弦图、弧长链接图等;层次关系图包括:树图、旭日图、矩形树图等。详细的标准化图表,可以借助E-chart、TableauPublic、Smartbi等软件进行参考选择(如图9)。

如果数据关系比较清晰简单,能够被这两类标准化图表所覆盖,则可以直接选择把节点和关系直接映射其中。如果你的数据关系比较复杂,或个性化,则可对标准化图标进行组合或变化,或设计个性化视图。

例如,在北京邮电大学彭国雁的论文《面向京剧知识图谱的信息可视化研究与设计》的案例中,“京剧传承之美”这一主题,“师承关系、家族关系、联姻关系”的三元组关系较复杂,如果直接用可视化图表映射来展示,会产生易读性差和页面布局难以控制的问题。

于是论文作者采用不同图表相结合的方式,并将图形的视觉元素进行改造:

(2)可视化视图设计

经过以上四个步骤,就完成了对知识图谱数据进行可视化。它不是单纯的以视觉效果展示数据信息,而是从数据关系提取到关系呈现为一体的设计过程。

三、结语

与传统数据信息可视化相比,知识图谱可视化更倾向于数据之间三元组关系的视觉表达,所谓“整体大于局部之和”,有了关系的建立,则更能够发现单一数据之外的延展信息和潜在机会。希望能够通过设计的力量,让普通用户也能更好的使用数据和洞察数据。

本文由@腾讯CDC体验设计原创发布于人人都是产品经理,未经许可,禁止转载。

THE END
1.基于HTML5的数据可视化方法有哪些基于数据可视化现在在大数据的带领下,数据可视化越来越突出,能够清楚的分析出自己想要的数据,这也是我们现在最求的数据可视化方法,那么实现HTML5的数据可视化方法有哪些?这都是我们值得研究的东西,数据可以给我们带来敏感的市场未来发展,同时也能够实时分别不同数据效果。 HTML5为数据可视化提供了新的实现方法。本文对HTML5在健康数据可https://blog.csdn.net/qianduankuangjia/article/details/78086309
2.数据可视化的方法有哪些?数据可视化是以图表的形式显示数据分析的结果。可视化数据的工具有Excel、报告、BI。图表的表现形式有柱状图、条形图、折线图、饼图、雷达图、地图、漏斗图、仪表板图、散点图、桑基图、语云和矩形树图等各种图形。了解了数据可视化的定义之后,小编带大家看看数据可视化的方法有哪些。 https://www.36dianping.com/news/2529.html
3.数据可视化方法有哪些数据可视化方法有哪些 曾老师 08-02 02:34 积木教育数据可视化是一种将数据以图表、图像等形式呈现的技术,它可以帮助我们更直观地理解数据的趋势、关系和模式。以下是一些常见的数据可视化方法: 1. 柱状图:柱状图适用于比较不同类别的数据量。通过不同高度的柱子,可以一目了然地看到各个类别之间的差异。例如,可以https://localsite.baidu.com/article-detail.html?articleId=26549019&ucid=PHfzrjnLPWf&categoryLv1=%E6%95%99%E8%82%B2%E5%9F%B9%E8%AE%AD&ch=54&srcid=10004
4.数据可视化有哪些方法?万象方舟以上是常见的数据可视化方法,选择合适的方法取决于数据的特点以及想要传达的信息。 飞翔的猪 数据可视化是将复杂的数据通过视觉元素呈现出来,以便更容易理解和分析。数据可视化方法有很多种,以下是一些常用的数据可视化方法: 1.折线图(Line Chart):用于展示数据随时间或其他连续变量的变化趋势。 https://www.vientianeark.cn/qa/385310.html
5.数据可视化之常见12种图表类型分析,数据分析图表类型主要有哪些本文讲述了数据可视化之常见12种图表类型分析,数据分析图表类型主要有哪些?数据可视化有众多展现方式,不同的数据类型要选择适合的展现方法,今天就整理分析了几种常见的类型,给大家提供参考。1.饼图饼图是一个划分为几个扇形的圆形统计图表。每个扇形的弧长(以及圆心角和面积)大小,表示该种类占总体的比例,且这些扇形合https://www.jiandaoyun.com/article/post/3990.html
6.数据可视化那些可用的工具和示例什么是数据可视化?数据可视化主要旨在借助于图形化手段,清晰有效地传达与沟通信息。为了有效地传达思想概念,美学形式与功能需要齐头并进,通过直观地传达关键的方面与特征,从而实现对于相当稀疏而又复杂的数据集的深入洞察。 这意味面对一大堆杂乱的数据你无法嗅觉其中的关系,但通过可视化的数据呈现,你能很清晰的发觉其中价https://zhuanlan.zhihu.com/p/679274007
7.专利分析方法流程步骤有哪些?澎湃号·湃客澎湃新闻专利分析方法 | 流程步骤有哪些? 原创 丑丑姐姐 专利分析可视化 WIPO的专利分析专家在github上开辟了WIPO Patent Analytics专栏(https://wipo-analytics.github.io/),专门分享专利分析的相关技术,其中有一本关于专利分析开源工具的书The WIPO Manual on Open Source Patent Analytics,这本书我们公众号在几年前的文章https://www.thepaper.cn/newsDetail_forward_18958556
8.对啊网设计学院:WEB的10种数据可视化最佳做法行业新闻进行精美,细致,探索性的可视化总是很诱人的,但这很少是最合适的方法。设计图形时要考虑周全-允许听众的知识和目标来决定应包含哪些数据以及应包含多少数据,并整理数据以讲述您要讲述的故事。 触摸屏与OLED网推出微信公共平台,每日一条微信新闻,涵盖触摸屏材料、触摸屏设备、触控面板行业主要资讯,第一时间了解触摸屏行http://www.51touch.com/lcd/news/dynamic/2020/0401/56721.html
9.管理会计有哪些工具方法数据可视化是指将庞大的数据通过图形化展示的方式,使其更容易被人理解和分析的方法。具体而言,数据可视化的方法很多,比较常见的有以下几种。 5.1 报表分析 报表分析是最常见的数据可视化方式之一。通过数据报表的形式,将数据展示出来。这种方法便于人们快速了解企业的经营现状和趋势,进而针对性地采取措施。 https://h.chanjet.com/ask/5046cfc6a07a2.html
10.数据可视化常用的五种方式及案例分析2)做数据可视化时,上述的五个方法经常是混合用的,尤其是做一些复杂图形和多维度数据的展示时。 3)做出的可视化图表一定要易于理解,在显性化的基础上越美观越好,切忌华而不实。 总结:作为设计师,除了掌握方法来有针对性的设计之外,还要在平时多留心积累素材,同时培养自己的创造力和专业素养,保持一颗好奇心,才能真正https://www.cda.cn/view/15902.html
11.电影数据分析及可视化系统研究方法包括哪些电影数据分析电影数据分析及可视化系统研究方法包括哪些 电影 数据分析 电影数据案例分析 需求 实现 问题一 问题二 问题三 需求 现在我们有一组从2006年到2016年1000部最流行的电影数据 数据来源:https://www.kaggle.com/damianpanek/sunday-eda/data 问题1:我们想知道这些电影数据中评分的平均分,导演的人数等信息,我们应该怎么https://blog.51cto.com/u_16213688/8129881
12.必备的5种数据可视化方法,结合可视化图表分析做得好的数据可视化一般具有以下特点:准确、创新、简洁。制作数据可视化,那必须要掌握相应的数据可视化设计方法,还要注重素材的积累。本文从最实用、最常用的角度,列出来必备的5种数据可视化方法,并结合可视化图表分析,干货满满。 一、什么是数据可视化? 数据可视化,是以图形化的方式,提供清晰、快速和有价值的信息。 https://www.finebi.com/2019/keshihua-2
13.针对公安民警开展数据建模方法的研究和实践本文旨在探索一种面向广大民警的可视化建模方法,通过放开数据操作权限、赋予可视化建模能力,催生更多警务应用模型。 导读 2018年3月,公安部科技信息化局以公安基层技术革新奖推荐评选为载体,以公安大数据建设应用为主线,组织开展了“智慧公安我先行”全国公安基层技术革新专项活动。新智认知自主研发的产品“自主数据建模的可https://www.secrss.com/articles/7120
14.两万五千字!写给设计师的数据可视化指南优设网达到数据可视化目标的基本方法 目前我们工作中经常遇到的数据可视化,大多数是制作数据图表(即统计图 Graph),所以我们本文的主要教学内容也是围绕着如何制作统计图来说。 制作统计图的过程可以被四个步骤,分别是:明确目的、选择图表、视觉设计、突出信息。 明确目的:明确数据可视化的目标,通过数据可视化我们要解决什么样的https://www.uisdc.com/data-visualization-design
15.中文NLP笔记:4.文本数据可视化的几个方法腾讯云开发者社区中文NLP笔记:4. 文本数据可视化 的几个方法 文本数据可视化有下面三种 1. 基于文本内容的可视化 基于词频的可视化和基于词汇分布的可视化 常用的有词云、分布图和 Document Cards 2. 基于文本关系的可视化 研究文本内外关系,帮助人们理解文本内容和发现规律https://cloud.tencent.com/developer/article/1388528
16.数据可视化有哪些手段数据可视化主要是借助于图形手段,去识别和理解数据中的规律、趋势、异常和关联,以提高数据分析的效率和准确性。而数据可视化的展现方式主要有以下五种:1.图形可视化;2.空间区域可视化;3.颜色可视化;4.面积及尺寸可视化;5.抽象概念可视化。它们可以帮助用户更好地与数据进行交互,探索数据中的潜在模式和趋势。 https://www.linkflowtech.com/news/3055
17.4种方法教你利用Python发现数据的规律python以上是一些基本的数据可视化方法,Matplotlib和Seaborn都提供了更丰富的功能,可以用来创建更复杂的图表和图形。 4.分组和聚合分析发现规律 在Python中,使用pandas库可以方便地对数据进行分组和聚合操作,以发现数据的规律。以下是一个基本的分组和聚合示例: 假设我们有一个数据集,包含销售日期、销售金额和销售员名称,我们想https://www.jb51.net/article/278111.htm
18.在地图上可视化地理空间数据的12种方法开源地理空间基金会中文分但它也是一门确保视觉效果与所基于的数据准确一致的科学。鉴于地图的优势和局限性,一些样式的地图在表示某些类型的信息方面比其他样式更好。因此,为了帮助展示的数据能够选择比较合适的地图,本文列出了12种常用的可视化地理空间数据的方法,有助于选择一种最适合方式来理解信息。https://www.osgeo.cn/post/12f76
19.融合Cesium和Geoserver的地质数据形变监测可视化方法①?在形变图层展示效果上,?不同于 Google?Earth 单一的渲染效果,?设计出一种动态改变形变监测点云数据过渡颜色的方式.?在可视化分析交互上与 ENVI/SARscape 进行对比.?实践及应用结果表明,?相对于传统方法如二维平面展示以及通过 Google?Earth 导入数据的集成展示,?本 文方法对形变监测结果有更加https://c-s-a.org.cn/csa/article/pdf/8179
20.中文NLP笔记:4.文本数据可视化的几个方法常用的有地理热力图、ThemeRiver、SparkClouds、TextFlow 和基于矩阵视图的情感分析可视化等 代码举例 1. 词云 wordcloud=WordCloud(font_path=simhei,background_color="white",max_font_size=80) 2. 关系图 用连线图来表示事物相互关系的一种方法。 安装Matplotlib、NetworkX https://www.jianshu.com/p/96f2f105e1fe