开通VIP,畅享免费电子书等14项超值服
首页
好书
留言交流
下载APP
联系客服
2020.09.01
导言
在当今海量数据的不断产生和积淀的时代,博物馆如何利用自身采集或拥有的各类数据资源,并通过数据的分析、挖掘及有效的呈现产生新的效用,是博物馆数字化建设今后所应该努力的方向。这其中,数据可视化就是一个可供开发和利用的新技术。本文介绍了数据可视化的一些基本概念,分析了它与博物馆之间的相互关系,并通过上海博物馆的一些案例来展现这项新技术在博物馆数字化建设中的一些应用场景,借此为今后数据可视化技术在博物馆中的进一步运用提供参考和借鉴。
一、什么是数据可视化
数据可视化作为一门技术,从20世纪80年代就开始出现。当时的定义可概括为:“运用计算机图形学和图像处理技术,以图表、地图、标签云、动画或任何使内容更容易理解的图形方式来呈现数据,使通过数据表达的内容更容易被理解。”而随着数据数量和种类的不断扩张以及人们对数据可视化研究的深入,单一的可视化已很难满足人们越来越多的对于挖掘数据中存在的各种隐形关系的需求,可视化慢慢发展成为一个涉及数据挖掘、人机交互、计算机图形学等的综合性学科。由此,将数据挖掘技术与可视化技术相结合起来,成为人们从海量数据中汲取有效信息的一种良好方式。
数据可视化的实现步骤
②数据选择和数据清洗。对选择出的数据进行数据清洗,将数据转变成“干净”的数据。
③数据转换。将清洗后的数据转化成关联规则算法所能接受的格式。同时对数据进行关联分析,尽可能发掘出数据背后隐含的有价值的信息和规律。
④主题挖掘。使用技术手段对转换后的数据进行主题挖掘,发现数据相对集中的主要的观点和论述。
⑤可视化。以适当的可视化技术,对数据集进行可视化展现,同时运用图谱等手段对关联关系进行可视化,使关联的结果一眼可见,让观者可通过观察得到启示和发现。
那么,什么才算是一个好的数据可视化?这里援引一位台湾学者的观点:数据可视化能做到简单、充实、高效,兼具美感就是好的可视化。成功的可视化的美妙之处既在于其艺术设计,也在于其通过对细节的优雅展示,能够有效地产生对数据的洞察和新的理解。典型如名为“NORSE”的网站制作的“全球黑客攻击示意图”(图1)。这个网站可以观测实时的网络攻击,难能可贵的是,它把原本抽象的网络攻击表现得非常具有画面感,地图上的亮点每闪烁一次说明该区域有黑客进行了一次对外攻击活动,而光线所指向的区域,则代表了被攻击的对象所在的区域。
图1全球黑客攻击示意图
当然,要做好一件数据可视化的产品并不容易,它除了需要开发者具备良好的数据分析能力和熟练使用可视化技术方法之外,还需要有较好的美学素养和较强的用户体验感觉,而更为重要的是需要数据收集和整理等基础性工作的保障。
二、博物馆与数据可视化
博物馆本来就多以直观的方式作为最主要的与社会发生联系的纽带,故此,可以说可视化是博物馆与生俱来的一种基因。陈列展览作为一种可视化的呈现,一直是博物馆传播知识、实现社会价值的重要载体。但此类可视化只是一种物象或图景的展现,只是可视化的最直接的表露,与我们现在所说的数据可视化有着很大的不同。真正的数据可视化是随着博物馆数字化的进程而逐渐浮现的。当博物馆的各类数据,藏品数据、业务数据、管理数据、研究数据、观众数据等一一被纳入采集的视野,并成为数据库中的沉淀数据以后,如何激活、用好这些数据,发挥它们的价值,就成为很多博物馆尤其是数字化从业人员经常思考的问题。
也许有人会问,博物馆本来就以物体的直观显露为特点,博物馆为什么还要做数据可视化?它对博物馆的工作能起到什么作用?实际上,博物馆本身就存在着可视化的需要,即以艺术类博物馆来说,“艺术本身在某种程度上就是对思维和想法的图像化、可视化呈现。艺术图像对线条、图形、图案等数据图表常见元素的运用也不胜枚举,更不要提在现当代艺术史上直接呈现图表、图谱的创作了。”其他类型的博物馆也大致如此,虽然具体呈现有所不同。就现在数据可视化技术的能力来看,做可视化的着眼点不应该仅仅放在展示上,而是如何鼓励观者通过数据去进行发现。发现,可以说是现在做博物馆数据可视化的一个关键词。“在视觉的层面建立起数据、图像与世界之间更为清晰、完整和广泛的联系,并进行知识生产,塑造思维认知。这不失为一种现代的诉求。”鼓励发现,引导发现,由发现产生价值,并由此促使博物馆数字化建设向博物馆核心业务渗透,最终成为博物馆业务整体转型的推手,这就是博物馆数据可视化的意义之所在。
“当信息成为博物馆收藏、研究、展示和传播的关键要素的时候,数字化更直接将信息或数据置于博物馆的核心”。这段话可以用来解释在数字化建设中引入数据可视化乃至数字人文的原因。数字人文作为人文科学领域的一种新实践,能够使数据资源、技术与人文研究深度融合。数字人文在博物馆的应用,将为博物馆的各项业务提供新的强劲推力,尤其是促进博物馆传播拓展新的边界和产生新的思维。而且随着人工智能技术的成熟,数字人文的应用还将逐步丰富博物馆研究的方法论体系,使知识内涵显性化,拓展博物馆研究人员的学术视野,为研究范式的转变提供新思路。可视化技术是构成数字人文技术体系和直观形象的极其重要的一环。它对数字人文比较和发布功能的实现具有不可替代的作用。因此,如果一个博物馆对自身要求较高,对数字产品注重知识的体系化与多层次挖掘,看重多维度、广视角的表现,需要有较高的立意和更高的观察视野,那么,数据可视化就是一个不错的选择。
三、上海博物馆在数据可视化的探索
上海博物馆从数字化建设伊始,就将内容建设放在首位,同时依据艺术博物馆的定位,追求内容和形式的统一。随着数字化建设的逐步深入,以及对数字产品理解程度的逐步提高,数据可视化技术逐渐进入我们的视野,并应用到实践中,取得了一些成果,当然也有不少教训。
图2上海博物馆官网首页
馆藏明代吴门书画家书札精品展
“遗我双鲤鱼:馆藏明代吴门书画家书札精品展”是上海博物馆在2017年所做的一个非常有特色的实体展。这个只有49封书札组成的小型展览办得亦小亦美,风生水起。我们的团队在经过研议以后,决定以数据可视化作为突破口,充分利用互联网的多元化特点,以生活为切入点,争取把明代文人及其书札作品的多面性展现出来。我们选取了两个入口:关键词入口和人物关系入口。关键词入口是从书札中选取贴近生活的语句做成,名为“见字如面”(图3),人物关系入口则是与此次书札展涉及的人物的关系网络图相连而成,名为“云中谁寄锦书来”。无论是关键词还是人物关系入口的设置,都是缘于书札内容价值的一种数据可视化的表现。“见字如面”版块是源于数字人文中常用的词频分析方法而形成的设计思路。“云中谁寄锦书来”则是网络关系矩阵的一种视觉化表现。
在策划这个网展时,我们都注意到了策展人手绘和注释的人物关系表,这个关系表已经在展场得到了应用。由于通信双方的关系涉及书札内容的解读,也关系到人物和时代背景的印证,所以梳理和展现这整个关系网络的重要性不言而喻。但是,单纯复制原有的以线性表达的人物关系图不足以让普通观众看懂。从数据可视化的角度来看,必须利用数字技术去解构学术高度,进而采取一种更美观通俗的表达。最终我们引入李清照《一剪梅》的词意,对应吴门文人灿若星空的意向,利用“数字人文”的理念构建了一幅可视化互动关系图(图4)。在页面上,每一颗闪烁的“星星”都代表着一位文人巨星,点击“星星”,便可一键穿越走进明代吴门文人的生活交游圈,阅读他们的私人通信,得见他们有血有肉的日常生活。
图3“见字如面”界面
图4吴门星空人物网络关系图
上海博物馆数字中心项目及其子项目
图5上海博物馆数字中心综合页界面
图6上海博物馆数字中心观众服务数据界面
作品可视化板块则是对董其昌的书画作品予以介绍和分析。在这一板块中尝试引入最新的机器学习技术,以人工智能方式分析中国古代绘画的元素级特征,构成素材数据抓取和聚类的自动化模式。通过算法的调优,目前已初步提取了山、树、房、亭、矾头、船等数十类特征元素上千个(图8)。为进一步自动图像聚类分析、相似度匹配等应用提供了精准的数据基础。
图7董其昌大事年表可视化界面
图8机器标注与学习结果
总之,对于博物馆数字化建设来说,数据可视化是其中不可或缺的一部分。展示数据的力量,通过数据去引导发现,在发现过程中形成创造,并以创造成果造福于社会,这才是博物馆数据可视化的意义所在,也是博物馆融入新时代,应对新形势应有的勇气和担当。当然,这将是一个长期的、循序渐进的过程。
本文改编自《博物馆数据可视化的探索与实践——以上海博物馆数字化建设为例
本文改编自《博物馆数据可视化的探索与实践——以上海博物馆数字化建设为例》,原文刊载于《博物院》2019年第2期(总第14期)。作者:刘健上海博物馆。