构建数智时代社会记忆的多重证据参照体系:理论与实践探索

开通VIP,畅享免费电子书等14项超值服

首页

好书

留言交流

下载APP

联系客服

2023.11.18广西

0引言

1文献述评

1.1社会记忆理论的发展与多重证据法的演变

相释证,出土文物中的无名写本与传世经典写本、拓本互相释证,采用多重证据参照法进行书法研究。可见,书籍、档案、绘画、照片、老地图、音乐、电影等文化记忆资源,服装、饰物、纹身、文物、遗迹、雕塑、历史街区、建筑地标景点等物质文化遗产,仪式、节日、活动、饮食、民间艺术、手工艺等非物质文化遗产,甚至自然科学研究的成果,都可成为多重证据参照体系中的一部分。

随着数智时代带来的人文研究范式的革新,数据循证、量化计算、文本分析、时空分析、社会网络关系分析、可视化展演、虚拟仿真(VR/AR/ER/MR、数字孪生、全息投影等)成为数字人文的典型研究方法。除了传统人文研究所需的“多重证据”,上述数字人文典型研究方法所用到的资源库、语料库、数据集和知识库,量化计算结果、可视化图表、虚拟场景等,成为了另一重证据——数智证据,可作为传统“多重证据”的有益补充。

1.2数字记忆的理论开拓及实践创新

“社会记忆”理论对档案馆、图书馆、博物馆、美术馆(GLAMs)等文化记忆机构及其相应研究领域的理论和实践产生了深远的影响,在“文化记忆”视域下,获得了历时性和共时性并重的双轴思维和一体化发展的全新视角。

“档案记忆观”发展并丰富了包括“文化记忆”在内的“社会记忆”理论,使得“文化记忆”具备了现实意义上的可操作性。“数字记忆”为各种文化记忆机构在数字时代保存、传承和建构“社会记忆”提供了新的方法和手段,也在逐步改变着“社会记忆”的理论格局,拓展了“档案记忆观”的理论边界,并不断更新着包括图书馆在内的文化记忆机构的运作模式和业务流程。各种文化记忆机构联合起来,共同构建面向人文研究的“数据基础设施”,有助于各应用和研究领域相互之间取长补短和交叉融合,为基于记忆媒介的人文研究提供更广阔的视野和更便捷的途径,有望更好地支撑数智时代人文研究的“多重证据法”。

2数智时代社会记忆的多重证据参照体系

数智时代社会记忆的多重证据参照体系,指的是支撑包含“数智证据”在内的“多重证据法”研究范式的数字人文研究基础设施,包括数据基础设施、算法基础设施和交流基础设施(见图1)。其中数据基础设施主要实现跨机构、跨网域、跨领域的多重证据的收集、处理、整合和融通。算法基础设施包括各种可以相互调用的软件、平台、工具、模型和算法,既为数据基础设施生产知识,同时也在数据基础设施的基础之上生成数智证据,从文本、图像和音视频中提取数据,建立算法模型,进行量化计算和可视化分析,动态地生成统计分析结果以及各种可视化展示和分析图表,支撑多重证据的便捷获取和相互参照,动态地形成证据链。交流基础设施支撑机构与机构、机构与用户、用户与用户之间的知识交流,支持交流过程中各交流主体之间的资源共享、众包、数据交换和融合,同时为用户提供建立在深刻洞悉用户需求基础上的精准服务,并在服务过程中保存交流活动中产生的“交往记忆”,将交往记忆固化为数字形态的“文化记忆”,进一步完善数据基础设施建设。

图1数字记忆多重证据参照体系的基础设施

2.1数据基础设施:多重证据的整合和融通机制

由GLAMs机构主要参与的“数据基础设施”建设,强调跨机构的共建共享、跨网域的开放获取、跨领域的知识融通、跨时空的版本迭代,有助于实现“社会记忆”多重证据参照体系的整体性、连续性和系统性。

虽然各种GLAMs机构的馆藏资源种类大相径庭,档案馆的主要馆藏——档案是人类从事生产和生活的一手资料,图书馆的主要馆藏——书籍是人类精神世界产出的知识产品,而博物馆和美术馆的主要馆藏——文物或艺术品则是人类生产、生活过程中遗存的或精神世界产出的物质文化遗产,但站在“文化记忆”理论的高度俯瞰,无论是档案馆和图书馆还是博物馆和美术馆的馆藏资源,无论是语音和视频的记录,还是图像和文字的表达,抑或是有形的实物彰显,甚至是无形的节日仪式昭示,都是文化记忆的媒介(载体),是以“文化记忆”的形式固化和再造、传承和传播的“社会记忆”,也是“多重证据法”所依赖的文化记忆基础设施,需要作为一个整体来考虑。在数智时代,内容和载体的分离,缩小了档案馆、图书馆、博物馆、美术馆不同文化记忆机构之间因资源载体不同而造成的差距,数据、事实和知识成了“社会记忆”的最小单位,脱离了媒介的束缚,跨机构文化记忆基础设施的整体性、连续性和系统性构建成为可能。

具体来说,社会记忆的整体性构建体现在数据基础设施将全种类(物质文化遗产、非物质文化遗产和文化记忆资源)和全媒体(非结构化或半结构化的文本、静态或动态的图像、音视频、3D模型)的资源纳入统一的框架之中,还包括用户贡献内容和用户交互数据。另外,还应支持数据的多粒度、多层次描述和策管,包括数字资源对象层、元数据层、内容层(文本、图像、公式、表格)、客观知识层(人、地、时、事、物等世界知识实体)、主观知识层(概念、思想、情感、典故等)。其中主观知识层应具有开放性和包容性,能够容纳来自不同领域、不同群体和个人的多视角、多维度的主观知识,允许对同一资源的不同主观认识,因其是个体所处群体的集体记忆和当下的社会规范和文化框架在个体记忆中的投影。

社会记忆的系统性构建主要是在媒介、客观知识实体和主观知识之间构建基于事理逻辑的广泛关联。可通过在资源对象、元数据层和内容层之上建立高层的知识互操作层来实现,基于社会记忆整体性和连续性,利用数据、事实和知识在资源和主客观知识之间建立广泛的关联,利用统一的知识建模和一致的知识表示方法和技术使得这种关联可被机器理解和计算,形成语义互操作层,实现多重证据在数智世界中的整合和融通。

2.2算法基础设施:数智证据的生成和参照机制

笔者将数字记忆的多重证据参照体系分为五个层面:数字记忆媒介层、客观知识层、主观知识层、数智证据生成层以及多重证据参照层,根据每个层面的功能需求和支撑的平台、软件、工具、算法需求进行分层分析(见图2)。

图2数字记忆的多重证据参照体系与算法基础设施

数字记忆媒介层包括全种类、全媒体数字资源对象,一般以文本、静态和动态的图像、音视频、3D模型、虚拟场景等数字化形态存在。数字记忆媒介要成为多重证据参照体系的一环,需要利用区块链技术支持数字资源对象的签名和在媒体格式更新换代和传播的过程中建立信任链,实现防篡改和可追溯;需要建设联合编目系统支持跨机构合作编目和协同知识生产,以生成标准规范的元数据记录,实现数字资源对象的描述和揭示;需要支持国际图像互操作框架(IIIF)的图像发布、检索、展示、共享和标注的工具套件;还需要支持OCR、图像识别、语音识别的工具和算法,从数字记忆媒介中提取知识。

主观知识层主要指基于特定专业领域的认识而形成的各种受控词表,如图书馆的分类主题词表:美国国会图书馆主题词表(LCSH);艺术领域的分类主题词表:盖蒂博物馆艺术与建筑叙词表(AAT)、英国V&A博物馆的中国图像志索引典等;或个人贡献的自由标签形成的大众分类法。主观知识层的知识要成为多重证据参照体系的一部分,需要利用简单知识组织系统(SKOS)和关联数据技术将词表发布为规范的知识组织体系,以便在互联网上提供规范控制、自动分类和标注服务。

数智证据生成层则需要支持量化计算、文本分析、时空分析和社会网络关系(SNS)分析的各种算法和工具、软件、平台,如支持时空分析的历史地理信息系统(HGIS),各种文本分析算法、大数据和云计算技术、数据可视化技术、虚拟仿真技术等。这些工具、软件、平台和算法如采用“微服务架构”进行设计和开发,则可成为相互独立又能彼此调用的组件,有利于迭代升级和共享重用。

多重证据参照层与上述四层和用户之间进行频繁的交互,因而需要一个强大智能的语义搜索引擎支持多重证据的检索、展示、比较、鉴别、关联、推理、演绎,以形成解决问题的证据链;需要利用用户画像技术来精准地洞悉用户需求、偏好和习惯,进行个性化推荐;需要专业、科学的用户界面设计(包括图形界面设计、用户体验设计和交互设计)来为用户提供便捷、美观、舒适的体验,通过激发用户的感官体验来加强其感知和理解,建立认知和情感方面的协同体系,创造出更加接近用户需求和更易于交互的系统。

在上述算法基础设施中,有的是集一系列技术标准规范、相应软件工具和业务流程于一体的集成式套件,如IIIF是图像互操作标准规范、支撑该标准规范的图像服务器和浏览器的集合。IIIF始于图像但不止于图像,形成了庞大的国际社区,已发展成为包括地图、音视频、3D在内的全媒体数字资源对象互操作规范。关联数据则是一系列语义网技术标准规范如RDF、RDFs、Ontology、OWL、SPARQL和相应软件如RDFStore的集合。有的则是一种更复杂的、专业的支撑平台,HGIS作为数字记忆的时空数据基础设施的核心组件,包括以下专业功能:提供对作为底图的历史地图资源及其矢量数据的存取和服务,如底图上传、在线配准、底图切换;对历史地名、疆域、界限的矢量或栅格等空间数据的管理和服务;提供空间计算支撑,如距离与面积计算、裁剪、合并、差集、概化、简化、求交,计算标识点、计算关系、重塑形状等;提供在线制图支持,支持点要素、线要素、面要素、注记要素的增删改查等操作和制图结果展示等。

2.3交流基础设施:多重证据的发育和成长机制

数据基础设施在协同式的知识生产和多向的知识交流过程中不断迭代,数智证据也随之动态变化,随着资源种类的增加、资源描述的深化、实体规模的扩大、语义关联的增强、机器算法的进化,所生成的量化分析数据、可视化图表和虚拟场景也会随之变化。获得数智证据对于研究者来说固然必不可少,追溯这种变化发生的机理和透视导致变化发生的细节也至关重要。因此在交流基础设施中,不仅要记录机构内部的知识生产活动和机构与机构、机构与人、人与人之间的知识交流活动,还要记录机器与机器之间的知识交流活动,以便于追溯数字记忆媒介和数字内容在这种交流活动中的演变。

3实践探索:构建“上海记忆”的多重证据参照体系

“上海记忆”是上海图书馆响应上海市委宣传部打响“三大文化”品牌的号召而开展的一系列实践探索,它建立在上海图书馆丰富的地方文献馆藏和自2006年启动并一直延续至今的“上海年华”项目的基础上,充分利用“图片上海”“电影记忆”“上海与世博”“辛亥革命在上海”“抗战图片库”“明星公司诞生90周年”“上海历史文化年谱”等各种专题库建设的成果,贯彻数字人文、文化记忆、公众科学等理念,采用数智时代的语义网、关联数据、知识图谱、机器学习、历史地理信息系统(HGIS)、数据可视化等技术,建设数据基础设施和基于多重证据参照体系的数字人文服务平台,服务于一系列记忆展演、文旅融合应用和多媒体展陈项目。

3.1支撑多重证据参照体系的数据基础设施建设

在数据基础设施建设中,利用基于本体方法的统一知识建模实现了多种类、全媒体数字记忆媒介之间知识的融通,利用关联数据技术的一致性知识表示在数据的底层实现了语义互操作,在语义描述框架的设计上充分考虑资源、数据、事实和知识的社会记忆属性。以图像的语义描述框架为例,图书馆界的图像元数据描述规范往往偏重于图像本身的物理特征或数字媒介特征及其浅层次的视觉艺术特征,忽略了社会记忆特征和深层次的视觉艺术特征。笔者基于“图像不仅是视觉艺术的表达,也是社会记忆的媒介”这一认识,设计了图像语义描述框架(见图3)。

图3图像的语义描述框架

图4支持多种类、全媒体数字记忆媒介语义关联的“上海记忆”本体模型

借助2021年开发完成的“上海文化总库”项目,在服务界面上完成了多个知识库的初步整合工作,在业务流程上也开发了配套的“上海文化总库内容管理系统”,实现了“素材库”“知识库”“专题库”建设的全流程管理和与服务平台的无缝集成。其中的“素材库”即是多种类、全媒体的数字记忆媒介,将素材的数字化、收集、整理、编目、著录、标注的过程置于整个知识生产的过程中,与知识库建设和专题库建设连成一体。应用交互元数据方案,在“历史原照”的数字化翻拍和加工过程中采集、保留数字化成像的技术参数和人工标引记录,为图像的长期保存、识别、访问和基于IIIF的发布和共享奠定基础。通过从已有的“知识库”中选择各种客观知识实体和主观知识词表,在素材的编目、著录和标注时即建立与知识库的语义关联,同时补充和丰富已有“知识库”中缺失的部分。而在“专题库”建设中,可根据不同的主题自由选择重复利用不同的素材和知识节点。这种将数字化、数据化连通的全流程管理,有利于提高知识生产的效率和质量。

3.2基于多重证据参照体系的记忆研究和展演

在融合了多种类、全媒体数字记忆媒介的数据基础设施建设的基础上,引入了支持IIIF标准规范的工具套件、支持文本分析的各种算法、支持社会网络关系分析的可视化组件、支持时空分析的HGIS平台、支持跨知识库检索的语义搜索引擎及检索结果的多维分面量化计算模型,以支持基于文本分析、社会网络关系分析、时空分析、量化计算等数智证据的生成和多重证据参照。另外还建设了“众包平台”支持用户贡献内容,开发了个性化与推荐模块,保存用户的检索历史、浏览历史、收藏历史、标注历史,基于用户交互数据提供个性化服务。

数字记忆展演为社会记忆提供了新的唤醒过往、与过往建立情感链接、跨时空交互的“记忆之场”,利用数据可视化和VR/AR/ER/MR、数字孪生、全息投影等虚拟仿真技术,以多媒体展陈的方式,为用户提供沉浸式的交互和体验,以促进文明的传承和文化的传播,不仅在博物馆界应用广泛,在图书馆界也越来越受到重视。上述数据基础设施和多重证据参照体系的建设,以上海图书馆东馆开馆为契机,正在为多个历史文献体验馆的多媒体展陈提供数据、方法和技术支持,尤其是上海地方文献馆的“上海之源”系列展项,如“红色旅游”“上海文化地标”“上海文化年谱”“上海之声”“外滩长卷”等,充分利用了数据基础设施提供的多种类、全媒体的数字记忆媒介和人物、机构、地点、建筑等客观知识库成果以及专家研究数据,重现了上海的红色文化、海派文化和江南文化共同孕育的城市记忆(见图5)。

图5数智证据生成和多重证据参照

4结语:同时作为知识中介和记忆宫殿的图书馆

数字记忆作为数智时代社会记忆的新形态和新常态,在某种程度上改写了“社会记忆”理论体系的格局,如记忆与遗忘的关系、个体记忆与集体记忆的关系、记忆与历史的关系、“交往记忆”与“文化记忆”的关系等都需要重新定义。同时也弥合了不同文化记忆机构之间由于所保存和传播的文化记忆媒介(载体)不同而形成的界限,在方法和技术层面为不同文化记忆机构共同构建整体性、连续性和系统性的“社会记忆”和支持数字人文研究所需的“多重证据参照体系”提供了可能,因而也对包括图书馆在内的文化记忆机构提出了新的需求。如何响应这种需求,近年来图书馆界积极参与的“数据基础设施”建设、新文科背景下的数字人文实践和大力投入的“智慧图书馆”建设,或许正在书写答卷。

夏翠娟上海图书馆研究员。中国人民大学信息资源管理学院博士研究生。

THE END
1.RFID智能档案管理系统——图书馆智慧升级的得力助手读者古籍同时,系统还具备自动盘点功能,图书馆工作人员可以通过手持 RFID 阅读器在书架间走动,系统就能快速检测出书架上图书的摆放情况,包括是否有图书错架、缺失等问题,并及时生成盘点报告。例如,在一次学期末的图书盘点工作中,工作人员使用 RFID 智能档案管理系统,仅用了一天时间就完成了对整个图书馆几十万册图书的盘点工作,https://www.163.com/dy/article/JJ7LPLOK053869PA.html
2.数字图书馆的服务创新(精选十篇)数字资源的建设是以强大和先进的技术力量为支持的。公共图书馆必须配备精良的计算机设备, 完善图书馆网络化和自动化系统, 为数字阅读和数字图书馆的建设提供强有力的发展平台和技术支撑。 3结语 面对数字阅读的浪潮和挑战, 公共图书馆应该认清形势, 把握时机, 顺应读者阅读习惯的改变, 积极利用现代资源优势, 拓展和开https://www.360wenmi.com/f/cnkeye84kw3h.html
3.闽江学院图书馆学术信息讲座之数据素养专题除此之外,系统深入参与用户学习与科研过程,在资源检索和阅读过程中嵌接笔记批注、分享交流、引用提醒、收藏导出、文献管理等多项服务,为用户提供学术资源深度利用的新型服务。 时间:2023年03月30日19:00点 地点:图书馆一楼学术报告厅 数字时代成为有信息素养的人https://lib.mju.edu.cn/_s96/2023/0210/c4944a144238/page.psp
4.高校图书馆管理系统的设计与实现对于高校而言,图书馆是学校教学和科研工作中的重要组成部分。然而随着计算机网络的发展,传统的图书馆自动化管理模式也受网络化的影响进入到了需要改革的时期,特别是数字图书馆作为一种新型的图书馆形态出现,使得这种变革的需求变得越来越迫切。 本文分析了图书馆业务工作不断信息化发展的情况下,当前国内外图书馆管理系统https://wap.cnki.net/touch/web/Dissertation/Article/-1012017267.html
5.图书情报硕士十篇面学术期刊利用数据之规范化探讨*叶继元 1,1 国外数字期刊及其它资源利用统计项目的经验及启示* ——以COUNTER项目为例 谢欢 1,8 期刊利用统计与Altmetrics的兴起* 陈铭 1,12 试析中国数字期刊利用统计指标的类型与功能* 刘丹1,18 数字时代期刊馆员知识结构刍议* https://www.mingkanw.com/w/keyid32e60hh.html
6.SSM图书馆管理系统计算机毕业设计源码07925图书馆系统代码“鸟欲高飞先振翅,人求上进先读书”,可见读书对我们的重要性,在这个高速发展的社会,人们也越来越意识到读书的重要性,人们需要汲取各个领域的知识,不断的拓展自己的知识水平,图书馆作为一个学习宝地,很多人都到图书馆借阅图书,这样不仅可以根据自己的需求搜索需要的图书,而且能够节约购书的成本。因此在信息化时代,开发https://blog.csdn.net/VX_DZbishe/article/details/139902929
7.分布式图书馆管理系统,中文例句,英文例句基于Z39.50的分布式检索技术在数字图书馆系统的应用研究 15. Library Integrated Management Information System 图书馆综合管理信息系统 16. On the Work of Administrator in Library Automatic System 图书馆自动化系统管理员工作的探讨 17. The Development of Management System with Microcomputer for Chinese Periodihttp://dictall.com/st/28/96/289664450C3.htm
8.美国国会图书馆介绍美国国会图书馆怎么样→MAIGOO百科二版权运作、管理、自动化处下设①编目科、②审查科、③信息参考组、④发证组、⑤记录加工组; 三政策与国际事务处; 四国内版权计划与采选组。 3.法律图书馆: 一法律研究处下设①东方法律组②西方法律组: 二法律图书馆服务处下设①藏书服务组②公共服务组; 4.图书馆服务部助理馆长办公室 下设有: 一集成图书https://www.maigoo.com/citiao/171128.html
9.书画发言稿(精选5篇)数字图书馆大厦的智能化应包括:通讯自动化系统(Communication Automation System,简称CAS);数字图书馆信息综合管理和服务系统,即办公自动化系统(Office Automation System,简称OAS);数字图书馆大楼自控系统,即智能大厦的楼宇自动化系统(Building Automation Control System,简称BAS)。此外还要考虑到它与大学办公室、实验室和https://www.1mishu.com/haowen/14166.html
10.教育部职业院校数字校园规范包括课堂与实训室数字化教学资源(媒体素材、试题、试卷、课件、案例、文献资料、网络课程、教学工具软件APP、常见问题解答和资源目录索引等)、仿真实训资源(仿真实验软件、仿真实训软件和仿真实习软件等)、数字场馆资源(职业体验馆、数字博物馆、数字艺术馆、数字科技馆、图书馆资源等),也规定了数字资源管理与共享的要求http://www.xtzy.com/wlzx/detail.jsp?public_id=153330
11.智慧图书馆解决方案图书馆自动化管理系统集成了采访、编目、典藏、流通、连续出版物管理等几大业务模块,实现了以书目数据为核心,纸质资源为对象,数据共享为目标的馆藏管理和用户管理,近年来,随着各种新型学术资源不断涌现,如研究数据、调查结果、计算模型、软件、小视频等电子资源及原生数字资源,原有以纸本为主要管理对象的图书馆自动化https://www.xinyetongcard.com/rfid-system/4073.html