激活中华典籍的“数字生命”——对我国古籍数字化建设的调查与思考

轻点鼠标,随着一缕悠远的音乐,“永乐大典”在隽秀的书法背景中缓缓浮现……

“终于让我们普通读者一睹国宝真容。”家住山东滕州的古籍爱好者李庆,在电脑屏幕前浏览《永乐大典》数字版时发出感叹。他所观看的,是由国家图书馆出版社有限公司和北京大学-字节跳动数字人文开放实验室联合研发的“《永乐大典》高清影像数据库”。历经600多年风雨,成书于明朝的《永乐大典》存世数量不及原书的4%,眼前的影像数据库让每一位读者都能感受它的厚重与魅力。

保护和传承中华古籍不仅是维护中华文明根基的重要任务,更是向世界传播中华文化智慧、造就中华文明新形态的关键环节。在学术意义上,古籍数字化意味着运用数字技术对古籍进行收藏与保护、整理与研究、呈现与出版,而在更广阔的人类文明衍进层面,数字化使古籍中的智慧精华,能够通过趣味性、前沿性和大众化的方式,得到传播与推广。调研中,98%的受访者认为应对古籍进行数字化转化,几乎相同比例的人认为数字技术对古籍保护和传承发挥着显著作用。

焕新以数字科技赓续中华文脉

古籍保护层面,数字化实现古籍生命永久存续,助力海外遗珍重现容颜。

中华文明是世界上唯一没有中断的文明,在数千年历史进程中,传世古籍浩如烟海。古籍不仅包含传统线装古籍,还包括甲骨、简帛、碑帖拓本、古地图等。《中国古籍总目》显示,我国现存古籍约有20万种。数字科技从根本上改变了古籍保护逻辑,通过“数字孪生”和“入库共享”,使古籍以数字形态永久保存。

“古籍数字化关系到我们国家文化资源的安全。古籍一旦遇到火灾、水灾等,将带来不可逆的损坏”,国家图书馆(国家古籍保护中心)办公室介绍。由国家图书馆(国家古籍保护中心)建设的“中华古籍资源库”,目前已发布古籍资源10.3万部(件),共2640万页,其中,读者利用率最高的善本古籍,已有2万多部实现上网。

对于壁画、彩塑等无法永久传世的文化形态,数字复刻更为重要。敦煌研究院的“数字敦煌”项目,将洞窟、壁画等制作成数字图像,一方面能永久保存敦煌文化信息,另一方面可使游客将线上参观与实地游览相结合,降低过量游客进入洞窟带来的文物保护压力。

古籍整理层面,数字化推动古籍搭上智能“快车”,促进整理工作提质增效。

当然,机器无法百分百准确地识别语义,人工标注和校对依然重要。借助数字平台,古籍整理的众包模式悄然兴起。中华书局下属的古联公司在2018年推出古籍整理众包平台,2020年上线了能在移动端分发任务的“i编纂”小程序。公司总经理洪涛向调研组介绍:“众包平台有5000多位注册用户,他们是来自各行各业的古籍爱好者。”据悉,该平台上编校过的任务近5万个,处理的古籍超14亿字。

古籍传播层面,数字化推动“蒙尘”古籍走向前台,搭载互联网实现开放共享。

小谭是中国古典文献学专业的在读研究生,日常学习“穿梭”于各大古籍网络平台。“这些平台基本能满足对材料的初步检索搜集,许多平台还提供珍贵古籍书影数据,不用去各地奔波就能看到古籍原貌。”

点开国家图书馆(国家古籍保护中心)建设的“中华古籍资源库”,排列着数字古籍、数字方志、赵城金藏、碑帖菁华、甲骨世界等20余个子栏目,支持单库检索、多库检索、精确检索、模糊检索。由北京大学-字节跳动数字人文开放实验室打造的“识典古籍”平台,提供原本影像对照、繁简转换、文白翻译等功能,并对内容添加了标点和注疏,还能显示文中人名、地名、书名等专有名词详细介绍。据调查,超过80%的受访者期待使用集搜索、翻译、注释等功能于一体的古籍应用平台,这些功能使古文褪去晦涩难懂的外壳,极大方便用户阅读和学习。

分布于全国各地的珍贵古籍也借助数字化浪潮纷纷亮相。截至2023年9月,国家图书馆(国家古籍保护中心)联合各地图书单位开展了8次古籍数字资源发布活动,地方图书单位累计发布古籍资源超过2.8万部(件),参与发布的机构下沉至县级图书馆。针对全省各地市馆不少珍贵古籍已做数字化处理但未能发布的情况,浙江图书馆建立了“浙江省历史文献数字资源总库”,已发布古籍2600余种,约6.5万余卷。联合发布让散布于中华大地的珍贵古籍重焕光彩。

活化融古于今绘就现代文明

内容的活化:萃取海量古籍中的知识网络

将海量古籍文本进行数字化提取,就形成了汇聚先哲智慧的“大数据库”。借助智能分析技术,能够针对其开展深度文本挖掘、社会网络分析、时空关系分析、知识图谱建构等,让大众全面又直观地理解古籍中的知识网络。

浙江大学徐永明教授团队开发的“智慧古籍平台”,在提供文本分词、标注、释义、文白翻译等功能基础上,还为用户呈现古籍著者的世系图、社会关系图等。“未来的发展方向,是将古籍文本与结构化数据进行关联,实现智能化处理”,徐永明教授告诉调研组,他的团队还开发了学术地图发布平台,以地理信息系统为依托显示其规律性、综合性数据,比如李白、杜甫一生中的地理迁徙轨迹图等,这一平台在中学语文教学中得到广泛应用。

对古籍文本知识进行显性化提取,也是北京大学数字人文研究中心持续发力之事。近期该中心上线“文献溯源分析平台”,能够呈现词语在古籍文本中的出现频次、共现情况等,并可追溯句子的来龙去脉,观察句意相似句子在形式和内涵上的流变过程。“吸引大众参与是古籍活化的重点,要利用智能技术让社会更多接触和使用古籍数据”,中心研究员位通谈到。在北京大学2022年举办的首届“北京大学数字人文作品展”中,“中国古代名人迁居地图”“中国古典诗歌声律分析系统”等也令人印象深刻。

形态的活化:虚拟仿真推动古籍融入现代生活

“千年之后,还有这么多人喜欢我,我还是蛮欣慰的”,在2023年央视《中国诗词大会》现场,诗人苏轼“穿越”而来,不仅为选手出题,还与演员饰演的黄庭坚一起再现了“鄱阳湖相会”。这位“苏轼先生”让人难辨真假,而“他”正是当下火热的虚拟数字人。

再如,深度沉浸的超现实技术将古籍活化推向新高度。2023年在国家典籍博物馆举办的“古籍寻游记”体验项目引发热烈追捧,观众只需头戴虚拟现实头盔,手持操作手柄,便能够“亲身”穿梭于历史时空,“亲手”将文物捧在掌心。

在技术加持下,虚拟现实、沉浸参与、人机交互、智能传播等为文化创新持续赋能。从“阅读古籍”到“身临其境”,技术重构了人与古籍的互动场景,让人能在综合感官体验中领略文化魅力,提升对文化的归属感和认同感。

此外,网络游戏、数字展厅、数字藏品等当下流行的传播形式,在多个维度上助力古籍从“活”起来到“潮”起来。

体验的活化:借助数字影像讲好古籍故事

古籍不仅蕴含古人智慧,也承载着中华文明发展的集体记忆。传播经典古籍,要将古籍知识与古籍历史相结合,运用具象化、生动化的手法讲好古籍故事。近年来,《典籍里的中国》《山海奇幻夜》《穿越时空的古籍》等视听节目,不断创新古籍影像叙事策略,引发一轮又一轮“古籍热”。更为重要的是,这些节目注重在时空交融中诠释中华古籍的当代价值。

“一直说‘古’会陷入曲高和寡,一定要汲取古籍对当下有指导意义、能够产生共鸣的点。”《山海奇幻夜》总导演雪芬向调研组介绍,“比如我们把夸父追日诠释为奔跑在路上的执着,将飞走的神鸟演绎为追求光明,这都能与现实呼应。”

短视频平台上,古籍的能见度也越来越高。抖音平台#寻找古籍守护人#话题播放超过25亿次,快手平台#古籍古书#话题播放3亿多次,古籍专家、普通用户和文化机构等讲述各自故事,让古籍及其文化通过手机屏幕进一步走进大众生活。

反思古籍数字化还需要完善什么

建设主体各自为政,技术标准不统一,数据库之间壁垒明显。当前,全国范围内的古籍数据库,在建设中缺少统一的技术规范,古籍的呈现、标注、检索等“千库千样”,质量参差不齐。随着数字化平台增多,库与库之间的壁垒愈加显现,用户难以实现“一站式检索”。面对海量古籍,对哪些书目进行数字化处理,各个建设单位缺少协同。“因没有相对可持续的规划,有较多重复制作,造成浪费”,某省级图书馆管理人员向调研组坦陈。

古籍活化系统性弱,资源配置待完善,“数字高阁”隐忧凸显。在古籍数字化建设目标上,多位受访专家表示,结构化、智能化开发古籍数据更为重要,但目前国内在这一层面“只见树木,未见森林”。从事古籍活化的主体数量较少、力量分散、单兵作战,在人力、财力和技术上面临制约。部分数字影像内容,将古籍元素作为噱头谋取利益,缺乏真正的文化传播意识,而与之形成对比的是,73%的受访者认为古籍数字化产品的宣传推广不充分。长此以往,古代典籍难免会被置于“数字高阁”。

古籍活化内容单一,集中于文史题材,更多古代智慧亟待呈现。在活化产品层面,65%的受访者认为产品形式相对单一,57%的受访者认为内容活化程度不够。在活化对象上,当前的数字产品通常聚焦文学和历史题材内容,对于中医、数学、生物、天文等自然科学领域古籍呈现较少。不少经典文学巨著已得到不同建设单位反复深度开发,但辉煌灿烂的古代科技发展图景,尚未进行有效的数字化呈现。如何克服技术难关,活化更多题材中华典籍,是未来建设不可忽视的问题。

展望我国古籍数字化工作高质量发展的策略建议

完善顶层设计,布局数字人文战略方向,引领文化软实力建设国际前沿。社会各界应充分认识古籍活化在当代文化传承中的重要作用,大力推进人工智能、大数据、云计算、可视化等技术融入古籍工作。针对前沿技术创新需求,发挥高水平企业和科研院所技术研发优势,破解技术创新难题。将全局规划与重点支持相结合,打造一批高质量古籍类数字人文产品。积极引领世界数字人文发展前沿,加强对外合作交流,向世界宣传推介我国古籍数字化建设成果,增强我国文化软实力和中华文化国际影响力。

优化人才培养,打通专业教育与社会参与,造就数字化建设有生力量。2022年,教育部将数字人文专业列入普通高等学校本科专业目录,但目前仅有个别高校开设此专业,应推动有条件、有基础的高校积极布局、开展办学。同时,依托国家新文科和新工科建设战略,加强信息技术、新媒体技术、视觉设计等学科知识与古典文献学、汉语言文学等专业交叉融合。推进高校与企业协同,在产、学、研深度融合中培育人才。面向社会开办古籍数字化专项培训班,统筹建设在线课程,推广古籍整理与数字出版众包模式,激活社会力量参与古籍数字化建设与传播。

(作者:光明日报联合调研组执笔人:北京市习近平新时代中国特色社会主义思想研究中心特约研究员吴占勇、本报记者白雪蕾;调研组其他成员:中央民族大学新闻与传播学院张亚文、张志颖)

THE END
1.《儒藏》启动古籍数字化,《永乐大典》等超1万部古籍上线北京大学表示,《儒藏》“精华编”编纂工作已收官,在全本编纂工作开展同时,专业人员将利用人工智能技术,通过“识典古籍”智能整理平台,开展古籍数字化整理工作。目前,《永乐大典》等超1万部古籍已在平台上线。 因为人工智能的加入,此次古籍数字化的速度将提升。人工整理者把相关文献的影像上传至平台,人工智能会先进行https://www.cqrb.cn/shishi/2024-12-10/2110618_pc.html
2.国学网——古籍数字化——古籍数字化概念的形成过程探析内容摘要:概念研究是古籍数字化研究的核心问题,探讨古籍数字化概念形成的历史过程,有助于古籍数字化概念的进一步明晰。古籍数字化概念的形成经历了早期实践、术语混用和概念形成3个阶段。 关键词:古籍;数字化;概念研究 作者简介:毛建军,男,1971年生,南京大学中文系2005级博士研究生 http://www.guoxue.com/zt/gjszh/yjwz_005.htm
3.加快古籍数字化进程原书影像与数字化文本相互对照,繁简字随时切换;遇生僻词句,还能“查看引用”,出处一目了然;可以360度观赏,仿佛拿着真书在读……打开“识典古籍”平台,《永乐大典》浓缩于方寸之间,读者得以更加直观深入地领略这部传世古籍的风采。 一些曾藏之名山的古籍,走入“寻常百姓家”,是数字时代的新气象。前不久召开的第九https://m.gmw.cn/2024-11/04/content_37655973.htm
4.古籍数字化现在面临的问题与趋势转自国学网行业新闻此外,笔者还见到有位图形式和多媒体格式的数字化古籍。前者如济南开发区汇文科技开发中心研制、武汉大学出版社出版发行的《四库全书》原文电子版。后者如方圆电子出版社出版的《中国古典文学精品书库》(见2688阿里巴巴网站的“芝麻开门”图书系列),包含了《红楼梦》、《三国演义》、《西游记》、《初刻拍案惊奇》、《二刻https://www.iscan.com.cn/news/hynews/2020/0904/576.html
5.古籍数字化传统文化焕活力山东大学文学院院长杜泽逊说,因为有了数字化古籍,北京大学教授张丽娟和一位年轻人在国图收藏中发现了过去不知道的十行本《尚书注疏》的元刊原印本和杨复《仪礼图》元十行原印本。元十行本,清代以来用的都是明代历次修版,原印本的发现甚至会改变原有的结论。 https://m.haiwainet.cn/mip/3541083/2020/0102/content_31692350_1.html
6.瓯越学术讲座第153期:古籍数字化及数字人文实验室建设2024年6月20日,中华书局古联(北京)数字传媒科技有限公司副总经理、《数字人文》副主编朱翠萍女士应邀在我院203会议室作了题为《古籍数字化及数字人文实验室建设》的学术讲座。本次讲座由我校古籍整理研究所所长侯荣川教授主持,我院本科生、研究生及部分教师积极到场参加。 https://hum.wzu.edu.cn/info/1012/35132.htm
7.中华书局推进古籍数字化纪实四川省社会科学院天府智库打开中华书局“中华古籍数据库”,黄褐色的界面充满古典感和文化气息,左侧的目录栏里,各本古籍按照“经”“史”“子”“集”分类排列,纲举目张,条理清晰。 这一数据库保留了标点、校勘、专名、注释等全部整理成果,提供原书扫描图像页与数字文本一一对照,公众将拥有可靠、可直接引用的数字化古籍,实现了中国高质量古http://www.sass.cn/101004/21697.aspx
8.古籍数字化,为古籍保护赋予了新活力文旅科技数字化古籍:走出深闺待人识 《十年,哈佛燕京图书馆中文善本特藏数字化终完成,5.3万卷全部无偿共享,一键直达》,这篇发布于2017年8月的微信公众号文章,至今仍然不断被转发、阅读。 这篇文章热度不减的背后,是读者对于中国图书馆古籍数字化的殷殷期待:哈佛燕京图书馆的中文古籍只有4200部、5.3万卷,而国内现存的汉文古https://www.cacta.cn/DSJ/HTML/20191107094841.html
9.国家古籍数字化资源总平台“《永乐大典》高清影像数据库(第一辑)”由国家图书馆出版社与北京大学数字人文研究中心合作建设,致力于开展存世大典的文献数字化、全文化与数字版本征集,全面展示大典风貌及版本魅力,传播大典相关知识与文化,为相关学术研究提供文献资源支撑。 来源:国家图书出版社 查看 上一页 下一页 古籍专题资源库古籍整理出版https://www.guji.cn/
10.西藏古籍文献数字化提速大批珍贵藏文古籍近期实现“云阅读”记者从西藏自治区古籍保护中心获悉,2019年西藏完成近6000函古籍文献普查登记数据整理归档,建设完成近6TB藏文古籍文献数字化数据库,古籍文献数字化保护利用进一步提速推进。 西藏古籍普查工作人员在世界文化遗产罗布林卡开展古籍普查登记工作(资料图片)。新华社发(西藏自治区古籍保护中心供图) http://m.amdotibet.com/news/xizang/2020-03-13/19483.html
11.数字化开创中国古籍保护工作新局面 中国古代文献典籍是中华民族在数千年历史发展过程中创造的重要文明成果。随着科学技术的发展,数字化逐渐成为古籍保护、研究利用、弘扬传统的重要途径和手段。那么,数字化是如何实现让祖国珍贵的文化遗产,超越纸质载体的存在年限,永久地传承下去? 国家图书馆针对古籍数字化开展的各项工作。下面让我们一起回顾数字化https://weibo.com/ttarticle/p/show?id=2309404715619667804283
12.古籍整理数字化(精选四篇)古籍的数字版本可以无限复制,是取之不尽、用之不竭的资源,并可以进行网络实时传播,突破了时空的限制;数字化古籍因为其传播便利和易用性,读者使用数字化古籍更方便,也较容易汇集知识从而产生新的价值;数字古籍容易储存,体积小,便于检索、应用及处理,所以数字化的古籍是使古籍保持生命力发挥价值唯一的选择。https://www.360wenmi.com/f/cnkey2e4phhk.html
13.浅谈图书馆古籍的数字化管理古籍是我国几千年文化的传承,是我国极为宝贵的精神和智力财富。为了更好保护和利用这些财富,很多大型图书馆,都利用了现代化的计算机技术,以下就是由小编为您提供的浅谈图书馆古籍的数字化管理。 将古籍中的语言文字及图形转化成能为计算机所识别的数字符号,以此来制成古籍文献书目数据库以及古籍全文数据库,即对古籍进https://www.ruiwen.com/guji/1025505.html
14.2024年两会陈红彦委员:数字化助力古籍保存与传播北京大学“新时代,图书馆要不断创新、升级服务方式,让公共文化服务惠及更多人。图书资源数字化可以让读者阅读更方便,不受时间空间限制。尤其是图书馆的古籍资源以数字化方式呈现给广大读者,既能展现古籍的内容,又起到了保护原件的作用。”全国政协委员、国家图书馆古籍馆馆长、北京大学1983级中国语言文学系本科校友陈红彦认为,数http://www.pku.org.cn/zt/2024nlkxyyl/1374438.htm
15.试论古籍数字化的重要意义摘要: 古籍数字化是通过应用现代信息技术将古籍进行电子化扫描录入管理,实现古籍的再生,将古籍的原貌展现给读者,让读者通过电子计算机、网络、手机等载体快速阅读古籍。古籍数字化有利于保护和开发利用中国古代文化遗产,很好地解决古籍保护和使用之间的矛盾,避免人为因素对古籍造成的损害。 https://www.fx361.com/page/2019/0411/4958208.shtml
16.“互联网+古籍”:梨洲文献馆的数字化复活此刻,那些在处理过程中的数字化古籍,亟待有一个清爽而雅致的专门去处。文物保护部门最初的意念更为强烈和明确了———不如建立一个网上的“梨洲文献馆”,不仅用于保存与维护数字化古籍,而且还不设任何限制地面向公众开放,免费阅读,充分体现公益价值与社会意义。 https://www.nbmuseum.cn/art/2016/11/1/art_47_17122.html
17.古籍数字化,除了保护+传承,还能做什么?产业资讯事实上,古籍数字化的学科建设问题已经引起了部分学者的关注,如毛建军从传统目录学、版本学、校勘学研究的新视野,探讨了电子文献学的研究范畴[41];葛怀东对古籍数字化学科的研究对象、学科性质作了初步界定,并提出拟以数字化古籍整理学、中文信息处理技术、古籍数字化管理理论作为学科构建的基本框架[42]。 http://www.ordoswh.com/article/Info/index/id-5585
18.《古籍数字化概述》课件.pptx《古籍数字化概述》ppt课件引言古籍数字化技术古籍数字化现状与趋势古籍数字化面临的挑战与对策案例分析总结与展望CATALOGUE目录01引言背景介绍古籍作为中华文化的重要载体,具有极高的历史和文化价值。数字化技术的发展为古籍的保护和传承提供了新的途径。随着时间的推移,古籍原件逐渐破损、遗失,保护和传承面临巨大挑战。目的https://max.book118.com/html/2024/0116/8137021065006026.shtm
19.李军:古籍数字化,让“沉睡的古籍”苏醒新华访谈近年来,国家开始重视古籍保护工作,并且建立了专门的国家级保护中心,省市乃至一些区县也都有相关的古籍保护机构。现阶段,全国古籍的收集和整理,比以前更具有系统性,也为研究工作提供了更多的数据。随着各项普查目录的发布,以及多个单位对自身收藏古籍目录的出版,使得古籍资源的“总账”更加详尽。 李军 古籍数字化为研http://www.js.xinhuanet.com/2022ft/lij.htm