全国累计在线发布古籍数字资源13万部(件)数字化助古籍走出“深闺高阁”

安徽博物院文物科技保护中心纸质文物修复室的工作人员对古籍文物进行修复。新华社记者周牧摄

为查阅古籍文献,要出差到各地,探访各家图书馆——这是许多古籍研究者的共同记忆。在数字时代,这种情况正发生改变。国家图书馆(国家古籍保护中心)等6家单位近日在线新增发布古籍数字资源6786部(件)。至此,全国已累计在线发布古籍数字资源13万部(件)。依托数字化手段,卷帙浩繁的古籍走出“深闺高阁”,让文明触手可及。

兼顾“藏”与“用”

古籍,作为文物必须保护,作为文献必须为读者所用。兼顾“藏”与“用”,一直是古籍保护工作的重点,而数字化是最好的方法。中国古籍数字化起步于20世纪90年代。随着数字技术不断成熟,科技赋能古籍工作取得可喜进展。

AI助力古籍整理

把纸质古籍转化成数字文本,只是古籍保护的第一步。“现有的数字古籍大多由缩微胶片转换而成,分辨率低,使用也不方便。”杨海峥举例解释,这类古籍通常不具备检索功能,想查阅某个内容,需逐篇逐页阅读原文,很难快速找到想要的知识。

人工智能的快速发展,为数字古籍的整理分类带来革命性变化。2022年10月,由字节跳动与北京大学数字人文研究中心合作研发的数字古籍平台“识典古籍”便是一个生动案例。

进入“识典古籍”的网站,记者看到《周易》《左传》《礼记》等陈列于首页上。随机点开一本,左侧为章节目录,右侧为正文,排版形式既顺应现代人的阅读习惯,又还原了古籍纸张的阅读美感。

“与一些数字化平台不同,‘识典古籍’是完全免费的,而且增加了简繁体转换、底本影像对照、全文检索等一系列便捷功能。”抖音集团企业社会责任部产品总经理唐垲鑫介绍,该平台主要应用了文字识别、自动标点和命名实体识别这3种技术,不仅能将影印本上的文字提取整理,还能通过序列标注识别文本中的人名、地名等信息,准确率达到96%至97%。

“平台已整理上线了685部经典古籍,共计7900多万字,主要来自《四部丛刊》。”唐垲鑫说,“识典古籍”已上线手机移动版,未来平台中的书目将持续更新。

业内人士预测,随着AI技术的运用,古籍文献中所蕴藏的古代历史文化知识将不断被抽取,构造成各种各样的知识库,并将以知识图谱的形式支持互联网前端应用。

跨界合作成趋势

事实上,在“识典古籍”上线之前,文保机构、科研院校与互联网公司的跨界合作已越来越普遍。比如,腾讯联合敦煌研究院开发了AI病害识别技术,帮助“问诊”敦煌千年壁画。

由于在产品研发、设计方面存在优势,互联网公司等社会力量的加入会进一步保障古籍数字化平台的服务质量。“我们有优秀的产品经理、设计师、软件工程师,能够不断优化数字古籍平台的产品功能。”唐垲鑫说。

“识典古籍”的诞生离不开专家学者支持。北京大学数字人文研究中心主任王军表示,北大在这次合作中负责人工审核与校对,弥补人工智能有识别错误率的短板,并利用自有学术平台,连接更多专业研究者和学生群体。

专家认为,在古籍整理中,人文社科学者要积极介入,并加强与技术人员的合作,那样才能更好地利用机器而不是被机器牵着鼻子走,从而保证结果的准确性。

THE END
1.《儒藏》启动古籍数字化,《永乐大典》等超1万部古籍上线为确保整理文本的可靠性,专家广泛参考各种古籍目录,走访各大图书馆搜集海内外馆藏善本,于2022年整理完成并出版了《儒藏》“精华编”中国部分510种、282册,总字数近2亿字。《儒藏》全本编纂工作已启动,包括“精华编”在内,中国部分计划收书3000余种,约10亿字,将基本囊括我国历史上有价值的儒学文献。https://www.cqrb.cn/shishi/2024-12-10/2110618_pc.html
2.北京中文出版传媒融合创新发展联盟一、申报范围1.申报单位须为国家新闻出版行政管理部门批准的具有出版资质的出版单位,具备完成古籍出版或古籍数字化项目的条件和能力。 2.古籍出版申报项目须为古籍整理作品,整理对象原则上应为1911年以前在中国抄写或刊行的汉文书刊、文献资料,以及出土的1911年以前以汉文文字为载体的文献http://bcpma.cn/list/zx/100110141001/703
3.北京中文出版传媒融合创新发展联盟一、申报范围1.申报单位须为国家新闻出版行政管理部门批准的具有出版资质的出版单位,具备完成古籍出版或古籍数字化项目的条件和能力。 2.古籍出版申报项目须为古籍整理作品,整理对象原则上应为1911年以前在中国抄写或刊行的汉文书刊、文献资料,以及出土的1911年以前以汉文文字为载体的文献http://www.bcpma.com.cn/list/zx/100110141001/703
4.开通试用(2024年12月18日—2025年3月18日)文物考古知识服务平台是由文物出版社主导开发的文物考古领域专业数据库。平台汇聚了丰富的文物考古专业内容资源,具备检索、在线阅读、收藏等功能,旨在提供便捷的专业知识服务。 特色资源: 【数字图书馆】收录超过3000种图书资源,覆盖考古发掘、文物保护等多个领域,资源类型包括报告、图录、学术专著和古籍等。 【电子期刊库https://lib.tsinghua.edu.cn/info/1077/7304.htm
5.“简牍学文库”编纂启动将集纳百年研究成果地方工作12月16日,旨在收集我国简牍百年研究成果的“简牍学文库”启动编纂,将由甘肃简牍博物馆和读者出版集团有限公司联合编纂出版。 据悉,“简牍学文库”采取多学科融合方式,计划出版100册,主要包含简牍专题、简牍类编、学术新著、汉译名著、名家论集等五部分。相关成果将分三个阶段出版,预计到2029年结束。 https://www.nppa.gov.cn/xxfb/dfgz/202412/t20241217_877529.html
6.试用数据库(十九)中华思想文化术语数据库访问位置:图书馆网站---试用数据库资源---中华思想文化术语数据库 2 包含哪些资源? “中华思想文化术语数据库”共有6个子库,每个子库收录了不同的资源。 1、中华思想文化术语库 主要收录“中华思想文化术语传播工程”近几年的最重要成果--中华思想文化术https://mp.weixin.qq.com/s?__biz=MzI5MzAyNjQ3Nw==&mid=2650125479&idx=1&sn=be683f123cf87d4f0822e12d64c94ed9&chksm=f5c0a4e853438362745a5d383ef8f39a985cdecf4d86147cdaf0c05a77887b62111eabb28efc&scene=27
7.收藏文史数据库大全(分类归纳版)《瀚堂典藏》古籍数据库以精准校对的小学工具(文字、音韵、训诂)、古代类书、出土文献类数据为基础,大量纳入包括经史子集,以及中医药典籍、古典戏曲、敦煌文献、儒、释、道等历代传世文献,以及大型丛书、史书、方志、民国报刊等,涵盖文史哲等专业的教学和研究工作中所应用到的专业古籍文献数据。至 2010 年底,《瀚堂https://m.weibo.cn/ttarticle/p/show?id=2309634740159047599763
8.国家图书馆联合39家单位累计在线发布古籍数字资源13万部本次6家单位新增发布古籍资源6786部(件),不仅有明清版刻、稿抄本古籍,还有碑帖拓本等特色资源,为广大读者和专家学者开展利用和研究提供了更加丰富的文献资料。截至目前,全国累计发布古籍及特藏文献影像资源达到13万部(件),其中国家图书馆建设的“中华古籍资源库”发布古籍影像资源超过10.2万部(件),先后联合39家单位http://www.jslib.org.cn/zx/yjzx/gn/202301/t20230129_250636.html
9.数据库“中华古籍资源库”发布各类古籍资源,总量达10万部/件,包括馆藏善本古籍、普通古籍、甲骨、敦煌文献、碑帖拓片、西夏文献、赵城金藏、地方志、家谱、年画、老照片等,以及馆外、海外征集古籍资源。 【4】“古籍发现”开放全文古籍服务平台 北京珍本科技有限公司出资的公益性项目,免费提供使用,乃公益性的开放全文古籍服https://m.douban.com/note/844102806/
10.甲骨敦煌文献西夏文献……全国累计发布古籍及特藏文献影像该平台遵循边建设、边服务原则,目前在线发布资源包括国家图书馆藏善本和普通古籍、甲骨、敦煌文献、碑帖拓片、西夏文献、赵城金藏、地方志、家谱、年画、老照片等,以及馆外和海外征集资源,在线发布古籍资源超过10.2万部(件),已成为全国古籍资源类型和品种最多、体量最大的综合性资源共享发布平台。本次在“数字https://baijiahao.baidu.com/s?id=1754099700728720704&wfr=spider&for=pc
11.公共国家图书馆(国家古籍保护中心)“中华古籍资源库”:构建中华二是积极开展海外古籍数字化合作项目,如与哈佛大学哈佛燕京图书馆合作,在线发布该馆经部和史部善本和齐如山戏曲小说专藏共计931种;法国国家图书馆捐赠馆藏5300余号3.1万余拍敦煌西域文献数字资源等。 目前,“中华古籍资源库”面向全世界公益发布甲骨、敦煌遗书、宋元明清善本、永乐大典、碑帖拓片、民族文字古籍、老https://news.ccmapp.cn/news/detail?id=89f45d51-01d7-4dbb-8a8c-1d1a89fd9b7a&categoryname=%E6%9C%80%E6%96%B0%E8%B5%84%E8%AE%AF
12.全球免费历史文献数字资源大全这篇博客整理了全球范围内的免费历史文献数字资源,包括中国国家图书馆、其他国内图书馆、港台地区以及海外图书馆的珍贵古籍、地方志、拓片、家谱等资源。还涵盖了目录数据库和学术资源导航网站,为历史研究者和爱好者提供了丰富的在线检索平台。 摘要由CSDN通过智能技术生成 https://blog.csdn.net/qq494370/article/details/105957208/
13.十万部古籍免登录阅览!“中华古籍资源库”为读者“神助攻”张志清介绍,目前,“中华古籍资源库”全文古籍影像子库共计 17 个(“中华寻根网”“日本永青文库捐赠汉籍”两个数据库近期上线,上线后达到19 个),在线发布资源包括国家图 书馆藏善本、普通古籍、甲骨、敦煌文献、碑帖拓片、西夏文献、赵城金藏、地方志、家谱、年画、老照片等,天津图书馆、云南省图书馆等有关存藏https://www.sznews.com/news/content/2021-11/29/content_24776112.htm
14.同心战“疫”免费学习资源汇总(三)目前在线发布的古籍影像资源,包括:国家图书馆藏善本和普通古籍、法国国家图书馆藏敦煌遗书、天津图书馆藏普通古籍等,资源总量超过3.3万部。按内容则包括数字方志、甲骨世界、敦煌遗珍、中华古籍资源库、碑帖精华等17个专题。 用户在国图官网 www.nlc.cn 点击“读者门户登录注册”(身份证号申请开通),在读者门户首页左边https://m.thepaper.cn/newsDetail_forward_6034970
15.国家古籍数字化资源总平台“《永乐大典》高清影像数据库(第一辑)”由国家图书馆出版社与北京大学数字人文研究中心合作建设,致力于开展存世大典的文献数字化、全文化与数字版本征集,全面展示大典风貌及版本魅力,传播大典相关知识与文化,为相关学术研究提供文献资源支撑。 来源:国家图书出版社 查看 上一页 下一页 古籍专题资源库古籍整理出版https://www.guji.cn/