全国累计在线发布古籍数字资源13万部(件)数字化助古籍走出“深闺高阁”

安徽博物院文物科技保护中心纸质文物修复室的工作人员对古籍文物进行修复。新华社记者周牧摄

为查阅古籍文献,要出差到各地,探访各家图书馆——这是许多古籍研究者的共同记忆。在数字时代,这种情况正发生改变。国家图书馆(国家古籍保护中心)等6家单位近日在线新增发布古籍数字资源6786部(件)。至此,全国已累计在线发布古籍数字资源13万部(件)。依托数字化手段,卷帙浩繁的古籍走出“深闺高阁”,让文明触手可及。

兼顾“藏”与“用”

古籍,作为文物必须保护,作为文献必须为读者所用。兼顾“藏”与“用”,一直是古籍保护工作的重点,而数字化是最好的方法。中国古籍数字化起步于20世纪90年代。随着数字技术不断成熟,科技赋能古籍工作取得可喜进展。

AI助力古籍整理

把纸质古籍转化成数字文本,只是古籍保护的第一步。“现有的数字古籍大多由缩微胶片转换而成,分辨率低,使用也不方便。”杨海峥举例解释,这类古籍通常不具备检索功能,想查阅某个内容,需逐篇逐页阅读原文,很难快速找到想要的知识。

人工智能的快速发展,为数字古籍的整理分类带来革命性变化。2022年10月,由字节跳动与北京大学数字人文研究中心合作研发的数字古籍平台“识典古籍”便是一个生动案例。

进入“识典古籍”的网站,记者看到《周易》《左传》《礼记》等陈列于首页上。随机点开一本,左侧为章节目录,右侧为正文,排版形式既顺应现代人的阅读习惯,又还原了古籍纸张的阅读美感。

“与一些数字化平台不同,‘识典古籍’是完全免费的,而且增加了简繁体转换、底本影像对照、全文检索等一系列便捷功能。”抖音集团企业社会责任部产品总经理唐垲鑫介绍,该平台主要应用了文字识别、自动标点和命名实体识别这3种技术,不仅能将影印本上的文字提取整理,还能通过序列标注识别文本中的人名、地名等信息,准确率达到96%至97%。

“平台已整理上线了685部经典古籍,共计7900多万字,主要来自《四部丛刊》。”唐垲鑫说,“识典古籍”已上线手机移动版,未来平台中的书目将持续更新。

业内人士预测,随着AI技术的运用,古籍文献中所蕴藏的古代历史文化知识将不断被抽取,构造成各种各样的知识库,并将以知识图谱的形式支持互联网前端应用。

跨界合作成趋势

事实上,在“识典古籍”上线之前,文保机构、科研院校与互联网公司的跨界合作已越来越普遍。比如,腾讯联合敦煌研究院开发了AI病害识别技术,帮助“问诊”敦煌千年壁画。

由于在产品研发、设计方面存在优势,互联网公司等社会力量的加入会进一步保障古籍数字化平台的服务质量。“我们有优秀的产品经理、设计师、软件工程师,能够不断优化数字古籍平台的产品功能。”唐垲鑫说。

“识典古籍”的诞生离不开专家学者支持。北京大学数字人文研究中心主任王军表示,北大在这次合作中负责人工审核与校对,弥补人工智能有识别错误率的短板,并利用自有学术平台,连接更多专业研究者和学生群体。

专家认为,在古籍整理中,人文社科学者要积极介入,并加强与技术人员的合作,那样才能更好地利用机器而不是被机器牵着鼻子走,从而保证结果的准确性。

THE END
1.中国历史文献库中国科学技术大学图书馆《中国历史文献库》长期致力于收录国内外古籍、报刊、图书、图像、影音等与中国传统文化相关的古代及近代文献资料,旨在构建一个高品质、开放式网络知识体系,为中国传统文化研究及中华文明的传播提供坚实的文献保障。经过近十年的产品研发和数据积累,已拥有域外汉籍、四库全编、近代报刊、民国图书、近代教材、古地图、美术https://lib.ustc.edu.cn/%E7%94%B5%E5%AD%90%E8%B5%84%E6%BA%90/%E4%B8%AD%E5%9B%BD%E5%8E%86%E5%8F%B2%E6%96%87%E7%8C%AE%E5%BA%93/
2.图书详情限定所在馆: 限定所在馆藏地点: 限定馆藏状态: >> >> 索书号条码号馆藏状态应还时间文献所属馆所在馆所在馆位置流通类型卷册信息借阅次数续借次数 I313.45/z4443 00000191008758 借出 2024-12-19 杭州图书馆 杭州图书馆 文献借阅中心 中文图书 2 0 I313.45/z4443 00000190944736 借出 2024-11-29 杭州图书馆http://my2.hzlib.net/opac/book/2006996022
3.中国版本图书馆2010年恢复原建制并加挂新闻出版总署条码中心牌子,2015年更名为中国版本图书馆(国家新闻出版广电总局出版物数据中心),2018年转隶中央宣传部,副牌更名为中央馆藏丰富 收藏了包括图书、期刊、报纸、音像制品、电子出版物等在内的各种出版物版本,截至2009年12月31日,馆藏图书样本3225053种册,期刊样本7675种、20万http://www.360doc.com/content/24/1216/21/84253690_1142150904.shtml
4.浙图馆藏数据库目录索引十、中国基本古籍库 十一、中文生物医学数据库 十二、ELSEVIER SCIENCE 期刊电子版 十三、新华社多媒体数据库 十四、书生之家数字图书馆 十五、数字化资源共享网 汇集了浙江图书馆、浙江大学与浙江科技情报研究所所拥有的电子文献资源,数据量达几千万条。 https://www.zjlib.cn/zxtzgggs/34159.htm
5.中国国家数字图书馆网站名称:中国国家数字图书馆 网站地址:www.nlc.cn 目录类别:图书馆院 分类位置:?文化教育?图书馆?图书馆院 服务器IP:202.96.31.117 网站标签:中国国家数字图书馆,中华古籍资源库,国家古籍保护中心,[点更新] 网站描述:国家图书馆是国家总书库,国家书目中心,国家古籍保护中心,国家典籍博物馆。履行国内外图书https://www.023dir.com/site/26627.html
6.中国国家图书馆?中国国家数字图书馆中华古籍资源库 “中华古籍资源库”是“中华古籍保护计划”的重要成果,目前在线发布的古籍影像资源包括:国家图书馆藏善本古籍、《赵城金藏》、法国国家图书馆藏敦煌遗书等资源,资源总量超过2.5万部1000余万叶。2016年9月28日,“中华古籍资源库”正式开通运行,在线发布国家图书馆善本古籍影像10975部;2017年2月28日,在https://www.360doc.cn/article/2237933_1106869199.html
7.中国国家图书馆发布《中华古籍资源库》可免登录浏览,包含10万部(件数字方志 地方志文献为我国所特有,也是国家图书馆独具特色的馆藏之一,所存文献数量与品质极高。该数据库以国家图书馆藏地方志文献建设,主要包括为清代(含清代)以前的方志资源6529种。 赵城金藏 《赵城金藏》被誉为国家图书馆四大镇馆之宝之一。《赵城金藏》是在金代刻的一部大藏,因为它藏在赵城县(今属山西洪https://www.appinn.com/?p=40774
8.美国国会图书馆与中国国家图书馆之比较全国方志动态中国国家图书馆负责全国图书馆业务辅导,开展图书馆学研究。代表国家执行有关对外文化协定,开展与国内外图书馆界的交流与合作。[2] 1.6 两个图书馆都建立了数字图书馆并设立了网站 国家数字图书馆是国会图书馆将其独有的美国历史收藏数字化,使之在因特网上广泛传播。主要包括:完整的卡片目录检索;关于国会信息的联机http://scdfz.sc.gov.cn/gzdt/qgfzdt/content_19071
9.国家图书馆学刊杂志中国国家图书馆主办2017年第06期《国家图书馆学刊》杂志创办于1979年,,主要被CSSCI 南大期刊(含扩展版)、北大期刊(中国人文社会科学期刊)、统计源期刊(中国科技论文优秀期刊)、知网收录(中)、维普收录(中)、万方收录(中)、JST 日本科学技术振兴机构数据库(日)、国家图书馆馆藏、上海图书馆馆藏、数据库收https://www.youfabiao.com/gjtsgxk/201706/
10.中国国家图书馆?中国国家数字图书馆1. 什么是国家图书馆数字资源门户系统? 数字资源门户是国家图书馆推出的数字资源综合检索平台,旨在有机地整合国家图书馆收藏的多文种、多学科、多载体、多类型,且分布式存在的印刷型和数字化的信息资源,为社会公众提供方便快捷的一站式检索和信息获取服务。该系统具有整合检索、数据库查找、期刊查找、原文查找、个人空间http://dportal.nlc.cn:8332/zylb/zylb_szzymh_faq.htm
11.适合青年阅读报刊杂志清单收录与荣誉:上海图书馆馆藏;国家图书馆馆藏;知网收录(中);维普收录(中); 中国期刊全文数据库(CJFD); 《散文诗》杂志基础信息 主管单位:湖南益阳市委宣传部 主办单位:湖南益阳市文联 国际刊号:1004-7573 国内刊号:43-1199/I 出版地方:湖南 邮发代号:42-116 https://www.meipian.cn/1wurj5db