从图书馆“搬”到网络平台数字技术让古籍“触手可及”

输入网址、轻点鼠标,儒家经典《论语》可逐页在线阅览,飘逸俊秀的汉隶代表作《曹全碑》书法跃然眼前,古籍还能实现繁体字和简体字转换等功能,让读者能查询、会阅读。专家认为,中华古籍浩如烟海,对珍贵古籍进行保护、修复和活用,关乎中华文脉的延续和传承。随着数字技术不断成熟,古籍正走出“深闺高阁”,资源会得到更有效利用。

从图书馆“搬”到网络平台

点击浏览器,进入一个名为“识典古籍”的网站,记者看到《周易》《左传》《礼记》等典籍陈列在首页上。随机点开一本,左侧为章节目录,右侧为正文,排版形式既符合现代人的阅读习惯,又还原了古籍纸张的阅读美感。

这是北京大学数字人文研究中心与字节跳动合作研发的一个数字古籍平台,自去年10月发布以来,已上线古籍1200余部,免费供公众浏览。

与一些数字化平台仅提供古籍影像不同,点击该平台的功能按钮,还能实现简繁体转换、图文对照、全文检索、支持移动端等服务。北京大学人工智能研究院副研究员杨浩介绍,该平台应用了文字识别、自动标点等技术,不仅将影印本上的文字提取整理,还可以标记文本中的人名、地名等信息。“我们利用人工智能技术,将古籍由以前的图像加工成可检索的文本与数据,方便研究者、用户直接阅读。”

这些古籍是怎样从图书馆库房“搬”到网络平台的?杨浩介绍,古籍数字化过程分为两步。首先将古籍进行扫描。古籍扫描使用专用非接触式扫描仪,通过高像素照相机,尽量不按压古籍页面进行拍照;采用的光源是防紫外线的LED灯冷光源,减少对古籍的损害。其次是对图像做数据化处理,利用人工智能技术对文字进行识别,对标点、实体等进行标引,方便读者阅读与检索。

方便读者获取资源

“作为再生性保护的重要手段,古籍数字化及其平台建设意义重大。”北京大学数字人文中心主任王军认为,古籍数字化可以很好地解决古籍保护与利用之间的矛盾。传统上,人们要利用古籍,必须直接接触书籍,这可能导致书籍受到进一步磨损,且只能在特定的图书馆或机构中阅读。通过数字化,不仅能减少对古籍的物理损害,还方便读者随时随地获取这些资源。

近年来,古籍数字化和平台建设进展很快。国家图书馆搭建的“中华古籍资源库”已成为全国古籍资源类型和品种最多、体量最大的综合性资源共享发布平台。中华书局的“中华经典古籍库”已发布6000多种、15亿字的点校本古籍。一些地方还打造了整理少数民族古籍的数字平台,如“广西古籍文库”目前共收录100多部古壮族文字古籍底本和近千份民族地区文书等资源。

不过,古籍数字化工作依然任重道远。业内人士指出,中国现存古籍中,只有少部分被拍摄成图像资料,而大部分未实现文本数字化。此外,大量古籍分散收藏在各个图书馆或收录于不同的数据库,难以进行高效检索、关联阅读和深度挖掘与利用。

如何将这些散落的古籍整合起来?6月初,一个旨在对2.5万种古籍进行数字化整理的古籍智慧图书馆项目启动。该项目到2025年底,将实现国家图书馆等馆藏古籍数字化,并为人们提供公益性阅读服务。

短视频再现古籍里的美食

“没想到古籍这么‘香’。”在看完系列短视频《食光机·随园私房菜》后,有网友留言说。该短视频由南京图书馆历史文献研究馆研究员史星宇和韩超制作,他们按照清代文学家袁枚写的《随园食单》,再现古籍里的美食,吸引不少人观看。

彭训文

我们利用人工智能技术,将古籍由以前的图像加工成可检索的文本与数据,方便研究者、用户直接阅读。

THE END
1.国家古籍数字化资源总平台“《永乐大典》高清影像数据库(第一辑)”由国家图书馆出版社与北京大学数字人文研究中心合作建设,致力于开展存世大典的文献数字化、全文化与数字版本征集,全面展示大典风貌及版本魅力,传播大典相关知识与文化,为相关学术研究提供文献资源支撑。 来源:国家图书出版社 查看 上一页 下一页 古籍专题资源库古籍整理出版https://www.guji.cn/
2.汇集《永乐大典》等2200余部古籍,“识典古籍”平台——数字化,让以上图片均为“识典古籍”平台网页截图。 制图:张芳曼 核心阅读 我国现存古籍约有20万种,修复整理现存的全部古籍,可能需要300余年。古籍数字化迫在眉睫。一本古籍,如何从纸页“搬”到网页?广泛收集图像资料、利用现代技术精细化处理……自2022年10月上线以来,“识典古籍”平台已陆续汇集经、史、子、集等2200余部https://wxb.xzdw.gov.cn/xxh/xxhgzdt/202401/t20240110_433629.html
3.古籍整理与数字化综合服务平台——《籍合网》开通使用(至2024年73、《红色经典报刊库》在《晚清民国文献平台》下;《中华经典古籍库》请使用机构版,进入方式为“籍合网首页-数据库-中华经典古籍库-机构版”。 试用期限:2024年4月30日至2024年7月31日 平台简介: 《籍合网》是国内首款古籍整理与数字化综合服务平台,由中华书局下属古联(北京)数字传媒科技有限公司负责建设和运营。《https://lib.fafu.edu.cn/d0/ad/c11924a381101/page.htm
4.云聪智慧古籍数字化平台繁体古籍报刊OCR云聪智慧古籍数字化平台为您提供繁体古籍报刊OCR服务,利用云聪智能技术,将古籍数字化,让古代智慧得以传承。欢迎使用云聪智慧古籍数字化平台,体验高效的古籍数字化服务,探索古代智慧的无限可能。拥有自主知识产权,为企政、文化单位打造具有推理能力的新一代文化认知引https://www.yuncong-ai.com/
5.古籍网站收藏一、识典古籍 识典古籍网站 : shidianguji.com/ 由“北京大学—字节跳动数字人文开放实验室”研发的古籍数字化平台。该平台涵盖了390部经典古籍,主要来自《 四部丛刊》,共计3000多万字,而且其内容全部免费开放 二…https://zhuanlan.zhihu.com/p/669576270
6.依托数字技术让古籍中的文字活起来!“尚古汇典”平台将汇聚超百亿在当天举行的“尚古汇典”平台发布会上,复旦大学图书馆馆长陈引驰、武汉大学图书馆馆长董有明、北京大学中国古文献研究中心副主任杨海峥、华东师范大学中文系副主任方笑一等专家学者纷纷表示,将古籍以数字化的方式展示出来,便于读者阅读与检索,对于传统古籍进一步挖掘和充分利用有重要的意义,有助于实现“让古籍中的文字活http://wenhui.whb.cn/third/zaker/202308/25/536323.html
7.古籍数字化平台:精校功能介绍古籍数字化平台,本着公益性、低成本、合作共赢的三大原则,功能涵盖古籍OCR识别、族谱县志OCR识别、民国报纸OCR识别、图文逐字校对、数据著录、智能标点分段、精编排版、智能白话译文等,是一站式线上整理全流程平台。 平台集成了团队管理功能,经过与校编团队3年磨合使用,可以组织大规模校编团队进行古籍、报纸校编任务的https://blog.csdn.net/uuleaf/article/details/137921562
8.推荐几个古籍网站对“两古”专业的学生来说,阅读古籍是家常便饭。随着古籍数字化进程的不断推进,诸多古籍网站 对“两古”专业的学生来说,阅读古籍是家常便饭。随着古籍数字化进程的不断推进,诸多古籍网站如雨后春笋,为学界提供了极大的便利。能否熟练地使用这些古籍网站,关系着硕士生乃至博士生的资料获取效率,也影响着“两古”https://weibo.com/ttarticle/p/show?id=2309634530452118503431
9.逛过这三个网站,才知道中国的数字博物馆有多强澎湃号·湃客刚刚上线不久的 “ 中华古籍资源库 ”,绝对是一座可以深入挖掘的宝藏,在大家的印象里,看古籍应该是一件既无聊又乏味的事情。 但是当你真的深入了解 “ 中华古籍资源库 ”后,你就会发现原来这些古籍孤本竟然可以这么有魅力! 在这十万册免费开放的部古籍,除了数字古籍以外,还有甲骨、敦煌文献、碑帖拓片、西夏文献、赵https://www.thepaper.cn/newsDetail_forward_15951553
10.识典古籍识典古籍是抖音公益与北大合作共建的古籍阅读平台。致力于为用户提供免费公开、稳定、快速、方便的搜索和阅读古籍的服务。识典古籍阅读平台为广大古籍爱好者和学者提供海量古籍资源,包括经部、史部、子部、集部、道教部、佛教部等。涵盖了儒家经典、道家经典、文学经典等丰https://www.shidianguji.com/