传承中华文脉,古籍是重要的载体。据统计,中国是全球拥有古籍最多的国家。然而,当代人面对浩如烟海的古籍,又存在“找不到、不会用、读不懂”等难题。近日,由字节跳动研发的“识典古籍”数字化平台上线智能助手功能,试图通过人工智能大模型技术,提升古籍查阅效率,让更多普通人读懂古籍,助力古籍保护与传承。
据不完全统计,我国现存古籍约有20万种,其中有数字化扫描影像的有8万种,实现文本数字化的仅有3-4万种左右。由于古籍种类、数量繁杂,保存程度不一,加之从事古籍修复的专业人员数量不足、资金匮乏等多重原因,古籍资源的挖掘传承保护工作仍面临巨大压力。
2021年,字节跳动公益就发起“寻找古籍守护人”活动,邀请来自不同领域的专家学者、文化名人和抖音达人,共同推动古籍保护。2022年,字节跳动启动了古籍数字化的工作,真正实现古籍从纸质到数字化的迁移。当年10月,字节跳动联合北京大学数字人文实验室共同打造的古籍数字化阅读平台“识典古籍”正式上线。
“识典古籍”上线以来,收到了许多文史爱好者与研究者的正面反馈与支持。有报道指出,“识典古籍”平台不仅是一个公益性数字化平台,对于古籍爱好者尤其是专业研究人员来说,其更是一座横跨千年历史的知识宝库。目前,该平台对社会免费开放的古籍超过了2900部,其提供的分词检索、图文对照、字典释义等功能,让普通人也能轻松阅读古籍文献。
此次“识典古籍”智能助手的上线,进一步降低了古籍的阅读门槛,让流传千百年的宝贵文献走入寻常百姓家。同时,以古籍智能助手为代表的人工智能工具,也为古籍数字化工作带来了机遇。“我们所处的新时代,有可能实现文化典籍永久保护和传承”,有业内人士表示。
下一步,“识典古籍”研发团队将有计划地为古籍智能助手开发更多的工具。除此之外,该团队还将继续提升AI在古籍整理等领域的应用,希望能够整理和校对更多的古籍,并将其数字化,促进古籍资源的高效利用,让平台在文化传承中发挥更大的作用。按计划,到2025年,“识典古籍”将陆续完成一万种古籍的智能化整理工作,基本覆盖儒家、道家和佛学的核心典籍目录,届时将全部免费开放。