搜集整理流散的中华古籍,建立数据库推动数字化利用汉籍合璧文脉赓续(护文化遗产彰时代新义)

古籍是中华优秀传统文化的重要载体。由于种种原因,大量中国汉文古籍流散于境外,其中不乏中国大陆缺藏的版本和品种。2017年,全球汉籍合璧工程启动,2018年,该工程被文化和旅游部、教育部作为国家重点文化工程列入“中华古籍保护计划”。山东大学是该工程的责任主体单位。

全球汉籍合璧工程旨在将境外所藏中华古文献的全部情况调研摸清,进而对中国大陆缺藏的品种和版本进行复制、出版、整理和综合性研究,从而完善中华古文献的存藏体系,为国内文化建设和国际文化交流提供文献支持。2023年,全球汉籍合璧工程出版了138种汉籍珍本、10种汉籍点校整理成果、2种汉籍与汉学研究著作。

汇集300多个学术团队千余位专家学者

走进山东大学国际汉学研究中心古籍书库,淡淡的书香扑面而来。细细看去,书籍按照经、史、子、集排布。全球汉籍合璧工程首席专家助理陈肖杉介绍,这是我国古代图书的四部分类法。其中子部书籍主要涉及诸子百家思想及艺术、谱录等,这也是全球汉籍合璧工程的起点——《子海》整理与研究。

为何从子部开始?上世纪60年代,诸子学研究领域的著名学者高亨任教于山东大学,结撰《先秦诸子研究文献目录》(手稿),交予山东大学董治安教授,子书整理与研究便成为山东大学传统学术特长和研究方向。师承董治安,山东大学讲座教授郑杰文立志把子书整理与研究推向深入。2010年,他提出对境内外现存子部汉籍进行系统整理和研究,项目命名为“《子海》整理与研究”。当年6月,该项目获批国家社科基金重大委托项目。

目验、复制、整理研究……经过团队共同努力,2013年11月,子海项目首批重大成果发布,出版了《子海珍本编》《子海精华编》。

调查团队足迹遍布95个国家的1988家图书馆

书籍刊刻,不同版本特征各不相同。见得多了,陈肖杉逐渐熟悉了古籍鉴定。

“这张书页的书口部分是白色的,叫做白口。”他说着,拿起一本书,是上课用的教具。古籍印刷后需对折装订,有的装订处会有一条黑色的细线,而到了明初,这条线加粗,被称为大黑口。仅看装订线,也能初步判断古籍年代。

但是,有些古籍也不好判断。有一回,陈肖杉发现一本《说苑》,这是汉代刘向编纂的小说集,曾收藏这本书的清代藏书家黄丕烈认为这是宋本。“后来发现有几页被撕掉了。”陈肖杉说,缺失的那几页正是说明版本特征的书页。

陈肖杉说:“每一本书都要编目人员亲眼看过。”由于图书馆每日借阅量有上限,团队成员有时需奔波几小时才能看上四五本汉籍。调查编目团队成员在全球各地奔走,足迹遍布五大洲95个国家的1988家图书馆,基本掌握了境外汉籍存藏情况,数量约为187.5万部。

据介绍,团队成员要对境外每一部书进行信息录入,与境内古籍逐一对比,将所有流散于境外的古籍逐一登记,并编撰版本目录。这个目录与常见的目录不同,是对书的特征进行详细描述和记录。“比如说行款,什么字体,边框有什么特征,等等。”陈肖杉说。

研究对比后,产生了两项成果:目录编和珍本编。珍本编就是对缺藏版本进行高精度扫描,颜色等还原程度都很高,留下古籍数字化资料的同时,也避免古籍被过度使用,使其得到真正的保护。

工作量如此之大,如何组建调查编目团队?据了解,全国有近30所高校和科研机构派人参与调查境外汉籍,其中从事调查编目的人员达420余人,其中既有高校教师,也有留学生和海外华人。

实际上,调查编目只是第一步。文献若是存在底本不佳、校勘不精、训释讹误等问题,研究工作便无法得出科学结论。因此,古籍需经初核、复核,初选、复选,才能确认是否具备复制的价值;经过专业、精细的校对,才能成为可信可靠的学术研究资料。

眼下,成员们正加速推进境外汉籍存藏数量的摸底调查,目前已经比对完成36万多部汉籍编目工作,从中遴选并复制稀缺汉籍1600余种,其中260种已出版。

建立数据库,推进汉籍数字化利用

每整理一本古籍,团队成员都要尽力将其来龙去脉研究清楚。“每一本书都有故事。”陈肖杉说。

“保护利用好古籍,是我们的使命所在。越来越多年轻人正在加入我们,共同努力,展现中华文明赓续绵延、生生不息的力量。”郑杰文说。

今年,全球汉籍合璧工程还将目验编纂或修订完善境外汉籍版本目录25万条;对90个境外藏书机构进行进一步调查和沟通;复制1000部境内缺藏汉籍;新开展15种具有重要学术价值境外汉籍的点校整理工作;新开展2项汉籍与汉学研究项目……

虽然任重道远,但郑杰文信心满满。为了让古籍真貌永存,山东大学依靠数字化手段,建立了古籍数据库。目前,山东大学已经与全球20余所图书馆或藏书机构签订合作协议,正在建立的全球汉籍目录数据库第一期录入书目36万余种,另有全球汉籍图像数据库、全球汉学研究论著数据库也将同期推出。

THE END
1.《域外汉籍数据库》开通试用该数据库为国内唯一一家长期致力于收录域外藏汉籍文献的数据库,所收书籍均影印自国外图书馆、研究机构和个人收藏的国内不见或稀见的汉文文献。目前已经收录汉籍珍本一万一千余种,共23万余卷,按经、史、子、集、类丛、新学六部分类。主要包括三部分内容:中国历史上流散到海外的汉文著述;域外钞录、翻刻、整理、https://libinfo.lsu.edu.cn/_t131/2023/0612/c737a330957/pagem.htm
2.汉籍电子文献资料库「漢籍全文資料庫計畫」的建置肇始於民國七十三年,為「史籍自動化」計畫的延伸,開發的目標是為了收錄對中國傳統人文研究具有重要價值的文獻,並建立全文電子資料庫,以作為學術研究的輔助工具。「漢籍全文資料庫」是目前最具規模、資料統整最為嚴謹的中文全文資料庫之一。 https://hanchi.ihp.sinica.edu.tw/
3.CBDBSourcesChinaBiographicalDatabaseProject(CBDB)As of September 2024, CBDB has covered 535,181 biographies in the Chinese history. CBDB finds data from the following sources:https://projects.iq.harvard.edu/cbdb/cbdb-sources
4.6个免费的全文检索数据库:中央研究院汉籍电子文献日本开发的汉◆ 中央研究院汉籍电子文献 地址:http://hanji.sinica.edu.tw/ 检索内容包括涵盖四部重要经典,另有《清经世文编》《道藏》《文心雕龙》、内阁汉文专题档案等全文检索功能。 ◆ 日本开发的汉籍电子检索 地址:http://www.kanripo.org/ 涵盖四部及佛道文献,共约9000种,可提供图文对照,并注明版本,甚好。 ◆ https://www.bandianxiang.com/info/YFZixdM
5.《汉籍数字图书馆》——大型古籍数据库产品《汉籍数字图书馆》是陕西师范大学出版总社出版运营的大型汉字古籍数据库产品,由传世文献库和甲骨文献库、金文文献库、石刻文献库、敦煌文献库、明清档案库、书画文献库、舆图文献库、中医药文献库等八大专题分库组成。http://www.hanjilibrary.cn/
6.台湾中央研究院史语所汉籍全文数据库数据库和检索课「汉籍全文数据库计划」的建置肇始于1988年,为「史籍自动化」计划的延伸,开发的目标是为了收录对中国传统人文研究具有重要价值的文献,并建立全文电子数据库,以作为学术研究的辅助工具。「汉籍全文数据库」是目前最具规模、数据统整最为严谨的中文全文数据库之一。 https://www.jiansuoke.com/db/hanchi-ihp-sinica
7.收藏文史数据库大全(分类归纳版)从瀚典全文检索系统 2.0 版进入「汉籍全文数据库计划」的建置肇始于民国七十三年,为「史籍自动化」计划的延伸,开发的目标是为了收录对中国传统人文研究具有重要价值的文献,并建立全文电子数据库,以作为学术研究的辅助工具。「汉籍全文数据库」是目前最具规模、数据统整最为严谨的中文全文数据库之一。数据库内容包括经https://card.weibo.com/article/m/show/id/2309634740159047599763?id=2309634740159047599763