【关键词】古籍数字化;古籍版本;数据库开发
发端于上世纪80年代的古籍数字化建设,经历了近30年的不断发展,如今已经取得了丰硕的成果,一些大规模、具有代表性的古籍数据库陆续投入使用。2007年国务院办公厅发布《关于进一步加强古籍保护工作的意见》(国办发[2007]6号),也对古籍数字化提出了具体要求,这势必会将古籍数字化建设推向高潮。
随着数字技术的不断发展,开发满足有关古籍版本需求、功能完备的古籍版本数据库成为今后古籍数字化的选题之一。本文希望在当前古籍数字资源库现状研究的基础上,对今后古籍版本数据库的建设与发展进行探讨。
1.开发古籍版本数据库的意义
当前的古籍数字化项目多以古文献的内容作为切入点。虽说有的古籍书目或全文数据库有部分版本信息,但专门从版本视角开发的古籍数据库绝无仅有。而开发古籍版本数据库,利用现代化技术发掘蕴藏的古籍版本信息及其文物价值,对提升古籍全文数据库及其它数字化项目的建设质量,实现古籍信息的增值性开发,都有着十分重要的意义。
1.1古籍全文数据库的建设需要古籍版本数据库的支持
古籍版本对于古籍全文数据库的建设十分重要,它将直接影响到数字化产品的质量。众所周知,在长期流传过程中古籍有着诸多版本,而不同的版本又存在优劣和互补。在进行古籍数字化时,应尽量选择精良的版本作底本,同时也要与其他的一些版本进行校对,拾遗补阙,这样才有可能制作出高质量的古籍数字化产品。
古籍版本数据库汇集的是古代书籍版本的数据形态,可以揭示其表征、行款、字体、墨色、装帧等信息,这就为古籍全文数据库在版本选择及比较方面提供依据,尽可能地将最好的底本收入数据库,方便读者研究使用,从而提高古籍全文数据库的建设水准。
1.2古籍版本数据库是古籍增值性开发的直观表现
古籍不仅仅具有文献价值,同时也是古代文化艺术(书法、雕刻、装帧等)和科学技术(印刷、造纸等)的重要实证,而这种实证就是通过不同形式、种类的版本来体现其差别的。
古籍版本的形态,包括版刻工艺、装帧、用纸、行款、字体、边栏、墨色以及藏印、题跋等,如用文字描述,说得再详细也是纸上谈兵。而开发古籍版本数据库,使其具有重现作为历史文物古籍原貌的功能,并能满足版本研究、文物鉴赏及原件对照等特殊需要。
同时,开发古籍版本数据库,可以拓宽古籍利用的渠道。通过对古籍版本中蕴含的数字素材进行萃取、加工、整合,发掘其间特有的中国文化元素,形成具有市场价值的文化产品,可供文化产业采用,实现古籍的增值服务。
1.3古籍交换价值的实现,急需古籍版本数据库的支持
随着市场经济的繁荣,人们正在积极地寻找古籍的交换价值。拍卖这种竞价交易方式无疑就是一种方便、快捷的买卖方式,也是让古籍保护赢得社会各界重视、参与的重要渠道。
作为一种特殊的交易对象,古籍除了具有一般拍卖标的经济价值外,其独有文献价值、历史价值与审美价值在很大程度上影响甚至决定古籍拍品在拍卖中的成交价格。而对于古籍投资、收藏者来说,更需要了解不同时期古籍版本的收藏价值。建设古籍版本数据库,挖掘古文献在版别、版式、结构和装帧等方面的信息,正是对这些“纸墨俱佳、写刻俱精”古籍的直观表征,将极大地推动古籍收藏与市场交易的健康发展。
2.古籍版本数据库的建设契机
2007年1月,国务院办公厅下发了《关于进一步加强古籍保护工作的意见》(国办发[2007]6号),要求从2007年开始,在全国范围内组织开展古籍普查工作,全面了解和掌握各级图书馆、博物馆等单位及民间所藏古籍情况。作为实施“中华古籍保护计划”的基础性工作,全国古籍普查是古籍抢救、保护与利用工作的重要环节,对登记的古籍进行详细清点和编目整理,建立中华古籍综合信息数据库,形成中华古籍联合目录。
截止到2010年6月,《国家珍贵古籍名录》和“全国古籍重点保护单位”已评审并公布三批,其中入选《国家珍贵古籍名录》的古籍共有9859部,而申报的古籍约有29600部之多,具体统计见下表:
3.古籍版本数据库的建设
古籍版本数据库是以古籍版本信息为揭示对象,通过扫描、拍照、缩微胶片等方式对古籍原本进行影像处理,以便为读者呈现古籍原貌,并提供版本研究的服务。
3.1古籍版本的著录信息
3.2古籍书叶的影像信息
4.古籍版本数据库的建设原则
4.1规范化、标准化原则
4.2实用性原则
建设古籍版本数据库的目的和任务是为更好地发挥数字化古籍版本信息资源的功能,从而准确地揭示和正确地评价古籍版本,最大限度地满足人们对于古籍版本的各种需求。因此,建库时应遵循“实用性”的原则,充分调研对于古籍版本的信息需求和处理需求,深入分析版本数据库的实用价值以及社会效益,保证版本数据库能满足读者和社会需求,并能进行深层次开发,实现增值效应。
4.3可扩展性原则
4.4协调性原则
为了充分发挥古籍版本数据库特有的信息优势,避免内容贫乏或重复,版本数据库的建设需要采取协调管理,分工协作,联合建库的方式展开。目前已公布入选《国家珍贵古籍名录》的9859部古籍,其馆藏地分属国内500多家图书馆、博物馆。为了加大古籍版本信息的共享性,古籍版本数据库的建设应根据我国古籍再生性保护的整体需求,有针对性地拓展古籍版本数据库的统筹管理与建设。
4.5阶段性原则
5.当前古籍版本数据库建设的阶段成果
当前,古籍数字化建设的成果主要以古籍书目数据库及古籍全文数据库为主。下面所列举的“古籍版本数据库”,仅是部分或浅层次涉及古籍版本的信息集成,但可以作为古籍版本数据库建设的阶段成果,为接下来的深度挖掘及开发提供借鉴和参考。
5.1中华古籍善本国际联合书目系统
“中华古籍善本国际联合书目系统”是由中文善本书国际联合目录项目发展而来的新数据库,主要由美国普林斯顿大学和中国国家图书馆合作建设。中文善本书国际联合目录数据库著录了北美图书馆的几乎全部藏书以及中国图书馆的部分藏书,数据达到2万多条。在其基础上建立的新数据库首批公布了普林斯顿大学东亚图书馆约2000条中文古籍善本数据,供公众免费使用,所有用户均享有检索、浏览、打印、下载本系统书目数据及书影。
5.2台湾国家图书馆善本丛刊影像先导系统
善本丛刊影像先导系统将台湾国家图书馆典藏善本古书一万二千余部中的部分善本,利用拍摄及扫瞄的方式,将善本古书的各叶影像数字化。内容收录十七种馆藏珍贵明人诗文集,各诗文集的书名、撰者、版本、篇名、序跋者、题跋者等数据皆可检索并浏览,其书叶影像全部为彩色。
5.3“学苑汲古——高校古文献资源库”
“学苑汲古——高校古文献资源库”是一个汇集高校古文献资源的数字图书馆,由北京大学、北京师范大学、南京大学、四川大学等高校图书馆先行合力创建。内容不仅包括各参建馆所藏古文献资源的书目记录,而且还配有部分相应的书影或全文图像。该资源库中的古文献类型暂时只有各馆馆藏善本古籍和普通古籍,今后还要增加金石拓片、舆图等多种古文献资源。各馆并向读者提供一定范围的文献传递服务。该资源库为中国高等教育文献保障系统(CALIS)的特色库项目之一。
5.4哈佛大学哈佛燕京图书馆藏善本特藏资源库
5.5东京大学东洋文化研究所汉籍全文影像数据库
东京大学东洋文化研究所从2002年开始建立古籍全文影像数据库,在互联网上免费提供开放性服务。读者可按照经部、史、子、集四个部分进行分类浏览。这批数据包括收藏在东洋文化研究所和一些专藏文库中的珍贵宋、元、明、清善本和民国时期抄本,经史子集各类俱全,其中以小说、戏曲为大宗,具有重要的史料价值。
5.6汉籍数字图书馆
《汉籍数字图书馆》(第一阅览室)内涵中文古籍文献近9万多种,120余万卷册,总页数达1622万页,目录系统文字达860万字,原文献数据量1814GB。该产品由目录系统和文献库两部分组成。目录部分采用文本格式,文献库采用PDF图形格式,原版原式、忠实原貌,确保了古籍文献的准确和应用价值。
5.7长春图书馆“馆藏国家珍贵古籍数据库”
作为全国古籍重点保护单位之一的长春图书馆,收藏有大量珍贵古籍善本。该图书馆将已入选《国家珍贵古籍名录》中的15种、273册进行数字化处理,以电子书形式(PDF格式)建成《长春图书馆馆藏国家珍贵古籍全文数据库》,供读者查询利用。