毛建军(南京大学中文系江苏210093)
摘要对台湾地区古籍书目数据库建设情况进行较全面的调查和分析,并总结了台湾地区古籍书目数据库建设的特点。
关键词台湾地区古籍数字化古籍书目数据库
1台湾地区计算机与古籍整理的早期实践
台湾地区的古籍数字化资源建设是在台湾地区图书馆自动化的基础上发展起来的。1971年台湾“国科委”马志钦教授提议利用计算机做中文资料处理研究,不久几乎所有大学和电子研究机构都全力投入了这项极具潜力的领域。[1]1972年,台湾清华大学图书馆建立了计算机图书目录,开始了计算机用于图书编目的工作。[2]1984年台湾“中研院”史语所开始实施开发“史籍自动化系统”,该计划由毛汉光教授倡议,谢清俊、管束东主持开发。1984年7月1日《“中研院”古籍全文资料库发展概要》起草,标志着台湾地区古籍数字化的真正起步。[1]“中研院”古籍全文资料库的开发宗旨是:“为了中华文化的延续,务必要使古籍能活出现代风貌,不可任其在科技的洪流中式微没顶,而解决的方法,则是将古籍以电子媒体表达。”(《“中研院”古籍全文资料库发展概要》)在台湾地区,除了单位投资建设中文信息资料库外,部分个人也积极投入到这项极具挑战的工作中。
2台湾地区古籍书目数据库的建设
台湾地区古籍书目数据库的编撰开始于上世纪80年代末。20世纪80年代初,台湾“中央图书馆”将馆藏善本制成机读目录,开启了台湾地区古籍书目数据库工作。其后,台北故宫博物院、台大图书馆、“中研院”傅斯年图书馆等单位也都积极参加进来,台湾“中研院”自上世纪80年代推动史籍自动化计划以来,也开发了大量的古籍书目数据库。随着计算机技术的发展以及机读编目实践的成熟,台湾地区古籍书目数据库的建设也逐步展开。
研院”民族所、“中研院”傅斯年图书馆、台北市文献会、“中央图书馆”台湾分馆、台湾省各姓渊源研究学会、宜兰县史馆、故宫博物院、“国史馆”、“国史馆”台湾文献馆、“国家图书馆”和万万斋。[4]
“明人文集联合目录与篇目索引数据库”由台湾“国家图书馆”汉学研究中心研制,包括台北故宫博物院图书馆、台湾大学图书馆、“中研院”傅斯年图书馆、“国家图书馆”及汉学研究中心所藏明人文集的书目数据。“中央图书馆”台湾分馆开发的“台湾地区文献数据联合目录”(32113笔)内容含台湾图书文献数据,凡古文书、古契、先贤遗著、士绅之文集、诗集、日记、账簿、族谱、家乘、祭祀公业资料等,包括“中央图书馆”、台湾省文献会、省立台中图书馆、“中研院”、台北市文献委员会、台湾师范大学图书馆、成功大学图书馆、傅斯年图书馆、台北市立图书馆等36个单位的文献数据。
另外,台北故宫博物院开发建设了“家族谱牒文献数据库”和“善本古籍资料库”;台湾“中研院”也开发建设了“简帛金石数据库书目”、“生命医疗史研究室数据库检索”以及“中国大陆各省地方志书目查询系统”等特色专题书目数据库。
3台湾地区古籍书目数据库建设的特点
3.1突出数据库建设的长期性和计划性
古籍书目数据库的建设是一项长期性工作,因此数据库的建设也要有计划性。由于台湾地区的古籍收藏十分分散,参与古籍书目数据库建设的单位也很复杂,除了“中研院”、“国家图书馆”、台北故宫博物院、历史博物馆等古籍收藏主体单位外,台湾省文献会、“文建会”以及部分古籍收藏丰富的高校图书馆也参与古籍书目数据库的建设。早期台湾地区古籍书目数据库的建设都是各单位封闭性的研究和开发,1998年起台湾有关部门率先推动“数字博物馆项目先导计划”,开始了台湾地区古籍数字化的合作阶段。2000年台湾“中研院”受委托规划并实施“典藏数字化计划”,2001年“文建会”成立“文化数据库”领导机构。其中“典藏数字化计划”在数据库规模和社会影响方面最为突出。[5]由“国家图书馆”承担建设的“古籍联合目录数据库”是该计划较有特色的数据库。该数据库遵循“分别建库、集中检索”的建库方案,待各参与单位数据库完成后统一设置。数据库计划分为台湾地区、中国大陆地区、港澳地区、东北亚及东南亚地区、北美地区及欧洲地区。
3.2注重数据库建设的交流与合作
3.3重视古籍书目数据库的兼容与整合
台湾地区古籍书目数据库的兼容与整合包括两个方面:一是岛内数据的兼容与整合,二是与大陆地区书目数据库的兼容与整合。由于台湾地区古籍数字化建设实施的是长期计划,在数据库建设之初就已经联合各单位制定了统一的数据库标准。因此,台湾地区古籍书目数据库的兼容与整合主要是指与大陆地区的书目数据库的兼容与整合。古籍书目数据库的最终目的是向读者提供馆藏古籍书目的检索服务,所面向的使用者是两岸及全球的读者。由于两岸数据库标准的不一致,因此数据库标准的建立以及后设数据格式的建立就显得十分重要。台湾“国家图书馆”在实施“中文古籍书目数据库”过程中强烈呼吁“世界各地图书馆应提供书目数据集中置于‘中文古籍书目数据库’中,使之扩大为华文世界‘共有共享’的中文古籍联合目录”,并建议各馆自行建库,通过Z39.50、OpenURL、HTTP等标准通讯协议整合检索,以实现资源共享。目前,两岸学者正在就建立“古籍联合目录数据库书目质量控制作业标准”、“数据库之维护”、“建文件标准”、“目录著录标准”等议题进行后续的讨论,以谋求古籍书目数据库的共通共享。[8]
参考文献
1叶晓珍.电脑摇身,古籍一变——访“中研院”谈古籍全文检索系统[J].国文天地,1990(9):16-19.
2程光.台湾数字图书馆的发展与启示[J].情报资料工作,2001(06):39-40,45.
rbookhtml/intr.htm.
edu.tw/rbook.cgi/frameset4.htm.
5罗凤珠.台湾地区中国古籍数字化的现况与展望[J].书目季刊,35(1):23-34.
6劳飞.海峡两岸携手研讨:整理研究中国古籍如何运用现代化技术[J].语言文字应用,1994(1):71.
7鲍道.两岸古籍整理研究学术研讨会在台北召开[J].中国典籍与文化,1996(3):126-127,
118.
lib.hku.hk/ccrcd/1-7.ppt.
附表:台湾地区古籍书目数据库列表
数据库名称开发单位网址备注与说明
ttsweb@0:0:1:/opc/catalog/rarecat@@0.09414726047048022。116034笔;书名、作者、出版地、出版者、版本项、主题检索。
hypage.cgiHYPAGE=home/rbook_home.htm。书目26619笔、图像书目8585笔;系统包括3个栏目:特藏珍品选介、善本资料查询、古籍影像检索。
frameset4.htm。55万余笔。
rbook.cgi/frameset5.htm。14986种;书名、编著者、收藏者、出版者、主题检索。
gs/ugsweb.cgio=dunidir。32113笔;包括“中央图书馆”台湾分馆、台湾省文献会、省立台中图书馆、“中研院”、台北市文献委员会等36个单位的数据。
~wenwu/search.htm。本系统采用中正大学信息研究所的GAIS系统。
%7Emedicine/book/search.htm。多项目查询、词组查询、排除字符及自然语言查询。
dblist.htm。另有:宫中档及军机处档折件、清代文献档案总目、清代档案人名权威资料查询、清宫奏折档台湾史料等。
Html。题名、著者、版本、四部类目、卷次、朝代、元版宋版其他明版清版检索。