学术访谈李振聚老师谈学术数据库的使用

李振聚,男,1986年1月生。山东大学儒学高等研究院中国古典文献学方向博士。山东大学文学院博士后。现为山东大学文学院研究员。研究方向为目录版本校勘学、中国经学。

part1常用数据库与古典文献研究

宓嘉祥:李老师好!请问您在学术研究中经常使用哪些数据库?如果让您选择古典文献领域最重要的数据库,您认为是哪个?

李振聚:在“中国基本古籍库”之前,我经常使用的是“文渊阁四库全书电子版”,里面包括原图和全文检索。后来产生的诸种全文检索系统,都有这个四库检索系统的身影。现在经常使用的是:

1、爱如生的“中国基本古籍库”和“中国方志库”,这两个库山东大学已经购买,校内可以使用。“中国基本古籍库”所收典籍都请专家学者圈定审核过,有一万多种,量非常大,版本选择也很审慎(“中国基本古籍库”收了一万多种书,三倍于《四库全书》,里面会有各种问题,陈尚君先生有《中国基本古籍库初感受》一文,可参阅,但创始为难,希望以后能再加改订)。只不过方志库,我校只买了初集和二集,后几集没有购买。还有较为有价值的“四库系列数据库”,我校也未购买。爱如生的数据库后来加上了全文检索和原图对照功能,原图对照是后期补上,故检索时不能够实现即时的一一对应,想翻原图,只能再回头翻检。但“一一对应”只是技术问题,希望以后会改善。

3、国家图书馆有“中华古籍资源库”,该数据库以国家图书馆藏书为主题,主要将国家图书馆等中的胶卷转化为电子图像,后期陆续也有大批量的扫描图像,现在逐渐增加中,此数据库内都是古籍图片,只能在线阅览,不能全文检索。该库有很多重要典籍重要版本以及稀见的稿抄校本,能够提供很多有益的学术线索。

4、CADAL数据库,是浙江大学主办的,扫描有大量的古籍和近现代学术著作(约200万册),可以在线阅览。

part2校图书馆所购数据库推荐

宓嘉祥:我校图书馆购买了大量电子资源,比如大家经常使用的中国知网、万方数据和爱如生古籍库等等,这之中有没有您认为非常方便好用的,能否向同学们简单介绍、推荐?

李振聚:我们学校购买的数据库,除了上面所列举的外,我认为“读秀”这个数据库值得推荐,这里面有知识栏目,基本可以实现现代学术著作的在线检索,显示的是原书图像,方便核实原文。听出版社编辑们讲,“读秀”对书稿校对引文甚为有用。“中华经典古籍库”也有它的特色,这个库是中华书局牵头,整合多家出版社的古籍整理资源,提供全文检索,都标示有出版物的所在页码。中华书局的标点本《二十四史》、《资治通鉴》、《新编诸子集成》和《古典文学基本丛书》等都在里面。该数据库能够做到文本可靠,属于可检索的数据库里面的精校版。

part3数据库分类及信息筛选

宓嘉祥:您认为学术资源数据库可以分为哪些类别?同学们在使用数据库的过程中,需要着重对哪些信息、资源有所侧重?

李振聚:古籍方面学术资源数据库大致可以分为三类:

1、古籍全文检索的,诸如爱如生中国基本古籍库、方志库,我们台湾地区与韩国国史编纂委员会合作建设的《明实录》、《清实录》等全文检索数据库之类的都属此类。

2、古籍原文图像的,如国家图书馆的“中华古籍资源库”、日本国立公文书馆、中国台湾地区的“国家图书馆”中的“古籍与特藏文献资源”等等,提供原文图像,一般没有全文检索。像晚清民国期刊数据库,属于既可以全文检索也可以下载原文图像的,我们山东大学档案馆开发了《山东大学学报》数据库,也属于这个性质。

3、专门的数据库,如古籍目录检索方面有:国家古籍保护中心的“古籍普查数据库”、北京大学联合国内外二十多所高校所做的高校藏古文献目录“学苑汲古—高校古文献资源库”、日本的“日本所藏中文古籍数据库”等等。对于调查典籍的版本和存藏情况等,这类数据库非常有用。当然也有其他类别的专门数据库,如“中国古典文献资源导航系统(奎章阁)”里面就整合了很多有用的资源,大家可以浏览,各取所需。

part4数据库内容检索与获取方法

宓嘉祥:任何工具的使用都有其方法,在使用学术资源数据库时,您一般都采用什么方法来高效、准确地获取自己需要的内容?

李振聚:数据库既不能帮助我们筛选信息,更不能帮助我们判别资料的可信与否。当然限于所选文献的量和检索关键词,我们使用时不一定能将有效信息提取出来。想要高效、准确获取自己需要的内容,当然是建立在对基本文献的较高的熟悉程度上。我认为只有对基本文献熟悉了,才能够用好各种学术资源数据库。对基本文献的不熟悉,会走很多弯路,当然有可能影响我们的最后结论。

每一类文献、每个时期的文献都有他的独特部分,需要深入了解掌握,才能高效、准确获取自己需要内容。换而言之,数据库只是提供一种便捷的检索方式,不能代替读书。我记得有个同学考证清代一本诗集的作者问题,只知道这个人是大概某时期的某县知县,县志也没有记载,数据库无法检索,我建议他去查这个时期的《缙绅全书》,里面果然有这个人,再根据这个人去检索,很多资料也搜集出来了。在这里,《缙绅全书》就很关键,是高效、准确获取信息的重要材料。

part5如何平衡取用电子资源与纸质资源

宓嘉祥:当下信息技术高度发达,同学们在使用电子资源的时候,有时会出现忽视实体书的情况,您认为我们应如何平衡电子资源和纸质资源的使用?一般在什么情况下、遇到什么问题时,选择使用电子数据库为佳?

另外,全文检索类数据库,一般重视文字而忽视了文献的形式,比如全文数字化会将古籍中的版式打乱,章句符号、句读等删削,有些重要的内容会丢失。分章离句,在古代读书是基本功。除了不同传本有异文外,一句话怎么读,不同的学术派别会有不同的说法,不是简简单单的标示符号的问题。清代学者如武亿,就为这个问题撰写有《经读考异》《句读叙述》之类的著作,这也是清代学者和藏书家都重视旧本的原因。旧本蕴含的信息多,得到一个旧本,没办法复制怎么办呢?想要尽可能的得到一部宋板书中蕴含的信息,就认认真真的制作一个校宋本出来,将宋板原书的行款、异文、标示符号等等信息,尽可能的标示在另外一个本子上,等于人工复制一个宋本出来。我们全文检索数字化的数据库尽量做到图文对照,也是为了弥补这方面的缺陷。

part6国外学术数据库推荐

宓嘉祥:最近有很多同学参与了杜泽逊老师的“日藏项目”,可见我们应该高度重视国外学术成果的学习、使用,您能否据此谈一下国外学术资源的使用问题?

李振聚:国外的文献数字化比国内进行的早,像美国的哈佛大学哈佛燕京图书馆藏中国典籍现在已经全部拍照上网,没有水印(中国大陆地区和台湾地区都喜欢在照片上加上影响阅读的巨大水印,割耳朵供菩萨,出力不讨好),全部采取开放获取的方式向全世界使用者开放,检索、浏览、下载都没有限制,这种才是世界一流大学的气度。当下很多学者在在阅览和研究中国典籍时,很多典籍是利用美国哈佛大学的馆藏。比如哈佛所藏明嘉靖江以达、李元阳所刻《十三经注疏》本的《尚书注疏》(这部《十三经注疏》因刻于福建,学术界称“闽本”。我们学术界所常见到的版本卷端校阅人已经挖改为李元阳或连李元阳一并挖改,就根据版式字体等信息定为“李元阳刻本”。实际这部书为江以达校刻的)是初刻初印本,卷端题衔仍是江以达,还没有挖改为李元阳,这个《尚书注疏》是研究闽本刊刻成书过程的重要材料。当然充分数字化也是保护古籍的手段之一,值得我们山东大学学习。

日本国立公文书馆、东洋大学东洋文化研究所、国立国会图书馆、京都大学人文科学研究所、早稻田大学等机构都有大量的线上资源供在线阅览、下载,图片堪称高清,且没有水印,做的很认真,值得仿效。日本国立公文书馆所藏宋板书基本都可以高清阅览、下载。而我们想看我们自己藏的宋板书,只有“中华再造善本数据库”,这个再造善本,影印时去底灰,一些印刷淡的笔画都给去没了,拿这个版本校勘,容易出问题。如果像日本这样高清原始照片上网,可以弥补很多不足。

欧洲地区,有德国巴伐利亚州立图书馆东亚数字资源库,该库收集的东亚文献资源非常丰富,在线阅览、下载皆可。

使用国外学术资源时,利用谷歌搜索比百度好很多,特别是谷歌图书,能够提供很多有益的线索。

李振聚:学术研究心得谈不上,说几个问题:

第一,电子资源方面,我推荐《网洋撷英》这本书,它简要介绍了一些重要的国内外学术资源,可以按自己的需求参考。网站我推荐“中国古典文献资源导航系统”,该网整合了很多在线的电子资源,分门别类,便于取用。

第二,数据库资源有其固定的范围,不是文献的全部,只能够在你掌握的资料之外予以增补。2012年,有人研究胡适早年的行历,晚清民国期刊库中胡适的《竞业旬报》收录就不全,只有几期,但这已经是整合全国的力量来收录了。其实这部书山东大学历史学院资料就有整套,属于全国独一份的资源。

第三,数据库多多少少都存在一些问题。比如版本问题,“中国基本古籍库”所收阮刻《十三经注疏》,标注的版本是清嘉庆阮元刻本,实际文本则是《文渊阁四库全书》本,是清乾隆武英殿刻本系统(《四库全书》本《十三经注疏》底本用殿本)。他们做数据库袭用《四库全书》已经数据化的文本,改改题名而已,这样省力,但容易误导使用者。所以用的时候要慎之又慎,不要轻信他们的题名,最好复核原书。

最后,希望我们国家各类收藏机构所藏文献都能充分数字化(即高清图片上网),这是世界大潮流,也是学术大潮流。只有这样,才能将沉睡的文献唤醒,才能让优秀传统文化活起来。千里之行,始于足下,我希望我们山东大学能够借鉴世界一流大学——美国哈佛大学的先进经验,将自己的收藏充分数字化,敢为全国之先。

宓嘉祥:好的,谢谢李老师的悉心回答!相信同学们一定会从您的讲解中获益很多。

李振聚:不客气。科研是一项系统工作,同学们在不断探索中会有更多发现,祝大家学业顺利。

THE END
1.读秀如何获取图书馆没有的资源?()某女性病人,头昏、乏力、面色苍白1年余,体检除贫血貌外,无特殊发现。血象HB75g/L, RBC25×1O12/L,WBC4.0×109/L,PLT120×109/L,网织红细胞0.06,肾功能正常,血清铁降低,道问病史,病人有月经过多,初步诊断为缺铁性贫血。下列支持该诊断的是( )https://www.shuashuati.com/ti/151a9762080f4cf6a66c49fc55260549.html?fm=bd3bdddd57631b0b19f5bdce0b4e72e228
2.宁波数字图书馆使用方法三、 没有借书证的用户如何使用宁波市数字图书馆? 对于不持宁波市数字图书馆各成员馆借书证的用户: 途径一:直接进入“全市开放”下设所有资源可直接检索、下载包括有:读秀,中文电 子期刊,中外文科技图:书文献(NSTL宁波服务站,进入该网站后请单独注册)、电子古籍,工具书 https://lib.webs.nbpt.edu.cn/2009/0907/c1998a1909/page.htm
3.图书馆电子资源超星读秀和超星发现数据平台已开通,欢迎大家登入读秀知识库是由海量全文数据及元数据组成的超大型数据库,以海量中文图书和全文资料为基础,为用户提供深入内容的章节和全文检索,期刊元数据打破空间限制的获取方式,为用户提供全面的期刊文章。 通过读秀学术搜素,读者能一站式搜索馆藏纸质图书、电子图书、随书光盘等学术资源,几乎囊括了本单位文献服务机构内的所有信息源https://www.zibotc.cn/info/1006/8328.htm
4.邵阳学院图书馆门户网站1.图书馆网站有什么作用?如何访问图书馆网站? 图书馆网站是图书馆的网上服务窗口,向全校师生发布图书馆的各类资源和服务信息,图书馆网站也是读者访问利用图书馆各类数字资源的门户。目前图书馆网站上有我校引进的各类中文数据库资源,近60万册中外文电子图书,在线考试题库等资源。图书馆网站还有各种网上免费访问使用的数https://lib.hnsyu.net/rgzn/zzzn/201705/t20170523_64349.html
5.数字资源视点(202417期)如何高效使用图书馆网站读秀中文学术搜索是一个超大型数据库,包含海量全文数据及资料基本信息。它以中文图书和全文资料为基础,为用户提供深入的章节和全文检索服务。通过读秀学术搜索,用户可以一站式找到馆藏纸质图书、图书馆购买的电子图书以及期刊等学术资源,几乎涵盖了文献服务机https://mp.weixin.qq.com/s?__biz=MzAxNzAwMjMxMg==&mid=2649204722&idx=1&sn=60383c1a210283ac6130179c0dd04533&chksm=82e2d1161e050d198f14a45b255bcdd23f24242e6d5daf4db76c12f5e6bbd4e22df9130ff413&scene=27
6.还在花钱买课呢?教你白嫖开放注册图书馆价值上万元的学习资源课程有多优质呢? 阿虚稍微截取了上面部分课程,看了下面这些大佬,你就应该明白了(没列完) 这些资源哪点不比那些抖音上的垃圾职场短视频强多了? PS:这个资源库,在阿虚注册的不少图书馆中,仅「辽宁图书馆」有购买此库,不排除其他图书馆有购买,欢迎在评论区补充 https://www.douban.com/note/807911477/
7.超星读秀是什么型的数据库帆软数字化转型知识库为了方便用户随时随地获取文献资源,超星读秀支持多平台访问。用户可以在电脑、手机、平板等多种设备上访问超星读秀,无论是在办公室、图书馆还是在家中,都可以方便地进行文献检索和阅读。同时,超星读秀还提供了移动应用程序,用户可以通过手机或平板下载并安装应用,随时随地进行文献查找和阅读。 https://www.fanruan.com/blog/article/257069/
8.南师图书馆终极攻略之资源检索!师宝们可以登录南阳师院主页(在图书馆四楼西406的电子阅览室也可以哦),点击“管理机构”—“图书馆”进入图书馆首页,根据需要选择“电子资源”“读者服务”“书海导航”等选项进行查询! 2 图书馆有哪些数据库? 我校图书馆有多类电子资源,分为中文数据库、外文数据库、特色数据库和试用数据库,下面南小师以中文数https://m.thepaper.cn/newsDetail_forward_2546192
9.采购工作总结15篇4、采购部除了日常工作外,多收集全国各地关于特色养生原料料系列,宏观把握采购信息资源,多渠道、多角度、多视听的分析采购途径,做到及时补充原材料。 三、存在问题 1、日常采购工作中,缺乏较强的计划性,没有全面系统的安排好采购计划,降低成本。 2、如何开辟和引进特色原材料的渠道和点子不够多,未能为一线部门带给较https://www.yjbys.com/zongjie/gerenzongjie/1509462.html