日本大学机构知识库社会化应用行为现状研究
暂未开放讨论
李肸
东北师范大学计算机科学与信息技术学院长春130117
关键词:机构知识库社会化应用开放获取社会化
分类号:G250
作者简介:李肸(ORCID:0000-0001-8087-7600),硕士研究生,E-mail:qybl123@sina.com。
机构知识库(institutionalrepository,以下简称IR)作为开放获取的重要实现途径之一,逐渐为人们所重视。大学作为社会中重要的科研教育机构,数量众多、种类多样,大学建设的IR成为实现资源开放获取的重要渠道。随着大学对于开放获取的认识不断加深,对于学术资源开放共享的需求不断增加,越来越多的大学开始尝试建设自己的IR。
知识产权的问题需要在现有法律条文基础上,通过出台相应的规范加以解决,这是一个长期的过程,需要不断地开展理论研究与实践方面的工作;但通过采取特定方式开展IR工作,如积极开放自身数据、开展宣传活动,或借助一定计算机技术手段,积极开发与其他数据库的互操作功能,与其他数据库内数据建立关联共同发挥作用,可以迅速提高IR的知名度,提升IR在学术活动中的地位,从而积极发挥作用。上述活动可视为IR的社会化应用行为的具体内容。
IR社会化应用行为,即IR收录数据的社会化应用行为,是指通过加强IR及其数据的开放程度,努力提高IR及其数据的社会认知,并与现有其他数据库及其中数据建立联系,在各个领域积极满足信息需求的各类行为。通过多种方式将资源信息推送给用户,帮助用户无障碍获取到全文,提高IR知名度,是推动IR社会化应用的根本目的。IR社会化应用行为的数据对象包括IR收录的各种数据以及IR未收录但能够与之直接或间接建立关联的各类数据;IR社会化应用行为的参与者除IR管理者自身外,也包括IR成果的提供者、各类用户、IR成果的正式出版者、商业数据库公司等各类社会群体与机构,这些社会群体与机构能够与IR数据建立联系,并积极促进IR资源的广泛应用。
IR社会化应用行为受到自身角色定位、数据结构与内容、技术手段等方面因素的影响。另外IR管理者开展的宣传推广、培训交流等活动也会对IR的社会化应用行为产生影响。从宏观层面来说,IR社会化应用要求IR能够较好地融入社会数据大环境中,提高社会参与度,发挥开放获取的优势来促进信息资源的共享交流;从微观层面来说,IR社会化应用行为的有效推进,要求IR自身要有准确的角色定位与规范的数据格式。
规范的数据格式是指IR内部资源组织的数据格式符合国际行业规范,采用国际通用的元数据标准来描述数据,或者采用在通用元数据标准基础上进行改造的符合本机构和IR资源特点、具备一定扩展功能的元数据格式。规范的数据格式首先可以允许某机构IR能够与同领域内其他IR资源数据建立关联;其次则便于与其他领域数据建立关联,突破领域限制来发挥作用。数据格式的规范也便于借助统一的元数据协议来收割元数据,实现IR元数据与内容数据的区域性聚合,从而为国家层面IR服务或搜索引擎检索提供可能,最终促进IR自身的发展。
IR社会化应用模式具有单纯的开放获取所没有的特点。首先,社会化应用模式强调积极开放,主动服务。通过IR主动服务,来为各类型IR用户甚至潜在的IR用户提供便利,帮助其获取需要的文献资源。与图书馆工作中强调的主动服务直接面向用户的服务方式有所不同,有些IR社会化应用行为,如与其他数据库建立数据互操作等并未涉及IR的用户,但实际上仍是在为用户访问、使用IR提供便利。其次,IR社会化应用行为涉及参与者较多。IR社会化应用的参与者应包括所有能够为IR数据利用提供便利的组织或个人,而不单是IR管理者。因此,IR的开放获取不等于IR的社会化应用。两者主要区别在于前者仅停留在IR各类型数据开放获取的阶段,较少涉及IR应用;而后者则在开放获取的基础上尝试突破机构、领域的限制,与其他各类型数据集建立关联,开展数据服务。IR社会化应用模式要比开放获取更强调主动服务,开放获取只是IR社会化应用模式的基础。
正如海量信息环境与用户特定信息需求之间的矛盾促使图书馆服务理念从被动服务向主动服务转变一样,IR也面临着类似的问题。要想充分发挥IR作用,发挥所收录文献资源的价值,IR便不能停留在开放获取的阶段。
目前关于IR社会化应用的研究,主要集中于数据互操作方面,为满足数据的互操作需求,数据交换协议以及系统关联等成为常见的研究主题。
在21世纪初期,NII等机构开始实施“最先进学术信息基础项目”(CyberScienceInfrastructure),借助互联网建设共享的信息资源网络。为推动该项目的进展,NII开始与国内大学密切合作,科研成果传播网络的建设是其中重要的合作内容[9]。在大学产出的研究成果向社会传播的过程中,大学IR发挥的作用备受期待,因此通过开展IR委托项目为大学建设IR提供帮助被纳入到体系建设之中。为了帮助大学建设IR,NII自2005年开始与国内有意向建设IR的大学共同开展IR委托项目。委托项目涉及IR建设发展的各个方面,NII会给予确定的IR委托项目一定的资金支持。
根据文部科学省面向国内国立、公立和私立大学开展的“学术信息基础实态调查”2015年度调查结果可得日本国内大学建设IR统计数据,如表1所示[13]。
表1日本国内建设IR大学数量(截至2014年底)
学校类型
国立大学(个)
公立大学(个)
私立大学(个)
总数(个)
学校总数
86
607
779
建设有IR
85
60
295
440
有IR建设意愿
0
13
174
187
通过调研统计,笔者发现自2006年开始直到2011年共6年间,每年都会有两个以上的研究项目与IR社会化应用行为有关,以下选取较为典型的研究项目进行介绍,这些项目的信息如表2[14]所示:
项目名称
累计参加机构数量(个)
主持机构
业绩数据库的合作项目
2006-2007年
6
金沢大学
研究者信息系统合作项目
2008-2009年
20
以学术机构知识库为平台的电子出版系统开发项目
4
名古屋大学
面向学术机构知识库的系统合作工具开发项目
2008年
2
电子出版系统(编辑审查系统)开发项目
早稻田大学
面向知识库与电子出版合作模型构建的实验性开发项目
10
云环境下电子出版·知识库合作实证实验项目
2010-2011年
开放获取环境下面向相同功能导入的统一标识符实证实验项目
金泽大学
提高机构知识库资源发现及获取成功率的调查研究开发项目(AIRway)
16
北海道大学
面向知识库与电子出版合作模型构建的实验性开发项目由早稻田大学、京都大学、广岛大学、长崎大学和佐贺大学等5所高校共同承担,其目的是开发具有出版审查功能的日语版本数字出版系统,来帮助纪要论文等校内发行物更快地被收录入IR从而实现开放获取[16]。
IR社会化应用行为多种多样,凡是能够促进IR资源应用、提高IR知名度的社会群体均应被纳入到到IR社会化应用模式范畴之中。目前,日本国内IR在社会化应用参与方面,主要参与对象除IR领域内各类IR及辅助应用数据库如IRDB成果分析系统、日本国内的国家层面IR服务JAIRO外,还包括校内研究者信息数据库、日本国家层面的研究者信息数据库researchmap等研究者信息平台、各个高校校内研究者数据库、日本国立国会图书馆(NationalDietLibrary,以下简称NDL)等图书馆、J-GLOBAL等学术信息门户网站和Google等搜索引擎。日本大学IR社会化应用结构如图1所示,图中实线箭头代表已经实现的较为可行的数据互操作行为,虚线箭头代表仍处于探索阶段的数据互操作行为。
图1日本大学IR社会化应用结构
各个大学IR以及其他校内数据库例如研究者信息数据库等是开展IR社会化应用活动的基础,IR可直接面向用户提供服务,也可以通过IRDB系统或JAIRO来提供访问、检索与资源获取,同时还可以通过与校内其他数据库之间建立数据互操作关联,来为用户提供种类多样的访问方式:用户访问其他校内数据库时可以通过特定链接访问IR,也可以借助以校内研究者信息数据库、科研成果数据库为数据基础的researchmap、J-GLOBAL等各类信息平台门户来增加用户访问IR的途径。通过OAI-PMH,Google等搜索引擎可以对IR内元数据进行收割,因此通过搜索引擎用户可以直接检索到IR内的文献资源,并通过搜索引擎提供的链接访问IR并获取资源。
researchmap与JAIROCloud之间也正积极开展合作,信州大学研究者总览数据库与信州大学IR之间的数据互操作发展,正是在researchmap与JAIROCloud合作基础上进行的探索性实践之一。与researchmap等系统的数据交互,为IR与社会其他领域信息系统开展合作探索了方法道路,积累了合作经验,为IR更好地融入社会大数据环境产生了积极影响。
笔者通过调研日本国内大学IR的网站、图书馆收集IR运营方针及政策性文件,来了解该大学对IR的定位情况以及开放获取方式。IR网站上公布的对于自身职能的界定、著作权说明信息、合理使用规范等,可以为判断IR开放政策提供参考依据。
日本大学的IR若想能够被IRDB系统收割元数据,需要满足两个条件[19]:首先是要有规范的URI,以能够被IRDB系统准确定位;其次,IR内数据格式要符合特定规范的元数据标准,即支持元数据收割协议——OAI-PMH和Junii2标准。
Junii2共有64个描述项目,每个描述项目有8个著录项,包括题名、是否必须、是否可重复、最大出现次数、最小出现次数、录入格式等[20]。Junii2可与国际众多标注系统实现数据的互操作,这一点在很多著录项中得到了体现。很多著录项内为国际著名分类法、主题词表设置了专门的著录子项。例如在著录项“主题”中,设置了11个著录子项,分别是“著者关键词”“国立信息学研究所元数据主题词词汇集”“日本十进分类法”“国立国会图书馆分类表”“日本标题表”“国立国会图书馆标题表”“医学标题表”“杜威十进分类法”“美国国会图书馆分类表”“国际十进分类法”“美国国会图书馆标题表”,后4个著录项均是为国际分类法、主题词表设置的著录项。在著录项“ID”中,共有4个著录子项,分别是“PubMed编号”“DOI”“NII论文ID”和“医中志ID”,同样也为国际通行的ID编号设置了著录项目。这样的著录项目设置,使得IR在收录信息时能够按照国际分类法、主题词表对资源进行描述著录。
在Junii2的元素区域内提供有各个著录项目的英文内容,可以将本国语言的元素词汇与国外的元数据格式建立联系,为元数据聚合与集成奠定语言基础,进而实现系统的互操作。同时也有利于将按照Junii2格式进行组织的资源元数据以XML语言的格式进行发布。
日本大学的IR能够被IRDB系统收割元数据的第二个要求中,OAI-PMH的支持是必不可少的。OAI-PMH(OpenArchivesInitiativeProtocolforMetadataHarvesting)是由OAI(OpenArchivesInitiative)开发、维护的互操作协议标准,目前最新版本为2002年发布的2.0版。OAI-PMH以HTTP协议为基础,可以传输各种以XML作为数据格式的数据集。在OAI-PMH协议下,可以根据需要,从目标IR中收割单个元数据、元数据框架或数据集等。没有OAI-PMH的应用,IR内的元数据信息便无法被自动收割,大规模的开放应用自然无从谈起。OAI-PMH也是IR与搜索引擎等实现元数据交互的标准协议。NII自2002年10月启动的元数据-知识库共同构建事业便开始探讨OAI-PMH的实际应用,同一时期千叶大学也开始尝试使用OAI-PMH[3]。
笔者主要介绍金泽大学教育研究业绩数据库与IR的互操作应用[21-22]以及信州大学研究者总览与IR的互操作应用[23-24]。
目前,IR开展的社会化应用辐射范围除IR领域内的各类数据库外,还主要包括各类研究者信息数据库、研究成果数据库等。然而,在出版领域、商业数据库以及学术信息门户网站等方面,存在着与IR建立更为广泛的数据互操作关系的潜力。
[1]姚晓娜,祝忠明,卢利农,等.机构知识库OAI互操作数据同步策略研究[J].现代图书情报技术,2014(3):14-18.
[2]陈晓凤,张志平,白海燕.OAI-ORE在机构知识库中的应用研究与实现[J].现代图书情报技术,2010(11):69-74.
[3]尾城孝一,杉田茂樹,阿蘓品治夫,等.日本における学術機関リポジトリ構築の試み-千葉大学と国立情報学研究所の事例を中心として-[J].情報の科学と技術,2004,54(9):475-482.
[5]王海花,黄金霞,刘雪梅.ORCID在机构知识库建设中的应用研究[J].图书情报工作,2015,59(17):134-140,133.
[7]山本哲也.汎用のデータ変換フレームワークを開発する[J].名古屋大学附属図書館研究年報,2007(6):71-79.
[8]棚橋是之,山本哲也,梶田健史,等.システム間連結のための著者名典拠ディレクトリシステムの開発[J].名古屋大学附属図書館研究年報,2007(6):63-70.
ResearchontheSocializedApplicationofInstitutionalRepositoriesofUniversitiesinJapan
LiXi
SchoolofComputerScienceandInformationTechnology,NortheastNormalUniversity,Changchun130117
Abstract:[Purpose/significance]BasedontheinformationofinstitutionalrepositoriesinJapanwhichhavebeencollectedandstudied,thispapermakesresearchonthepresentsituationaboutthesocializedapplicationofinstitutionalrepositoriesinJapan.[Method/process]Bytheliteratureinvestigation,theauthorvisiteddifferentsitesofinstitutionalrepositories,librariesanddatabasesofuniversities,aswellasthesitesofNationalInstituteofInformaticstoresearchtherelationshipbetweeninstitutionalrepositoriesandotherdatabases.[Result/conclusion]Basedontheanalysis,thesocializedapplicationofinstitutionalrepositoriesinJapanisknownandthispaperdiscussesitfromfourviews:self-localization,dataformat,OAI-PMHprotocolandsysteminteroperability.
Keywords:institutionalrepository;socializedapplication;openaccesssocialization