都柏林核心元数据及其在我国数字图书馆建设中的应用

3、元数据是一个由OCLC和NCSA(美国国家超级计算机应用中心于1995年3月联合发起,图书馆专家、计算机专家和网络专家等人员开发的,旨在研究一套描述网络信息资源的方法,以实现网络信息的辨识、查询和检索,其核心是如何用一个简单的标准化的元数据记录来描述种类繁多的电子信息,使各类网络用户都能够了解和使用这种内容描述方法,达到更有效地描述和检索网络资源。由于这次会议是在俄亥俄州哥伦布市的都柏林镇举行,所以会议成果“核心元数据集”被称为“都柏林核心元数据”。从19952001年,OCLC与有关机构联合举行了9次研讨会,各次会议均有不同的研究重点,由浅入深、由泛到专地对都柏林核心元数据集的理

6、性,可以简化著录项目,OCLC推荐7个元素作为基本描述的要求,这7个元素是:题名、出版者、形式、资源类型、资源标识符、日期和主题。2.3都柏林核心元数据集的修饰词在实际应用中,仅仅依靠这15个基本元素是不够的,必须加以修饰限定和进行若干子元素的规范描述。为了保证互操作性,在进行修饰限定子元素规范的时候,不能改变元素本身的定义,不能重新对基本元素做出解释,而只能根据自己团体和行业的需要对DC元素进行修饰限定和规范。都柏林核心元数据集的修饰词分类为以下两类:(1元素修饰词(ElementRefinement这些修饰词缩小了元素的含义范围,使其具有专指性。都柏林核心元数据集在以

7、下元素中设有元素修饰词:Title(题名:Alterative(交替题名Date(日期:Created(创建、Valid(有效、Avail2able(可获取、Issued(发行、Modified(修改Relation(关系:IsVersionOf(版本继承、HasVersionOf(版本关连、IsReplacedBy(被取代、Re2places(取代、IsRequiredBy(被需求、Requires(需求、IsPartOf(组成部分、HasPart(部分为、IsEef2erenced

11、数据组成元素。资源描述框架是W3C(万维网集团支持并推荐使用的格式,支持在元数据实际交换使用时能够互容的一般格式,以标准的XML语言表述,具有人与机器都可以进行处理的形式,其内容由特定的团体确定。资源描述框架与都柏林核心元数据集彼此受益于对方:都柏林核心元数据集为资源描述框架提供了语义支持:反过来资源描述框架的进展又促进了都柏林核心元数据集数据模型的发展,而都柏林核心元数据集模型的正规化将有利于解决当前都柏林核心元数据集的许多问题。OCLC的“联机合作资源编目”(CORC就是目前成功采用资源描述框架和都柏林核心元数据集进行描述的成功案例。资源描述框架模型通常通过一个简单的三元关系表示

12、:(1资源(Resource:任何可进行描述的对象都可称其为资源。(2属性形式(PropertyType:与描述资源有关的各方面特征。(3属性值(Value:可以是原子型的字符串,也可以是另一资源。3我国对都柏林核心元数据集的研究与应用1999年以来,都柏林核心元数据集在我国也引起了同行们的重视与应用研究。中国国家图书馆就以都柏林核心元数据集为元数据方案制作了大量的数字化资源,上海图书馆与清华大学也参与了OCLC基于都柏林为核心元数据集的CORC计划,清华大学建筑数字图书馆、北京大学图书馆的古籍拓片数据库、上海交通大学的音乐资源库、广东省中山图书馆牵头的数字式中文全文文

13、献通用格式、上海图书馆数字图书馆项目等,都柏林核心元数据集在我国也得以较为广泛地应用。3.1几个应用项目的介绍3.1.1上海图书馆数字图书馆元数据方案上海图书馆的数字图书馆项目实施中,元数据方案的选择是其中一个关键所在。所采用的元数据方案是以都柏林核心元数据集为核心,多种对应于不同资源类型的元数据方法并存,并以资源描述框架为基础的资源描述体系将它们封装在一起,如,对于古籍来讲,有它独立的古籍(RB元数据体例。对于全国报刊索引与上海图典,则是都柏林核心元数据。而对于年鉴等原有图书馆藏书数字化之后所产生的数字资源,则直接使用原来已有的CNMARC记录来进行描述。上海图书馆采用IBM的数字图书

14、馆开发平台作为系统的平台,由于应用系统本身对多种不同元数据格式的支持不足,尤其是对于MARC这样的复杂元数据格式支持能力不够,在将元数据装入IBMDL中之前,实际上是将各种元数据都转换为统一的都柏林核心元数据再行装入的。这样的转换也造成了很多问题,首先是由于多种元数据结构定义之间的非对称性,在转换中一定会丢失很多信息,或者是会造成岐义或者是语义概念上不恰当的伸缩;其次这样的转换也使得对用户提供的检索服务功能受到了限制。所以理想的状态自然是将所有的元数据都装入数字图书馆应用系统,将应实际需要而要进行的转移放在系统之外,这样就可以在满足用户统一检索界面与服务的情况下,提供用户更好的数据挖掘

15、的服务及更多样化的选择可能。3.1.2数字式中文全文文献通用格式“数字式中文全文文献通用格式”是文化部制定的文化行业标准。该标准采用都柏林核心元数据集1.1版本为基本框架,除全部采用都柏林核心元数据格式15,还增加了记录控制号(Record项目,共有16个数据项目,采用面向对象技术,可以对文本、图像、音频、视频、计算机程序以及网址资源进行编目和数字化处理,覆盖了几乎所有的文献类型,并规定了中文数字化文献的文本著录格式,使之符合数字化中文文献的规范著录要求,同时也符合国际数字图书馆标准化的发展趋势。可以说:“数字式中文全文文献通用格式”是中文化的DC元数据格式。这一格式在通用置标语言以及其他

17、元素以及拓片个别元素组成。拓片元数据标准的设计要以拓片基本著录单位为基础。不同拓片之间存在着各类复杂的关联,如包含关系、并列关系、附加关系等。这些关系影响着拓片著录对象的确定,进而涉及到元数据标准的设计。3.2中文元数据存在的问题从以上三个项目中,我们可以看出,DC元数据的应用还存在着以下问题。3.2.1中文元数据标准化的问题虽然都柏林核心元数据是国际上应用广泛且成熟的元数据体系,但是其中文标准化问题却很大。没有经过很好的母语规范与应用规范的定义,对于我们来说,应用起来就会产生这样那样的问题。以上介绍的几个项目尽管都用到了都柏林核心元数据,但具体应用时所选取得元素和标准还是不尽相同。举例来讲,

19、。引进和利用各种成熟、规范的编码体系中的元素,将这些基本构件有机地组合起来,形成适应具体应用需求与中文资源特点的应用规范,推动标准化、模块化的中文DC元数据应用方案的交流与推广。3.2.3以MARC为代表的传统元数据的发展与利用问题。MARC作为一种发展成熟且在图书馆界应用普遍的技术,我们不可能即刻将它抛弃。而是应该针对传统元数据与现代元数据的不同特点,取长补短,发挥各自特长,对各种信息资源形态与特点的资源进行有效的内容组织与信息挖掘。加强传统元数据与DC元数据格式之间的融合,提高中文DC元数据应用的互操作性。同时在新的信息技术与标准的应用环境下,对传统元数据进行革新与发展,使这些元数

22、版社,2000,9.2马张华.分类搜索引擎类目体系研究J.图书情报工作,2001,(2:3640.3马张华,李玲.论超文本技术在分类法编制中的应用J.大学图书馆学报,2001,(1:6062,66.4同2.5石春芳,石晓华.网络信息的分类组织J.图书馆论坛.2000,(6:7274.AStudyofRetrievalLanguageofChineseSearchEnginesWUFengyu,LIUJiayingAbstract:InviewofthefactthatChinesesearchenginesoftenyieldu

23、nsatisfactoryresults,thispaperexaminesanum2berofChinesesearchenginesfromtheperspectiveofretrievallanguages.Itsuggeststhataproperapplicationofprinciplesandmethodsofinformationretrievallanguagemaysignificant2lyimprovetheperformanceofthesese

THE END
1.中国国家图书馆www.nlc.gov.cn图书展馆 网站信息 网站类型:教育文化,图书展馆 所属地区:北京 网站简介 查看nlc.gov.cn站点信息 > 站点介绍 中国国家图书馆,中国国家数字图书馆 网站数据 查看更多> 0 百度权重 2 360权重 -- APPPC排名 0 关键词数 0 APPPC反向PR 百度预估流量百度收录单月收录百度索引量百度反链数APPPC流量排名 https://top.chinaz.com/site_www.nlc.gov.cn.html
2.数字资源超干货!图书馆数字资源使用攻略新闻图书馆图书馆有着丰富的纸本图书,还有海量的电子资源,这些资源涵盖了图书、期刊、论文、考试等内容,是助力我校师生科研教学的好帮手。为了帮助读者熟悉掌握图书馆数字资源使用方法,我们对现有的常用数据库进行汇总整理,还有图书馆提供的信息服务内容,请大家跟随这份指南,一同去看看吧! https://tsg.hkxy.edu.cn/2024_12/06_16/content-61075.html
3.黑龙江中医药大学图书馆CNKI系列数字资源采购结果公告服务类(同方知网数字出版技术股份有限公司) 五、评审专家(单一来源采购人员)名单: 李长海、刘政、宋业旭(采购人代表) 六、代理服务收费标准及金额: 七、公告期限 自本公告发布之日起1个工作日。 八、其他补充事宜 合同包1(图书馆CNKI系列数字资源采购): http://www.ccgp.gov.cn/cggg/dfgg/cjgg/202412/t20241211_23841859.htm
4.世界国家数字图书馆世界数字图书馆美国国家图书馆 https://www.loc.gov/collections/world-digital-library/about-this-collection/ 中国国家图书馆 百度搜索即可 英国国家数字图书馆 The British Library: The National Library of the UK - The British Library Digital Public Library of America https://blog.csdn.net/geniusChinaHN/article/details/141344011
5.中国科学技术信息研究所期刊信息 主管单位: 新华通讯社 主办单位: 中国新闻技术工作者联合会 国际刊号: 1671-0134 国内刊号: 11-4653/N 出版周期: 月刊 地址: 北京市宣武门西大街甲97号 邮政编码: 100031 电话: 010-63071478/4927 电子邮箱: cmkj@xinhua.org相关期刊 https://netl.istic.ac.cn/site/objdata/2F54B3A514A34193AB662FE41DEAE1D1/zgcmkhj
6.中国数字图书馆2012-02-17 国家版权局2月16日,中国ISRC(国际标准录音制品编码)中心揭牌仪式在2012CPCC中国版权服务年会开幕式上举行。该中心将通过对ISRC编码的分配,实现相关制品在数字网络环境下的有效检索、版权信息确认及监测和版权费用结算认证等。新闻出版总署副署长阎晓宏等为中国ISRC中心揭牌。 中国ISRC中心是新闻出版总署批准http://www.cdlc.cn/n/news.aspx?nid=442
7.计算机网络论文15篇在数字图书馆计算机网络上所记载的用户的个人信息以及图书馆的一些信息没有经过授权管理就被“非法用户”肆意的篡改。也就是说,在图书馆的计算机网络所传播的一切信息都要求不能被随意的颠倒顺序、伪造信息、重置信息内容以及肆意修改等等,这些都关系到图书馆计算机网络的安全技术有着必然的联系。https://www.yjbys.com/biyelunwen/fanwen/jisuanji/733688.html
8.温州市图书馆温州市以国家公共文化服务体系示范区建设为抓手,立足“人民中心”,紧扣精准服务,围绕“品质化+特色化”的创新发展理念,融入“15分钟品质文化生活圈”。书目检索 资源检索 站内搜索 搜索 ? 服务热线: 0577-88962666 城市书房 流动书巴 服务指南 书香门递 智慧城市书房 籀园学堂 我的图书馆 (续借、验证) 用户登录https://www.wzlib.cn/
9.中国数字图书馆有限责任公司(北京市海淀区中关村南大街33号邮政企业名称:中国数字图书馆有限责任公司手机查看 注册地址:北京市海淀区中关村南大街33号(怎么走?) --如何免费在百度地图标记公司地址、门店位置、地点信息? 注册日期:2000年1月17日 地区:海淀(点击查看海淀最新注册的公司、海淀最新注册的工厂) 海淀邮政编码:100089 https://gongshang.mingluji.com/beijing/name/%E4%B8%AD%E5%9B%BD%E6%95%B0%E5%AD%97%E5%9B%BE%E4%B9%A6%E9%A6%86%E6%9C%89%E9%99%90%E8%B4%A3%E4%BB%BB%E5%85%AC%E5%8F%B8
10.中国科学院文献情报中心(国家科学图书馆)中国科学院文献情报中心为中国科学院直属事业法人单位,立足中国科学院、面向全国,主要为自然科学、边缘交叉科学和高技术领域的科技自主创新提供文献信息保障、战略情报研究服务、公共信息服务平台支撑和科学交流与传播服务,同时通过国家科技图书文献平台和开展共建共享为http://www.las.cas.cn/
11.大连市数字图书馆网站6月22日上午 报告厅 “艺行大连”系列文化讲座之六:走近交响乐的世界——巴赫的音乐特点 郑冰 作曲家、指挥家、国家一级作曲 享受国务院特殊津贴专家 中央美术学院、大连大学音乐学院客座教授 大连爱乐交响乐团团长 6月22日下午 报告厅 “温故”系列视频讲座之十二:塞尚与形式分析(视频由上海图书馆提供) 沈语冰 复https://www.dl-library.net.cn/
12.山东师范大学信息科学与工程学院研究生招生本课程是数字通信领域的一门经典课程,通过对概率论及随机过程的复习,讲授数字和模拟信源编码、数字调制信号和窄带信号与系统的特征、加性高斯白噪声中数字通信的调制和最佳调制与检测方法、基于最大似然准则的载波相位估计和定时同步的方法、不同信道模型的信道容量及随机编码、带限信道的信号设计、受到符号间干扰恶化信https://m.okaoyan.com/kaoyanshop/sdsfdx/xxkxygcxy/
13.三年级数学上《数字编码》教学设计(精选15篇)师结合板书小结:你们搜集的信息很全面,现行的第二代身份证号码由18位数字组成,前6位数字是地址码,7—14位是生日码,15—17位是顺序码,第18位是校验码。像这样把一些数字或字母按一定标准排列,就叫数字编码。(板书课题:数字编码) 以前我们学习了用数表示数量和顺序等等,(课件出示)这节课我们知道了数还可以用来编https://m.ruiwen.com/jiaoxuesheji/5342985.html
14.三年级数字编码教案(通用12篇)2、让学生通过小组讨论、观察、比较去探索数字编码的简单方法。 3、让学生经历设计编码的过程,体会在信息化、数字化时代下数字在表达、交流和传递信息中的作用,初步学会用数字进行编码。 教学重难点 1、教学重点:让学生了解身份证号码、邮政编码等数字编码的含义和数字编码的简洁。 2、教学难点:了解数字编码的规则,初https://www.yuwenmi.com/jiaoan/sannianji/552359.html
15.中关村高新技术企业认定申报一、事项名称 中关村高新技术企业证书服务 二、设定依据 《中关村高新技术企业库管理办法(试行)》(中科园发〔2018〕55号)(文件详细内容见下方附件下载) 三、纳入中关村高新http://www.chinasbzx.com/article/show?id=1207&nid=3