1、第二章数字图书馆的发展,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,理论篇,(续),刘炜,上海图书馆数字图书馆研究所,面向21世纪课程教材,数字图书馆原理及应用,数字图书馆产生背景,信息技术发展的后果;,图书馆业务处理对象:信息载体质和量的变化;,图书馆业务处理手段:网络化、虚拟化、自动化;,迫使图书馆必须调整馆藏结构、变革处理流程、改变服务方式。,第二章数字图书馆的发展,数字图书馆的产生背景-内因,文献载体电子化、数字化;,文献信息利用手段受到信息技术发展的影响,特别是计算机和网络技术的发展。,第二章数字图书馆的发展,数字时代实现图书馆的四大
2、职能,图书馆的四大社会职能*在数字时代的延续,保存人类文化遗产,开发智力资源,传递科技信息,开展社会教育,*出处:国际图联(IFLA)1975年在法国里昂举行的关于图书馆职能的学术研讨会,第二章数字图书馆的发展,图书馆在信息社会中居于中心地位,国际图联(IFLA)在2003年柏林信息社会全球峰会的决议中指出,图书馆在信息社会中居于中心地位,1,。图书馆以信息载体为处理对象,通过对其所负载的知识内容的加工、处理和整序,达到传播和利用知识的目的。随着信息社会的到来,图书馆这样一个以信息载体及其负载的知识内容为工作对象的社会机构,从形态到结构、从流程到手段都在发生巨大变革,数字化和网络化是图书馆面
3、临的必然趋势,数字化是源,网络化是流,通过网络手段将数字信息提供给用户是图书馆服务的最终目的。,1,参见:(访问日期:2004年7月27日),第二章数字图书馆的发展,信息资源的剧增,数字图书馆的产生背景-外因,第二章数字图书馆的发展,数字化信息量举例,音乐作品(莫扎特):约100MB,报纸(华尔街杂志):100MB/年(文本),卡片目录(美国国会图书馆):17GB,广播(WABC):270GB/年(未经压缩),网络论坛(Netnews):300GB/年,地区图书馆(加州大学图书馆):1.4TB(图书扫描版),Internet出版(WWW):1997年约4TB,电视(CNN新闻):1GB/1
5、le,Internet,38,13,10,5,Source:MorganStanleyResearch,互连网以爆炸方式发展普及,1998,1999,2000,2001,2002,110M,140M,175M,230M,320M,US,Western,Europe,Japan/AP,RestofWorld,.到全球每个角落,第二章数字图书馆的发展,全球信息存在形式,纸,胶片,录象带,CDs,数字影像,磁带,硬盘,文件系统,300Exabytes,20Exabytes,1000Petabytes,100Terabytes,模拟,数据,离线,在线,Internet,.,10,HT
6、ML,Source:InformationTYO(June1999),byAshokChandra,IBMResearch-Almaden,第二章数字图书馆的发展,世界信息总量,全世界每年生产信息1x10182x1018字节信息,大约为全世界每人250MB字节。,印刷体只占0.003%,磁介质93%。,Email达11,285TB。,Usenet73TB。,2000年WWW公共浏览网页21亿,平均每个网页10K数据,每年新增700万网页。2001年网页将达到40亿。,众多数据库以非网页形式存储7,500TB数据,包含5,500亿记录或文件。,中国短信信息总量10亿条
7、/年*,第二章数字图书馆的发展,介质,媒体形态,产量/上限,产量/下限,增长率,纸张,图书,报纸,期刊,办公文件,小计,8,25,12,195,240,1,2,1,19,23,2,2,2,2,2,光学介质,音乐光盘,数据光盘,DVDs,小计,58,3,22,83,6,3,22,31,3,2,100,70,磁介质,数字摄象磁带,个人计算机硬盘,部门服务器,单位服务器,小计,300,000,766,000,460,000,167,000,1,693,000,300,000,7,660,161,000,108,550,577,210,5,100,100,100,55,总计,2,120,539,63
9、异质,信息值不同,长度不同,语法或输入错误,内容错误、过时或不可靠,多种格式,多语种,速度问题,每分钟需要接受15,00020,000次查询请求,第二章数字图书馆的发展,数字化技术的发展,数字图书馆的产生背景-外因,第二章数字图书馆的发展,信息服务领域的技术进步(1),技术类别,七十年代,(联机服务),八十年代,(Internet服务),九十年代中期以来,(网络服务),网络,联机,LAN,Internet,第二代Internet宽带网,MAN,无线,网格,网络服务,计算机,小型计算机,个人电脑,手持,家用,芯片,磁盘价格(1MB),约1万美元,1988年11.54美元,19940.71
10、美元,19980.07美元,20000.03美元,20020.01美元,信息量单位,MB,GB,GB,TG,TG,PB,EB,数字化,OCR,模式识别,数字化Audio/video,语音识别,第二章数字图书馆的发展,信息载体,文本,多媒体,虚拟空间,信息层次,文本信息,显形知识,隐形知识,信息组织,结构化,关系数据库,半结构化,关系数据库,非结构化,数据仓库,信息体系结构(IA),内容特征(标识),规范控制,元数据(metadata),专业元数据,内容组织格式,MARC,SGML,HTML,XML,专业标置语言,内容组织体系,Thesaurus,Wordnet,CYC,Taxonomy
11、,Ontology,内容转换,压缩技术,汉字切分关键词抽取,试验性:自动标引,自动分类,自动摘要,自动翻译,实用性,智能化:,自动标引,自动分类,自动摘要,自动翻译,自动文本生成,内容控制,全文文本排序、算法改进,假设内容处理单元都是独立的,最多仅是词法、句法关联,数据挖掘、数据融合、文本挖掘、信息抽取,可视化,信息服务领域的技术进步(2),第二章数字图书馆的发展,信息链接,文献内部,文献间,引文链接,超文本链接,跨库链接,Internet链,Intranet链接,跨网链接,语义链接跨语言链接,集合组织,主题网站,信息门户,跨网门户,虚拟资源门户,语义门户,信息提供,文本,多媒体,个性化,可
13、字资源共享,第二章数字图书馆的发展,数字图书馆产生演变过程,早期数字化技术和概念探索阶段,V.布什的Aswemaythink,兰开斯特的无纸化社会预言,电子图书馆的定义与猜想,图书馆自动化管理系统的研究开发,数字图书馆项目启动,数字图书馆建设与利用,第二章数字图书馆的发展,美国数字图书馆研究开发情况,第二章数字图书馆的发展,加州大学伯克利分校,环境电子图书馆:可升级的、智能化和分布式电子图书馆的原型,加州大学圣巴巴拉分校,亚历山大项目:图象和空间参考信息综合服务的分布式数字图书馆的初步探索,卡内基,梅隆大学(,CarnegieMellonUniversity,),信息媒体:集成
14、声音、图象和语言理解技术创建和探索数字视频图书馆,伊利诺大学厄尔巴那分校,构建互联空间:为大学工程学科建立数字图书馆的基本架构,密歇根大学,智能信息搜索,斯坦福大学,斯坦福综合电子图书馆,DLI1研究项目,第二章数字图书馆的发展,DLI2研究项目,专家选择利用信息的轨迹研究及其利用,图象传输中的安全研究,WWW上自动化参考“图书馆员”,为人文科学服务的实验图书馆,棉质藏品的2D/3D重建,高性能的数字图书馆分类系统:从信息搜寻到知识管理,第二章数字图书馆的发展,DLI2特点概述,信息检索领域技术在不断进步,;,数字图书馆的研究领域极大地扩展,;,许多重组因特网网络资源的努力正在取得效果,;
16、服务模式,对社会公众开放,第二章数字图书馆的发展,加州大学数字图书馆,最新资源:报纸历史文档,PalmersIndextoTheTimes(coverage:TheTimes1790to1905),TheOfficialIndextoTheTimes(coverage:TheTimes1906to1980),TheHistoricalIndextoTheNewYorkTimes(coverage:1851toSeptember1922),PalmersFullTextOnline(coverage:TheTimes1785-1870fulltext),第二章数字图书馆的发展,美国国会图书馆,国家数字图书馆,美国记忆,数字图书馆竞争项目,第二章数字图书馆的发展,美国国会图书馆,图书馆竞争项目概况,首次将国家数字图书馆馆藏扩大到国会图书馆之外;,三年内由Ameritech提供200万美元奖金;,每年不超过十个获奖项目;,竞赛向除了联邦图书馆之外的所有美国境内的图书馆、档案馆、历史协会和其它原始资料收藏机构开放;,所有