江苏档案信息网业务新知互联网档案馆建立25周年:网页存证当下官司与未来之路?

计算机科学家布鲁斯特·卡勒感怀于亚历山大大帝的雄心壮志,梦想为数字时代建立一个“万物图书馆”,他把这个数字图书馆命名为“互联网档案馆”。互联网档案馆作为公益网站,旨在为所有人提供获取知识的通途。然而在实现使命的道路上,互联网档案馆正在面临着一场牵动互联网开放进程的官司。本文将介绍互联网档案馆在数字环境中的存档实践、多元主体共建知识社区,探究互联网文化与档案管理的融合以及管理、技术与司法的撞击,从中窥探数字档案馆的发展与未来之路。

一、为数字时代构建互联网档案馆

牛津大学博德利图书馆(Oxford’sBodleianLibraries)馆长理查德·欧文顿(RichardOvenden)指出:“千年以来一直有人梦想建造一个世界级图书馆,文艺复兴时期,便有人幻想把当时世界上所有已经印刷在纸上的知识全部储藏在一个房间或者一家机构里。”

数千年前,亚历山大大帝(公元前356-323年)征服西方世界后,在尼罗河口建立亚历山大城。他志存高远,希望从这里连接欧亚非、联结希腊和埃及两大文明。亚历山大大帝死后,托勒密王朝的君王们继承了亚历山大的志向。公元前259年,在托勒密一世的主持之下,亚历山大图书馆拔地而起。亚历山大图书馆“收集世界知识之书”,将地中海沿岸地区古往今来所有文献汇聚到一起“实现世界智慧总汇”,亚历山大城由此成为世界“学术之都”和“文明灯塔”。然而,非常遗憾的是,随着托勒密王朝的衰落,亚历山大图书馆被吞没于战火之中。

亚历山大图书馆

曾经地中海的太阳如今只存于想象

数千年后的1996年,一位名叫布鲁斯特·卡勒的年轻计算机科学家感怀于亚历山大大帝的雄心壮志,梦想为数字时代建立一个“万物图书馆”。图书馆包含人类所有的作品,免费向公众开放。他把这个数字图书馆命名为“互联网档案馆”(InternetArchive),其使命是:为所有人提供获取知识的通途。它将网站、软件、音乐、视频、图片和数以百万计的书籍以数字形式存档,并为公众提供免费的访问渠道;不仅如此,互联网档案馆还积极倡导自由和开放的互联网建设。[1]

再建亚历山大图书馆的机会摆在我们所有人面前,

我们要更进一步——面向全球知识开放。

有趣的是,现在技术上是可行的。

——布鲁斯特·卡勒

二、互联网档案馆网页存档实践

如今大数据的概念风行全球,人们通常将大数据的特征归纳为”4V”,即规模性(Volume)、多样性(Varity)、高速性(Velocity)和价值性(Value)。互联网上,数据量巨大、数据形式多样、数据更新频率快、数据价值密度低,这些都是数字环境中存档必须考虑的基本问题。

大数据的4V特征

1996年正是互联网发展之时,互联网档案馆保存的最早的网页可追溯至1996年5月,存档内容于2001年首次向公众开放。当时开发了网页时光机(WaybackMachine),允许用户搜索和访问存档网页,穿越过往。有人甚至说,几乎可以肯定,如果哪些东西没有被网页时光机收录,它们等于从来没有存在过。

通过回溯机可最早追溯到1996年5月12日存档的网页

1999年底,互联网档案馆将其馆藏扩展到互联网网页档案之外。截至2021年4月,互联网档案馆在网页时光机中保存了超过3000万册图书和文本、890万部电影、视频和电视节目、649,000个软件程序、13,225,000个音频文件、380万张图片和5,800亿个网页。

互联网档案馆保存着形式多样的数字档案

互联网档案馆的信息组织略显杂乱

同时,互联网具有更新速率高、价值密度低的特点,通常体现在网站的更动上。网络存档涉及收集、保存和提供继续访问互联网信息的整个过程,如何确定存档的范围与存档的方式是目前网络存档面临的需要改进的问题。互联网档案馆通过与750余个图书馆和其他合作伙伴合作以确定重要的网页,并且在网络爬虫等自动化技术的帮助下完成,目前互联网档案馆的网页时光机已经捕获超过6,270亿个网页。

回溯机通过网络爬虫等方式将重要的网页保存

三、多元主体共建知识社区

Archive-It功能为个人与机构提供

生成和保存数字档案的途径

“国家紧急图书馆”被迫于6月16日终止

结语

虽然对互联网档案馆的做法是否合法、崇高使命能否支撑其行为的正当性等问题仍然存在争议。但毫无疑问的是,互联网档案馆将开放多元、共建共享的互联网文化与档案开放利用服务相结合,成为数字时代中档案领域的先行者。25年来,互联网档案馆总是行动先于观念转变,正是得益于此,我们才能在今天追溯到1996年以来的网页,在疫情期间仍能不间断学习,并从中窥探到数字档案馆的未来。同时,我们也从互联网档案馆中看到了数字档案的脆弱性和短暂性,在数字空间存在的档案的保护及其利用仍然受限于现实条件。[7]如果互联网档案馆的实践失败,其所保存的数字档案与社会记忆就会如同古代亚历山大图书馆般永远消失了。

THE END
1.InternetArchive互联网档案馆The Internet Archive 定期收录并永久保存全球网站上可以抓取的信息,为互联网保存一份档案。备份整个互联网,让网络上的信息像印刷在书籍里一样被永恒地保存下来。收录工作有主次之分,对于不同的网站,收录的数量和频次也不相同。 Internet Archive - 互联网档案馆 Wayback Machine - 网站时光倒流机器 1 2 1. Intehttps://blog.csdn.net/chengyq116/article/details/122443892
2.谷歌搜索结果现已嵌入互联网档案馆“网络时光机”,便于用户浏览IT之家 9 月 14 日消息,谷歌搜索引擎目前已正式嵌入互联网档案馆(Internet Archive)“网络时光机”(Wayback Machine)链接,用户可以查看特定网页的历史版本。 不过IT之家发现这一链接入口比较隐蔽,用户需要点击搜索结果旁的三个点,再选择“进一步了解此网页”(More About This Page),然后向下翻,才能看到“查看先前版http://finance.sina.com.cn/tech/digi/2024-09-14/doc-incpciyq5103958.shtml
3.互联网档案馆最后总结一下,互联网档案馆是一个可以让人找到网站的历史版本,同时也是免费的,公益项目不收费,非常良心,但是有一个缺点,需要一些东西才能进去,并且这个网站是全英文的,用翻译也没有多大的用,并且不支持中文切换,如果想了解更多的,可以自行百度搜索如何进入。https://www.jianshu.com/p/4e559b139262
4.互联网档案馆互联网档案馆是美国数字图书馆与所陈述的使命“普及所有的知识。”它使公众可以免费访问数字化资料集,包括网站、软件应用程序/游戏、音乐、电影/视频、动态图像和数百万本书。除了存档功能外,Archives还是一个激进组织,倡导免费开放的Internet。互联网档案馆目前在Wayback Machine中拥有超过2000万本书籍和文本,300万部电https://vibaike.com/111954/
5.互联网档案馆VIDEOTUTORIAL.RO教程“如何在 Whatsapp 上进行隐形对话”的内容 在本教程的标题“如何在 Whatsapp 上进行隐形对话”中,我向您展示隐藏与联系人或在 Whatsapp 群组中的对话的最佳方法。许多人不知道这种隐藏 Whatsapp 对话的方法许多人只知道阻止 [阅读更多]1 2 https://zh-cn.videotutorial.ro/category/internet/
6.互联网档案馆七色猫视频Please add this domain to one of your websites. Whoops, looks like this domain isn't yet set up correctly. If you're the site owner, please check your site management tools to verify your domain settings.http://archive.org/
7.互联网档案馆(InternetArchive)数据库和检索课互联网档案馆(英语:Internet Archive)是一个非营利性的数字图书馆组织。是一个包含数百万免费书籍,电影,软件,音乐,网站等的非营利性图书馆。成立于1996年,由Alexa创始人布鲁斯特·卡利创办。提供数字数据如网站、音乐、动态图像、和数百万书籍的永久性免费存储及获取。迄至2012年10月,其信息储量达到10PB。除此之外https://jiansuoke.com/db/internet-archive
8.互联网档案馆InternetArchiveSD分享导航站SD分享导航站“互联网档案馆”(Internet Archive)是1996年成立的非营利组织维护的网站,目的是建立一个数字化的全球互联网图书馆,以保留互联网上的文化遗产,使其能够被后代访问和研究。就像纸质图书馆一样,为研究人员、历史学家、学者、阅读障碍者和公众提供免费访问。使命是提供所有知识的普遍获取。 https://home.designshidai.com/10788.html
9.时间机器:从「互联网档案馆」下载网站Archive.org被称做「互联网档案馆」,这里保存了大约 2840 亿个网页,正常情况下,每个人都可以一页、一页的浏览这些「档案」。有个叫WAYBACK MACHINE DOWNLOADER的在线服务,能帮你快点… @Appinn 在Archive 上面可以找到早起的小众软件的样子,或者你感兴趣的网址,比如新浪、腾讯、淘宝之类,可以去试试看 https://www.appinn.com/wayback-machine-downloader/
10.互联网档案馆:查询网站历史数据利器!漏洞人生互联网档案馆就是保留所有网站信息的地方,这个档案馆和Alexa有着密切的关系,因为互联网档案馆搜集的网站资源主要来自于Alexa及部分其它网站,也接受主动加入的网站(如果你发现自己的网站没有被收录,可以主动添加到互联网档案馆)。互联网档案馆位于美国旧金山,与Alexa一样诞生于1996年,是一家非赢利性的信息资源数据库,面https://www.vuln.cn/579
11.InternetArchive(互联网档案馆)jinzi互联网档案馆(英语:Internet Archive)是美国的一个由Alexa创始人布鲁斯特·卡利创办于1996年的非营利性的、提供互联网多媒体资料档案阅览服务的数字图书馆,总部位于加利福尼亚州旧金山的列治文区,其使命是“普及所有知识”(英语:universal access to all knowledge.)。该“档案馆”提供的数字资料有如网站、网页、图形https://www.cnblogs.com/aozhejin/p/16399705.html
12.美国:延长互联网档案馆侵权案证据开示期限国际视野2021年6月1日,在美国出版商协会协调下,阿歇特出版公司、哈珀柯林斯出版集团、约翰威立出版有限公司和企鹅兰登书屋向互联网档案馆提起诉讼,声称互联网档案馆扫描和出借图书是大规模侵犯版权行为。互联网档案馆则表示,其运行已久的图书扫描和借阅计划旨在使传统图书馆在数字时代发挥作用,此计划受合理使用原则保护。在2021年http://m.chinaarchives.cn/home/category/detail/id/38542.html
13.请问互联网档案馆离线可以访问吗怎么弄(可以网上查询档案吗)微信公众号 弱电行业网 扫码关注公众号 热门搜索: 布线 系统 施工 智能家居 施工报价 爱采购 发产品 发布供应 管理供应 匿名 点击243回答02022-11-28 14:41 待解决悬赏分:20- 离问题结束还有 0反对00007 微信小程序 微信小程序 微信公众号 微信公众号 https://www.rdhyw.com/know/show-26719.html
14.如何通过互联网档案馆访问不可用的网页副本什么是互联网档案? 为了保留互联网的历史记忆,互联网档案馆(Internet Archive)是一种巨大的数字档案馆,包括网页和内容,是许多年前出现的。它是一个非营利性组织,位于加利福尼亚州旧金山。Internet存档是Internet上最重要的网站之一,它就像一个巨大的数字图书馆,鲜为人知。在此站点上,我们可以免费找到和下载各种内容https://www.dujup.com/2020/09/blog-post.html
15.互联网档案馆因黑客攻击而陷入瘫痪前不久,互联网档案馆(The Internet Archive)遭受了一系列DDoS(Distributed Denial of Service,即分布式阻断服务)攻击,导致其服务下线。有媒体注意到,该馆在线数据库陷入瘫痪时,其网站出现弹窗,声称已被黑客入侵。在X平台上,有账户声称对此次攻击负责,并暗示后续将有另一轮攻击。 http://hbdaxh.cn/home/article/detail/id/4784.html
16.互联网档案馆Archive.org, 也被称为互联网档案馆, 是一个非营利性的数字图书馆。它的目标是为全球公众提供永久的访问权限, 以浏览互联网上的历史内容。这个项目由Brewster Kahle创立于1996年, 旨在创建一个“互联网的图书馆”。 主要功能 网页存档:互联网档案馆最著名的功能是它的Wayback Machine, 它允许用户查看网页在过去https://hao.archcookie.com/sites/997.html
17.文学共享还是版权至上?互联网档案馆面临英国版权危机界面新闻英国作家协会(The Society of Authors)近日表示,互联网档案馆(Internet Archive)在未经授权的情况下,非法扫描图书并上传至其开放图书馆(Open Library)供大众借阅的行为已涉嫌侵权,若不及时停止,协会将不得不采取法律手段进行维权。 互联网档案馆于1996年在旧金山成立,定期收录并保存互联网上发布的内容。此外,该机构还https://www.jiemian.com/article/2821306.html
18.公共档案馆网站(精选四篇)互联网档案馆是布鲁斯特·卡利于1996年在旧金山所建, 它是一个非营利性质的数字图书馆。它最大的收集项目是网页档案馆———“snapshot of the world wide web”即“万维网快照”。目前, 它已收集了1500亿个网页文件, 并用Wayback Machine检索工具提供回溯检索。当前, 互联网档案馆还收藏了大约107万部各类型电影https://www.360wenmi.com/f/cnkey8r5b4l4.html
19.互联网档案馆InternetArchive我的学习信息记录互联网档案馆Internet Archive链接直达 ">手机查看 该网站提供的数字资料有如网站、网页、图形材料音乐、视频、音频、软件、动态图像和数百万书籍等的永久性免费储存及获取的副本。 用户在网页顶部的框中输入网址,点击“BROWSE HISTORY”按钮,然后选择想要查看的日期,就可看到网站历史的样子相关https://kf369.cn/sites/3713.html
20.InternetArchive:记录那些被遗忘的互联网爱范儿然而,想要建立全球化的互联网档案馆不太容易,部分原因在于各个国家在法定送存、版权、隐私等法律问题上无法统一。今年年初,英国作家协会(The Society of Authors)表示 Internet Archive 做法涉嫌侵权——在英国所有的书籍扫描和借阅行为必须得到版权所有者的授权,且每一次借阅能为作者带来 8.52 便士的公共出借报酬。英国https://www.ifanr.com/1282342
21.互联网档案馆一个月内遭两次黑客攻击,数千万用户数据泄露黑客通过这一漏洞获得了访问支持平台的权限,曝光了自2018年以来的数千个支持工单,其中可能包含用户的个人身份证明文件。这一事件突显了互联网档案馆在安全实践上的重大失误,未能定期更换访问令牌的做法导致了再次泄露。 在日益严峻的网络安全形势下,互联网档案馆(Archive.org)近期接连遭遇两次重大安全泄露事件,导致用户数https://www.szw.org.cn/20241023/67936.html
22.公益性项目互联网档案馆(InternetArchive)遭到DDoS攻击目前正在互联网档案馆 (Internet Archive,Archive.org) 致力于通过快照方式保存各类网站的页面、媒体内容甚至提供文件下载服务。 本身该网站就是公益性的开放项目,但没想到竟然还有人对互联网档案馆发起 DDoS (即分布式拒绝服务) 攻击,这影响了互联网档案馆的可访问性。 https://www.landiannews.com/archives/104132.html
23.Epic与互联网档案馆网站合作保护老版《虚幻》游戏Epic Games 已批准互联网档案馆(Internet Archive)托管《虚幻(Unreal)》以及其后续作品《虚幻竞技场》的安装文件。 根据OldUnreal Discord 服务器内的一篇帖子,存档网站现在过关这两款游戏的原版光盘镜像。玩家可以下载这些镜像,或者使用 OldUnreal 之前发布的仅限 Windows 的游戏安装程序来下载和安装存档的文件。这使得https://m.3dmgame.com/news/202411/3908647.html
24.互联网档案馆网站时光机功能以临时只读模式重新上线,暂不可保存新据Internet Archive 互联网档案馆创始人 Brewster Kahle 的 X 平台动态,互联网档案馆的核心功能之一 Wayback Machine 网站时光机,现已以临时、只读的模式重新上线。 Wayback Machine 已保存的超 9160 亿个网页存档目前已可访问,流量恢复常态,但暂不可缓存新网页。不过 Internet Archive 包括 Open Library 开放图书馆https://news.17173.com/content/10152024/193304658.shtml