<档案学习>互联网档案馆(TheInternetArchive)

由Alexa创始人布鲁斯特·卡利(BrewsterKahle)创办,是一个Waybackmachine公益性质的计划。InternetArchive非正式中文名有“网站时光倒流机器”、“互联网档案馆”等。对于不同的网站,其收录的网页数量和收集周期也不相同,一些大型网站可能每天都会被“备份”一次,每次可能收录数十个以上的网页,而一些小型网站可能每年收录几次,每次只有几个网页。对网站不同时期的历史资料进行研究,是互联网档案馆最大的价值所在。用户可以通过InternetArchive的“TakeMeBack”对网站的发展与历史资料进行研究。

互联网档案计划

“互联网档案计划”分为六大部分:

一、电子书

这个部分,我以前已经介绍过了,它专门收集公共领域的书籍和文档,任何人都可以免费下载。截至到今天,共有29万多种材料,堪称互联网上最好的公共领域图书搜索引擎。

它主要收集英语书籍,但也包括少部分其他语种的书籍,比如朱熹的《论语集注》。

二、网页

光倒流机器”截图2012.08

这个部分有个专门的名字,叫做”时光倒流机器“(WaybackMachine),它像收集旧报纸那样收集旧网页。举例来说,Yahoo!的首页就有5000多份档案,最早的可以回溯到1996年10月17日,最近的则是2007年8月30日。

要将全世界的网页都保存下来,这需要多大的存储容量啊?根据2006年的统计,当时WaybackMachine的存储容量有2000T,然后还在以每月20T的速度增加。

三、视频

这个部分收集视频材料,你在其中可以找到动画片和电影。

四、音频

音频材料主要是有声书籍和音乐。

五、软件

六、教育材料

这部分主要是美国大学课程,有视频和文字材料下载,相当于不去北美就可以上那里的课,比如麻省理工学院的《微分方程》和Naropa大学的《艾伦·金斯堡的诗歌》。

延申阅读

印度:宝莱坞封禁互联网档案馆

日前,互联网档案馆在印度遭到封杀。此举似乎是两家宝莱坞电影生产公司试图禁止国内用户在线观看盗版电影的结果。政府机构向英国广播公司发送了一份法院判决的副本,其中列出了2650个法官下令封禁的互联网提供商,也包括互联网档案馆。

互联网档案馆成立于1996年,这项旧金山非营利计划以其“时光倒流机器”(WaybackMachine)而闻名。“时光倒流机器”是允许公众查看旧版网站的在线工具。

8月2日,印度马德拉斯司法部高等法院正式颁布网站禁令。印度的用户一旦尝试访问网站就会被告知:“该页面已受到政府电信部限制”。由于这一举措并没有说明屏蔽的原因,所以一度引发了混乱。政府新闻信息局局长ShambhuChoudhary告诉英国广播公司:“法院和安全机构封禁某些网站,有时是可以不公开原因的。”

互联网档案馆曾将此事告知Medianama新闻网站,办公室经理ChrisButler表示:“显然,我们对此事感到既失望又担心,迫切需要了解为什么会出现这种情况,并希望能够尽快恢复网民的访问权限。”

档小科有说

很多人说,以后都无纸化办公了,是不是就没有档案了。我们了解一下档案的定义为:

档案,是指过去和现在的国家机关、社会组织以及个人从事政治、军事、经济、科学、技术、文化、宗教等活动直接形成的对国家和社会有保存价值的各种文字、图表、声像等不同形式的历史纪录。

从定义上我们就不难看出档案的载体不只局限于纸张,包括了以往历史产生的:竹简、甲骨,金石等各种载体档案,还包括了目前产生的:网页、电子数据等等。

THE END
1.一史馆信息化管理系统研究项目获奖近日,由中国第一历史档案馆(以下简称“一史馆”)申报的国家档案局科技项目《明清档案电子数据管理元数据规范及海量电子数据的信息化管理系统研究》,经国家档案局评审,获得优秀科技成果三等奖。该项目是一史馆数据处基于自身档案数据管理工作实务,加强档案数据治理工作的有益尝试,也是对海量明清档案电子数据标准化、科学化https://fhac.com.cn/detail/8095.html
2.互联网档案馆(InternetArchive)数据库和检索课互联网档案馆(英语:Internet Archive)是一个非营利性的数字图书馆组织。是一个包含数百万免费书籍,电影,软件,音乐,网站等的非营利性图书馆。成立于1996年,由Alexa创始人布鲁斯特·卡利创办。提供数字数据如网站、音乐、动态图像、和数百万书籍的永久性免费存储及获取。迄至2012年10月,其信息储量达到10PB。除此之外https://jiansuoke.com/db/internet-archive
3.寻找消失的数据,互联网档案馆WaybackMachine新功能但是,就对于互联网信息丢失的问题上,便有一个名为互联网档案馆(Internet Archive)能通过其技术去寻找丢失的信息。互联网档案馆是一家非营利性数字图书馆,主要以普及利用所有知识为目标而常见的。自从1996年,互联网档案馆就开始搜集存档网页并将其内容永久储存。 根据外媒的报道,互联网档案馆的数据表示,一般网页在其http://baijiahao.baidu.com/s?id=1647916656251488033&wfr=spider&for=pc
4.InternetArchive互联网档案馆使用评测分享Internet Archive 互联网档案馆点赞收藏1 收录于2023-05-19 互联网档案馆,存储网页历史快照 Web应用 分享到: Internet Archive,顾名思义,可以将其理解为一个数字图书馆或者互联网档案馆。 网站提供的数字资料,有如网站、网页、图形材料音乐、视频、音频、软件、动态图像和数百万书籍等的永久性免费储存及获取的副本https://hao.logosc.cn/p/829
5.theinternetarchive七色猫视频Please add this domain to one of your websites. Whoops, looks like this domain isn't yet set up correctly. If you're the site owner, please check your site management tools to verify your domain settings.http://archive.org/
6.互联网档案馆InternetArchive我的学习信息记录巴西 10 办公资源站长工具 链接直达">手机查看 该网站提供的数字资料有如网站、网页、图形材料音乐、视频、音频、软件、动态图像和数百万书籍等的永久性免费储存及获取的副本。 用户在网页顶部的框中输入网址,点击“BROWSE HISTORY”按钮,然后选择想要查看的日期,就可看到网站历史的样子 https://kf369.cn/sites/3713.html
7.你听说过「互联网档案馆」吗?51CTO博客其实互联网档案馆(The Internet Archive),从 1996 年就成立了,功能就是:定期收录并永久保存全球网站上可以抓取的信息。 互联网档案馆是由Alexa创始人布鲁斯特 · 卡利创办,是一个公益性质的计划,它的中文名可以叫「互联网档案馆」,也可以叫「网站时光倒流机器」。 https://blog.51cto.com/u_15127664/2788337
8.互联网档案馆(Archive.Org)遭黑客入侵:3100万个账户遭盗用互联网档案馆遭受大规模网络攻击,导致数据泄露,3100万用户记录被盗并在HaveIBeenPwned(HIBP)上共享。 互联网的历史宝库互联网档案馆遭受了毁灭性的网络攻击,导致数据泄露,3100万用户的个人信息被盗。攻击过程非常戏剧性:archive.org网站的访问者会收到一条弹出消息,似乎是黑客自己发的。消息内容如下: https://www.zzwa.org.cn/8281/
9.internet信息服务器Internet档案馆如何维护信息高速公路互联网档案馆是为整个世界服务的公共图书馆。 世界上任何人都可以使用我们图书馆中的媒体,任何人都可以通过上传来贡献媒体。 最近的archive.org重新设计的背后推动力是什么? AR:Internet档案馆的座右铭是“对所有知识的普遍访问”。 我们花费了数年时间改善存储系统,学习将书籍数字化,收集网页和媒体,并与合作伙伴一起https://blog.csdn.net/cumo7370/article/details/107422336
10.公益性项目互联网档案馆(InternetArchive)遭到DDoS攻击目前正在互联网档案馆 (Internet Archive,Archive.org) 致力于通过快照方式保存各类网站的页面、媒体内容甚至提供文件下载服务。 本身该网站就是公益性的开放项目,但没想到竟然还有人对互联网档案馆发起 DDoS (即分布式拒绝服务) 攻击,这影响了互联网档案馆的可访问性。 https://www.landiannews.com/archives/104132.html
11.非盈利数字图书馆互联网档案馆(TheInternetArchive)披露遭遇攻击者获得了一个 6.4 GB 的文件,其中包含在互联网档案馆注册的用户的电子邮件地址和散列密码。 互联网档案馆(The Internet Archive)是一家非营利性数字图书馆,因其 Wayback Machine 而闻名。 10 月 9 日下午,互联网档案馆的访问者开始看到弹出消息,内容如下: “你是否曾感觉互联网档案馆就像在木棍上运行一样https://www.anquanke.com/post/id/300798
12.Ruffle开发Ruffle 的缘由很简单,互联网档案馆 Internet Archive 上保存了超过 1000个精选的 Flash 内容合集,在Flash 退役之后,这些内容该怎么办? Flash 曾经是互联网的一部分 毕竟,没人可以否认,Flash 曾经是互联网的一部分,也为互联网带来了繁荣。在 2000 年~2005年间,Flash 达到了高峰,这期间有很多网站甚至是纯 Flahttps://www.appinn.com/ruffle-is-a-flash-player-emulator/
13.如何通过互联网档案馆访问不可用的网页副本什么是互联网档案? 为了保留互联网的历史记忆,互联网档案馆(Internet Archive)是一种巨大的数字档案馆,包括网页和内容,是许多年前出现的。它是一个非营利性组织,位于加利福尼亚州旧金山。Internet存档是Internet上最重要的网站之一,它就像一个巨大的数字图书馆,鲜为人知。在此站点上,我们可以免费找到和下载各种内容https://www.dujup.com/2020/09/blog-post.html
14.互联网档案馆关于archive互联网档案馆 官网:https://archive.org/ Archive.org, 也被称为互联网档案馆, 是一个非营利性的数字图书馆。它的目标是为全球公众提供永久的访问权限, 以浏览互联网上的历史内容。这个项目由Brewster Kahle创立于1996年, 旨在创建一个“互联网的图书馆”。 https://hao.archcookie.com/sites/997.html
15.互联网档案馆遭遇DDoS攻击,保存8660亿个网页历史的“时光机IT之家5 月 29 日消息,互联网档案馆(Internet Archive)今天发布博文,表示近期频繁遭到分布式拒绝服务(DDoS)攻击,导致其服务多次宕机,用户无法正常访问。 IT之家翻译官方博文部分内容如下: 互联网档案馆(Internet Archive)是一家非营利性研究图书馆,拥有数以百万计的历史文献、保留下来的网站和媒体内容,目前已进入抵御https://www.ithome.com/0/771/536.htm
16.互联网档案馆获赠价值100万美元比特币币界网报道:互联网档案馆(Internet Archive)日前收到了价值100万美元的比特币。据悉,这笔捐款由一名匿名慈善家通过菠萝基金会(Pineapple Fund)捐赠。而互联网档案馆现在成为了第14个从慈善家那里收到比特币捐赠的机构。该网站表示,他们将把这笔善款的大部分款项捐赠给更需要的领域。https://www.528btc.com/bkuaixun/100655.html
17.MarxistsInternetArchiveThe most complete library of Marxism with content in 80 languages and the works of over 720 authors readily accessible by archive, sujbect, or history as well as hundreds of periodicals.https://www.marxists.org/
18.Epic与互联网档案馆网站合作保护老版《虚幻》游戏Epic Games 已批准互联网档案馆(Internet Archive)托管《虚幻(Unreal)》以及其后续作品《虚幻竞技场》的安装文件。 根据OldUnreal Discord 服务器内的一篇帖子,存档网站现在过关这两款游戏的原版光盘镜像。玩家可以下载这些镜像,或者使用 OldUnreal 之前发布的仅限 Windows 的游戏安装程序来下载和安装存档的文件。这使得https://m.3dmgame.com/news/202411/3908647.html
19.奇客Solidot互联网档案馆用户数据泄露互联网档案馆 archive.org 遭遇了用户数据泄露。一名黑客入侵了网站,窃取了包含 3100 万条唯一记录的用户身份验证数据库。黑客还创建了一则 JavaScript 警告,在用户访问 archive.org 时警告网站遭到入侵用户数据泄露。Have I Been Pwned 数据泄露通知服务的作者 Troy Hunt 表示,黑客在 9 天前与他分享了互联网档案馆https://www.solidot.org/story?sid=79445