这个不讲“道德”的网站,成了千万网友最爱的白嫖工具

开通VIP,畅享免费电子书等14项超值服

首页

好书

留言交流

下载APP

联系客服

2024.04.16广东

由BrewsterKahle创办,是一个非营利性的数字图书馆。

从1996年起,它每隔一会就会抓取各种各样的网页、视频、图片等资料,保存在“图书馆”。

目前图书馆里存了8660亿个网页,1200万个视频,490万张图片和110万个软件程序。

点进网站,从MJ演唱会视频,到1999年测试版的Google搜索页面,再到你多年前送给凤姐的表白,都会重新进入你的世界。

不过,今天故事的主角不是这位,而是另一个档案馆archive.today(今日档案)。

archive.today于2012年创办。从名字和功能上看,它类似于,可以备份网页。

但它俩之间还是有个很大区别——

类似于搜索引擎,绝大多数资料都是爬虫自动抓取的。所以一直以来他们都遵守robot.txt。

但archive.today不遵守这个协议,即便网站不让它存,它也会霸王硬上弓。

不过,这也不能说archive.today缺德。

因为它并非自动抓取别人的网站,只有用户上传某个网页时,它才会抓取。

存档ing.....▼

目前,archive.today已经存储了5亿个网页。虽然远不及,但这种大家主动寻求备份的网页,相对来说,它的意义和价值会更大点。

就像三年前,有位吴彦祖备份了差评的官网,明显是肯定了咱们,咳咳。

除了可以备份网页,因为技术上一些细节,人们发现archive.today有另外一个妙用:

翻越付费墙。

对于那些订阅费动辄几百美刀的西方媒体,很多第三方世界国家的读者不光无力支付,甚至压根没有匹配的支付方式。

但自从这个功能被发现后,archive.today成为了大家心照不宣的“白嫖”工具。

还有不少人基于这个网站做了一些小工具,让白嫖变得更简单。

编辑部偶尔也用过它,有一些东西在这上面确实比较好找。

虽然archive.today管理员曾说过,翻阅付费墙不是网站本意,只是技术问题上产生的一些“意外”。

但想到他愿意冒着被诉讼风险默许这个情况存在,甚至教读者一些白嫖技巧。。。

差评君更愿意相信,他就是一个知识自由的支持者。

根据网站里问答纪录,2013年的时候,存储这些档案每月要在服务器上花300欧元。

2014年,随着网页越来越多,服务器成本升到了2000美元/月。

2016年,这个数字涨到了4000美元。

那问题来了,这些服务器的钱谁出呢?

我们知道,的背后是一家组织,总部在旧金山。它的年度预算有1000万美元,这些钱来自于它的合作赞助商和基金会。

但archive.today管理员说,这个网站全靠自己。

并一路坚持了十多年?

这个赛博菩萨到底是谁啊?

报以好奇和敬意差评君去网上搜了一下,但发现archive.today的背后,是一个迷。

维基百科上关于经营者的身份,只写了一句话:

事实上,没人知道他的真实身份。

首先,网站能追溯到的第一个历史纪录是在2012年5月16日,网站一开始的域名叫archive.is。

由一个来自捷克布拉格,名叫“DenisPetrov”的人注册。

DenisPetrov,是第一个线索。

但随着调查,Jani察觉DenisPetrov可能是假名。

一来这是很常见俄罗斯名字,光是在领英里就有242个同名好哥们。

二来Jani发现同样的名字和联系方式还注册了一堆乱七八糟的域名。

后来Jani还验证了很多带有这个名字的网站,如denispetrov.com、denis.biz、petrov.net。

但大部分网站都已经停运了,唯一能打开的那个,只是一位纽约程序员的博客,早在2011年就已停更了。

DenisPetrov这个线索似乎断了。。。

和Jani一样,这些年也有其他网友探索过这位神秘人,但大多数人都停在了“DenisPetrov”的阶段。

倒是2020年,有另一个网友找到了神秘人的重要线索。

顺着线索,他找到了一个名为MashaRabinovich的领英账号。账号显示,她有德国柏林某个大学的学士学位。

如果这个头像确实是本人,那说起来你可能不信,这个神秘人居然是一个留着波波头,有点娃娃脸的女生。

有人把MashaRabinovich放进谷歌搜索,发现了一个2012年帖子,基本实锤MashaRabinovich就是那个神秘人。

当时一位昵称为masharabinovich用户发帖子,吐槽自己网站archive.today被恶意举报,进了黑名单。

既然名字“确认”了,接下来就是网友们发挥福尔摩斯天赋的时候了。

他们发现MashaRabinovich曾多次参与了维基词条的编辑,最多的就是“俄罗斯护照”;

名字中的“Masha”(Маша)是玛丽亚的常见俄语说法,Rabinovich是德国犹太人的姓氏;

另外archive.today用的分析引擎是俄国的,回答问题时会使用一些大写词汇,可能有德国背景。

基于这些信息,网友推断出,神秘人大概是一个曾在德国留学的俄罗斯人,且学识渊博,英语流利。

至于“MashaRabinovich”,还不一定是其真名。也许和DenisPetrov一样,只是神秘人在网络世界的马甲之一。

虽然大家仍无法确定神秘人真实身份,但差评君觉得点到为止,他隐藏起来一定有自己的原因。

相比起来,我认为神秘人的个性更值得一提。

在archive.today的网站上,有一个基于Tumblr问答服务的页面。

通过这些Q&A,我推断神秘人是一个偏执且不喜欢被吹捧的技术极客。

首先就是我们前面说的,不遵守robot.txt。

像后来也推出了手动备份的功能,但用户上传网页后,它还会检查一遍robot.txt,如果网站不同意被抓取,还是会删除的。

但archive.today可不管这些。

我觉得这么做,是因为他创建网站的初衷就是尊重历史,保存历史。

他也说过,网站即便存档了假新闻,也不会删除。

这一点差评君也认可,历史不是纪录大事记就够了,它是由无数细节拼凑起来才够完整。

虽然archive.today看似有点极端,但也不是所有网页都一视同仁。如果存档确认为恐怖分子的宣传网页、儿童色情等,收到举报后他也会删除。

另外神秘人很低调,从不希望自己被抬得很高。

当网友把他和放在一起夸奖时,他都会否定,说自己没有想保存整个互联网的目标,目前只有的百分之一,且运作方式不同。

差评君觉得,这是每一个老板都要学习的不画大饼精神。

他知道自己一个人/团队的能力有限,做不到那么宏大的目标,一开始就没设想过这么多。

但12年了,网站帮大家存档了五亿多个网页,遇到了无数难题,并依旧坚持免费。

我觉得他和一样,都是令人尊敬的。

不过最近的情况,让差评君觉得网站的生存环境不容乐观。

因为神秘人回答网友问题的频率明显变低了,从两年前月均回答40个问题,到现在隔了好几个月才回答2个问题。

结合历史来看,这种情况其实是必然的。

互联网档案馆因为把140万实体书扫描出来,不限量租借给读者,被四家出版商联合起诉,还有六千名作家签了请愿书支持这场诉讼。

我知道,有很多人都抵制他们这种行为,认为盗版就是犯罪,不是解决问题的方式。

但世界不是非黑即白,“盗版”就一定不被提倡吗?

这个问题几十年来一直争论不休。

90年代,互联网上各种盗版电影和音乐横飞、破解和盗版软件横行。明明是赤裸裸的侵权,但却没有明确的法律能治一波乱象。

毫无疑问,它保护了无数原创者的权利,让人们获得了相应的回报,也让他们的心血没有被盗版商肆意践踏。

“科学和教育资源,就不应该有所谓的知识产权和资本运作的存在”这是Sci-hub传达的理念之一。

从到Sci-hub再到archive.today,他们把无法翻越的信息壁垒,难以打破的知识桎梏,都变成一个简单的回车键,让我们看到了世界的另外一种可能。

不管怎么说——

BrewsterKahle、AlexandraElbakyan、神秘人以及所有那些不追求利益去捍卫知识自由的人,他们都值得我们的尊重和敬佩。

THE END
1.科研干货这11个免费科研工具网站,让你的科研效率翻倍苏苏为您分享11个免费科研工具网站,帮你告别词穷、读懂外刊、追踪文献、搞定翻译、解除限制……甚至轻松制作PPT。一身好装备,提高科研效率。 01 学术写作词句库:Phrasebank 网址: https://www.phrasebank.manchester.ac.uk/ 对于中国科研人员而言,不论是刚开始学习进行英文学术写作,还是具有一定的科研经验,在写作英文论https://zhuanlan.zhihu.com/p/13362651959
2.如何在2024年通过AO3网页版链接登录入口访问并享受更多精彩内容对于热衷于在线阅读原创小说的朋友来说,AO3(Archive of Our Own)无疑是一个重要的资源平台。2024年,随着技术的不断更新与优化,AO3网页版的登录入口也有了一些变化和改进。许多用户可能会有疑问:如何才能顺利登录AO3的网页版并访问海量的原创作品呢?在本文中,我们将详细介绍AO3的网页版登录方式,帮助你顺利进入这个充满http://www.plus1688.com/wfsxsi/26795.html
3.SpecialProjectsEditor,AppStore應徵Apple 的 Special Projects Editor, App Store 職務。請詳閱關於此職務的資訊,了解是否適合你。https://jobs.apple.com/zh-tw/details/200580192/special-projects-editor-app-store
4.worldstatspocketbook2024数据交流中心经The World Statistics Pocketbook 2024 edition (Series V, No. 48) is the forty-eighth in a https://bbs.pinggu.org/thread-13312994-1-1.html
5.archivetoday·GitHubTopics·GitHub# Star Here are 2 public repositories matching this topic Language:All wabarc/archive.is Star36 A command-line tool and Go package for wayback web pages to archive.today golangtorarchiveinternet-archiveanticensorshipinternet-freedommementowayback-machinewaybackno-more-404archiveisarchivetoday https://github.com/topics/archivetoday
6.分享给大家一个互联网存档方法https://archive.md/ 比如保存的这个帖子:http://archive.today/XhZBW 里面原本网页带的内容是可以点击跳转的,就算帖子?了,别人点进链接也可以点尸体火化|不小心发了那种网站到一千多人的年级大群 (社会性死亡小组) 分享一个好东西!建议码住!点开试试! (拼点好饭小组) 鹅们废弃手机号一定https://www.douban.com/group/topic/299960467/
7.theinternetarchive七色猫视频Please add this domain to one of your websites. Whoops, looks like this domain isn't yet set up correctly. If you're the site owner, please check your site management tools to verify your domain settings.http://archive.org/
8.将Archive.today翻译成中文,字典法文Archive.is (anciennementarchive.today) est un site dont le but est d'archiver des pages web et dont le centre de données est situé en France, dans le Nord-Pas-de-Calais. archive.is(又名為archive.today)是一個私人資助的网页存档網站, 資料中心位於歐洲法國的北部-加来海峡。 https://fr.glosbe.com/fr/zh/Archive.today
9.奶酪清单(20241101)? 网页存档查询 archive.org 网页时光机。 waWebpage Archive ? 存档当前网页 1 archive.org 存档当前网页。 wsWebpage Save ─────── ? 自动滚屏 按Esc 停止,按方向键左减速,按方向键右加速。 asAuto Scroll ? 自动刷新 设置数值后自动刷新网页,60 为 60 秒。 arAuto Refresh https://www.runningcheese.com/aaa/comment-page-5?replytocom=38835
10.精通Django(八)django通用视图显示今天的所有对象的日存档页面。这与django.views.generic.dates.DayArchiveView完全相同,只是使用今天的日期而不是year/month/day参数。 注释 使用默认的template_name_suffix为_archive_today 示例myapp/views.py: from django.views.generic.dates import TodayArchiveView from myapp.models import Article class Arhttps://blog.csdn.net/wizardforcel/article/details/140743893
11.网页存档(Archive.today)数据库和检索课archive.is(又名为archive.today)是一个私人资助的网页存档网站,数据中心位于欧洲法国的北部-加来海峡。这个网站典藏档案馆使用Apache Hadoop与Apache Accumulo软件。它可以一次取回一个类似于WebCite的小于50MB的页面,但收录Google地图与Twitter。 archive.is会根据著作权所有者的合乎数字千年著作权法案(DMCA)的撤除请求https://jiansuoke.com/db/archive-today
12.教育存档存档 Filter 筛选 重置 教育 所有话题 辅助功能 配件 AirPods AirTag App Store Apple Arcade Apple Card Apple Maps 音乐片 Apple News Apple Podcasts Apple Stories Apple Vision Pro Apple TV+ 价值观 Watch 商务 App 公司新闻 教育 环境责任 事件 健康https://www.apple.com.cn/newsroom/archive/education/
13.如何在Outlook中不带附件进行存档?MicrosoftOutlook如何在Outlook中不带附件进行存档? 通常,Outlook的存档功能将保存所有电子邮件元素,包括电子邮件内容,电子邮件标头,电子邮件附件等。但是,附件可能会使存档的5. In the Archive dialog box, please click to highlight the specified folder you will archive without attachments, type TODAY in the Archive https://www.ruanfujia.com/10402858/
14.如何存档网站:多种方式建立Web档案的指南2. Archive.today Archive.today网站 接下来是Archive.today。它在很多方面都与Wayback Machine相似——甚至是网站几乎“复古”的设计。它的数据服务器位于欧洲,但它的归档方式与Wayback Machine不同。 首先,Archive.today不是基于在网络上运行的爬虫。相反,您提交您的URL并同意将其包含在存档中。此外,它的功能列表https://www.wbolt.com/archive-a-website.html
15.Archive.todayArchive.today是你个人的时间机器! 在这里你可以将网页永久保存,即使原来的网页消失了,你仍然可以通过这里的存档查看原网页的内容。 为了保证准确性,本站会保存一份文字版本和一份截图版本。 本站还会为网页生成短网址,类似 tinyurl、 goo.gl、bit.ly 等服务。 https://www.zmt.wiki/sites/27764.html
16.outlookarchive设置outlook如何archiveIf you want to keep Outlook 2010 clean and run faster, one method is to set up the AutoArchive feature. Today we show you how to configure and manage the feature in Outlook 2010. 如果要保持Outlook 2010清洁并运行得更快,一种方法是设置自动存档功能。 今天,我们向您展示如何在Outlook 2010中配置https://blog.51cto.com/u_16213580/8710881
17.statusarchiveoptions的翻译是:状态选项存档中文翻译英文意思status archive options 青云英语翻译 请在下面的文本框内输入文字,然后点击开始翻译按钮进行翻译,如果您看不到结果,请重新翻译! 翻译结果1翻译结果2翻译结果3翻译结果4翻译结果5 翻译结果1复制译文编辑译文朗读译文返回顶部 状态存档选项 翻译结果2复制译文编辑译文朗读译文返回顶部http://eyu.zaixian-fanyi.com/fan_yi_5109315
18.ArchivetychoishArchive 2023 5 September 1 The Mid Career Shuffle 2023-09-20 · tychoish August 4 The Most Forgotten CI Feature 2023-08-22 · tychoishToday 2006-11-15 · tychoish I’ve been looking for…. 2006-11-12 · tychoish NaNoWriMo 2006-11-04 · tychoish October 9 Familieshttps://tychoish.com/archives
19.快照查看查看快照信息3、利用第三方存档服务 Internet Archive:除了Wayback Machine,还可以使用Internet Archive查看网页的历史快照,这个非盈利组织定期收录和保存全球网站上可抓取的信息,提供访问过去网页状态的服务。 Archive Today:作为Internet Archive的补充,Archive Today采用主动存档策略,能保存任意一个网页并提供快速的保存服务,这对于研究https://www.kdun.com/ask/771718.html
20.Today3.anytao.comAnytaoToday3.anytao.com Today BlogToday_Asp.net Data Tutorials BookToady_Applied Microsoft .NET Framework Programming CodeToday_Xbase:Details ?2007Anytao.com 支持anytao的创业产品Worktile Worktile,新一代简单好用、体验极致的团队协同、项目管理工具,让你和你的团队随时随地一起工作。完全免费,现在就去了解一下https://www.cnblogs.com/anytao/archive/2007/04/11/today.html