这个不讲“道德”的网站,成了千万网友最爱的白嫖工具

老差友应该都知道互联网档案馆(下称archive.org),咱介绍好几次了。

archive.org由BrewsterKahle创办,是一个非营利性的数字图书馆。

从1996年起,它每隔一会就会抓取各种各样的网页、视频、图片等资料,保存在“图书馆”。

目前图书馆里存了8660亿个网页,1200万个视频,490万张图片和110万个软件程序。

点进网站,从MJ演唱会视频,到1999年测试版的Google搜索页面,再到你多年前送给凤姐的表白,都会重新进入你的世界。

不过,本文故事的主角不是这位,而是另一个档案馆archive.today(今日档案)。

archive.today于2012年创办。从名字和功能上看,它类似于archive.org,可以备份网页。

但它俩之间还是有个很大区别——

archive.org类似于搜索引擎,绝大多数资料都是爬虫自动抓取的。所以一直以来他们都遵守robot.txt。

但archive.today不遵守这个协议,即便网站不让它存,它也会霸王硬上弓。

不过,这也不能说archive.today缺德。

因为它并非自动抓取别人的网站,只有用户上传某个网页时,它才会抓取。

存档ing.....▼

目前,archive.today已经存储了5亿个网页。虽然远不及archive.org,但这种大家主动寻求备份的网页,相对来说,它的意义和价值会更大点。

就像三年前,有位吴彦祖备份了差评的官网,明显是肯定了咱们,咳咳。

除了可以备份网页,因为技术上一些细节,人们发现archive.today有另外一个妙用:

翻越付费墙。

对于那些订阅费动辄几百美刀的西方媒体,很多第三方世界国家的读者不光无力支付,甚至压根没有匹配的支付方式。

但自从这个功能被发现后,archive.today成为了大家心照不宣的“白嫖”工具。

还有不少人基于这个网站做了一些小工具,让白嫖变得更简单。

编辑部偶尔也用过它,有一些东西在这上面确实比较好找。

虽然archive.today管理员曾说过,翻阅付费墙不是网站本意,只是技术问题上产生的一些“意外”。

但想到他愿意冒着被诉讼风险默许这个情况存在,甚至教读者一些白嫖技巧。。。

差评君更愿意相信,他就是一个知识自由的支持者。

根据网站里问答纪录,2013年的时候,存储这些档案每月要在服务器上花300欧元。

2014年,随着网页越来越多,服务器成本升到了2000美元/月。

2016年,这个数字涨到了4000美元。

那问题来了,这些服务器的钱谁出呢?

我们知道,archive.org的背后是一家组织,总部在旧金山。它的年度预算有1000万美元,这些钱来自于它的合作赞助商和基金会。

但archive.today管理员说,这个网站全靠自己。

并一路坚持了十多年?

这个赛博菩萨到底是谁啊?

报以好奇和敬意差评君去网上搜了一下,但发现archive.today的背后,是一个迷。

维基百科上关于经营者的身份,只写了一句话:

事实上,没人知道他的真实身份。

半年前一位悉尼的工程师Jani花了很大精力,想看看archive.today幕后神秘人到底是谁。

首先,网站能追溯到的第一个历史纪录是在2012年5月16日,网站一开始的域名叫archive.is。

由一个来自捷克布拉格,名叫“DenisPetrov”的人注册。

DenisPetrov,是第一个线索。

但随着调查,Jani察觉DenisPetrov可能是假名。

一来这是很常见俄罗斯名字,光是在领英里就有242个同名好哥们。

二来Jani发现同样的名字和联系方式还注册了一堆乱七八糟的域名。

后来Jani还验证了很多带有这个名字的网站,如denispetrov.com、denis.biz、petrov.net。

但大部分网站都已经停运了,唯一能打开的那个,只是一位纽约程序员的博客,早在2011年就已停更了。

DenisPetrov这个线索似乎断了。。。

和Jani一样,这些年也有其他网友探索过这位神秘人,但大多数人都停在了“DenisPetrov”的阶段。

倒是2020年,有另一个网友找到了神秘人的重要线索。

顺着线索,他找到了一个名为MashaRabinovich的领英账号。账号显示,她有德国柏林某个大学的学士学位。

如果这个头像确实是本人,那说起来你可能不信,这个神秘人居然是一个留着波波头,有点娃娃脸的女生。

手动码一下

有人把MashaRabinovich放进谷歌搜索,发现了一个2012年帖子,基本实锤MashaRabinovich就是那个神秘人。

当时一位昵称为masharabinovich用户发帖子,吐槽自己网站archive.today被恶意举报,进了黑名单。

既然名字“确认”了,接下来就是网友们发挥福尔摩斯天赋的时候了。

他们发现MashaRabinovich曾多次参与了维基词条的编辑,最多的就是“俄罗斯护照”;

名字中的“Masha”(Маша)是玛丽亚的常见俄语说法,Rabinovich是德国犹太人的姓氏;

另外archive.today用的分析引擎是俄国的,回答问题时会使用一些大写词汇,可能有德国背景。

基于这些信息,网友推断出,神秘人大概是一个曾在德国留学的俄罗斯人,且学识渊博,英语流利。

至于“MashaRabinovich”,还不一定是其真名。也许和DenisPetrov一样,只是神秘人在网络世界的马甲之一。

虽然大家仍无法确定神秘人真实身份,但差评君觉得点到为止,他隐藏起来一定有自己的原因。

相比起来,我认为神秘人的个性更值得一提。

在archive.today的网站上,有一个基于Tumblr问答服务的页面。

通过这些Q&A,我推断神秘人是一个偏执且不喜欢被吹捧的技术极客。

首先就是我们前面说的,不遵守robot.txt。

像archive.org后来也推出了手动备份的功能,但用户上传网页后,它还会检查一遍robot.txt,如果网站不同意被抓取,archive.org还是会删除的。

但archive.today可不管这些。

我觉得这么做,是因为他创建网站的初衷就是尊重历史,保存历史。

他也说过,网站即便存档了假新闻,也不会删除。

这一点差评君也认可,历史不是纪录大事记就够了,它是由无数细节拼凑起来才够完整。

虽然archive.today看似有点极端,但也不是所有网页都一视同仁。如果存档确认为恐怖分子的宣传网页、儿童色情等,收到举报后他也会删除。

另外神秘人很低调,从不希望自己被抬得很高。

当网友把他和archive.org放在一起夸奖时,他都会否定,说自己没有想保存整个互联网的目标,目前只有archive.org的百分之一,且运作方式不同。

差评君觉得,这是每一个老板都要学习的不画大饼精神。

他知道自己一个人/团队的能力有限,做不到那么宏大的目标,一开始就没设想过这么多。

但12年了,网站帮大家存档了五亿多个网页,遇到了无数难题,并依旧坚持免费。

我觉得他和archive.org一样,都是令人尊敬的。

不过最近的情况,让差评君觉得网站的生存环境不容乐观。

因为神秘人回答网友问题的频率明显变低了,从两年前月均回答40个问题,到现在隔了好几个月才回答2个问题。

结合历史来看,这种情况其实是必然的。

互联网档案馆因为把140万实体书扫描出来,不限量租借给读者,被四家出版商联合起诉,还有六千名作家签了请愿书支持这场诉讼。

我知道,有很多人都抵制他们这种行为,认为盗版就是犯罪,不是解决问题的方式。

但世界不是非黑即白,“盗版”就一定不被提倡吗?

这个问题几十年来一直争论不休。

90年代,互联网上各种盗版电影和音乐横飞、破解和盗版软件横行。明明是赤裸裸的侵权,但却没有明确的法律能治一波乱象。

毫无疑问,它保护了无数原创者的权利,让人们获得了相应的回报,也让他们的心血没有被盗版商肆意践踏。

“科学和教育资源,就不应该有所谓的知识产权和资本运作的存在”这是Sci-hub传达的理念之一。

从archive.org到Sci-hub再到archive.today,他们把无法翻越的信息壁垒,难以打破的知识桎梏,都变成一个简单的回车键,让我们看到了世界的另外一种可能。

不管怎么说——

BrewsterKahle、AlexandraElbakyan、神秘人以及所有那些不追求利益去捍卫知识自由的人,他们都值得我们的尊重和敬佩。

您当前使用的浏览器版本过低,导致网站不能正常访问,建议升级浏览器

THE END
1.统一身份认证平台*登录账号: *设置密码: *确认密码: *手机号码: *真实姓名: 性别: 男 女 出生年月: 学历: 职业类型: *图形验证码: 看不清?请点击图片 *短信验证码: 获取验证码 提交 已有https://www.moj.gov.cn/sfbsso/register.html
2.图书版权与知识开放之间的较量——为2024年“世界图书和版权日2022年12月,《新京报书评周刊》发表了一篇署名“申璐”的文章,题目是“最大电子书平台Z-Library关停,一场无法取胜的版权战?”。文章详细分析了当今国际电子书市场对出版商和著作人的权利提出的严峻挑战,以及政府、社会对电子书复制和传播引发的争论。我只是一个普通的写书人和读书人,所以,我将从这一普通身份出发,https://www.thepaper.cn/newsDetail_forward_27135249
3.走进那些“神奇图书馆”这里既是阅览之地、寻求知识之地,还是一个综合的聚会场所:成群结队的青少年在底层的玻璃墙前练习舞蹈;音乐家在花园里演奏;年长的男人来这里看报纸;学生们在课本和笔记本电脑上忙碌着;情侣们忙着拍摄,位于图书馆大厅显著位置的巨鲸骨架出镜率最高;老朋友们围坐在能俯瞰城市的大桌子旁,悠闲地交谈……http://www.xinhuanet.com/ci/20240419/c09efff09d3f4f58b3a9e4c13ad2426b/c.html
4.常来图书馆坐坐,不为打卡只为读书天山网这些新景观、新打卡地,靠颜值引流,确实吸引了不少人走进图书馆。但打卡替代不了读书,回归图书馆的本位,须在吸引更多人静心阅读上下功夫,图书馆不仅是一个藏书和借阅的地方,更是一个将读者与知识、体验、创新力联系起来的阅读场所。 当前,文化润疆工作深入推进,新疆各地图书馆、文化馆、书屋拔节生长,为各族群众送去https://www.ts.cn/xwzx/pl/202404/t20240423_20543860.shtml
5.读书图书馆,是人类理想中最好的那一部分亚历山大大帝骄傲地宣布:“世界是属于我的。”实现这一理想的方式之一,就是收集世上现存的所有书籍。很可惜,亚历山大出师未捷身先死,只有《伊利亚特》陪伴在他身边。后来,这位帝王的遗志被托勒密王朝所继承,以“亚历山大”命名的图书馆矗立在埃及的港口,面向大海,沐浴阳光,仿佛被亘古以来的人类智慧所笼罩。 https://www.whb.cn/commonDetail/928312
6.AI满足多样性阅读需求用户隐私问题不可忽视哈密市图书馆三楼的蜜宝数字体验空间通过AR增强现实技术、智能图形识别与实时渲染技术等高科技手段,为市民带来了前所未有的阅读体验。如今,AI技术已在文化领域广泛应用。然而,在享受AI带来的便利与创新的同时,用户隐私问题也不容忽视。 (图片来源:摄图网) 数字阅读产业持续增长 近年来,数字阅读产业持续展现出强劲的增长https://www.fjii.com/content/detail/268394.html
7.这个春节,在家免费坐拥国图外文电子书、外语学习视频在线 一批资源等你来看 以上,只是众多资源库其中的一部分,还有更多优质外文资源库供注册用户免费在线使用。4.收看国图公开课 国家图书馆借鉴MOOC的大规模、开放、在线理念,与当代社会发展和民众生活紧密联系,以传承和弘扬中华优秀传统文化为核心,依托馆藏海量资源,以专题形式设置课程。采取http://baijiahao.baidu.com/s?id=1657064648038739136&wfr=spider&for=pc