算法对于我们今天生活十分重要,怎样宣扬也不会夸张。它们在虚拟世界中无处不在,从金融机构到交友网站。但是,相比于其他算法,其中有一些算法更大程度上改变并控制着我们的世界——本文列举了其中十种最为重要的算法。
在正式介绍算法内容之前,让我们来迅速复习一些基本内容。虽然,没有明确的定义,但是计算机科学家将算法描述为一个定义了操作顺序的规则集合。它们是一组顺序指令,用来告诉计算机怎样解决一个问题或者达到某种既定目标。认识算法的好方法,是将算法可视化为流程图。
不久之前,搜索引擎成为了互联网时代的霸主。与搜索引擎一起崛起的还有谷歌和谷歌提出的PageRank算法。
今天,在美国的核心搜索市场中,谷歌的市场占有率达到了66.7%,其次是微软(18.1%),雅虎(11.2%),Ask(2.6%),AOL(1.4%)。毋庸置疑,谷歌已经统治了搜索市场,而且我们中的很多人把谷歌作为使用互联网的主要途径。
在线交友现在是一个价值20亿美元的产业。由于Match.com,eHarmony,andOKCupid等网站的发展,这个产业自从2008年以来每年扩大3.5%。分析家认为这个产业的加速发展在未来五年还将继续——情有可原:这是情侣遇见的有效方式。婚恋网站不仅仅造就了更多的成功婚姻,他们也擅长于根据个人不同的喜好和倾向,匹配潜在情侣。当然,这样的匹配完全是由算法完成的。
我们将以OKCupid为例,OKCupid是一个免费的婚恋网站,联合创始人之一是哈佛大学的数学家ChristianRudder。OKCupid采用一种绝对的分析方法促成约会,他们从用户那里尽力获取信息。OKCupid的配对算法不仅仅是简单地匹配一些共同爱好,同时,每一个问题都被赋予了权重,用来衡量这个问题对于用户和他们潜在情侣的重要程度。这就是所谓的差异造就不凡——这是OKCupid成为最高效婚恋网站的原因之一。
有意思的是,NSA声称实际上他们并没有"采集"我们的数据。根据一份1982年的程序手册,"信息"采集"是指当信息被收集并被国防部情报机构在职责范围内使用"。同时"数据由电子系统采集是指信息采集并被转换为可理解的形式"。英国卫报的BruceSchneier解释道:
"因此,假设你的朋友在家里有成千上万的书籍,根据NSA的解释,他并不"收集"图书。只有他真正在读的那些才是他"收集"的图书,他利用图书做其他事情时并不能认为他在"收集"图书。"
这会产生一个问题因为:
诸如比如亚马逊和Netflix这样的网站,会记录你购买过的书籍或是你看过的电影,然后根据我们的爱好为我们推荐商品。
正如许多自动程序一样,这种二十一世纪独有的技术既有优点也有缺点。虽然这样的推荐有时候很有帮助,但是有时候也会偏离目标——特别是你为你的三岁女儿选购了一本儿童读物作为礼物之后。
与PageRank和Facebook的新闻提要一样,这样的算法正在造成所谓的"过滤器泡沫",这是一种现象,用户与他们不感兴趣的信息隔离——有效地将用户通过意识形态的"泡沫"隔离起来。这导致了EliPariser提出的"信息决定论",我们过去在网上浏览的兴趣决定了我们的未来。
很久之前,金融部门就开始使用算法来预测市场波动,但是他们在高频率的股票交易中的实践才刚刚开始。这样的高速交易涉及的算法,也叫做机器人,可以对订单在毫秒级做出判断。相反,一个人通常需要至少一秒才能对潜在的风险做出反应。因此,人们逐渐被排除在了实际交易的循环之外——一个全新的电子生态正在逐渐形成。
但是,又是这些算法会造成错误。LeoHickman解释道:
比如:2010年五月六日的"闪电崩盘",当时道琼斯指数在几分钟内平均下跌了1000点,而在二十分钟之后市场才出现反弹。这样的大幅直线下跌到目前为止也没能得到完整解释,但是大部分经济学家将齐归咎于"竟次"。"竟次"的罪魁祸首是为了达到高频交易而大规模使用的量化交易算法。ScottPatterson,华尔街日报的记着和《TheQuants》的作者,将在交易场地使用这些算法比作飞机的自动驾驶。今天,大部分的交易是由算法自动完成的,但是当情况出现不同时,比如发生闪电崩盘时,应当有人工介入。
压缩数据算法是电子世界不可磨灭的重要一员。我们希望更快地接收媒体数据,同时希望节约硬盘空间。因此,人们设计了很多方法来压缩和传送数据。
比如,在1991年思科系统研发了CRTP协议。1987年,德国研究者发明了今天广泛使用的MP3格式,从而将音频的大小减少到原始大小的十分之一。这一压缩格式导致了音乐产业的革命(影响有好有坏)。
目前这一技术并没有主宰我们的世界,但是它将很快主宰世界。越来越多的警察机构正在使用一种预测分析技术——一种让人想起电影《少数派报告》的新工具。
这一技术结合了数据采集、统计分析,当然还有前沿的算法。它使得警察可以评估城市的犯罪特点,并且预告可能的犯罪"热点",从而"积极地配置资源和分配人手,从而提高人力物力的使用效率,提高公众安全"。
未来,这个系统可能会大规模替代分析家的工作。犯罪行为可以被精确的算法所追踪,这些算法监控了互联网行为、GPS,个人电子设备,生物特征和其他现实中的通信方式。越来越多的无人机会用来追踪潜在罪犯,通过分析他们的肢体动作和其他的可视化线索,来预测他们的意图。
最后,仅供娱乐,现在调音器由算法完成。无论是歌声或是乐器的声音,这些设备都能通过一组特定规则,略微修改音高,让音高达到最接近的准确半音上。有趣的是,这种技术最初由Exxon'sAnyHildebrand用于处理地震数据。
美国女歌手Cher的《Believe》,被认为是第一首使用调音的流行歌曲。