此时此刻,也许不只是你一个人,很多人都和你一样在打开、点击、犹豫不决,或者已有人正在下单……如此种种也都在形成数据,这些数据会影响商家下一步的产品设计和营销策略。
无独有偶,也许你正通过输入关键词搜索一款感兴趣的商品,网页上立即出现了各种不同款式的商品,你选择了最中意的产品并购买,接下来的交易支付、物流配送、到货通知、验货取货、满意度评星等环节也都在产生着记录,形成对商家很有价值的数据。商家利用这些数据可以改善产品服务、加强经营管理、制定新的市场策略……
那么,到底该如何定义数据呢?
我们身边充斥着各种信息,但信息只有被记录下来,才能称之为数据。因此,凡是那些能被记录下来——尤其是能以电子化的方式记录下来的信息,均可称为数据。
数据并非近些年才有,而是从古至今一直都存在,人类从很早以前就有记录数据的习惯。例如,用壁画记录数据,放羊的时候,在墙壁上画几头羊,回来时要对照有没有丢;再比如打绳计数法,每打一个结代表一个或一次等。
如今,我们已身处大数据时代。其实,大数据的本质依旧是数据,只是运用了大数据的思维和方法对数据进行使用。大数据中的数据(data)种类繁多,错综复杂,本身没有用,经过一定的处理后才能派上用场。这些数据携带很多信息,经过一定的梳理和清洗后可形成有用的信息(information);这些信息中包含着许多规律,可以借助智能算法进行挖掘,提炼成知识(knowledge);而知识可以应用于问题解决和决策支持等实践,这便产生了智慧(intelligence)。
诸如此类,这种采集数据(各种动作,如点击与否/购买与否)→提取特征(做好标签)→形成决策(是否继续推送/下次推送什么产品)的“输入数据、产生决策结果”的链条,就是算法在起作用。
那么,到底该如何定义算法呢?
很早以前,算法已经存在。算法的雏形是规律,例如4000多年前,中国的大禹曾在治理洪水的过程中发现了勾股术,并且使用勾股术成功测量了两地的地势差。
除此之外,还有很多例子证明了算法从古至今都存在。比如“算法”这个单词最早出现在公元825年(相当于我国的唐代)波斯数学家阿尔·花剌子密(Al-Khwarizmi)所写的《印度数字算术》中。
如今,算法不再局限于数学领域的应用,而是升级为解决多领域复杂问题、提供多行业应用方案的有力助手,成为人工智能时代的关键要素。算法无论在政务领域还是在商业领域都有着极大的应用,可以应用到智慧政务、公安防诈、无人驾驶、内容推荐、人脸识别、货品陈列等多个行业领域。换句话说,我们早已生活在算法的世界里。
大数据时代,数据是一种资源。因此,产生了数据,就需要存储或调取这些数据;而要应用算法解决问题或辅助决策,则需要计算这些数据。存储、调取和计算对应的数据资源,离不开算力的支撑。
小到手机,大到超级计算机,人工智能每完成一次信息推送、人脸识别或音译转换等,都需要硬件芯片的算力支持。
“算力”听起来比较抽象,但我们平时用手机时都深有体会。我们会发现,有些手机装很多应用都不卡,玩大型游戏也不卡,有些则不然。这是因为不同的手机有着不同的配置、CPU、显卡及内存,因此有着不同的计算和运行能力。
通俗来说,算力就是计算能力,算力的大小代表着对数字化信息处理能力的强弱。
如今,我国正在大力构建算力网络,以提升数据资源效用。2022年2月,国家发改委等部门印发文件,同意在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏建设国家算力枢纽节点,并规划了10个国家数据中心集群,全面启动“东数西算”工程。
来自国际数据公司IDC发布的《数字化世界——从边缘到核心》以及《IDC:2025年中国将拥有全球最大的数据圈》白皮书指出,预计到2025年,中国将成为全球最大的数据圈,数据量增至48.6ZB,占全球数据圈数据总量的27.8%,同时非结构化数据将占据数据总量的80%~90%。
未来,各行各业对算力的需求只会越来越大。
算量(数据)、算法、算力之间的关系,就像“厨师炒菜”,数据相当于“食材”,算力相当于“厨房”,算法就相当于厨艺大师的“手艺”。
即使是同样的食材和同一个厨房,不同厨师做出来的菜肴,其味道也会有很大差异。因此,算法在人工智能领域相当于核心的工艺技术,需要大力推进其产业化,进行技术创新。
人工智能“三兄弟”不可或缺,正因为算量(数据)、算法、算力为人工智能发展奠定了雄厚的基础,整个社会才能够向着数字化、智能化、信息化的方向快速迈进。