作为一个较为抽象且新兴的概念,有关大数据的概念众说纷纭。对大数据的理解取决于定义者的态度和学科背景。我们认为,大数据定义之所以众说纷纭,主要是因为大数据如其名一样,所涉内容太“大”,大家看它的角度不一样,于是出现了仁者见仁、智者见智的局面。
(1)大量性。
(2)多样性。
大数据的类型繁多,不仅包括以文本资料为主的结构化数据,还包括网络日志、音频、视频、图片、地理位置等半结构或非结构化的数据资料。
(3)价值性。
大数据价值巨大,但价值密度低。由于大数据规模巨大,数据在不断更新变化,这些有价值的信息可能转瞬即逝。因此,如何通过强大的机器算法更迅速地完成数据的价值“提纯”成为目前大数据背景下亟待解决的难题。
(4)高速性。
2.大数据时代
大数据时代是建立在通过互联网、物联网等现代网络渠道广泛大量数据资源收集基础上的数据存储、价值提炼、智能处理和展示的信息时代。在这个时代,人们几乎能够从任何数据中获得可转换为推动人们生活方式变化的有价值的知识。大数据时代具有以下基本特征:
(1)社会性。
在大数据时代,世界范围的计算机联网使越来越多的领域以数据流通取代产品流通,将生产演变成服务,将工业劳动演变成信息劳动。信息劳动产品不需要离开它的原始占有者就能够被买卖和交换,这类产品能够通过计算机网络大量复制和分配而不需要额外增加费用,其价值增加是通过知识而不是手工劳动来实现的。
(2)广泛性。
在大数据时代,计算机技术不仅促进自然科学、人文社会科学各个领域的发展,而且全面融入到了人们的社会生活中。人们在不同领域采集到的数据量之大,达到了前所未有的程度。同时,人们的工作和生活方式已发生了一定程度的改变。
(3)公开性。
大数据产生于一个开放的、公共的网络环境中。虽然考虑到对用户隐私的保护,但在大数据时代会有越来越多的数据被开放、被交叉使用。这种公开性、公共性的实现以若干个网络开放平台或云计算服务为基础,并受到一系列法律或社会公认的数据标准、规范的约束。
(4)动态性。
在大数据时代,数据资料可以随时随地产生,不仅数据资料的收集具有动态性,而且数据存储技术、数据处理技术也随时更新,即处理数据的工具也具有动态性。