什么是分析,数据分析决胜未来

------故明君贤将,所以动而胜人,成功处于众者,先知也。先知者,不可取于鬼神,不可象于事,不可验于度,必取于人,知敌之情也。

——《孙子兵法用间篇》

通过上面《孙子兵法》这段话,我们也可以知道古人也在很早就会使利用分析知己知彼,洞察秋毫,决胜千里。

02

什么是分析

一般的定义是为:一种全面的、基于数据驱动的解决问题的策略和方法。分析通过试用逻辑、归纳推理、演绎推理、批判思维、定量阀(结合数据)等手段,来检验和分析现象,从而确定其本质特征。

分析的概念

1.商业智能和报表

关于分析和商业智能的的区别,几乎没有形成过共识。有些人将分析归类为商业智能的一个子集,而另一些人则把它归为完全不同的类别。

大多数商业智能应用的局限性并不在于技术的限制,而在于分析的深度和为行动提供依据的真正洞察力。例如,告诉我们已经发生了什么事情并不能帮助我们决定如何行动以改变未来,这样的结果往往通过离线分析可以得到。分析的真正责任是形成可行动的,可操作的洞察力,从而能够帮助我们了解已经发生的事情(在什么地点发生,为什么会发生,在什么条件下发生)预测出未来可能发生什么,以及我们可以做什么来影响和优化未来的结果。

图1:商业智能(BI)仪表盘

而报表,是用来描述有关现象的信息展示技术,通常位于数据传递管道的尾部,在那里可以直观地访问数据和结果。而另一方面,分析则超越了对数据的描述,它真正理解了这个现象的内在规律,从而来预测、优化和预判未来应采取的适当行动。

2.大数据

大数据(BigData)是一种描述不和谐信息的方法、在将数据转化为洞察能力的过程中,组织必须处理这些难以处理的信息。如果将大数据描述当今信息复杂的概念,那分析就可以帮助我们以主动的方式(预测性和规范性)来分析复杂性,而不是以被动的方式(BI,商业智能)来应对。

3.数据科学

数据科学是一门科学学科,它利用统计学和数学等领域的定量方法及现代技术,开发出用于发现模式、预测结果和为复杂问题找到最佳解决方案的算法。

数据科学和分析的区别在于,数据科学可以帮助甚至支持自动化实现对数据的分析,但是分析是一种以人为中心的策略,它充分利用各种工具,包括那些在数据科学中发现的工具,来理解事物现象之间的真正本质。

4.边缘分析

边缘分析一般指的是分布式分析,分析被内置到一些机器或系统中,通过这种内置的方式,信息的生成与收集已经成为企业“下意识”的自主活动。边缘分析通常与智能设备,物联网(IoT)联系在一起,把分析嵌入到收集设备上完成的,给物联网带来独特的价值机会。

5.信息学

信息学(informatics)是信息技术和信息管理的交叉学科。在实践中,信息学涉及用于数据存储和检索的处理技术。从本质上讲,信息学讨论信息是如何管理的,指的是支持流程化工作流的系统和数据生态系统,而不是对其中发现的数据进行分析。

在信息科学中经常谈到的健康信息学,它专门用于保健医疗研究,是介于健康信息技术和健康信息管理之间的一种专业技术,它将信息技术、通信和保健结合起来,以提高病人护理的质量和安全性。在下图中,我们可以看出,它位于人、信息和技术三者交汇的中心。

分析集成了所有这些概念,并依赖于底层数据、支持技术和信息管理过程来实现这一目标。

图2:健康信息管理、健康信息技术和信息学之间的区别

6.人工智能与认知计算

人工智能(AI)是一门“让计算机做需要人类智能才能做的事情的科学”。

人工智能和机器学习的区别在于,人工智能是指利用计算机完成模式的识别与探索这类“智能”工作的广义概念,而机器学习是人工智能的子集,它主要利用计算机从数据中学习的概念。

机器学习可以根据数据进行学习和预测,不是仅仅根据特定的一组规则或指令完成事先规划好的操作,而是利用算法训练来自主识别大量数据中的模式。

03

分析方法论

1.应用统计与数学

图3:统计与其他定量科学之间的关系

数学的思维是演绎性的,就是通过一般定律或原则来推断某一特定实例,而统计推理是归纳性的,就是从具体实例中提炼一般规律。这种差异在分析环境下是很重要的,因为我们将归纳推理和演绎推理应用与分析解决不同的问题。因此,将数学和统计都应用到分析领域是适当的和必要的。

3.自然语言处理

自然语言处理(NaturalLanguageProcess,NLP)是通过计算机来理解和生成“自然语言”的方法。NLP专注人类语言和计算机之间相互交互的研究领域,NLP的目标是理解计算机文本中的自然语言,用于文本分类、提取和总结。例如:在分析过程中,我们获取过去的描述信息(如,文本、文档、推文、演讲),并对它们进行语义分类或情绪理解,处理过的文本将作为分析过程的输入,用于预测建模、决策分析、搜索或回答问题的机器人。

下图描述了一个完整的自然语言处理的普遍过程。

图5:自然语言处理过程示意图

4.文本挖掘与文本分析

文本挖掘处理文本数据本身,文本分析涵盖范围比较广泛,通常包括应用统计分析、机器学习和其他一些高级分析技术,但通常被认为等同于文本挖掘。

5.机器学习

机器学习的核心是使用算法来建立量化分析模型,帮助计算机模型从数据中“学习”。它同以人为中心的处理过程不同,它是由计算机学习和发现隐藏在数据中的模式,而不是由人去直接建立模型。一般而言,机器学习中模型建立和模型管理的概念是指能够持续并重复开展后续的决策流程,而不是高度人工参与的常常基于统计手段的分析。

随着近年来计算能力的进步,机器学习可以用来自动地实现针对大数据的复杂数学计算,而这在以前是不可能实现的。

机器学习常见的方法如下图:

图6:机器学习常用的技术归纳

6.数据挖掘

数据挖掘是指在大型数据集中发现和解释规律模式,以解决业务问题的过程。数据挖掘作为一种分析大型数据库以生成新的或与众不同的信息方法而被广泛使用。

数据挖掘采用传统的统计方法,以及人工智能和机器学习技术,目的是在我们拥有的数据中识别出以前未知的模式并进行预测。

04

分析的目的

分析是一种支持变革的全面战略,它为干预措施或战略转型提供信息。分析的目的是支持数据驱动的、基于事实的探索过程。这一切是为了建立信心,推动我们了解知识,并利用这些知识来理解、解释、预测和优化。

总的来说,分析的主要目的主要有以下四点:

1.分析是关于改善结果的活动

我们通过分析来理解、描述和解决问题,并通过分析做出决策和创造洞察力,以推动变革。我们用我们所知道的来理解我们的世界:描述、发现、预测并给出建议。

2.分析是关于创造价值的活动

结果是分析的一个关键组成部分,我们通过分析要创造一些有价值的东西,否则分析将无任何意义。

3.分析是关于发现的活动

如何我们常用的商业智能是关于认知可知的事物,那么分析可以帮助我们探索未知的事物。分析的力量在与它支持我们对未知探索,我们利用推理和理解能力来挖掘数据中隐藏的模式。

4.分析是关于促成变革的活动

最后,关于变革,很少人喜欢或者主动拥抱变革,但变革是不可避免,完全不变的组织几乎不存在。推动组织变革的动力可以有多种形式,对于组织来说,可能是以危机的形式出现,比如灾难、利润下降、政府强制要求、系统性失败或者公共卫生危机等。

05

总结

在很大程度上,分析是一项有弹性的工作,因为它能够影响我们的工作方式,我们所做的决策以及我们取得的成果。分析常常与大数据、数据科学、信息学、甚至商业智能(BI)等放在一起讨论。

分析是一种组织战略,也是一个过程。对于企业来说分析不是终点,而是获得洞察力以实现变革的过程,分析是将数据转化为切实可行的措施的艺术和科学。

推荐阅读

数据分析的价值是什么?

经常有同学在工作中抱怨,感觉“做的分析没有啥业务价值,报表丢出去了也没回应”。到底怎么做才能让数据分析体现价值,今天结合一个具体场景,详细讲解一下。问题场景…

1,412

数据分析与数据挖掘的区别是什么?

数据分析可以分为广义的数据分析和狭义的数据分析,广义的数据分析就包括狭义的数据分析和数据挖掘,我们常说的数据分析就是指狭义的数据分析,下面我们来看一下数据分析与…

1,832

小会计做着做着,就跑去做数据分析了,分析做着…

最让我头疼的应该是在会议上面做汇报吧,内心是胆怯的。我觉得认真也是一种天赋的。特别是高压下还能仔细认真不出错。有时候不是不认真,而是工作太多又要求几天内出报表,…

THE END
1.一分钟告诉你,什么是机器学习导语:机器如何能像人类一样学习? 点击喇叭图标可取消静音 科普中国 是中国科协为深入推进科普信息化建设而塑造的全新品牌,旨在以科普内容建设为重点,充分依托现有的传播渠道和平台,使科普信息化建设与传统科普深度融合,以公众关注度作为项目精准评估的标准,提升国家科普公共服务水平 扫一扫 即刻关注 动动手指,分享知识https://www.shkp.org.cn/articles/2024/12/if440189.html
2.机器学习:开启智能未来的钥匙腾讯云开发者社区一、机器学习概述 机器学习作为人工智能的核心方法,通过分析数据中的隐藏规律,让计算机从中获取新的经验和知识,不断提升和改善自身性能,从而像人一样根据所学知识做出决策。 机器学习涉及概率论、统计学、微积分、代数学、算法复杂度理论等多门学科,是一门多领域交叉学科。其应用范围极为广泛,涵盖自然语言处理、图像识https://cloud.tencent.com/developer/article/2478495
3.机器学习人工智能和数据挖掘到底有什么联系?数据挖掘人工智能其中,统计分析和数据库这两个学科没有和机器学习相交,主要是他们俩是单独的学科,是和数据挖掘是相关的。 对于统计分析来说,这算是一个传统学科,在一定程度上,统计分析是可以独立完成一些分析的(不需要借助机器学习)。 什么是人工智能 首先是人工智能:它用于预测、自动化和优化人类历史上完成的任务,例如语音和面部识https://blog.csdn.net/AveryHzzz/article/details/143729244
4.什么是数据挖掘?如何进行数据挖掘数据挖掘涉及多个学科,包括统计学、机器学习、模式识别、人工智能、数据库和可视化技术等。它是通过分析型企业中的重要技术,帮助企业调整市场策略、减少风险并做出正确的决策。数据挖掘的对象可以是任何类型的数据,如结构化数据、半结构化数据和非结构化数据。数据源可以是关系数据库、数据仓库、文本、多媒体数据、空间https://baijiahao.baidu.com/s?id=1779508221728752274&wfr=spider&for=pc
5.数据挖掘和机器学习之间到底什么关系?宇翔rose数据挖掘和机器学习之间到底什么关系? 首先我认为没有必要给两个词划定一个明确的界限,不妨从字面意思理解就足够了。 数据挖掘——首先是有一定量的数据作为研究对象,挖掘--顾名思义,对一些东西进行深度的研究、对比、甄别等工作,最终从中间找到知识和规律,“挖掘”这个词用的很形象。https://www.cnblogs.com/fengyx/p/7659354.html
6.数据挖掘VS机器学习,你了解多少?数据挖掘和机器学习都是有助于模式检测的分析技术,但它们在许多重要方面有所不同。与我们一起阅读,了解更多关于数据挖掘与机器学习之间的关键区别。 什么是数据挖掘? 通过数据挖掘,通常称为数据库中的知识发现,分析大量数据和数据集以提取有意义的见解,帮助企业解决问题、预测趋势、降低风险和发现新机会。数据挖掘者在https://www.fromgeek.com/telecom/509859.html
7.数据挖掘与机器学习有什么关系呢?问答同时数据挖掘要用到数据管理的技术,这就相当于数据挖掘的核心算法来自于机器学习。https://developer.aliyun.com/ask/443727
8.什么是数据挖掘数据挖掘介绍?IBM什么是数据挖掘? 数据挖掘是指利用机器学习和统计分析从大型数据集中发现模式和其他有价值的信息。 随着机器学习 (ML) 的演进、数据仓库的发展和大数据的增长,数据挖掘 - 也称为数据库知识发现 (KDD) - 在近几十年里的应用不断加速。然而,尽管这项技术在处理海量数据方面不断进步,企业领导者仍然可能面临可扩展性https://www.ibm.com/cn-zh/topics/data-mining
9.什么是数据挖掘和KDD·MachineLearningMastery博客文章翻译您了解到机器学习是数据挖掘中使用的工具,数据挖掘实际上是数据库或KDD中知识发现过程中的一个步骤,并且它已经成为术语的同义词,因为它更容易说。 您了解到,当您从事机器学习项目时,您可能正在执行某种形式的KDD流程,其具体目标是解决问题而不是进行发现。 https://www.kancloud.cn/apachecn/ml-mastery-zh/1951996
10.机器学习与数据挖掘的区别有哪些问答机器学习和数据挖掘是两个相关但又不完全相同的概念。以下是它们之间的主要区别:1. 定义和目标:机器学习是一种通过让计算机系统学习数据和模式,从而进行预测、分类或决策的方法。而数据挖掘则是从大规模数据集https://www.yisu.com/ask/63065253.html
11.数据挖掘的定义和解释什么是数据挖掘? 数据挖掘是对大量数据进行筛选以查找可用于特定目的的相关信息的过程。数据挖掘对于数据科学和商业智能都至关重要,它本质上是关于模式的。 一旦收集并存储数据,下一步就是理解数据,否则就毫无意义。数据分析以多种方式进行,包括使用机器学习之类的概念,其中使用复杂的自适应算法来人工分析数据。 https://www.kaspersky.com.cn/resource-center/definitions/data-mining
12.什么是数据挖掘?SAS在数据进行挖掘以发现隐藏的联系并预测未来趋势的过程由来已久。"数据挖掘"这个术语直到 20 世纪初才被创造出来,它有时也被称为"数据库中的知识发现"。而它的基础包括三个相互交织的科学学科:统计学(对数据关系的数值研究)、人工智能(由软件和/或机器显示的类人智能)和机器学习(可以从数据中学习以进行预测的算法https://www.sas.com/zh_cn/insights/analytics/data-mining.html
13.什么是大数据和数据挖掘?数据挖掘是大数据分析的重要组成部分,它可以通过各种算法和技术来发现数据中的模式和关系。数据挖掘主要包括聚类、分类、关联规则挖掘、时序分析、异常检测等技术。聚类是将数据集中的相似对象分组,每个组称为一个“簇”,用于数据的分类和归纳总结。分类是将数据样本分为不同的类别,通过学习已知类别的样本来预测未知样本https://www.cda.cn/view/202592.html
14.一文让你分清楚机器学习,数据挖掘,人工智能明确大数据应用目标之后,我们再看看数据科学(Data Science),数据科学可以理解为一个跨多学科领域的,从数据中获取知识的科学方法,技术和系统集合,其目标是从数据中提取出有价值的信息,它结合了诸多领域中的理论和技术,包括应用数学,统计,模式识别,机器学习,人工智能,深度学习,数据可视化,数据挖掘,数据仓库,以及高性能计https://www.jianshu.com/p/9b1d009a1f8c
15.数据分析与数据挖掘课程的主要内容从两条主线开展,一条围绕数据科学的体系:数据收集、数据预处理、数据存储、数据分析、数据挖掘、数据可视化、数据产品等;一条围绕着人工智能的诸多专题方向,简要包括:人工智能的宏观概念,数据分析基础,数据挖掘,机器学习,深度学习,神经网络,统计分析,前沿跟踪等。 https://i.study.uestc.edu.cn/DATAM/menu/teaching-programme