数据挖掘建模:如何从数据中“淘金”?

本文笔者将对数据挖掘建模的一般过程进行解析,主要分为四部分:数据准备、模式发现、模型构建以及模型评价。

数据挖掘介绍

数据挖掘(DataMining,DM):就是从大量数据(包括文本)中挖掘出隐含的、未知的、对决策有潜在价值的关系、模式和趋势,并用这些知识和规则建立用于决策支持的模型,提供预测性决策支持的方法、工具和过程;是利用各种分析工具在海量数据中发现模型和数据之间关系的过程。这些模型和关系可以被企业用来分析风险、进行预测。

数据挖掘的目的就是从数据中“淘金”,就是从数据中获取智能的过程,数据挖掘是提供了从数据到价值的解决方案。

数据+工具+方法+目标+行动=价值。

目前,数据挖掘已有一系列应用:

以上这些应用涉及的技术和工具各不相同,然而却可以依据统一的方法论来实行,并可以协同作战,解决许多有价值的商业问题。

数据挖掘建模的一般过程

第一步,数据准备

数据选择主要考虑的包括:

1)数据探索:数据清洗和构造

前面所叙述的数据选择,多少是带着人们对如何达到数据挖掘目的的先验认识进行操作的。

对所抽取的样本数据进行探索、审核和必要的加工处理,是保证预测质量所必需的。可以说,预测的质量不会超过抽取样本的质量。

2)数据预处理:整合和格式化

当采样数据维度过大,如何进行降维处理?采样数据中的缺失值如何处理?这些都是数据预处理要解决的问题。

由于采样数据中常常包含许多含有噪声、不完整、甚至是不一致的数据。显然对数据挖掘所涉及的数据对象必须进行预处理。那么,如何对数据进行预处理以改善数据质量,并最终达到完善最终的数据挖掘结果的目的呢?

数据预处理主要包括以下内容:数据筛选、数据变量转换、缺失值处理、坏数据处理、数据标准化、主成分分析、属性选择、数据规约。

第二步,模式发现

样本抽取完成并经预处理后,接下来要考虑的问题是:本次建模属于数据挖掘应用中的哪类问题(分类、聚类、关联规则或者时序模式),选用哪种算法进行模型构建?

模型构建的前提是在样本数据集中发现模式,比如:关联规则、分类预测、聚类分析、时序模式等。

在目标进一步明确化的基础上,我们就可以按照问题的具体要求来重新审视已经采集的数据,看它是否适应挖掘目标的需要。

第三步,模型构建

确定了本次建模所属的数据挖掘应用问题(分类、聚类、关联规则或者时序模式)后,还需考虑:具体应该采用什么算法,实施步骤是什么?

这一步是数据挖掘工作的核心环节,模型构建是对采样数据轨迹的概括,它反映的是采样数据内部结构的一般特征,并与该采样数据的具体结构基本吻合。

预测模型的构建通常包括模型建立、模型训练、模型验证和模型预测4个步骤,但根据不同的数据挖掘分类应用会有细微的变化。

第四步,模型评价

模型评价的目的是什么?如何评价模型的效果?通过什么评价指标来衡量?

模型效果评价通常分两步:

第一步是:直接使用原来建立模型的样本数据来进行检验。

假如这一步都通不过,那么所建立的决策支持信息价值就不太大了。一般来说,在这一步应得到较好的评价。这说明你确实从这批数据样本中挖掘出了符合实际的规律性。

第一步通过后,第二步是:另外找一批数据,已知这些数据是反映客观实际的、规律性的。

业务应用场景:网红销售额评估模型、客户ROI评估模型、网红品类推荐模型、网红报价建议模型、网红欺诈行为预警模型、网红流失预警模型等

结论

实践表明:由于人工智能发展的局限性,计算机在未来相当长的一段时期内不可能像人类这样会进行复杂的思考,它只会按照人的指令工作。

但是,计算机拥有海量的数据存储能力和超强的计算能力,所以只要我们建立合适的业务模型,设计完善的执行程序,选择正确的分析算法,它一定可以更好地为我们服务。

数据挖掘技术是一个年轻且充满希望的研究领域,商业利益的强大驱动力将会不停地促进它的发展。

每年都有新的数据挖掘方法和模型问世,人们对它的研究正日益广泛和深入。尽管如此,数据挖掘技术仍然面临着许多问题和挑战:如数据挖掘方法的效率亟待提高,尤其是超大规模数据集中数据挖掘的效率;开发适应多数据类型、容噪的挖掘方法,以解决异质数据集的数据挖掘问题;动态数据和知识的数据挖掘;网络与分布式环境下的数据挖掘等。

另外,近年来短视频,图片等多媒体数据库发展很快,面向多媒体数据库的挖掘技术今后将成为研究开发的热点。

本文由@无语凝咽原创发布于人人都是产品经理。未经许可,禁止转载

THE END
1.数据挖掘的步骤包括什么数据挖掘的步骤包括什么 数据挖掘是一个通过特定算法对大量数据进行处理和分析,以发现数据中的模式、趋势或关联性的过程。下面详细介绍数据挖掘的步骤包括什么? 1、数据收集 首先,需要收集与待挖掘主题相关的数据。可能涉及从各种来源(如数据库、文件、网络等)获取数据,并将其清洗、整合到一个统一的格式中。https://www.pxwy.cn/news-id-81213.html
2.数据挖掘的步骤包括以下步骤:()D. n加油D.花药离体培养过程中,基因重组、基因突变和染色体变异n加油均有可能发生 查看完整题目与答案 母线及隔离开关长期许诺的工作温度通常不该超过( )。 A. 50℃ B. 60℃ C. 70℃ D. 80℃。 查看完整题目与答案 平安xx星的投保年龄是( ) A. 0-17周岁 B. 0-55周岁 C. 0-15周岁https://www.shuashuati.com/ti/7c02c30b35d44a878095e40d6ded48a0.html?fm=bd57bb8d50e5790641c9fb65691073399c
3.数据挖掘的七个关键步骤,你知道吗数据挖掘是一个复杂的过程,通常包括以下几个关键步骤:业务理解、数据理解、数据准备、数据预处理和建模、模型评估、模型部署应用。以下是每个步骤的详细说明: 业务理解 业务理解的主要任务是进行需求调研,了解商业背景,明确业务目标和成功的标准。这个阶段通常与数据理解同时进行,涉及确定建模所需的数据,描述数据,探https://mbd.baidu.com/newspage/data/dtlandingsuper?nid=dt_2449351349113159145
4.知识发现的过程步骤是什么学术知识根据数据和所要解决的问题选择合适的数据挖掘算法.并决定如何在这些数据上使用该算法。 6、运行数据挖掘算法 根据选定的数据挖掘算法对经过处理后的数据进行模式提取。 7、结果的评价 对学习结果的评价依赖于需要解决的问题.由领域专家对发现的模式的新颖性和有效性进行评价。数据挖掘是KDD 过程的一个基本步骤.它包括https://www.xueshubox.com/studybad/2432.html
5.数据挖掘的流程包含哪些步骤?数据挖掘是从大量数据中挖掘出有用的信息和模式的过程。它涉及多个步骤,从数据收集到模型评估。以下是数据挖掘的常见流程步骤: 理解业务目标:在进行数据挖掘之前,需要明确业务目标和问题。确定要解决的问题以及所需的结果有助于指导整个流程。 数据收集:在这一阶段,需要收集与业务目标相关的数据。数据可以来自各种来源,https://www.cda.cn/view/202981.html
6.数据挖掘的六个步骤有哪些帆软数字化转型知识库数据挖掘的六个步骤分别是:问题定义、数据收集与准备、数据清洗、数据转换与特征选择、模型建立与评估、结果解释与部署。其中问题定义是数据挖掘过程的首要步骤,直接影响整个项目的成功与否。问题定义涉及明确业务目标、研究目标和所需的数据类型。只有在问题定义清晰的情况下,后续的每一步骤才能有的放矢,确保数据挖掘的结https://www.fanruan.com/blog/article/594251/
7.高效实施数据挖掘的方法和步骤yuanye1014产生的结果是否易为商业用户所理解?如果不能,需要采取什么步骤以使结果便于读懂?该工具是否要求商业专家参与整个数据挖掘过程? ? 第六阶段:结果发布 数据挖掘过程可能很简单,如只是对商业问题给出一个建议,也可能很复杂,如应用一个应用程序向信息客户提供新知识。无论简单还是复杂,在结果发布阶段,都要用到该过程。http://blog.chinaunix.net/uid-64814-id-2690182.html
8.数据挖掘标准流程数据挖掘6个基本流程1.数据挖掘的过程分成 6 个步骤。 1.商业理解: 从商业的角度理解项目需求,再对数据挖掘的目标进行定义。 2.数据理解: 收集部分数据,对数据进行数据描述、数据质量验证等。有利于对收集的数据有个初步的认知。 3.数据准备: 收集数据,对数据进行清洗、数据集成等操作,完成数据挖掘前的准备工作。 https://blog.51cto.com/u_16213634/6993714
9.数据挖掘的过程张杰整理数据挖掘是指一个完整的过程,该过程从大型数据库中挖掘先前未知的、有效的,可实用的信息,并使用这些信息做出决策或丰富知识。下图描述了数据挖掘的主要步骤和过程。 数据挖掘过程中各步骤的大体内容如下: 第一步:确定挖掘目的。认清数据挖掘的目的是数据挖掘的重要一步。挖掘的最后结果是不可预测的,但要探索的问题应https://maimai.cn/article/detail?fid=1405334297&efid=7lwV824VMzvaUfEhWMvd3A
10.数据分析与挖掘11篇(全文)Web数据挖掘过程是一个完整的知识发现的过程,但与传统数据和数据仓库相比,Web上的信息是非结构化或半结构化的、动态的,并且是容易造成混淆的,所以很难直接以Web网页上的数据进行数据挖掘,而必须经过必要的数据处理。因此可以将Web数据挖掘分为确定业务对象、数据准备、数据挖掘、结果分析等四个步骤。 https://www.99xueshu.com/w/ikeyp687ycyz.html
11.数据挖掘的七个步骤理想股票技术论坛数据挖掘的七个步骤包括数据预处理、数据清洗、数据转换、数据建模、模型评估与优化以及数据可视化展示。这些步骤是数据挖掘过程中必不可少的环节,通过对数据的深入挖掘和分析,可以提取出有价值的信息和规律,为决策提供支持。 ,理想股票技术论坛https://www.55188.com/tag-thread-8849372-1.html
12.数据挖掘在管理会计中的重要意义在上述两个步骤的基础上对数据进行增删、修改,使之更明确、更有效。 4.建模 使用人工神经网络、回归分析、决策树、时间序列分析等分析工具来建立模型,从数据中发现那些能够对预测结果进行可靠预测的模型。 5.评价 就是对从数据挖掘过程中发现的信息的实用性和可靠性进行评估。 https://www.jy135.com/guanli/327644.html
13.干货!非结构化数据分析的10个步骤腾讯云开发者社区如今,数据分析正在成为企业发展过程中的重要组成部分。企业必须对结构化和非结构化数据有所了解,才能更好地为业务发展做出正确决策。本文将详细介绍企业分析非结构化数据的10个步骤: 1.确定一个数据源 了解有利于小型企业的数据来源非常重要。企业可以使用一个或多个数据源来收集与其业务相关的信息。而从随机数据源收集https://cloud.tencent.com/developer/article/1008189
14.网络资源:数据挖掘实战1(电力窃漏电用户识别)本次学习我们将使用“什么是数据挖掘”中的挖掘过程:根据实际问题定义挖掘目标、取什么样的原始数据、对原始数据的探索分析、如何对数据进行处理、建立合适的模型完成目标、评估模型完成的好不好。 问题背景:实际生活中,有很多人可能会偷别人的电用,或者计量电量的设备坏了,造成无法根据实际用电情况计价,可能导致用户多https://nonlinear.wtu.edu.cn/info/1117/1665.htm
15.大数据分析的基本步骤数据分析的基本步骤 1、明确思路 明确数据分析的目的以及思路是确保数据分析过程有效进行的首要条件。它作用的是可以为数据的收集、处理及分析提供清晰的指引方向。可以说思路是整个分析流程的起点。首先目的不明确则会导致方向性的错误。当明确目的后,就要建分析框架,把分析目的分解成若干个不同的分析要点,即如何具体开https://www.qianjia.com/zhike/html/2020-06/3_24986.html
16.应用机器学习过程·MachineLearningMastery博客文章翻译步骤1:数据选择:考虑可用的数据,缺少的数据以及可以删除的数据。 步骤2:数据预处理:通过格式化,清理和采样来组织您选择的数据。 步骤3:数据转换:通过使用缩放,属性分解和属性聚合的工程特征,转换为机器学习做好准备的预处理数据。 您可以在帖子中了解有关准备数据的此过程的更多信息: https://www.kancloud.cn/apachecn/ml-mastery-zh/1951987