数据挖掘模型和挖掘步骤技术方案

随着中国电信的改革重组,中国通信业取得了跨越式的发展,成为国民经济中发展速度最快的行业之一,中国通信业总规模现已在世界排名第一。与此同时,中国通信市场竞争也日趋激烈。通信运营商的经营观念逐渐从"技术质量第一"向"服务客户第一"转化。以前的营销模式已经无法满足客户的多样化、层次化、个性化的需求。长期以来,通信单位大量详尽的业务数据也只是被简单地应用在各种业务系统中,没有被更有效地开发利用。如何利用这些数据进一步拓宽通信业务,促进通信业务发展,从而为通信业提供决策支持服务,已经成为各个通信单位的当务之急。

客户细分模型和挖掘算法选择

构建客户分类模型需要用到第2章所介绍的一些技术。其中聚类技术就是其中之一。在前面的章节中我们曾了解到聚类和分类有着很大的区别:分类时,我们事先选择一些属性作为分类标准,通信企业总是会将重要的、有影响力的属性作为分类的依据;而在实际应用当中,通信企业事先根本不知道哪些属性会起到作用。而找到那些起关键作用的属性是聚类技术的任务之一。在通信客户分析中,聚类分析能够帮助我们发现特征迥异的不同客户群和对客户分类起关键作用的指标变量,并辅助运营商对各客户类别的特征进行深刻观察。通信客户从营销属性方面分为三类:普通客户、价值客户和黄金客户,其中普通客户消费行为有较大的随机性,分布较广,规律难寻,比较适于聚类分析。

本数据挖掘实例采用通话行为、数据业务使用情况等作为客户分类变量,把通信行为相似的人群聚为一组。数据挖掘方法论选用CRISP-DM(Cross-IndustryProcessforDataMining)过程模型。即交叉行业数据挖掘过程标准。它从数据挖掘技术应用的角度来划分挖掘任务,将数据挖掘技术和实际应用紧密结合。CRISP-DM过程模型的主要步骤有商业理解、数据理解、数据准备、建立模型、数据挖掘、评价和实施以及结果发布,如图3-9所示。该过程的各个环节按顺序进行,但需要不断地循环往复进行数据探索和模型的调优。这里为了简化说明问题,先不考虑循环往复的探索和调优过程,直接顺序考察各个环节。

数据挖掘模型和挖掘步骤

在各种硬件条件和软件条件都具备的情况下,就可以开始进行挖掘的工作了。

1.数据准备

数据准备过程如下:

(1)确定项目目标,制定挖掘计划。

(2)分析变量的获取。

(3)数据收集和获取。(4)数据集成。

依据CRISP-DM流程,第一要确定项目目标,之后制定挖掘计划。首先必须明确项目的商业目标,这个目标应该是适于用选取的聚类分析方法来达到的。所定义的客户细分的商业目标是"对某地方数十万普通客户,从客户行为的角度进行客户分类,以了解不同客户群的消费行为特征,为发展新业务、原有客户挽留、对其他通信公司用户争夺的针对性策略的制订提供依据,并实现企业稳定现有客户量、提高客户增长量的战略目标"。

客户的消费行为和需求通过调查问卷以及访谈的方式来实现。

客户的通信行为以及需求特征类别见表3-1。

表3-1客户行为特征信息表

客户的通信行为

客户的需求特征类别

短消息使用次数

移动梦网使用次数

GPRS数据流量

方便性及信息实时性的需求

IP长途使用次数

优惠时段通话次数

套餐定制和使用次数

拨打10086次数

对资费的敏感程度

本地、长途、漫游呼叫时长

本地、长途、漫游呼叫次数

工作/休息时段、优惠/非优惠时段)

呼叫类型(主叫、被叫、呼叫转移)

对通话的多层次需求

服务种类

对个性化服务的需求程度

基于客户需求和上述行为特征信息表,定义了几组细分变量,d_代表时常,t_代表频率,见表3-2。在这里只列出通话形式和通话比例表。

表3-2细分变量表(简表)

通话形式

市话

d_local

t_local

省内长途

d_toll_InProvince

t_toll_InProvince

跨省长途

d_toll_BetweenProvince

t_toll_BetweenProvince

国际长途

d_toll_htm

t_toll_htm

通话比例

网内通话

d_mob_Ttl

t_mob_Ttl

联通通话

d_uni_Ttl

t_uni_Ttl

小灵通通话

d_phs_Ttl

t_phs_Ttl

d_fix_Ttl

t_fix_Ttl

2.数据准备

数据准备包括所有从原始的未加工的数据构造最终分析数据集的活动,是数据挖掘过程中最耗时的环节,甚至要占据整个数据挖掘项目一半以上的工作量。数据准备工作的流程如图3-11所示。

3.建立模型

在生成最终的数据集后,就可以在此基础上建立模型来进行聚类分析了。建立模型阶段主要是选择和应用各种建模技术,同时对它们的参数进行校准以达到最优值。在明确建模技术和算法后需要确定模型参数和输入变量。模型参数包括类的个数和最大迭代步数等。

不同的技术方案产生的模型结果有很大不同,而且模型结果的可理解性也存在较大差异。另外,对结果的分析和描述也很关键,不恰当的描述会造成误导。需要指出的是,不同的商业问题和不同的数据分布属性会影响模型建立与调整的策略,而且在建模过程中还会使用多种近似算法来简化模型的优化过程。因此还需要业务专家参与调整策略的制定,以避免不适当的优化造成业务信息丢失。

建立模型是一个螺旋上升,不断优化的过程,在每一次聚类结束后,需要判断聚类结果在业务上是否有意义,其各群特征是否明显。如果结果不理想,则需要调整聚类模型,对模型进行优化,称之为聚类优化。聚类优化可通过调整聚类个数及调整聚类变量输入来实现,也可以通过多次运行,选择满意的结果。通常可以依据以下原则判断聚类结果是否理想:类间特征差异是否明显;群内特征是否相似;聚类结果是否易于管理及是否具有业务指导意义。

4.模型评估

通过上面的处理,就会得到一系列的分析结果和模式,它们是对目标问题多侧面的描述,这时需要对它们进行验证和评价,以得到合理的,完备的决策信息。对产生的模型结果需要进行对比验证、准确度验证、支持度验证等检验以确定模型的价值。在这个阶段需要引入更多层面和背景的用户进行测试和验证,通过对几种模型的综合比较,产生最后的优化模型。

模型评估阶段需要对数据挖掘过程进行一次全面的回顾,从而决定是否存在重要的因素或任务由于某些原因而被忽视,此阶段关键目的是决定是否还存在一些重要的商业问题仍未得到充分的考虑。验证模型是处理过程中的关键步骤,可以确定是否成功地进行了前面的步骤。模型的验证需要利用未参与建模的数据进行,这样才能得到比较准确的结果。可以采用的方法有直接使用原来建立模型的样本数据进行检验,或另找一批数据对其进行检验,也可以在实际运行中取出新的数据进行检验。检验的方法是对已知客户状态的数据利用模型进行挖掘,并将挖掘结果与实际情况进行比较。在此步骤中若发现模型不够优化,还需要回到前面的步骤进行调整。

THE END
1.数据挖掘的基本步骤和流程解析请阐述数据挖掘的基本过程和步骤一、数据挖掘的基本步骤 1. 明确目标 在进行数据挖掘之前,首先要明确挖掘目标,即确定想要解决的问题和期望得到的结果。 明确目标有助于指导后续的数据处理和分析工作。 例子:某电商企业希望通过数据挖掘分析用户购买行为,以提高销售额。 2. 数据准备 数据准备包括数据收集、数据清洗和数据预处理三个环节。 https://blog.csdn.net/m0_67484548/article/details/142665300
2.数据挖掘的六个阶段是哪些帆软数字化转型知识库其中,数据预处理是最为关键的一步。数据预处理包括数据清洗、数据集成、数据变换和数据归约。数据清洗的目的是去除噪声和处理缺失值,数据集成则是将来自多个数据源的数据整合在一起,数据变换将数据变换为适合挖掘的形式,数据归约通过减少数据量而提高数据挖掘效率。通过这些步骤,数据预处理确保了数据的质量和一致性,https://www.fanruan.com/blog/article/594238/
3.数据挖掘的主要步骤包括()。数据挖掘的主要步骤包括( )。A. 数据取样B. 数据探索C. 数据整理D. 数据挖掘E. 评估的答案是什么.用刷刷题APP,拍照搜索答疑.刷刷题(shuashuati.com)是专业的大学职业搜题找答案,刷题练习的工具.一键将文档转化为在线题库手机刷题,以提高学习效率,是学习的生产力工具https://www.shuashuati.com/ti/97a7b2c76c2b4b40abcf09676a40de6e.html?fm=bd29ed9920b35039fb54a17b514cc6fe3a
4.数据挖掘的步骤包括什么数据挖掘是一个通过特定算法对大量数据进行处理和分析,以发现数据中的模式、趋势或关联性的过程。下面详细介绍数据挖掘的步骤包括什么? 1、数据收集 首先,需要收集与待挖掘主题相关的数据。可能涉及从各种来源(如数据库、文件、网络等)获取数据,并将其清洗、整合到一个统一的格式中。 https://www.pxwy.cn/news-id-81213.html
5.什么是数据挖掘?qq5a12455433444的技术博客数据挖掘可以简单的理解为从大量数据中提取或挖掘知识或者说是知识发现。 数据挖掘应用了众多领域的思想,包括来自统计学的抽样、估计和假设检验;来自人工智能、模式识别和机器学习的搜索算法、建模技术和学习理论等。 数据挖掘的步骤: 数据挖掘作为知识发现的过程,一般由三个主要阶段组成: https://blog.51cto.com/u_13488918/6087061
6.数据分析的步骤一般包括()数据分析的步骤一般包括() A、数据预处理B、可视化呈现C、数据建模D、数据挖掘E、数据采集正确答案:数据预处理|可视化呈现|数据建模|数据挖掘|数据采集 点击查看答案进入小程序搜题你可能喜欢x、y坐标都是对数坐标系应该输入 点击查看答案进入小程序搜题https://m.ppkao.com/wangke/daan/ac3af600c48e47adafb07ffd552ec912
7.系统集成项目管理速记口诀1. 数据(签)迁移 2. 数据(合)合并 3. 数据(同)同步 4. 数据交换(换) 5. 数据(窗)仓库 6. 数据(帘)联邦 7.2商业智能的实现有三个层次: 口诀:挖多宝 1. 数据(挖)挖掘 2. (多)多维数据分析 3. 数据(宝)报表 7.3实施商业智能的步骤: https://developer.aliyun.com/article/1204984
8.数据挖掘的流程包含哪些步骤?数据集成:如果数据来自多个源头或多个数据表,需要将它们整合为一个统一的数据集。这涉及到对数据进行连接、合并和转换等操作,以便进行综合分析。 特征选择:在数据挖掘中,特征选择是非常重要的步骤。通过评估和选择最相关的特征,可以提高模型的准确性和效率。常用的特征选择方法包括统计分析、相关性分析、信息增益等。 https://www.cda.cn/view/202981.html
9.数据挖掘的基本步骤是什么?数据挖掘的基本步骤包括: 理解业务目标:首先要明确数据挖掘的目的是什么,是为了预测销售额、识别欺诈行为还是其他目标。只有明确了业务目标,才能有针对性地进行数据挖掘分析。 数据理解:收集相关数据,理解数据的含义、格式、质量等特征。这一步通常包括数据收集、数据描述性统计、数据可视化等方法,以便更好地理解数据。 https://www.mbalib.com/ask/question-1ff33c04b2a8f83d1aff9875a50d017f.html
10.用友分析云一般步骤7篇用友分析云一般步骤7篇 很高兴能够为您带来用友分析云的使用手册。用友分析云是一款强大的数据分析工具,它可以帮助您深入挖掘数据,发现商机,实现精准决策。无论您是数据分析新手,还是经验丰富的分析师,用友分析云都能满足您的需求。接 创建时间 2024-02-26 17:38:36https://hsy.chanjet.com/wenku/wk262e523fe313.html
11.艾龙著1.数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中Atitit 数据挖掘之道 attilax总结 艾龙著 1. 数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。 12. 数据(Data)-信息(information)-知识(Knowledge)是一个递进的关系。 13. 数据挖掘的步骤一般https://www.cnblogs.com/attilax/p/15197691.html
12.数据挖掘的七个关键步骤,你知道吗数据挖掘是一个复杂的过程,通常包括以下几个关键步骤:业务理解、数据理解、数据准备、数据预处理和建模、模型评估、模型部署应用。以下是每个步骤的详细说明: 业务理解 业务理解的主要任务是进行需求调研,了解商业背景,明确业务目标和成功的标准。这个阶段通常与数据理解同时进行,涉及确定建模所需的数据,描述数据,探https://mbd.baidu.com/newspage/data/dtlandingsuper?nid=dt_2449351349113159145
13.什么是数据挖掘?为什么它如此重要?数据挖掘的步骤 数据挖掘的方法取决于所问问题的类型以及提供分析原材料的数据集或数据库的内容和组织。数据挖掘涉及的步骤包括: 理解问题 企业的决策者需要对他们应该从事的领域有一个总体的了解。他们应该知道需要探索的内部和外部数据类型,并对业务和所涉及的不同功能领域有深入的了解。 https://ai.qianjia.com/html/2023-03/27_400072.html
14.数据分析流程包括哪些步骤综上所述,数据分析流程包括了问题定义、数据采集、数据探索和可视化、数据预处理和特征工程、建立模型和算法选择、模型评估和优化、模型应用和结果解释等七个步骤。 数据分析过程中需要使用的分析方法 在数据分析过程中,需要使用多种分析方法和技术,以从数据中提取有用的信息和洞察。下面介绍几种常见的数据分析方法和技https://www.linkflowtech.com/news/1597
15.TRIZ技术进化理论6篇(全文)15.物—场模型分析一般解法应用步骤包括什么?(简答) 答,1,确定相关的元素。2,联系问题情形,确定并完成物-场模型的绘制。3,选择物-场模型的一般解法。4,开发设计概念。 15.技术系统的理想状态包括哪三个方面的内容?(简答) 答:(1)系统的主要目的是提供一定功能。 https://www.99xueshu.com/w/ikey2wv34p93.html
16.数据挖掘的七个步骤理想股票技术论坛数据挖掘的七个步骤包括数据预处理、数据清洗、数据转换、数据建模、模型评估与优化以及数据可视化展示。这些步骤是数据挖掘过程中必不可少的环节,通过对数据的深入挖掘和分析,可以提取出有价值的信息和规律,为决策提供支持。 ,理想股票技术论坛https://www.55188.com/tag-8849372.html
17.河北省职业院校技能大赛D.数据规约 4、以下哪个选项不属于大数据消费者洞察的特点? A.全面性 B.静态性 C.真实性 D.方便性 5、企业大数据项目分析流程包括以下步骤()(单选题) A.数据收集-业务理解-数据分析与挖掘-数据预处理-报告撰写 B.数据收集-业务理解-数据可视化-数据挖掘-报告撰写 http://hbszjs.hebtu.edu.cn/jnds/newsContent?newsId=2616&colId=7
18.如何用SPSS统计数据?(spss数据分析一般步骤)如何用SPSS统计数据? ( spss数据分析一般步骤 ) SPSS采用类似EXCEL表格的方式输入与管理数据,数据接口较为通用,能方便的从其他数据库中读入数据。其统计过程包括了常用的、较为成熟的统计过程,完全可以满足非统计专业人士的工作需要。输出结果十分美观,存储时则是专用的SPOhttp://www.cnjit.net/spss/61720.html
19.数据挖掘技术在客户关系管理中如何应用四、客户关系管理应用数据挖掘的步骤 1.需求分析 只有确定需求,才有分析和预测的目标,然后才能提取数据、选择方法,因此,需求分析是数据挖掘的基础条件。数据挖掘的实施过程也是围绕着这个目标进行的。在确定用户的需求后,应该明确所要解决的问题属于哪种应用类型,是属于关联分析、分类、聚类及预测,还是其他应用。应对现有https://www.wenshubang.com/xingzhengguanlibiyelunwen/151599.html
20.高效实施数据挖掘的方法和步骤yuanye1014产生的结果是否易为商业用户所理解?如果不能,需要采取什么步骤以使结果便于读懂?该工具是否要求商业专家参与整个数据挖掘过程? ? 第六阶段:结果发布 数据挖掘过程可能很简单,如只是对商业问题给出一个建议,也可能很复杂,如应用一个应用程序向信息客户提供新知识。无论简单还是复杂,在结果发布阶段,都要用到该过程。http://blog.chinaunix.net/uid-64814-id-2690182.html
21.关于中试放大的方法(5)物料计算的步骤1)收集合计算所必需的基本数据。2)列出化学反应方程式,包括主反应和副反应;根据给定条件画出流程简图。3)选择物料计算的基准。 4)进行物料衡算,5)列出物料平衡表: ①输入与输出的物料平衡表;②三废排量表;③计算原辅材料消耗定额(kg)。 https://www.360doc.cn/article/50786598_1126298568.html