数据挖掘模型和挖掘步骤技术方案

随着中国电信的改革重组,中国通信业取得了跨越式的发展,成为国民经济中发展速度最快的行业之一,中国通信业总规模现已在世界排名第一。与此同时,中国通信市场竞争也日趋激烈。通信运营商的经营观念逐渐从"技术质量第一"向"服务客户第一"转化。以前的营销模式已经无法满足客户的多样化、层次化、个性化的需求。长期以来,通信单位大量详尽的业务数据也只是被简单地应用在各种业务系统中,没有被更有效地开发利用。如何利用这些数据进一步拓宽通信业务,促进通信业务发展,从而为通信业提供决策支持服务,已经成为各个通信单位的当务之急。

客户细分模型和挖掘算法选择

构建客户分类模型需要用到第2章所介绍的一些技术。其中聚类技术就是其中之一。在前面的章节中我们曾了解到聚类和分类有着很大的区别:分类时,我们事先选择一些属性作为分类标准,通信企业总是会将重要的、有影响力的属性作为分类的依据;而在实际应用当中,通信企业事先根本不知道哪些属性会起到作用。而找到那些起关键作用的属性是聚类技术的任务之一。在通信客户分析中,聚类分析能够帮助我们发现特征迥异的不同客户群和对客户分类起关键作用的指标变量,并辅助运营商对各客户类别的特征进行深刻观察。通信客户从营销属性方面分为三类:普通客户、价值客户和黄金客户,其中普通客户消费行为有较大的随机性,分布较广,规律难寻,比较适于聚类分析。

本数据挖掘实例采用通话行为、数据业务使用情况等作为客户分类变量,把通信行为相似的人群聚为一组。数据挖掘方法论选用CRISP-DM(Cross-IndustryProcessforDataMining)过程模型。即交叉行业数据挖掘过程标准。它从数据挖掘技术应用的角度来划分挖掘任务,将数据挖掘技术和实际应用紧密结合。CRISP-DM过程模型的主要步骤有商业理解、数据理解、数据准备、建立模型、数据挖掘、评价和实施以及结果发布,如图3-9所示。该过程的各个环节按顺序进行,但需要不断地循环往复进行数据探索和模型的调优。这里为了简化说明问题,先不考虑循环往复的探索和调优过程,直接顺序考察各个环节。

数据挖掘模型和挖掘步骤

在各种硬件条件和软件条件都具备的情况下,就可以开始进行挖掘的工作了。

1.数据准备

数据准备过程如下:

(1)确定项目目标,制定挖掘计划。

(2)分析变量的获取。

(3)数据收集和获取。(4)数据集成。

依据CRISP-DM流程,第一要确定项目目标,之后制定挖掘计划。首先必须明确项目的商业目标,这个目标应该是适于用选取的聚类分析方法来达到的。所定义的客户细分的商业目标是"对某地方数十万普通客户,从客户行为的角度进行客户分类,以了解不同客户群的消费行为特征,为发展新业务、原有客户挽留、对其他通信公司用户争夺的针对性策略的制订提供依据,并实现企业稳定现有客户量、提高客户增长量的战略目标"。

客户的消费行为和需求通过调查问卷以及访谈的方式来实现。

客户的通信行为以及需求特征类别见表3-1。

表3-1客户行为特征信息表

客户的通信行为

客户的需求特征类别

短消息使用次数

移动梦网使用次数

GPRS数据流量

方便性及信息实时性的需求

IP长途使用次数

优惠时段通话次数

套餐定制和使用次数

拨打10086次数

对资费的敏感程度

本地、长途、漫游呼叫时长

本地、长途、漫游呼叫次数

工作/休息时段、优惠/非优惠时段)

呼叫类型(主叫、被叫、呼叫转移)

对通话的多层次需求

服务种类

对个性化服务的需求程度

基于客户需求和上述行为特征信息表,定义了几组细分变量,d_代表时常,t_代表频率,见表3-2。在这里只列出通话形式和通话比例表。

表3-2细分变量表(简表)

通话形式

市话

d_local

t_local

省内长途

d_toll_InProvince

t_toll_InProvince

跨省长途

d_toll_BetweenProvince

t_toll_BetweenProvince

国际长途

d_toll_htm

t_toll_htm

通话比例

网内通话

d_mob_Ttl

t_mob_Ttl

联通通话

d_uni_Ttl

t_uni_Ttl

小灵通通话

d_phs_Ttl

t_phs_Ttl

d_fix_Ttl

t_fix_Ttl

2.数据准备

数据准备包括所有从原始的未加工的数据构造最终分析数据集的活动,是数据挖掘过程中最耗时的环节,甚至要占据整个数据挖掘项目一半以上的工作量。数据准备工作的流程如图3-11所示。

3.建立模型

在生成最终的数据集后,就可以在此基础上建立模型来进行聚类分析了。建立模型阶段主要是选择和应用各种建模技术,同时对它们的参数进行校准以达到最优值。在明确建模技术和算法后需要确定模型参数和输入变量。模型参数包括类的个数和最大迭代步数等。

不同的技术方案产生的模型结果有很大不同,而且模型结果的可理解性也存在较大差异。另外,对结果的分析和描述也很关键,不恰当的描述会造成误导。需要指出的是,不同的商业问题和不同的数据分布属性会影响模型建立与调整的策略,而且在建模过程中还会使用多种近似算法来简化模型的优化过程。因此还需要业务专家参与调整策略的制定,以避免不适当的优化造成业务信息丢失。

建立模型是一个螺旋上升,不断优化的过程,在每一次聚类结束后,需要判断聚类结果在业务上是否有意义,其各群特征是否明显。如果结果不理想,则需要调整聚类模型,对模型进行优化,称之为聚类优化。聚类优化可通过调整聚类个数及调整聚类变量输入来实现,也可以通过多次运行,选择满意的结果。通常可以依据以下原则判断聚类结果是否理想:类间特征差异是否明显;群内特征是否相似;聚类结果是否易于管理及是否具有业务指导意义。

4.模型评估

通过上面的处理,就会得到一系列的分析结果和模式,它们是对目标问题多侧面的描述,这时需要对它们进行验证和评价,以得到合理的,完备的决策信息。对产生的模型结果需要进行对比验证、准确度验证、支持度验证等检验以确定模型的价值。在这个阶段需要引入更多层面和背景的用户进行测试和验证,通过对几种模型的综合比较,产生最后的优化模型。

模型评估阶段需要对数据挖掘过程进行一次全面的回顾,从而决定是否存在重要的因素或任务由于某些原因而被忽视,此阶段关键目的是决定是否还存在一些重要的商业问题仍未得到充分的考虑。验证模型是处理过程中的关键步骤,可以确定是否成功地进行了前面的步骤。模型的验证需要利用未参与建模的数据进行,这样才能得到比较准确的结果。可以采用的方法有直接使用原来建立模型的样本数据进行检验,或另找一批数据对其进行检验,也可以在实际运行中取出新的数据进行检验。检验的方法是对已知客户状态的数据利用模型进行挖掘,并将挖掘结果与实际情况进行比较。在此步骤中若发现模型不够优化,还需要回到前面的步骤进行调整。

THE END
1.数据挖掘的六大过程数据挖掘的六大过程通常包括:数据清洗、数据集成、数据选择、数据变换、数据挖掘、模式评估。 这六个过程构成了一个系统而复杂的工作流程,旨在从大量数据中提取有用的模式和知识,支持决策和预测。 以下是每个过程的详细解释: 一、数据清洗 定义:数据清洗是对原始数据进行预处理的过程,旨在解决数据缺失、不一致、噪声等https://www.ai-indeed.com/encyclopedia/10656.html
2.大数据与分析:数据挖掘概念及流程数据挖掘是一个从大量数据中提取有价值信息或模式的过程,它依赖于统计学、机器学习、数据库技术和人工智能等多个领域的知识和技术。以下是数据挖掘的概念及其流程的详细解释: 一、数据挖掘的概念 数据挖掘(Data Mining)是指通过特定的计算机算法对大量的数据进行自动分析,以揭示数据中的隐藏模式、未知的相关性和其他有https://blog.csdn.net/NSAcbba/article/details/143417836
3.数据挖掘的步骤和流程是什么?数据挖掘是什么意思?以便于用户理解和应用。因此,需要在数据挖掘过程中注重结果的可解释性和可视化展示。总之,数据挖掘是一个复杂而又多变的过程,需要结合实际需求和场景进行灵活应用和调整。为了提高数据挖掘的效率和准确性,我们需要不断学习和探索新的技术和方法,同时注重实践和应用效果的评估和反馈。https://baijiahao.baidu.com/s?id=1781738580317359646&wfr=spider&for=pc
4.python数据挖掘算法的过程详解python这篇文章主要介绍了python 数据挖掘算法,首先给大家介绍了数据挖掘的过程,基于sklearn主要的算法模型讲解,给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下+ 目录 1、首先简述数据挖掘的过程 第一步:数据选择 可以通过业务原始数据、公开的数据集、也可通过爬虫的方式获取。 第二https://www.jb51.net/article/238548.htm
5.数据挖掘论文其次,对档案进行鉴定与甄别,这也是档案工作中较困难的过程,过去做好这方面的工作主要依靠管理档案管理员自己的能力和水平,主观上的因素影响很大,但是数据挖掘技术可以及时对档案进行编码和收集,对档案进行数字化的管理和规划,解放人力资源,提升档案利用的服务水平。第三,数据挖掘技术可以减少档案的收集和保管成本,根据https://www.unjs.com/lunwen/f/20220924130749_5650839.html
6.计算机应用技术论文范例[15篇]在信息化建设中,计算机应用技术主要包括数据挖掘技术和信息共享技术。其中,数据挖掘技术的实施包含信息收集、数据集成、数据规约、数据清理、数据变换、数据挖掘过程、模式评估以及知识表示8个步骤[2]。数据挖掘是一个反复循环的过程,若一个步骤没有达到目标,需要返回至前一个步骤,重新进行。同时,并非所有数据都要进行数https://www.yjbys.com/bylw/jisuanji/156222.html
7.数据分析的过程主要包含这7个方面数据分析的过程是循序渐进的过程,主要包括如下7个方面。 一个完整的数据分析的过程,应该包括数据采集、数据存储、数据提取、数据挖掘、数据分析、数据展现、数据应用七个方面。今天我们就来从这几个角度着手,简要介绍一下数据分析的过程。 1. 数据采集 数据采集的意义在于真正了解数据的原始面貌,包括数据产生的时间、条https://www.jiushuyun.com/hywz/2061.html
8.大数据一文总览数据科学全景:定律算法问题类型;什么是目录:1什么是数据分析;2数据分析职业介绍;3数据分析生涯规划;4数据分析薪酬情况;5数据分析基本素质。 一:那到底什么是数据分析呢? 数据分析是基于商业目的,有目的的进行收集、整理、加工和分析数据,提炼有价信息的一个过程。 其过程概括起来主要包括:明确分析目的与框架、数据收集、数据处理、数据分析、数据展现和撰写https://zhuanzhi.ai/document/ba50f489f166e5f700f1800aab8dea65
9.数据仓库与数据挖掘技术—数据挖掘分类及过程模型数据挖掘:首先根据对问题的定义明确挖掘的任务或目的,如分类、聚类、关联规则发现或序列模式发现等。然后选择算法 结果解释与评估:对发现的模式进行可视化,或者把结果转换为用户容易理解的其他表示形式 Fayyad过程模型从某种意义上来说是面向理论,偏向技术的模型,而不是面向工程、面向应用的模型。虽然有模型的评估,但侧重https://www.jianshu.com/p/da25173289b9
10.商战数据挖掘:你需要了解的数据科学与分析思维数据科学的一条重要原则是,数据挖掘的流程可以分解为几个通俗易懂的环节。有些环节涉及信息技术的应用,如数据中模式的自动发现和评估,而有些则主要依赖数据分析师的创意、常识和商业知识。理解数据挖掘的整个过程,有助于组织数据挖掘项目,使它们更接近系统性的分析,而不是凭借运气和个人智慧的冒险行为。 https://www.ituring.com.cn/book/tupubarticle/28952
11.国家开放大学(电大)《电子政务》形考作业答案314、数据数据仓库的体系结构有 查看答案 模拟考场 15、西方国家的政府再造运动以()﹑()为代表。 查看答案 模拟考场 16、从根本上来说﹐明确电子政务的()与外延﹐正确把握电子政务的实质,提高认识﹐走出误区,这就是实现电子政务的()。 查看答案 模拟考场 17、分布式数据挖掘过程分为几个步骤 查看答案 模拟考https://www.zikaosw.cn/chengkao/news-53009.html
12.电力系统负荷预测综述(精选十篇)4.2数据挖掘。数据挖掘是指从大量数据中挖掘出隐含的、对决策有价值的知识和规则的过程, 提取的知识可以表示成概念、规则、规律和模式等形式, 面对电力系统日益增加的数据信息量, 针对系统运行安全性和经济性的要求, 将数据挖掘用于短期负荷预测是非常有利的, 尤其在环境因素和社会信息等变化较大的条件下, 数据挖掘https://www.360wenmi.com/f/cnkey7yc99o6.html
13.网络营销全部38.“预测客户购买商品A的同时是否会购买商品B”的数据挖掘技术属于()。 A.关联分析B.分类分析C.聚类分析D.时间序列分析【注释】:第十章第二节 第283页 关联分析的目的是找出数据之间的属性联系,形成关联规则。如预测通常客户在购买A的同时会购买 B,这就为企业提前做出决策提供依据 39.下列不属于移动大数据精准https://www.wjx.cn/xz/261160017.aspx
14.终于有人把数据挖掘讲明白了图1 数据挖掘过程 2数据挖掘的内容 2.1 关联规则挖掘 从大规模数据中挖掘对象之间的隐含关系称为关联分析(Associate Analysis)或者关联规则挖掘(Associate Rule Mining),它可以揭示数据中隐藏的关联模式,帮助人们进行市场运作、决策支持等。 考察一些涉及许多物品的事务。事务1中出现了物品甲,事务2中出现了物品乙,事务3https://www.51cto.com/article/698009.html
15.数据采集复习题1.数据采集系统主要实现哪些基本功能? 1)采集传感器输出的模拟信号,经过调整,采样,量化,编码,传输等步骤后转换成计算机能识别的数字信号然后送入计算机进行计算和处理。 2)将计算得到的数据进行存储、显示、或打印,以便监视物理量。 2.简述数据采集系统的基本结构形式,并比较其特点。 https://www.skycaiji.com/aigc/ai1303.html
16.西藏自治区粮食和物资储备局2019年成品储备粮轮换原粮轮换费用项目支出评价人员与被评价单位无任何利益关系,评价内容客观公正、标准统一、数据可靠,评价过程不受被评价单位干扰,评价结果依法公开并接受监督。 (2)科学合理。充分考虑项目特点实情,从系统性和历史性视角出发,定量和定性数据挖掘中考虑多维因素的影响。在此基础上,严格执行规定的评价程序,对项目财政资金支出的经济性、效率性和https://www.xizang.gov.cn/zwgk/xxgk_424/zxxxgk/202104/t20210415_199619.html
17.案例分析报告精选15篇2. 数据预处理:对原始数据进行清洗,去除重复、无效及异常数据,确保数据质量。同时,对数据进行标准化处理,以便进行后续分析。 三、分析方法 1. 描述性分析:统计用户基本信息分布,如年龄、性别比例,以及热销商品类别、购买时间分布等。 2. 关联性分析:使用Apriori算法挖掘用户购买行为中的关联规则,如哪些商品经常一起https://www.ruiwen.com/fenxibaogao/8282184.html
18.数据挖掘数据挖掘面试题汇总测测你的专业能力是否过关8. 建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务?(C) A. 根据内容检索 B. 建模描述 C. 预测建模 D. 寻找模式和规则 9. 用户有一种感兴趣的模式并且希望在数据集中找到相似的模式,属于数据挖掘哪一类任务?(A) https://cloud.tencent.com/developer/article/1045567
19.数据挖掘的步骤包括什么数据挖掘是一个通过特定算法对大量数据进行处理和分析,以发现数据中的模式、趋势或关联性的过程。下面详细介绍数据挖掘的步骤包括什么? 1、数据收集 首先,需要收集与待挖掘主题相关的数据。可能涉及从各种来源(如数据库、文件、网络等)获取数据,并将其清洗、整合到一个统一的格式中。 https://www.pxwy.cn/news-id-81213.html
20.数据挖掘的过程包括:()。数据挖掘的过程包括:()。 A.问题定义 B.数据准备和预处理 C.数据挖掘 D.结果解释和评估 E.以上全部 点击查看答案进入题库练习 查答案就用赞题库小程序 还有拍照搜题 语音搜题 快来试试吧 无需下载 立即使用 你可能喜欢 多项选择题 服务价值包括()。 A.产品介绍 B.送货 C.维修 D.调试 E.技术 点击https://m.ppkao.com/mip/tiku/shiti/9021272.html