数据挖掘主要解决的四类问题互联网数据资讯网199IT中文互联网数据研究资讯中心

数据挖掘非常清晰的界定了它所能解决的几类问题。这是一个高度的归纳,数据挖掘的应用就是把这几类问题演绎的一个过程。下面让我们来看看它所解决的四类问题是如何界定的:

1、分类问题

分类问题属于预测性的问题,但是它跟普通预测问题的区别在于其预测的结果是类别(如A、B、C三类)而不是一个具体的数值(如55、65、75……)。

举个例子,你和朋友在路上走着,迎面走来一个人,你对朋友说:我猜这个人是个上海人,那么这个问题就属于分类问题;如果你对朋友说:我猜这个人的年龄在30岁左右,那么这个问题就属于后面要说到的预测问题。

2、聚类问题

聚类问题不属于预测性的问题,它主要解决的是把一群对象划分成若干个组的问题。划分的依据是聚类问题的核心。所谓“物以类聚,人以群分”,故得名聚类。

聚类问题容易与分类问题混淆,主要是语言表达的原因,因为我们常说这样的话:“根据客户的消费行为,我们把客户分成三个类,第一个类的主要特征是……”,实际上这是一个聚类问题,但是在表达上容易让我们误解为这是个分类问题。分类问题与聚类问题是有本质区别的:分类问题是预测一个未知类别的用户属于哪个类别(相当于做单选题),而聚类问题是根据选定的指标,对一群用户进行划分(相当于做开放式的论述题),它不属于预测问题。

聚类问题在商业案例中也是一个非常常见的,例如需要选择若干个指标(如价值、成本、使用的产品等)对已有的用户群进行划分:特征相似的用户聚为一类,特征不同的用户分属于不同的类。

聚类的方法层出不穷,基于用户间彼此距离的长短来对用户进行聚类划分的方法依然是当前最流行的方法。大致的思路是这样的:首先确定选择哪些指标对用户进行聚类;然后在选择的指标上计算用户彼此间的距离,距离的计算公式很多,最常用的就是直线距离(把选择的指标当作维度、用户在每个指标下都有相应的取值,可以看作多维空间中的一个点,用户彼此间的距离就可理解为两者之间的直线距离。);最后聚类方法把彼此距离比较短的用户聚为一类,类与类之间的距离相对比较长。

如需了解细节,请查阅:聚类分析、系统聚类、K-means聚类、欧氏距离、闵氏距离、马氏距离等知识。

3、关联问题

说起关联问题,可能要从“啤酒和尿布”说起了。有人说啤酒和尿布是沃尔玛超市的一个经典案例,也有人说,是为了宣传数据挖掘/数据仓库而编造出来的虚构的“托”。不管如何,“啤酒和尿布”给了我们一个启示:世界上的万事万物都有着千丝万缕的联系,我们要善于发现这种关联。

关联分析要解决的主要问题是:一群用户购买了很多产品之后,哪些产品同时购买的几率比较高?买了A产品的同时买哪个产品的几率比较高?可能是由于最初关联分析主要是在超市应用比较广泛,所以又叫“购物篮分析”,英文简称为MBA,当然此MBA非彼MBA,意为MarketBasketAnalysis。

关联分析有三个非常重要的概念,那就是“三度”:支持度、可信度、提升度。假设有10000个人购买了产品,其中购买A产品的人是1000个,购买B产品的人是2000个,AB同时购买的人是800个。支持度指的是关联的产品(假定A产品和B产品关联)同时购买的人数占总人数的比例,即800/10000=8%,有8%的用户同时购买了A和B两个产品;可信度指的是在购买了一个产品之后购买另外一个产品的可能性,例如购买了A产品之后购买B产品的可信度=800/1000=80%,即80%的用户在购买了A产品之后会购买B产品;提升度就是在购买A产品这个条件下购买B产品的可能性与没有这个条件下购买B产品的可能性之比,没有任何条件下购买B产品可能性=2000/10000=20%,那么提升度=80%/20%=4。

4、预测问题

此处说的预测问题指的是狭义的预测,并不包含前面阐述的分类问题,因为分类问题也属于预测。一般来说我们谈预测问题主要指预测变量的取值为连续数值型的情况。

例如天气预报预测明天的气温、国家预测下一年度的GDP增长率、电信运营商预测下一年的收入、用户数等?

相对来说,用于预测问题的回归分析在商业中的应用要远远少于在医学、心理学、自然科学中的应用。最主要的原因是后者是更偏向于自然科学的理论研究,需要有理论支持的实证分析,而在商业统计分析中,更多的使用描述性统计和报表去揭示过去发生了什么,或者是应用性更强的分类、聚类问题。

数据挖掘的应用领域

数据挖掘一开始就是面向应用而诞生的,前面说到数据挖掘主要解决四大类的问题,如果把这些问题演绎到不同的行业,我们将看到数据挖掘的应用是非常广泛的。

以我们经常接触的移动通信行业来说,结合前面提到的四大类问题,我们看看数据挖掘在通信行业都有哪些应用。

分类问题:

信用申请评分:根据用户资料评估用户是否可以授信(如预付费用户可以透支、后付费用户可以延长帐期)。

信用行为评分:根据用户过去的消费行为特征评估信用得分高低,便于调整话费透支额度或者付费帐期。

定位产品(如彩铃、WAP、增值数据业务等)目标用户:构建模型筛选产品营销的目标用户群。

聚类问题:

用户细分:选择若干指标把用户群聚为若干个组,组内特征相似、组间特征差异明显。当然用户细分的方法很多,不一定都是采用聚类方法。聚类的优点是可以综合处理多维变量,缺点是随之带来的不易解释性。一种便于解释的细分方法是结合业务对用户群进行人为的划分,习惯上称为Pre-Define的方法。这种方法的优点是便于解释且应用性强,缺点是对业务要求比较高,划分边界比较难定,对多维变量处理有难度。

关联问题:

交叉销售:针对用户已经使用的产品和业务,向其推荐他没有使用的,但可能有兴趣的产品。交叉销售的问题从某种角度上来也可以理解为分类问题,与定位产品目标用户这个问题比较相似。

THE END
1.数据挖掘与应用(豆瓣)《数据挖掘与应用》全面地介绍了数据挖掘的相关主题.包括数据理解与数据准备、关联规则挖掘、多元统计中的降维方法、聚类分析、神经网络、决策树方法、模型评估等内容。全书体系完整,文字精炼,注重对数据挖掘方法的直觉理解及其应用:同时,保持了一定的严谨性,为学生理解和运用这些方法提供了坚实的基础。 https://book.douban.com/subject/3812646/
2.数据挖掘的应用嘲有哪些?数据挖掘的应用场景有哪些? 数据挖掘是从大量的数据中发现规律、模式及关联性的一项技术,可以帮助企业和组织更好地了解客户、市场以及自身业务。下面将介绍数据挖掘在不同领域的应用场景。 一、金融领域 银行、保险等金融机构可以通过数据挖掘技术对顾客的信贷历史、收入水平、购物习惯等进行分析,为其提供更加个性化的https://www.cda.cn/bigdata/202783.html
3.数据挖掘的应用嘲有哪些在医学分析的领域,病人的病例可以通过记录他的门诊就诊次数和假期的季节来分析。它还有助于确定对各种疾病,成功进行药物治疗的模式。研究人员也正在使用多维数据来降低成本,提高提供的服务质量,并提供更广泛和更好的护理。 5、教育 在教育领域,数据挖掘的应用一直很普遍,其中新兴的教育数据挖掘应用,主要集中在从教育机https://www.linkflowtech.com/news/2012
4.数据挖掘的应用有哪些数据挖掘的实际应用数据挖掘的应用有哪些 数据挖掘的实际应用 数据挖掘工作给很多行业带来了很大的转型和转变,由此推动了各个行业的蓬勃发展,尤其是金融行业。如今的金融领域,在数据挖掘的渗透下已经得到了突飞猛进的发展,业务也开始朝向新的领域进发。在这篇文章中我们就来给大家介绍数据挖掘具体给金融领域带来的种种帮助。https://blog.51cto.com/u_12929/7629636
5.数据挖掘的应用综述(精选十篇)数据挖掘的应用综述(精选十篇) 数据挖掘的应用综述 篇1 在知识经济主导的趋势下, 数据采集与知识发现在刺激经济发展、提高商业领域竞争力、建立核心竞争优势中将扮演更为重要的角色。 所谓商业, 是以货币为媒介进行交换从而实现商品流通的经济活动和服务。商业领域是指商业活动发生的社会环境。商业有广义与狭义之分, https://www.360wenmi.com/f/cnkey1g3t331.html
6.利用数据挖掘的知识挖掘方法?Worktile社区二、数据挖掘的技术分类 2.1 监督学习 2.2 无监督学习 2.3 半监督学习 2.4 强化学习 三、数据挖掘的常用技术和算法 3.1 关联规则挖掘 3.2 分类与预测 3.3 聚类分析 3.4 离群点检测 3.5 时间序列分析 3.6 社交网络分析 四、数据挖掘的应用领域 4.1 金融领域 https://worktile.com/kb/ask/85519.html
7.《数据挖掘应用》课件.ppt《数据挖掘应用》PPT课件欢迎来到《数据挖掘应用》PPT课件!本课程将介绍数据挖掘的概念、任务、流程、算法以及应用实例,并展望其发展趋势和应用前景。让我们一起深入探索数据挖掘的奥秘。一、介绍数据挖掘的定义数据挖掘是指从大量数据中发现隐藏在其中有价值的信息和模式的过程。了解数据挖掘的基本概念、优势和局限性。https://max.book118.com/html/2023/1224/5002131114011031.shtm
8.数据挖掘技术的应用领域数据挖掘应用前景很多公司已成功地部署了数据挖掘应用系统。随着这一技术的早期采用者已经逐步趋于信息密集型工业时,例如财务服务和直邮市场公司,这一技术已经对任何想利用一个大的数据仓库去较好地管理他们的客户关系的公司均是适用的。数据挖掘成功的两个关键因素是:一个大且完整的数据仓库,和一个可挖掘的定义、理解都明确的商务流程https://cda.pinggu.org/view/21018.html
9.数据挖掘怎么挖掘的帆软数字化转型知识库同时,数据挖掘技术还被用于社交网络的社区发现,识别用户之间的关系,提升用户体验。 通过这些案例可以看出,数据挖掘不仅能够帮助企业提升运营效率,还能够为决策提供科学依据,推动业务的持续发展。随着技术的不断进步,数据挖掘的应用场景将越来越广泛,潜在价值也将不断被挖掘。https://www.fanruan.com/blog/article/573966/
10.数据挖掘在人力资源信息分析中的应用从中选择出适用于数据挖掘应用的数据;再次,利用数据挖掘工具在数据中查找模型,将数据转换成一个分析模型,常用的数据挖掘模型有:神经网络方法、决策树方法、遗传算法、粗集方法、统计分析方法、模糊集方法,根据不同岗位对人才的不同需求对各种人才进行分类和比较,判断哪类人才更适合该岗位,最后是结果分析,由于所选取的https://biyelunwen.yjbys.com/fanwen/guanli/614244.html
11.数据挖掘技术的应用网易数帆为您提供数据挖掘技术的应用相关产品介绍、帮助文档,与数据挖掘技术的应用感兴趣的用户在网易数帆社区进行知识和技术交流互动。网易数帆 - 领先的数字化转型技术与服务提供商!https://www.163yun.com/search/5pWw5o2u5oyW5o6Y5oqA5pyv55qE5bqU55So
12.数据挖掘的应用嘲随着技术的发展和数据的爆炸性增长,数据挖掘在各个领域得到了广泛的应用。本文将介绍数据挖掘在商业、金融、医疗和社交媒体等领域的应用场景。 一、商业领域: 1.市场细分和目标客户定位: 通过数据挖掘可以对大量的市场数据进行分析,将市场细分为不同的群体,并确定潜在目标客户,从而为企业的市场营销决策提供依据。 2.https://wenku.baidu.com/view/9f7f4c0787868762caaedd3383c4bb4cf7ecb7c7.html
13.湖南省统计局算法和建模作为数据挖掘工具的核心技术从它诞生之日起就在得到不断完善,而在最近两年,也有一些新的技术和应用热点开始引起人们的关注,比如文本挖掘、网络挖掘和可视化挖掘就是其中比较重要的三种。 “文本挖掘是个太恐怖的事情。”中国传媒大学调查统计研究所副所长、数据挖掘研究室主任沈浩如此形容文本挖掘的威力。文本http://tjj.hunan.gov.cn/hntj/bsfw/tjkp/tjsh/201507/t20150717_3825196.html
14.数据挖掘的应用领域,并举例说明数据挖掘的应用领域,并举例说明 数据挖掘(Data Mining)是一种从大量数据中提取出有意义的信息和模式的技术。它结合了数据库、统计学、机器学习和人工智能等领域的理论和方法,通过高效的算法和工具,对大数据进行分析和挖掘,从而揭示数据中隐藏的规律、关联和趋势,支持决策和预测。https://www.elecfans.com/d/2395155.html
15.R语言数据挖掘方法及应用(薛薇著)完整pdf扫描版[188MB]电子书下后续围绕数据挖掘应用的四大核心方面,安排了数据预测篇:立足数据预测未知,数据分组篇:发现数据中的自然群组,数据关联篇:发现数据的内在关联性,离群数据探索篇:发现数据中的离群点。每篇下各设若干章节,各章节从简单易懂且具代表性的案例问题入手,剖析理论方法原理,讲解R语言实现,并给出案例的R语言数据挖掘代码和结果https://www.jb51.net/books/630445.html
16.我国的数据挖掘技术现状分析论文数据挖掘 (DM) 是一个新兴的学科, 学名叫做数据库中发现知识 (KDD) , 其出现在20世纪90年代, 并在这三十年间发展迅速, 它的主要工作领域为数据库系统以及数据库应用领域, 其作用在于能够从应用数据中提取隐藏的关键信息与知识, 应用数据的范围广泛, 不管是不完整的数据, 还是受干扰的数据, 数据挖掘技术都能https://www.ruiwen.com/lunwen/2444988.html
17.什么是数据挖掘数据挖掘有哪些应用数据挖掘是一种从大量数据中自动发现隐藏信息和潜在关系的技术。它运用了统计学、机器学习和数据库等相关领域的知识与技术,可以帮助人们对数据进行全面深入的分析,提高数据的利用价值。https://www.eefocus.com/e/1348975.html
18.商业数据挖掘的13种应用嘲,你了解多少?文章浏览阅读1w次,点赞2次,收藏20次。数据挖掘涉及到公司运营的方方面面,这包括对企业部门经营情况的评估、内部员工的管理、生产流程的监管、产品结构优化与新产品开发、财务成本优化、市场结构的分析和客户关系的管理。_请简要叙述一个可以应用数据挖掘的分析场景。https://blog.csdn.net/j2IaYU7Y/article/details/81571506
19.数据挖掘:原理与应用——丁兆云,周鋆,杜振国目前,数据挖掘类课程已成为我国新工科教育的数据科学思维提升课程,成为信息、电子等各类工科专业本科生与研究生的必修课。本书深入浅出地介绍了数据挖掘和数据分析的知识、常用的各类算法;系统梳理与比较各类算法的优缺点与适用场景。本书内容结合作者多年的科研和教学经验,大量案例来自作者的项目和科研成果,不仅适合作为http://m.cmpedu.com/books/book/5605161.htm
20.数据挖掘在管理会计中的重要意义在管理会计领域中运用数据挖掘技术,寻求和发现更多的企业顾客、供应商、市场以及内部流程优化的信息,将为企业决策者提供更为广泛而有效的决策依据,提高企业战略竞争能力。本文简要介绍了数据挖掘的基本概念和方法,在此基础上重点分析了数据挖掘技术在作用成本和价值链分析,产品、市场和顾客分析以及财务风险防范等方面的应用https://www.jy135.com/guanli/327644.html