什么是数据挖掘?数据挖掘技术有哪些?
数据挖掘(datamining)是指从大量的资料中自动搜索隐藏于其中的有着特殊关联性的信息的过程。在全世界的计算机存储中,存在未使用的海量数据并且它们还在快速增长,这些数据就像待挖掘的金矿,而进行数据分析的科学家、工程师、分析员的数量变化一直相对较小,这种差距称为数据挖掘产生的主要原因。数据挖掘是一个多学科交叉领域,涉及神经网络、遗传算法、回归、统计分析、机器学习、聚类分析、特异群分析等,开发挖掘大型海量和多维数据集的算法和系统,开发合适的隐私和安全模式,提高数据系统的使用简便性。
数据挖掘与传统意义上的统计学不同。统计学推断是假设驱动的,即形成假设并在数据基础上验证他;数据挖掘是数据驱动的,即自动地从数据中提取模式和假设。数据挖掘的目标是提取可以容易转换成逻辑规则或可视化表示的定性模型,与传统的统计学相比,更加以人为本。
商业应用数据挖掘的实现步骤:
2.数据挖掘的数据准备和数据理解;
3.建立模型,模型评估,结果发布。
数据挖掘的具体应用举例:
1.商业管理:数据库营销、客户群体划分、背景分析、交叉销售等市场分析行为,以及客户流失性分析、客户信用记分、欺诈发现等。
2.营销方面:通过收集、加工和处理涉及消费者消费行为的大量信息,确定特定消费群体或个体的兴趣、消费习惯、消费倾向和消费需求,进而推断出相应消费群体或个体下一步的消费行为,然后以此为基础,对所识别出来的消费群体进行特定内容的定向营销,提高了营销效果,从而为企业带来更多的利润。
3.企业危机管理:对企业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助经营决策的关键性数据。
5.Internet应用:SNS应用数据挖掘,给用户带来基于直接信息的大量潜在信息和价值,能够一直保持用户对SNS的兴趣。商家能够更方便的将商品推送给目标人群,消费者也更容易买到最实惠的自己最需要的产品。