数据挖掘领域的10大经典算法分享

1)用信息增益率来选择属性,克服了用信息增益选择属性时偏向选择取值多的属性的不足;

2)在树构造过程中进行剪枝;

3)能够完成对连续属性的离散化处理;

4)能够对不完整数据进行处理。

C4.5算法有如下优点:产生的分类规则易于理解,准确率较高。其缺点是:在构造树的过程中,需要对数据集进行多次的顺序扫描和排序,因而导致算法的低效。

2.Thek-meansalgorithm即K-Means算法

3.Supportvectormachines

5.最大期望(EM)算法

6.PageRank

PageRank是Google算法的重要内容。2001年9月被授予美国专利,专利人是Google创始人之一拉里·佩奇(LarryPage)。因此,PageRank里的page不是指网页,而是指佩奇,即这个等级方法是以佩奇来命名的。

PageRank根据网站的外部链接和内部链接的数量和质量俩衡量网站的价值。PageRank背后的概念是,每个到页面的链接都是对该页面的一次投票,被链接的越多,就意味着被其他网站投票越多。这个就是所谓的“链接流行度”——衡量多少人愿意将他们的网站和你的网站挂钩。PageRank这个概念引自学术中一篇论文的被引述的频度——即被别人引述的次数越多,一般判断这篇论文的共识性就越高。

7.AdaBoost

Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。其算法本身是通过改变数据分布来实现的,它根据每次训练集之中每个样本的分类是否正确,以及上次的总体分类的准确率,来确定每个样本的权值。将修改过权值的新数据集送给下层分类器进行训练,最后将每次训练得到的分类器最后融合起来,作为最后的决策分类器。

8.kNN:k-nearestneighborclassification

9.NaiveBayes

10.CART:分类与回归树

CART,ClassificationandRegressionTrees。在分类树下面有两个关键的思想。第一个是关于递归地划分自变量空间的想法;第二个想法是用验证数据进行剪枝。

THE END
1.十大经典数据挖掘算法详解【十大经典数据挖掘算法详解】 以下是个人觉得算法讲解比较清晰易懂的博客! C4.5 K-Means SVM Apriori使用Apriori进行关联分析(一)使用Apriorhttps://www.jianshu.com/p/dc16ac2403e2
2.数据挖掘十大经典算法(详解)因素属性的值可以是连续量,C4.5 对其排序并分成不同的集合后按照ID3 算法当作离散量进行处理,但结论属性的值必须是离散值. 2) 训练例的因素属性值可以是不确定的,以 ? 表示,但结论必须是确定的 3. 对已生成的决策树进行裁剪,减小生成树的规模. 二、数据挖掘十大经典算法(2) k-means https://blog.csdn.net/u011067360/article/details/24368085
3.数据挖掘十大经典算法数据挖掘十大经典算法_总结版.ppt,《数据挖掘领域十大经典算法初探》 数据挖掘领域十大经典算法初探 - 结构之法 算法之道 - 博客频道 - CSDN.NET 译者:July二零一一年一月十五日 参考文献: 国际权威的学术组织ICDM,于06年12月年评选出的数据挖掘领域的十大经典算法: C4.5https://max.book118.com/html/2016/0424/41239351.shtm
4.学习详解数据挖掘十大经典算法!腾讯云开发者社区数据挖掘十大经典算法(5) 最大期望(EM)算法 在统计计算中,最大期望(EM,Expectation–Maximization)算法是在概率(probabilistic)模型中寻找参数最大似然估计的算法,其中概率模型依赖于无法观测的隐藏变量(Latent Variabl)。最大期望经常用在机器学习和计算机视觉的数据集聚(Data Clustering)领域。最大期望算法经过两个步骤https://cloud.tencent.com/developer/article/1105704
5.十大经典算法之C4.5算法(超详细附代码)C4.5是决策树算法的一种。决策树算法作为一种分类算法,目标就是将具有p维特征的n个样本分到c个类别中去。常见的决策树算法有ID3,C4.5,CART。 数据挖掘十大经典算法如下: 简介 C4.5是决策树算法的一种。决策树算法作为一种分类算法,目标就是将具有p维特征的n个样本分到c个类别中去。常见的决策树算法有ID3,Chttps://www.51cto.com/article/572078.html
6.数据挖掘领域十大经典算法summerbell数据挖掘领域十大经典算法 下面是参与评比的18种算法,实际上随便拿出一种来都可以称得上是经典算法,它们在数据挖掘领域都产生了极为深远的影响。在我们学习数据挖掘时,可以以这18种算法为主线,如果能把每一种算法都弄懂,整个数据挖掘领域就掌握得差不多了。另外,也可以用这18种算法的熟悉程度来判断自己知识的掌握程度https://www.iteye.com/blog/479731
7.科学网—数据挖掘十大经典算法数据挖掘十大经典算法 1、C4.5分类决策树 2、K均值聚类 3、支持向量机 4、Apriori算法 5、期望最大化算法 6、PageRank算法 7、AdaBoost算法 8、k近邻算法 9、朴素贝叶斯分类器 10、分类与回归树(CART)https://wap.sciencenet.cn/blog-394950-535342.html
8.十大经典机器学习算法之一AprioriApriori算法是经典的挖掘频繁项集和关联规则的数据挖掘算法,也是十大经典机器学习算法之一。 Agrawal和Srikant两位博士在1994年提出了Apriori算法,主要用于做快速的关联规则分析。 A priori在拉丁语中指“来自以前”。当定义问题时,通常会使用先验知识或者假设,这被称作“一个先验”(a priori)。Apriori算法正是基于这样https://m.hqew.com/tech/fangan_2016440