机器学习常用的十类算法

人工神经网络(ANN)以大脑处理机制作为基础,开发用于建立复杂模式和预测问题的算法。该类型算法在语音、语义、视觉、各类游戏等任务中表现极好,但需要大量数据进行训练,且训练要求很高的硬件配置。

ANN在图像和字符识别中起着重要的作用,手写字符识别在欺诈检测甚至国家安全评估中有很多应用。ANN的研究为深层神经网络铺平了道路,是「深度学习」的基础,现已在计算机视觉、语音识别、自然语言处理等方向开创了一系列令人激动的创新。

2.决策树

在机器学习中,决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系。其采用一种树形结构,其中每个内部节点表示一个属性上的测试,每个分支代表一个测试输出,每个叶节点代表一种类别。

决策树算法属于非参数型,较为容易解释,但其趋向过拟合;可能陷入局部最小值中;无法在线学习。决策树的生成主要分为两步:1.节点的分裂:当一个节点所代表的属性无法给出判断时,则选择将该节点分成2个子节点2.阈值的确定:选择适当的阈值使得分类错误率最小。

3.集成算法

简单算法一般复杂度低、速度快、易展示结果,其中的模型可以单独进行训练,并且它们的预测能以某种方式结合起来去做出一个总体预测。每种算法好像一种专家,集成就是把简单的算法组织起来,即多个专家共同决定结果。

集成算法比使用单个模型预测出来的结果要精确的多,但需要进行大量的维护工作。

AdaBoost的实现是一个渐进的过程,从一个最基础的分类器开始,每次寻找一个最能解决当前错误样本的分类器。好处是自带了特征选择,只使用在训练集中发现有效的特征,这样就降低了分类时需要计算的特征数量,也在一定程度上解决了高维数据难以理解的问题。

4.回归算法

5.贝叶斯算法

朴素贝叶斯分类是一种十分简单的分类算法:对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项属于哪个类别。

朴素贝叶斯分类分为三个阶段,1.根据具体情况确定特征属性,并对每个特征属性进行适当划分,形成训练样本集合2.计算每个类别在训练样本中的出现频率及每个特征属性划分对每个类别的条件概率估计3.使用分类器对待分类项进行分类。

6.K近邻

K紧邻算法的核心是未标记样本的类别,计算待标记样本和数据集中每个样本的距离,取距离最近的k个样本。待标记的样本所属类别就由这k个距离最近的样本投票产生,给定其测试样本,基于某种距离度量找出训练集中与其最靠近的k个训练样本,然后基于这k个“邻居”的信息来进行预测。

K紧邻算法准确性高,对异常值和噪声有较高的容忍度,但计算量较大,对内存的需求也较大。该算法主要应用于文本分类、模式识别、图像及空间分类。

7.聚类算法

聚类算法是机器学习中涉及对数据进行分组的一种算法。在给定的数据集中,我们可以通过聚类算法将其分成一些不同的组。应用中可利用聚类分析,通过将数据分组可以比较清晰的获取到数据信息。该算法让数据变得有意义,但存在结果难以解读,针对不寻常的数据组,结果可能无用。

在商业领域中,聚类可以帮助市场分析人员从消费者数据库中区分出不同的消费群体来,并且概括出每一类消费者的消费模式或者说习惯。

8.随机森林算法

随机森林是一种有监督学习算法,基于决策树为学习器的集成学习算法。随机森林非常简单,易于实现,计算开销也很小,但是它在分类和回归上表现出非常惊人的性能,因此,随机森林被誉为“代表集成学习技术水平的方法”。

9.支持向量机

支持向量机通过寻求结构化风险最小来提高学习机泛化能力,实现经验风险和置信范围的最小化,从而达到在统计样本量较少的情况下,亦能获得良好统计规律的目的。它是一种二类分类模型,其基本模型定义为特征空间上的间隔最大的线性分类器,即支持向量机的学习策略便是间隔最大化,最终可转化为一个凸二次规划问题的求解。

支持向量机可应用于诸如文本分类,图像分类,生物序列分析和生物数据挖掘,手写字符识别等领域。

10.深度学习

深度学习基于人工神经网络的机器学习,区别于传统的机器学习,深度学习需要更多样本,换来更少的人工标注和更高的准确率。

小结

算法是计算机科学领域最重要的基石之一,当下需要处理的信息量是呈指数级的增长,每人每天都会创造出大量数据,无论是三维图形、海量数据处理、机器学习、语音识别,都需要极大的计算量,在AI时代越来越多的挑战需要靠卓越的算法来解决。

THE END
1.机器学习与数据科学核心技术概览C4.5,是机器学习算法中的一个分类决策树算法, 它是决策树(决策树也就是做决策的节点间的组织方式像一棵树,其实是一个倒树)核心算法 ID3的改进算法,所以基本上了解了一半决策树构造方法就能构造它。 决策树构造方法其实就是每次选择一个好的特征以及分裂点作为当前节点的分类条件。 https://blog.csdn.net/jirongzi_cs2011/article/details/9531297
2.人工智能领域的十大算法线性回归(Linear Regression)可能是最流行的机器学习算法。线性回归就是要找一条直线,并且让这条直线尽可能地拟合散点图中的数据点。它试图通过将直线方程与该数据拟合来表示自变量(x 值)和数值结果(y 值)。然后就可以用这条线来预测未来的值! 这种算法最常用的技术是最小二乘https://mp.weixin.qq.com/s?__biz=MzUyMzY3NDA5Nw==&mid=2247490224&idx=1&sn=544cdc16c7fce6a1054385575cf03f33&chksm=fa38522ecd4fdb38380f401e7d8289d6a087117b1cd233b82d32312a50df0931cf29310e9083&scene=27
3.轻松看懂机器学习十大常用算法(附实例)轻松看懂机器学习十大常用算法(附实例) 通过本篇文章大家可以对ML的常用算法形成常识性的认识。没有代码,没有复杂的理论推导,仅是图解,介绍这些算法是什么以及如何应用(例子主要是分类问题)。以后有机会再对单个算法做深入地解析。 今天的算法如下: 一、决策树https://mse.xauat.edu.cn/info/1038/2182.htm
4.17个机器学习的常用算法!腾讯云开发者社区根据数据类型的不同,对一个问题的建模有不同的方式。在机器学习或者人工智能领域,人们首先会考虑算法的学习方式。在机器学习领域,有几种主要的学习方式。将算法按照学习方式分类是一个不错的想法,这样可以让人们在建模和算法选择的时候考虑能根据输入数据来选择最合适的算法来获得最好的结果。 1.监督式学习: https://cloud.tencent.com/developer/article/2078750
5.机器学习算法概览生活百科机器学习算法概览 1、 监督式学习 工作机制:这个算法由一个目标变量或结果变量(或因变量)组成。这些变量由已知的一系列预示变量(自变量)预测而来。利用这一系列变量,我们生成一个将输入值映射到期望输出值的函数。这个训练过程会一直持续,直到模型在训练数据上获得期望的精确度。监督式学习的例子有:回归、决策树、https://www.cnblogs.com/kekexuanxaun/p/9451186.html
6.常规算法和机器学习算法之间的区别是什么?机器学习算法的行为取决于它在训练过程中学到的内容,然后是它与现实生活中的相似之处 – 在生产中。这与大多数常见算法非常不同,它要求公司能够以机器学习算法独有的方式评估模型性能。 资源 ML与经典算法 我已经看到客户对机器学习和经典算法项目应用类似的升级,在那里你有一些实验开发(PoC),然后是全面生产。 https://easyai.tech/blog/what-is-an-ai-algorithm/
7.什么是机器学习算法?IBM机器学习算法是 AI 系统用来执行任务的一套规则或流程,最常见的用途是发现新的数据洞察或模式,或者从一组给定输入变量中预测输出值。机器学习 (ML) 利用算法来学习。 行业分析师一致认同机器学习及其底层算法至关重要。Forrester 指出:“机器学习算法的进步让营销数据的分析更加精确深入,可帮助营销人员了解营销细节(如https://www.ibm.com/cn-zh/topics/machine-learning-algorithms
8.11种比较常见的机器学习算法简介近年来,由于对技术的高需求和进步,机器学习的普及已大大增加。 机器学习可以从数据中创造价值的潜力使其吸引了许多不同行业的企业。 大多数机器学习产品都是使用现成的机器学习算法进行设计和实现的,并且需要进行一些调整和细微更改。 近年来,由于对技术的高需求和进步,机器学习的普及已大大增加。 机器学习可以从数据中https://www.51cto.com/article/622149.html
9.机器学习常用的十大算法人工智能机器学习常用的十大算法-二项logistic回归模型是一种分类模型,由条件概率分布P(Y|X)表示,形式为参数化的logistic分布。这里随机变量X取值为实数,随机变量Y取值为1或0。可以通过有监督的方法来估计模型参数。https://www.elecfans.com/rengongzhineng/2270100.html
10.TensorFlow机器学习常用算法解析和入门上图为基于ICA的人脸识别模型。实际上这些机器学习算法并不是全都像想象中一样复杂,有些还和高中数学紧密相关。 后面讲给大家一一详细单独讲解这些常用算法。 强化学习 13)Q-Learning算法 Q-learning要解决的是这样的问题:一个能感知环境的自治agent,怎样通过学习选择能达到其目标的最优动作。 https://www.w3cschool.cn/tensorflow/tensorflow-s8uq24ti.html
11.英国最新研究表明:新机器学习算法助力防治传染病新华社伦敦11月4日电(记者张家伟)英国格拉斯哥大学发布一项新研究说,借助新的机器学习算法,科学家有望更高效从基因层面预测埃博拉和寨卡等病毒的天然宿主,从而采取措施预防这些病毒传播到人类身上。 不少致命病毒往往首先在野生动物和昆虫群体中大范围传播,随后才感染人类,并最终导致传染病疫情,因此尽早发现这些病毒的天然https://news.cctv.com/m/a/index.shtml?id=ARTICqxz6Xw9sVAU2RvkNB7b181105
12.机器学习10大经典算法详解python这篇文章主要为大家详细介绍了机器学习10大经典算法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下https://www.jb51.net/article/129969.htm
13.轻松看懂机器学习十大常用算法通过本篇文章可以对ML的常用算法有个常识性的认识,没有代码,没有复杂的理论推导,就是图解一下,知道这些算法是什么,它们是怎么应用的,例子主要是分类问题。 每个算法都看了好几个视频,挑出讲的最清晰明了有趣的,便于科普。 以后有时间再对单个算法做深入地解析。 https://www.jianshu.com/p/55a67c12d3e9
14.基于机器学习的肠道菌群数据建模与分析研究综述本文从大数据分析和机器学习的角度,对人体肠道菌群数据的建模、分析和预测算法的原理、过程以及典型研究应用实例进行综述,以期推动肠道菌群分析相关研究发展以及探索结合机器学习算法进行肠道菌群分析的有效方式,同时也为开发基于肠道菌群数据的新型诊疗手段提供借鉴,推动我国精准医疗事业发展。http://journals.im.ac.cn/html/wswxtbcn/2021/1/tb21010180.htm
15.科学网—[转载]转自:数据标准化/归一化normalization数据需要归一化的机器学习算法 需要归一化的模型: 有些模型在各个维度进行不均匀伸缩后,最优解与原来不等价,例如SVM(距离分界面远的也拉近了,支持向量变多?)。对于这样的模型,除非本来各维数据的分布范围就比较接近,否则必须进行标准化,以免模型参数被分布范围较大或较小的数据dominate。 https://blog.sciencenet.cn/blog-601186-1228314.html
16.《常用算法之智能计算(三)》:机器学习计算机器学习算法的功能可粗略的分为四大类,即分类、聚类、预测和降维,可用的机器学习算法不下数百种,包括回归分析、判别分析、聚类分析、因子分析和主成分分析、贝叶斯分类、决策树、支持向量机、EM、Adaboost、人工神经网络及它们之间的一些集成算法等。其中的回归分析、判别分析、聚类分析等已在统计计算里进行了介绍,神经http://www.kepu.net/blog/zhangjianzhong/201903/t20190327_475625.html