常见的机器学习算法,你知道几个?

??【天极网网络频道】诞生于1956年的人工智能,由于受到智能算法、计算速度、存储水平等因素的影响,在六十多年的发展过程中经历了多次高潮和低谷。最近几年,得益于数据量的上涨、运算力的提升,特别是机器学习新算法的出现,人工智能迎来了大爆发的时代。

??提到机器学习这个词时,有些人首先想到的可能是科幻电影里的机器人。事实上,机器学习是一门多领域交叉学科,涉及概率论、统计学、算法复杂度理论等多门学科。专门研究计算机如何模拟或实现人类的学习行为,利用数据或以往的经验,以此优化计算机程序的性能标准。

??根据学习任务的不同,我们可以将机器学习分为监督学习、非监督学习、强化学习三种类型,而每种类型又对应着一些算法。

各种算法以及对应的任务类型

??一、监督学习

??(1)支持向量机(Support?Vector?Machine,SVM):是一类按监督学习方式对数据进行二元分类的广义线性分类器,其决策边界是对学习样本求解的最大边距超平面。例如,在纸上有两类线性可分的点,支持向量机会寻找一条直线将这两类点区分开来,并且与这些点的距离都尽可能远。

??优点:泛化错误率低,结果易解释。

??缺点:对大规模训练样本难以实施,解决多分类问题存在困难,对参数调节和核函数的选择敏感。

??应用场景:文本分类、人像识别、医学诊断等。

??(2)决策树(Decision?Tree):是一个预测模型,代表的是对象属性与对象值之间的一种映射关系。下图是如何在决策树中建模的简单示例:

??缺点:对缺失数据处理比较困难。

??应用场景:在决策过程应用较多。

??(3)朴素贝叶斯分类(Naive?Bayesian?classification):对于给出的待分类项,求解此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类属于哪个类别。贝叶斯公式为:p(A|B)=?p(B|A)*p(A/p(B),其中P(A|B)表示后验概率,P(B|A)是似然值,P(A)是类别的先验概率,P(B)代表预测器的先验概率。

??优点:在数据较少的情况下仍然有效,可以处理多类别问题。

??缺点:对输入数据的准备方式较为敏感。

??应用场景:文本分类、人脸识别、欺诈检测。

??(4)k-近邻算法(K-Nearest?Neighbor,KNN):是一种基于实例的学习,采用测量不同特征值之间的距离方法进行分类。其基本思路是:给定一个训练样本集,然后输入没有标签的新数据,将新数据的每个特征与样本集中数据对应的特征进行比较,找到最邻近的k个(通常是不大于20的整数)实例,这k个实例的多数属于某个类,就把该输入实例分类到这个类中。

??优点:简单、易于理解、易于实现,无需估计参数。此外,与朴素贝叶斯之类的算法比,无数据输入假定、准确度高、对异常数据值不敏感。

??缺点:对于训练数据依赖程度比较大,并且缺少训练阶段,无法应对多样本。

??应用场景:字符识别、文本分类、图像识别等领域。

??二、非监督学习

??(1)主成分分析(Principal?Component?Analysis,PCA):是一种统计方法。其主要思想是将n维特征映射到k维上,这k维是全新的正交特征也被称为主成分,是在原有n维特征的基础上重新构造出来的k维特征。

??优点:降低数据的复杂性,识别最重要的多个特征。

??缺点:主成分各个特征维度的含义具有一定的模糊性,不如原始样本特征的解释性强;有可能损失有用的信息。

??应用场景:语音、图像、通信的分析处理。

??(2)奇异值分解(Singular?Value?Decomposition,SVD):可以将一个比较复杂的矩阵用更小更简单的几个子矩阵的相乘来表示,这些小矩阵描述的是矩阵的重要的特性。

??优点:简化数据,去除噪声点,提高算法的结果。

??缺点:数据的转换可能难以理解。

??应用场景:推荐系统、图片压缩等。

??(3)K-均值聚类(K-Means):是一种迭代求解的聚类分析算法,采用距离作为相似性指标。其工作流程是随机确定K个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。

??优点:算法简单容易实现。

??缺点:可能收敛到局部最小值,在大规模数据集上收敛较慢。

??应用场景:图像处理、数据分析以及市场研究等。

??三、强化学习

??Q-learning:是一个基于值的强化学习算法,它根据动作值函数评估应该选择哪个动作,这个函数决定了处于某一个特定状态以及在该状态下采取特定动作的奖励期望值。

??优点:可以接收更广的数据范围。

??缺点:缺乏通用性。

??应用场景:游戏开发。

??现如今,我们越来越多地看到机器学习算法为人类带来的实际价值,如它们提供了关键的洞察力和信息来报告战略决策。可以肯定的是,随着机器学习越来越流行,未来还将出现越来越多能很好地处理任务的算法。

THE END
1.机器学习与数据科学核心技术概览C4.5,是机器学习算法中的一个分类决策树算法, 它是决策树(决策树也就是做决策的节点间的组织方式像一棵树,其实是一个倒树)核心算法 ID3的改进算法,所以基本上了解了一半决策树构造方法就能构造它。 决策树构造方法其实就是每次选择一个好的特征以及分裂点作为当前节点的分类条件。 https://blog.csdn.net/jirongzi_cs2011/article/details/9531297
2.人工智能领域的十大算法线性回归(Linear Regression)可能是最流行的机器学习算法。线性回归就是要找一条直线,并且让这条直线尽可能地拟合散点图中的数据点。它试图通过将直线方程与该数据拟合来表示自变量(x 值)和数值结果(y 值)。然后就可以用这条线来预测未来的值! 这种算法最常用的技术是最小二乘https://mp.weixin.qq.com/s?__biz=MzUyMzY3NDA5Nw==&mid=2247490224&idx=1&sn=544cdc16c7fce6a1054385575cf03f33&chksm=fa38522ecd4fdb38380f401e7d8289d6a087117b1cd233b82d32312a50df0931cf29310e9083&scene=27
3.轻松看懂机器学习十大常用算法(附实例)轻松看懂机器学习十大常用算法(附实例) 通过本篇文章大家可以对ML的常用算法形成常识性的认识。没有代码,没有复杂的理论推导,仅是图解,介绍这些算法是什么以及如何应用(例子主要是分类问题)。以后有机会再对单个算法做深入地解析。 今天的算法如下: 一、决策树https://mse.xauat.edu.cn/info/1038/2182.htm
4.17个机器学习的常用算法!腾讯云开发者社区根据数据类型的不同,对一个问题的建模有不同的方式。在机器学习或者人工智能领域,人们首先会考虑算法的学习方式。在机器学习领域,有几种主要的学习方式。将算法按照学习方式分类是一个不错的想法,这样可以让人们在建模和算法选择的时候考虑能根据输入数据来选择最合适的算法来获得最好的结果。 1.监督式学习: https://cloud.tencent.com/developer/article/2078750
5.机器学习算法概览生活百科机器学习算法概览 1、 监督式学习 工作机制:这个算法由一个目标变量或结果变量(或因变量)组成。这些变量由已知的一系列预示变量(自变量)预测而来。利用这一系列变量,我们生成一个将输入值映射到期望输出值的函数。这个训练过程会一直持续,直到模型在训练数据上获得期望的精确度。监督式学习的例子有:回归、决策树、https://www.cnblogs.com/kekexuanxaun/p/9451186.html
6.常规算法和机器学习算法之间的区别是什么?机器学习算法的行为取决于它在训练过程中学到的内容,然后是它与现实生活中的相似之处 – 在生产中。这与大多数常见算法非常不同,它要求公司能够以机器学习算法独有的方式评估模型性能。 资源 ML与经典算法 我已经看到客户对机器学习和经典算法项目应用类似的升级,在那里你有一些实验开发(PoC),然后是全面生产。 https://easyai.tech/blog/what-is-an-ai-algorithm/
7.什么是机器学习算法?IBM机器学习算法是 AI 系统用来执行任务的一套规则或流程,最常见的用途是发现新的数据洞察或模式,或者从一组给定输入变量中预测输出值。机器学习 (ML) 利用算法来学习。 行业分析师一致认同机器学习及其底层算法至关重要。Forrester 指出:“机器学习算法的进步让营销数据的分析更加精确深入,可帮助营销人员了解营销细节(如https://www.ibm.com/cn-zh/topics/machine-learning-algorithms
8.11种比较常见的机器学习算法简介近年来,由于对技术的高需求和进步,机器学习的普及已大大增加。 机器学习可以从数据中创造价值的潜力使其吸引了许多不同行业的企业。 大多数机器学习产品都是使用现成的机器学习算法进行设计和实现的,并且需要进行一些调整和细微更改。 近年来,由于对技术的高需求和进步,机器学习的普及已大大增加。 机器学习可以从数据中https://www.51cto.com/article/622149.html
9.机器学习常用的十大算法人工智能机器学习常用的十大算法-二项logistic回归模型是一种分类模型,由条件概率分布P(Y|X)表示,形式为参数化的logistic分布。这里随机变量X取值为实数,随机变量Y取值为1或0。可以通过有监督的方法来估计模型参数。https://www.elecfans.com/rengongzhineng/2270100.html
10.TensorFlow机器学习常用算法解析和入门上图为基于ICA的人脸识别模型。实际上这些机器学习算法并不是全都像想象中一样复杂,有些还和高中数学紧密相关。 后面讲给大家一一详细单独讲解这些常用算法。 强化学习 13)Q-Learning算法 Q-learning要解决的是这样的问题:一个能感知环境的自治agent,怎样通过学习选择能达到其目标的最优动作。 https://www.w3cschool.cn/tensorflow/tensorflow-s8uq24ti.html
11.英国最新研究表明:新机器学习算法助力防治传染病新华社伦敦11月4日电(记者张家伟)英国格拉斯哥大学发布一项新研究说,借助新的机器学习算法,科学家有望更高效从基因层面预测埃博拉和寨卡等病毒的天然宿主,从而采取措施预防这些病毒传播到人类身上。 不少致命病毒往往首先在野生动物和昆虫群体中大范围传播,随后才感染人类,并最终导致传染病疫情,因此尽早发现这些病毒的天然https://news.cctv.com/m/a/index.shtml?id=ARTICqxz6Xw9sVAU2RvkNB7b181105
12.机器学习10大经典算法详解python这篇文章主要为大家详细介绍了机器学习10大经典算法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下https://www.jb51.net/article/129969.htm
13.轻松看懂机器学习十大常用算法通过本篇文章可以对ML的常用算法有个常识性的认识,没有代码,没有复杂的理论推导,就是图解一下,知道这些算法是什么,它们是怎么应用的,例子主要是分类问题。 每个算法都看了好几个视频,挑出讲的最清晰明了有趣的,便于科普。 以后有时间再对单个算法做深入地解析。 https://www.jianshu.com/p/55a67c12d3e9
14.基于机器学习的肠道菌群数据建模与分析研究综述本文从大数据分析和机器学习的角度,对人体肠道菌群数据的建模、分析和预测算法的原理、过程以及典型研究应用实例进行综述,以期推动肠道菌群分析相关研究发展以及探索结合机器学习算法进行肠道菌群分析的有效方式,同时也为开发基于肠道菌群数据的新型诊疗手段提供借鉴,推动我国精准医疗事业发展。http://journals.im.ac.cn/html/wswxtbcn/2021/1/tb21010180.htm
15.科学网—[转载]转自:数据标准化/归一化normalization数据需要归一化的机器学习算法 需要归一化的模型: 有些模型在各个维度进行不均匀伸缩后,最优解与原来不等价,例如SVM(距离分界面远的也拉近了,支持向量变多?)。对于这样的模型,除非本来各维数据的分布范围就比较接近,否则必须进行标准化,以免模型参数被分布范围较大或较小的数据dominate。 https://blog.sciencenet.cn/blog-601186-1228314.html
16.《常用算法之智能计算(三)》:机器学习计算机器学习算法的功能可粗略的分为四大类,即分类、聚类、预测和降维,可用的机器学习算法不下数百种,包括回归分析、判别分析、聚类分析、因子分析和主成分分析、贝叶斯分类、决策树、支持向量机、EM、Adaboost、人工神经网络及它们之间的一些集成算法等。其中的回归分析、判别分析、聚类分析等已在统计计算里进行了介绍,神经http://www.kepu.net/blog/zhangjianzhong/201903/t20190327_475625.html