监督学习有哪些常见算法?都是如何应用的人工智能

监督学习是机器学习的子集,监督学习会对机器学习模型的输入数据进行标记,并对其进行练习。因此,监督模型能最大限度地预测模型的输出结果。

监督学习背后的概念也可以从现实生活中找到影子,例如老师给孩子做辅导。假设老师要教孩子认识猫、狗的图像。她/他将通过不断地向孩子展示猫或狗的图像来辅导孩子,同时告知孩子图像是狗还是猫。

展示和告知图像的过程可以被认为是标记数据,机器学习模型训练过程中,会被告知哪些数据属于哪个类别。

监督学习有什么用?监督学习可用于回归和分类问题。分类模型允许算法确定给定数据属于哪个组别。示例可能包括True/False、Dog/Cat等。

由于回归模型能够根据历史数据预测将来的数值,因此它会被用于预测员工的工资或房地产的售价。

在本文中,我们将列出一些用于监督学习的常见算法,以及关于此类算法的实用教程。

线性回归是一种监督学习算法,它根据给定的输入值预测输出值。当目标(输出)变量返回一个连续值时,使用线性回归。

线性算法主要有两种类型,简单线性回归和多元线性回归。

简单线性回归仅使用一个独立(输入)变量。一个例子是通过给定的身高来预测孩子的年龄。

另一方面,多元线性回归可以使用多个自变量来预测其最终结果。一个例子是根据它的位置、大小、需求等来预测给定房产的价格。

以下是线性回归公式

对于Python的示例,我们将使用线性回归来预测相对于给定x值的y值。

我们给定的数据集仅包含两列:x和y。请注意,y结果将返回连续值。

下面是给定数据集的截图:

请注意,您应该在完成此步骤之前导入给定的数据集。

我们将数据集划分为训练和测试部分。选择测试数据集大小为总数据集的20%。

请注意,通过设置random_state=1,每次模型运行时,都会发生相同的数据拆分,从而产生完全相同的训练和测试数据集。

这在您想进一步调整模型的情况下很有用。

蓝点表示数据点,而红线是模型绘制的最佳拟合线性回归线。线性模型算法总是会尝试绘制最佳拟合线以尽可能准确地预测结果。

对于Python的示例,会使用逻辑回归将“花”分成两个不同的类别/种类。在给定的数据集中会包括不同花的多个特征。

模型的目的是将给花识别为Iris-setosa、Iris-versicolor或Iris-virginica几个种类。

请注意,随着测试分数的增加,模型的性能也会增加。

在逻辑图中,红点表示给定的数据点。这些点清楚地分为3类,Virginica、versicolor和setosa花种。

使用这种技术,逻辑回归模型可以根据花在图表上的位置轻松对花类型进行分类。

SVM算法能够将给定的数据点分成不同的组。算法在绘制出数据之后,可以绘制最合适的线将数据分成多个类别,从而分析数据之间的关系。

如下图所示,绘制的线将数据集完美地分成2个不同的组,蓝色和绿色。

SVM模型可以根据图形的维度绘制直线或超平面。行只能用于二维数据集,这意味着只有2列的数据集。

如果是多个特征来预测数据集,就需要更高的维度。在数据集超过2维的情况下,支持向量机模型将绘制超平面。

在支持向量机Python的示例中,将对3种不同的花卉类型进行物种分类。我们的自变量包括花的所有特征,而因变量是花所属物种。

花卉品种包括Iris-setosa、Iris-versicolor和Iris-virginica。

下面是数据集的截图:

因变量y仅包含模型预测的物种列。

返回值为0.9666666666667,这表明模型的高性能。

虽然线性、逻辑和SVM算法非常可靠,但还会提到一些有监督的机器学习算法。

请注意,使用的树格式是倒置树的格式。

意味着同时构建多个决策树,每个决策树都返回自己的结果,然后将其组合以获得更好的结果。

对于分类问题,随机森林模型将生成多个决策树,并根据大多数树预测的分类组对给定对象进行分类。

模型可以修复由单个树引起的过拟合问题。同时,随机森林算法也可用于回归,尽管可能导致不良结果。

这种分组基于不同个体之间的共同特征。KNN算法可用于分类和回归问题。

KNN的经典示例就是将动物图像分类到不同的组集中。

本文介绍了监督机器学习及其可以解决的两类问题,并解释了分类和回归问题,给出了每个输出数据类型的一些示例。

详细解释了线性回归是什么以及它是如何工作的,并提供了一个Python中的具体示例,它会根据独立的X变量预测Y值。

随后又介绍了逻辑回归模型,并给出了分类模型示例,该示例将给定的图像分类为具体花的种类。

对于支持向量机算法,可以用它来预测3种不同花种的给定花种。最后列出了其他著名的监督机器学习算法,例如决策树、随机森林和K近邻算法。

无论您是为了学习、工作还是娱乐阅读本文,我们认为了解这些算法是开始进入机器学习领域的一个开端。

如果您有兴趣并想了解更多关于机器学习领域的信息,我们建议您深入研究此类算法的工作原理以及如何调整此类模型以进一步提高其性能。

THE END
1.监督学习机器之心监督式学习算法多种多样,每种算法各有其优势和弱点。并没有某一种算法可以解决所有的监督式学习问题,这被称为‘天下没有免费的午餐’理论。目前被广泛使用的监督式学习算法有人工神经网络、线性回归、逻辑回归、线性识别分析、支持向量机、最近邻居法、高斯混合模型、朴素贝叶斯方法、决策树和径向基函数分类等。 https://www.jiqizhixin.com/graph/technologies/94fdbfed-9ebb-491b-b54e-9c2aae512f70
2.监督学习的分类算法所有的回归算法和分类算法都属于监督学习。回归(Regression)和分类(Classification)的算法区别在于输出变量的类型,定量输出称为回归,或者说是连续变量预测;定性输出称为分类,或者说是离散变量预测。 以下是一些常用的监督型学习方法。 一.K-近邻算法(k-Nearest Neighbors,KNN),K-近邻是一种分类算法,其思路是:如果一个https://wenku.baidu.com/view/3976264b02f69e3143323968011ca300a6c3f6fd.html
3.监督学习方法精讲在机器学习中,无监督学习(Unsupervised learning)就是聚类,事先不知道样本的类别,通过某种办法,把相似的样本放在一起归位一类;而监督型学习(Supervised learning)就是有训练样本,带有属性标签,也可以理解成样本有输入有输出。 所有的回归算法和分类算法都属于监督学习。回归(Regression)和分类(Classification)的算法区别在于https://blog.csdn.net/laobai1015/article/details/75006511
4.自监督学习算法BarlowTwins在ImageNet ILSVRC-2012 dataset上用自监督的方法进行预训练,在图像分类和目标检测任务上进行验证。 Linear evaluation on ImageNet Top1 73.2% image.png IMAGENET 半监督性能 用预训练的twins在imagnet的1%和10%有标签的子集进行半监督学习测试。 image.png https://www.jianshu.com/p/7f7f0c14ece5
5.无监督深度学习经典算法无监督算法举例1,有监督:通常被称为监督学习(supervised learning),常用于回归问题和分类问题。使用这种方法需要提供原始数据以及其对应的标签,常用的监督学习方法有K-近邻算法(k-Nearest Neighbors,KNN),决策树(Decision Trees),朴素贝叶斯(Naive Bayesian),逻辑回归(Logistic Regression)等。 https://blog.51cto.com/u_16099252/9423357
6.头条文章大部分模型都是属于监督学习,包括线性分类器、支持向量机等。常见的监督学习算法有: k-近邻算法(k-Nearest Neighbors, kNN)、决策树(Decision Trees)、朴素贝叶斯(Naive Bayesian)等。监督学习的基本流程如图1所示。 图1 监督学习的基本流程 无监督学习(Unsupervised Learning, UL)https://card.weibo.com/article/m/show/id/2309404598738399395890
7.科学网—[转载]最实用的机器学习算法优缺点分析,没有比这篇说得更分类是一种用于分类变量建模及预测的监督学习算法,使用案例包括员工流失、邮件过滤、金融欺诈等的预测。 正如你所见,许多回归算法都有其对应的分类形式,分类算法往往适用于类别(或其可能性)的预测,而非数值。 逻辑回归 2.1 (正则化)逻辑回归 逻辑回归是线性回归所对应的分类方法,基本概念由线性回归推导而出。逻辑回归https://blog.sciencenet.cn/blog-1396960-1170780.html
8.17个机器学习的常用算法在此学习方式下,输入数据部分被标识,部分没有被标识,这种学习模型可以用来进行预测,但是模型首先需要学习数据的内在结构以便合理的组织数据来进行预测。应用场景包括分类和回归,算法包括一些对常用监督式学习算法的延伸,这些算法首先试图对未标识数据进行建模,在此基础上再对标识的数据进行预测。如图论推理算法(Graph Inferehttps://aidc.shisu.edu.cn/78/aa/c13626a161962/page.htm
9.机器学习(一)2万多字的监督学习模型总结? 本文根据Andreas C.Muller的《Introduction to Machine Learning with Python》和西瓜书,整理了常见的监督学习模型。本文不讲解复杂的数学理论,涉及到了K近邻、线性模型、朴素贝叶斯分类器、决策树、随机森林、梯度提升回归树、SVM、MLP,以及监督学习模型的选择原则,全文2万多字,后续还会进一步补充。 https://www.flyai.com/article/515
10.《常用算法之智能计算(三)》:机器学习计算(2)基于学习方式的分类 机器学习算法按照学习方式的不同可以分为五种类型:有监督学习、无监督学习、半监督学习、强化学习和深度学习。 1)有监督学习?输入的数据为训练数据,并且每一个数据都会带有标签或类别。通过训练过程建模,模型需要作出预测,如果预测出错会被修正,直到模型输出准确的训练结果,训练过程会一直http://www.kepu.cn/blog/zhangjianzhong/201903/t20190327_475625.html
11.学习笔记:神经网络学习算法腾讯云开发者社区主流的神经网络学习算法(或者说学习方式)可分为三大类:有监督学习(SupervisedLearning)、无监督学习(Unsupervised Learning)和强化学习(Reinforcement Learning),如下图所示。 注:有监督学习、无监督学习和强化学习并不是某一种特定的算法,而是一类算法的统称。 https://cloud.tencent.com/developer/article/1610502