什么是机器学习中的学习曲线AI快速进阶系列JackYang

在本教程中,我们将研究什么是学习曲线,以及为什么在机器学习模型的训练过程中需要它们。

我们还将发现不同类型的曲线,它们的用途,以及如何解释它们以充分利用学习过程。

在本文结束时,我们将获得避免现实生活中机器学习训练中常见问题所需的理论和实践知识。准备?让我们开始吧!

与人们通常的想法相反,机器学习远非完全自动化。它需要大量的“保姆”;监视、数据准备和实验,尤其是在新项目的情况下。在所有这些过程中,学习曲线起着根本性的作用。

我们在学习过程中使用这些图表来监控模型的演变,以便我们可以诊断问题并优化预测性能。

其他非常流行的学习曲线的例子是准确性、精度和回忆率。所有这些都捕获了模型性能,因此它们越高,我们的模型就越好。

训练损失表示模型拟合训练数据的优度,而验证损失表示模型拟合新数据的优度。

我们稍后将看到这种组合,但现在,请参阅下面显示这两个指标的典型图:

另一种常见做法是在同一图表中具有多个指标,以及针对不同模型的这些指标。

我们经常在图表中看到这两种类型的学习曲线:

您可以在下面看到机器翻译中的一个示例,显示了两个不同模型(橙色和绿色)的BLEU(性能分数)以及损失(优化分数):

我们可以通过观察学习曲线的演变来检测模型行为中的问题。

接下来,我们将看到可以找到的模型行为检测的每个不同场景:

让我们快速回顾一下这些概念是什么:

我们可以看到它们是紧密相连的,因为模型越有偏差,它就越欠拟合数据。

假设我们的数据是下面的蓝点,我们想提出一个用于回归目的的线性模型:

假设我们是非常懒惰的机器学习从业者,我们提出这条线作为模型:

它已经在训练数据方面做得很糟糕,那么新示例的性能如何?

很明显,它在新示例中的表现与训练数据一样差:

现在,我们如何使用学习曲线来检测我们的模型是否拟合不足?请参阅显示验证和训练成本(损失)曲线的示例:

让我们简要回顾一下这两个概念:

让我们以与之前相同的示例为例,我们希望线性模型近似这些蓝点:

现在,在另一个极端,让我们假设我们是非常完美主义的机器学习实践者,我们提出了一个线性模型,可以完美地解释我们的数据,如下所示:

好吧,我们直观地理解这条线也不是我们想要的。事实上,它符合数据,但它并不代表其中的真实模式。当一个新示例出现时,它将很难对其进行建模。查看一个新示例(橙色):

使用过度拟合模型,它不能很好地预测新示例:

我们如何使用学习曲线来检测模型是否过拟合?我们需要验证和训练损失曲线:

偏差/方差问题的解决方案是找到它们之间的最佳平衡点。

在上面给出的示例中:

一个好的数据线性模型应该是这样的一条线:

因此,当出现新示例时:

我们将做出更好的预测:

我们可以使用验证和训练损失曲线来找到正确的偏差/方差权衡:

代表性数据集反映了来自同一域的另一个数据集中的比例统计特征。

我们可以发现训练数据集相对于验证数据集不具有代表性,反之亦然。

当训练期间可用的数据不足以捕获模型(相对于验证数据集)时,会发生这种情况。

我们可以通过显示一条用于训练的损失曲线和另一条用于验证的损失曲线来发现这个问题:

训练曲线和验证曲线正在改善,但它们之间存在很大差距,这意味着它们就像来自不同分布的数据集一样运行。

当验证数据集未提供足够的信息来评估模型的泛化能力时,会发生这种情况。

第一种情况是:

如我们所见,训练曲线看起来不错,但验证函数在训练曲线周围嘈杂地移动。

可能是验证数据稀缺且不能很好地代表训练数据的情况,因此模型很难对这些示例进行建模。

第二种情况是:

在这里,我们发现验证损失比训练损失好得多,这反映了验证数据集比训练数据集更容易预测。

一种解释可能是验证数据稀缺,但由训练数据集广泛表示,因此模型在这几个示例中表现非常好。

无论如何,这意味着验证数据集不代表训练数据集,因此存在代表性问题。

在本教程中,我们回顾了理解学习曲线背后的概念以及如何使用它们所需的一些基本概念。

接下来,我们学习了如何解释学习曲线以及如何使用它们来避免常见的学习问题,如欠拟合、过度拟合或不具有代表性。

THE END
1.机器学习入门知识八、学习机器学习的资源 前言 随着人工智能的发展,作为人工智能中的一个基础且重要的分支——机器学习也是愈发吸引大家来了解以及学习,那么在学习机器学习前,我们需要先来了解一下什么是机器学习,以及机器学习中涉及了哪些内容。 一、机器学习是什么? 机器学习(Machine Learning,ML)是人工智能(AI)领域的一个分支,致力https://blog.csdn.net/CYTLOVELY/article/details/143833863
2.什么是机器学习?数据科学NVIDIA术语表什么是机器学习?其工作原理是什么? 简而言之,机器学习就是训练机器去学习,而不需要明确编程。机器学习作为 AI 的一个子集,以其最基本的形式使用算法来解析数据、学习数据,然后对现实世界中的某些内容做出预测或判断。 换句话说,机器学习使用算法从输入到机器学习平台的数据中自动创建模型。典型的程序化或基于规则的系https://www.nvidia.cn/glossary/data-science/machine-learning/
3.机器学习:从基础到实践那么,什么是机器学习?简单来说,机器学习是人工智能的一个分支,它使用算法让计算机系统从数据中学习并做出预测或决策。一、机器学习基础机器学习的基础包括监督学习、无监督学习和强化学习。 监督学习:在这种方法中,我们有一个带有标签的训练数据集,算法通过学习输入和输出之间的关系来预测新的未知数据。例如,在图像识别https://developer.baidu.com/article/detail.html?id=2865599
4.机器学习中的特征空间腾讯云开发者社区声明:这篇博文主要是对参考文献中的那个PPT的学习之后记下的一些笔记,整理出来与大家一起分享,若笔记中有任何错误还请不吝指出,文中可能会使用到原作者的一些图,若侵犯到作者的权益,还请告知,我会删除,谢谢。 一、机器学习的流程 应用机器学习算法的流程大致可以分为: https://cloud.tencent.com/developer/article/1066396
5.机器学习课件机器学习课件-1.机器学习中的数学.pdf 90页VIP内容提供方:1243595614 大小:5.47 MB 字数:约2.99万字 发布时间:2017-11-05发布于浙江 浏览人气:491 下载次数:仅上传者可见 收藏次数:1 需要金币:*** 金币 (10金币=人民币1元)机器学习课件-1.机器学习中的数学.pdfhttps://max.book118.com/html/2017/1102/138623170.shtm
6.机器学习中常见分类方法【嵌牛导读】机器学习的分类方法,你知道几种? 【嵌牛鼻子】决策树,基于规则分类,最近邻分类,朴素贝叶斯,人工神经网络,支持向量机 【嵌牛提问】这几种分类方式各自适用于什么样的数据? 【嵌牛正文】 Content 1. 决策树分类(链接:http://blog.csdn.net/github_36299736/article/details/52749999) https://www.jianshu.com/p/45fdbdeb186b
7.Pandas在数据分析和机器学习中的应用及优势pythonPandas在数据分析和机器学习中的应用及优势 Pandas是Python中用于数据处理和数据分析的库,它提供了灵活的数据结构和数据操作工具,包括Series和DataFrame等。Pandas还支持大量数据操作和数据分析功能,包括数据清洗、转换、筛选、聚合、透视表、时间序列分析等 + 目录https://www.jb51.net/article/282879.htm
8.机器学习中的数据清洗与特征处理综述如上图所示是一个经典的机器学习问题框架图。数据清洗和特征挖掘的工作是在灰色框中框出的部分,即“数据清洗=>特征,标注数据生成=>模型学习=>模型应用”中的前两个步骤。 灰色框中蓝色箭头对应的是离线处理部分。主要工作是: 1.从原始数据,如文本、图像或者应用数据中清洗出特征数据和标注数据。 https://weibo.com/p/1001603859029393857056
9.机器学习中低精度计算产生高准确度结果的解决方案有人认为,用低精度训练机器学习模型会限制训练的精度,事实真的如此吗?本文中,斯坦福大学的DAWN人工智能研究院介绍了一种名为bit recentering的技术,它可以用低精度的计算实现高准确度的解决方案。以下是论智对原文的编译,文末附原论文地址。 低精度计算在机器学习中已经吸引了大量关注。一些公司甚至已经开始研发能够原https://www.elecfans.com/d/654475.html
10.教程:在PowerBI中生成机器学习模型在包含训练数据和标签信息的表的“操作”列表中,选择“应用 ML 模型”图标,然后选择“添加机器学习模型”。 创建机器学习模型的第 1 个步骤是确认历史数据,包括想要预测的结果字段。 通过学习此数据创建模型。 在这种情况下,你想要预测访问者是否会进行购买。 要预测的结果位于“收入”字段中。 选择“收入”作为“https://docs.microsoft.com/zh-cn/power-bi/service-tutorial-build-machine-learning-model
11.「机器学习」准确率精确率召回率F1分数ROCAUC在机器学习中衡量一个模型是否准确我们有很多指标: 准确率 - accuracy 精确率 - precision 召回率 - recall F1分数-F1 score ROC曲线下面积 - ROC-AUC (area under curve) 那么,这些指标到底都是什么呢?各自有什么优缺点呢?笔者在了解这些指标的时候是在网上各大网站(CSDN、博客园、知乎)上找文章学习的。但是https://www.flyai.com/article/683
12.谭庆收(博士)1.国家自然科学基金面上项目,噪声环境中机器学习辅助的量子计量学 研究,批准号:12275077,2023年1月至2026年12月。 2.国家自然科学基金青年项目,超冷原子腔光机械系统中的量子效应及 应用,批准号:11805047,2019年1月至2021年12月。 3.国家自然科学基金地区项目,玻色-爱因斯坦凝聚体中偶极-偶极与三 https://wdxy.hnist.cn/info/1102/4517.htm
13.机器学习中用来防止过拟合的方法有哪些?为什么在机器学习中比较常见?这是因为机器学习算法为了满足尽可能复杂的任务,其模型的拟合能力一般远远https://www.zhihu.com/question/59201590