一份机器学习模型离线评估方法的详细手册读完分类与回归算法的评估指标以及排序算法的评估指标之后,你已经知道了机器学习中分类

首先需要知道的是,机器学习想要能够解决业务中的问题,简单可以分为两个阶段:离线和线上(离线指的是模型未部署到生产环境之前,线上是指模型部署到生产环境之后)。在离线阶段,首先需要先训练一个模型,然后对训练好的模型进行离线评估来了解下模型的性能情况。

留出法(hold-out)是指将数据集D划分成两份互斥的数据集,一份作为训练集S,一份作为测试集T,在S上训练模型,在T上评估模型效果。

留出法的优点是简单好实现,但是也会有一些明显的缺点。比如说划分后的训练集和测试集的大小会严重影响模型最终的评估结果。如果说训练集S比较大,测试集T比较小,那么评估结果的不够稳定准确,可信度较低;如果说训练集S比较小,测试集T比较大,那么得到的模型很可能与全量数据集D得到的模型有很大的差别,这就降低了评估结果的真实性。通常的做法是,将全量数据集的2/3~4/5的样本作为训练集,剩余样本作为测试集。

除了划分得到的训练集S和测试集T的数据量会影响评估结果外,它们的数据分布也会影响评估结果,尽量保证训练集S和测试集T的数据分布一致,避免由于数据划分引入额外的偏差而对最终结果产生影响。举个具体的例子来说明,有一个包含了1500条正样本和1500条负样本的数据集,现在使用二分类模型来进行自动分类,假设将1/3的数据作为测试集,应该使得测试集正负样本均在500条左右;如果测试集由50条正样本和950条负样本组成,那么评估结果将会因为样本分布差异而导致很大的偏差。

因此,考虑到单次留出法的结果往往不够稳定可靠,我们一般会进行多次留出法实验,每次随机划分,最终将多次得到的实验结论进行平均。

但是在实际工作中,如果不分场景,任何时候都是用随机划分数据集可能会导致一些其他的问题,比如说数据泄露(穿越问题)等。

很明显,交叉验证评估结果的稳定性和保真性在很大程度上取决于k值的大小,所以交叉验证也叫做k折交叉验证(k-foldcrossvalidation)。k常用的取值有5、10和20。

假定数据集D中包含了m个样本,若令k=m,则得到了交叉验证法中的一个特例:留一法(leave-one-out,简称LOO)。留一法的优缺点都很明显。训练m个模型,每个模型基本上用到了全部的数据,得到的模型与全部数据集D得到的模型更接近,并且不再受随机样本划分方式的影响。但是当样本太多时,即m很大时,计算成本非常高。

由于存在不平衡分类问题(分类问题中样本里包含的标签的数量失衡,比如二分类中样本量包含的正负样本比例为10:1),基于此,存在一种叫做分层k折交叉验证法(stratified-k-fold)。这种方法对每个类别进行k折划分,使得每份数据子集中各类别的数据分布与完整数据集分布相一致。比如二分类中进行分层5折交叉验证,正样本有300条,负样本有30条,将数据划分成5分,并且每份数据中有60条正样本,6条负样本。

自助法(bootstrapping)以自主采样(bootstrapsampling)为基础,使用有放回的重复采样的方式进行训练集、测试集的构建。比如为了构建m条样本的训练集,每次从数据集D中采样放入训练集,然后有放回重新采样,重复m次得到m条样本的训练集,然后将将没有出现过的样本作为测试集。

这也就意味着,当数据量很大时,大约有36.8%的样本不会出现在训练集中,也就是这些样本都会作为测试集。

留出法和交叉验证法在训练模型时用的数据都只是整个数据集D的一个自己,得到的模型会因为训练集大小不一致导致一定的偏差。而自助法能够更好地解决这个问题。但自助法改变了初始数据集的分布,会引入估计偏差,所以在数据量足够时,一般采用留出法和交叉验证法。

参考:

[1]周志华.机器学习.第二章第二节(评估方法)[2]美团算法团队.美团机器学习实战.第一章第三节(交叉验证)

THE END
1.机器学习:在线学习和离线学习区别本文对比了在线学习和离线学习在数据获取、训练频率、应用场景和计算成本方面的差异,通过SGDClassifier和LogisticRegression实例展示了两者的工作原理。在线学习适合实时环境,离线学习适合稳定数据。 摘要由CSDN通过智能技术生成 机器学习中的在线学习(Online Learning)和离线学习(Offline Learning)是两种不同的学习方式,它们在数https://blog.csdn.net/weixin_41194129/article/details/132998721
2.机器学习中在线学习批量学习迁移学习主动学习的区别电子decremental learning递减学习,即抛弃“价值最低”的保留的训练样本。这两个概念在incremental and decremental svm这篇论文里面可以看到具体的操作过程。 七、在线学习与离线学习offline learning and online learning. In offline learning, the whole training data must be available at the time of model training. http://eetrend.com/node/100016949
3.机器学习RLHF:在线方法与离线算法在大模型语言模型校准中的简介:【机器学习】RLHF:在线方法与离线算法在大模型语言模型校准中的博弈 一、引言 在人工智能领域,大型语言模型(LLM)的校准已成为一个备受关注的热点。基于人类反馈的强化学习(Reinforcement Learning from Human Feedback,简称RLHF)作为一种有效的校准方法,已逐渐在GPT-4、ChatGPT等先进模型中展现出其独特优势。然而https://developer.aliyun.com/article/1542161
4.qlearning多智能体强化学习多智能体概念最近在学习多智能体的强化学习,看了几篇高质量基础论文,发现还是很有必要将强化学习的体系简单过一遍,然后再有针对性地练习代码。 1.强化学习简介 1.1 强化学习概念 强化学习与监督学习、非监督学习都属于机器学习,是人工智能的范畴。值得一提的是深度学习也是机器学习的一种范式,深度学习在机器学习的基础上优化了数https://blog.51cto.com/u_16099283/11852182
5.SklearnTensorFlow与Keras机器学习实用指南第三版(一机器学习海啸 2006 年,Geoffrey Hinton 等人发表了一篇论文,展示了如何训练一个能够以最先进的精度(>98%)识别手写数字的深度神经网络。他们将这种技术称为“深度学习”。深度神经网络是我们大脑皮层的(非常)简化模型,由一系列人工神经元层组成。在当时,训练深度神经网络被普遍认为是不可能的,大多数研究人员在 1990 年https://cloud.tencent.com/developer/article/2420382
6.从8个维度全面比较机器学习算法不同的 ML 算法会有不同的偏差 - 方差权衡,偏差误差来自于模型偏向于特定解或假设的事实。例如,在非线性数据上拟合线性决策边界时,偏差较大。另一方面,是方差测量模型方差带来的误差,它是模型预测与期望模型预测的均方差。 5. 在线和离线 在线和离线学习是指机器学习软件学习更新模型的方式。在线学习意味着可以一次https://time.geekbang.org/column/article/226084
7.2020届计算机科学方向毕业设计(论文)阶段性汇报推荐系统与用户进行多步交互的过程可以建模为马尔科夫决策过程并使用强化学习算法训练推荐策略,但在真实的工业界场景中,在线上进行强化学习模型的训练成本极高。本课题希望使用推荐系统与用户交互的历史数据离线训练强化学习算法,并探讨这一模式的问题解决方式。 https://zhiyuan.sjtu.edu.cn/html/zhiyuan/announcement_view.php?id=3709
8.服务价格机器学习服务服务价格 价格华为机器学习服务从2022年1月1日起,针对超过免费额度的部分,需要按照超过部分的使用量进行收费。同时,华为机器学习服务部分子服务实施试用期免费的计费政策,试用期为2022年1月1日……欲了解更多信息欢迎访问华为HarmonyOS开发者官网https://developer.huawei.com/consumer/cn/doc/development/hiai-Guides/ml-service-billing-0000001051010023
9.网站工具。涉及大数据几大组件Python机器学习和数据分析机器学习、图像声音处理文章列表 - TinyMind 机器学习-Label Encoding与One Hot的区别-20180513 机器学习与深度学习 - 连载 - 简书 Chrome Extension Downloader——可以通过此网站来下载因为某些原因无法在线安装 Chrome 插件 现在最新版chrome不支持直接离线安装插件了,但还是有办法的,见:Linuxhttps://github.com/josonle/Coding-Now/
10.蚂蚁金服新计算实践:基于Ray的融合计算引擎架构蔡芳芳随着计算和 AI 体系逐步成熟,我们希望机器学习应用能更多地在动态环境下运行、实时响应环境中的变化,这推动了机器学习从传统离线学习逐渐向在线学习演进。相比于传统的离线机器学习,在线学习可以带来更快的模型迭代速度,让模型预测效果更贴真实情况,对于线上的波动更加敏锐。https://www.infoq.cn/article/ualTzk5OwDb1crVHg7c1
11.机器学习,能为5G通信技术带来哪些新挑战?强化学习是基于智能体与外部环境之间的动态交互,可以在线处理数据。智能体通过探索环境和奖励或惩罚行为来学习,并以最佳行动序列优化累积奖励。 图一:人工智能,机器学习,监督学习,无监督学习,强化学习之间的关系 3、机器学习在5G通信中的应用 近年来,全球研究人员对利用机器学习发展5G通信技术表现出了极大的兴趣。接下来https://www.xakpw.com/single/31167
12.干货:功能安全预期功能安全与信息安全的融合与发展然后还有预期功能安全的评估,通过测试确保机器学习预期功能安全是否能达到。 3. 机器学习 & PFMEA安全分析 首先在自动驾驶里面,更多的是用离线学习,离线学习是什么?离线学习是打包好的数据来确认智能驾驶的算法。离线学习的流程是数据标注、数据划分、训练、验证和测试。 https://www.dongchedi.com/article/7234733568507855400
13.一文看懂什么是强化学习?(基本概念+应用嘲+主流算法)在线学习 VS 离线学习 详细请查看《强化学习方法汇总》 百度百科和维基百科 百度百科版本 强化学习(reinforcement learning),又称再励学习、评价学习,是一种重要的机器学习方法,在智能控制机器人及分析预测等领域有许多应用。 但在传统的机器学习分类中没有提到过强化学习,而在连接主义学习中,把学习算法分为三种类型,https://easyai.tech/ai-definition/reinforcement-learning/