在线元学习:通过持续元学习解决传统机器学习方式的致命不足

【新智元导读】传统机器学习正在凸显它的不足。为了解决此问题,伯克利大学人工智能实验室教授继2017年提出元学习后,又提出在线元学习。不仅可以解决传统学习的不足,同时也弥补了元学习缺乏持续学习的缺陷。

传统机器学习正在凸显它的不足。

传统的机器学习研究模式需要获取特定任务的大型数据集,然后利用这个数据集从头开始训练模型。面对数据量不足的新任务时,这种方式显然无法胜任。

解决上述问题的新理论:在线元学习

最近,伯克利大学人工智能实验室,SergeyLevine教授和同事切尔西·芬恩博士、领先的机器学习理论专家ShamKakade及其学生、华盛顿大学的AravindRajeswaran,进行了一些非常有趣的工作。

Levine教授多年来一直致力于将机器人技术,更多地转向一种综合“学习”方法:即让机器人或智能体,学会“学习”(Learningtolearn),即“元学习”。

元学习中,神经网络在某种意义上是对某些任务进行预先训练的,然后允许它实现一种技能转移,使用新的、不同于训练好的数据进行测试。此举的目标,是训练计算机能够处理前所未有的新任务。

要完成我们开头描述的新挑战,需要将所需的数据量尽可能的减少,以应对神经网络面临的一些新任务,例如可能没有大量可用的训练数据,或者没有大量已标记的训练数据。

在arXiv的一篇“在线元学习”论文中,作者描述了实现的可能性。(链接地址在文末)。与在线元学习并行的是,计算机正在学习如何及时扩展其对实例的理解,从某种意义上提高其理解能力。

此项研究已经与Levine的其他工作相呼应,例如哪些更接近机器人技术本身的成果。

了解在线元学习

在线元学习的诞生之前,Levine和他的团队在2017年开发了一个广泛的系统,称为“模型无关的元学习(MAML)”。

这种方法可以匹配任何使用梯度下降算法训练的模型,并能应用于各种不同的学习问题,如分类、回归和强化学习等。

为了解决这个问题,作者借鉴了另一条长长的研究线索:在线学习。

在线学习中,神经网络通过比较每个新任务的参数中,不同的可能设置之间的差别,来进行不断优化。

该神经网络寻求以这种方式找到其参数的解决方案,将任务的实际性能与最佳性能之间的差异,即最小化“regret”。

作者提出了“followthemeta-leader”算法,这是一个将“元学习”这个术语与最成功的“在线学习”算法相结合的词汇。

值得一提的是,“followtheleader”的,最早是在20世纪50年代,JimHannan为博弈论领域。

智能体被赋予一系列任务,这些任务在一轮又一轮不断的进行。例如经典MNIST数据集中的数字图像,或者对场景中的对象执行“姿势预测”,或对物体进行分类。

而所有这一切都通过经典的神经网络优化方法,随机梯度下降来实现。作者将这些任务与先前的方法相比后,展示了了一些令人印象深刻的基准测试结果。

在线元学习的缺陷

论文最后得出的观点是:这种方法在某种意义上说,是站在一种更偏自然过程的角度,来实现理想的现实世界学习过程,因为它包含“与不断变化的环境相互作用的智能体”。

正如作者提到,这个事实“应该利用流算法的经验来掌握手头的任务,并且在未来学习新任务时变得更加熟练。”

但是,万事都不是完美的。在线元学习也有一些弱项,算力就是一个非常典型的例子。

将来需要进行一些改进以维护过去任务的数据,从而得出一些使用“更便宜算力”的算法。

可扩展性也是一个非常大的问题。作者说虽然这种方法可以有效地按顺序,学习近100项任务而不会对计算或内存造成重大负担,但可扩展性仍然是一个问题。

而像mirroe下降这样,不能存储所有过去经验的流算法,是否能成功也是一个未知数

THE END
1.推荐算法中的在线学习和离线学习有何区别,各自的优缺点是什么在实际应用中,可以根据具体的场景需求来选择在线学习或离线学习,也可以结合两者的优势进行混合使用。例如,在推荐系统中可以使用离线学习来训练初始模型,在线学习来实时更新模型参数,以实现更好的推荐效果和用户体验。 综上所述,在线学习和离线学习各有优缺点,具体选择取决于应用场景和需求。0https://www.mbalib.com/ask/question-ec5c1bbee149c6534d0a725ffdb15235.html
2.在线学习与离线学习离线和在线学习方法机器学习算法可以分成两类。离线学习和在线学习。 在离线学习算法中,我们会有一个训练集,这个训练集包含多个训练实例。每个训练实例都认为是以某个概率分布从实例空间中独立同分布地抽取。我们的目标是根据这个训练样本构造一个分类器,使得其真正训练错误最小。‘ https://blog.csdn.net/hedan2013/article/details/78011600
3.强化学习的基本概念在线学习和离线学习针对的是在强化学习模型在训练过程中交互数据的使用方式。在线学习的强化学习模型,会在一个交互之后,立即用本次交互得到的经验进行训练。而离线学习的强化学习模型,往往是先将多个交互的经验存储起来,然后在学习的时候,从存储的经验中取出一批交互经验来学习。 https://www.jianshu.com/p/28625d3a60e6
4.行为强化对儿童和成人的在线和离线动作学习的影响这些结果可能与年龄相关的大脑成熟有关,儿童大脑的可塑性比成人更高,有更大的潜力提高自身的行为表现。另外,平均6小时的离线学习或平均12小时的离线学习都可能帮助儿童大脑进行动作记忆的整理、动作巩固和动作技能的迁移。本文将围绕行为强化在动作在线学习和离线学习的意义上进行讨论。https://cdmd.cnki.com.cn/Article/CDMD-10590-1017812152.htm
5.在线学习课程PADIPADI 在线水肺培训 无论何时何地,只要您都可根据自己的安排开始您的数字化潜水培训。 在繁忙的生活中,PADI 在线学习是完成水肺潜水课程的最简单的方式。 您可以使用电脑或移动设备,自行安排在线或离线学习。 准备就绪后,随时开始安排水下训练。查看在线课程 https://www.padi.com/zh-hans/padi-elearning
6.和学在线App排行榜华为手机和学在线app推荐学堂云移动端为学生们提供学习支持,覆盖学生线上学习的每个环节。在这里,你可以观看教学视频、完成作业,同时还能查看公告、讨论答疑。云端同步记录学习进度,帮助你掌握学习动态,反馈学习疑惑。【公告同步】教师可发布并置顶公告,公告显示在课程页上方,不用担心错过重要公告,随时掌握课程动态。【视频离线】支持学生将视频https://www.diandian.com/phb/1392/2-1.html
7.学习公社APP操作手册在无网络时学员可点击导航栏【个人】,选择离线缓存,找到此视频,进行观看。进入有网络的环境中,再次打开学习公社app,观看的学时会自动上传更新。 九、帮助中心 点击导航栏【个人】,选择帮助中心,可以选择留言咨询、在线客服或者服务电话。 十、设置 点击导航栏【个人】,选择设置,可对app设置进行浏览和修改。https://jgdw.ccit.edu.cn/info/1027/1157.htm
8.推荐系统遇上深度学习(十四)1)提出了一种强化学习的框架用于在线新闻的个性化推荐 2)使用用户活跃度作为一种新的反馈,来提高推荐的准确性 3)使用了一种更加高效的探索算法:Dueling Bandit Gra- dient Descent 4)模型可以进行在线学习和更新,在离线和在线实验上的表现都超过了传统的算法。 https://cloud.tencent.com/developer/article/1164769
9.学习中心离线版v2.0.2下载学习中心离线版2022最新版下载学习中心离线版是一款学习软件,它包含了许多我们生活中需要用到的功能。这款软件拥有简洁的界面,但是它的功能很强大。我们无论是在日常生活中还是在办公的过程当中,都可以使用这款软件作为我们的工具。 软件简介 学习中心离线版官方版是一款十分专业且内容丰富实用的在线学习软件,学习中心离线版官方版支持离线学习功能,https://soft.3dmgame.com/down/230487.html
10.美河学习在线美河学习在线(主站) eimhe.com?论坛 今日:177|昨日:128|帖子:355193|会员:223943|欢迎新会员:hxy1664 最新回复 下载桌面快捷访问 美河学习在线 www.eimhe.com - IT认证超级社区 更多IT认证热门资源请访问 美河学习在线 - 完美超乎想象 信赖拥有值得! https://eimhe.com/
11.离线强化学习在线强化学习分类离线训练平台离线强化学习 在线强化学习 分类 离线训练平台,Apollo无人驾驶平台的离线搭建与使用1.准备工作2.安装相关依赖环境2.1安装ubuntu16.042.2安装ROS环境2.3安装docker2.4加载docker的镜像3.使用Apollo仿真平台3.1启动并进入docker3.2编译与运行对于学习无人驾驶的人来说,apollhttps://blog.51cto.com/u_12195/10796191
12.争学网官方版争学网最新版下载2.1.27无论是想提升职业技能、学习兴趣爱好,还是备考各类考试,争学网都能为用户提供丰富的学习资源。 软件特色 1、提供在线测试的综合服务,是能评估用户学习效果的; 2、记录用户学习历史,方便用户复习和追溯的一个程序; 3、每个课程都是由专业人员设计,具有很高的质量。 软件功能 1、软件能支持在线学习和离线下载,让用户https://www.qimu86.com/soft/66139.html
13.线上线下融合教学的优势不足与发展策略内容首先,在教学方式上:以信息网络的学习平台为载体,以现代信息技术为媒介,依靠手机,平板电脑等个人智能终端设备,实现线上线下学习与线下的交互学习。学习内容:根据时间分为课前准备,课中教学和课后辅导三个阶段;按空间分为在线和离线;按照对知识点的解释,重构,将学习分解为学习,内化和外化三个阶段,全方位传授学习内容;https://tpd.xhedu.sh.cn/cms/app/info/doc/index.php/92024
14.全国碳交易能力建设培训中心在线学习平台全国碳交易能力建设培训中心在线学习平台共提供5大类、100余个碳市场能力建设相关教学视频,支持PC和移动端的高稳定性在线、离线访问,提供高互动、高分享性的学习体验,并配合能力建http://www.tanpaifang.com/tanguwen/2019/0730/64899.html
15.高校学习系统在线学习平台自考乐是一个高校在线学习平台,以大数据和智能化应用为发展路径,综合运用先进成熟的互联网技术,实现广大学生与学习内容、专业课程和知识结构上的精准匹配,能够为各高校定制性能优越、操作便捷、师生欢迎的学习培训平台。 电话:18580070692https://www.zsbxx.cn/