各大公司广泛使用的在线学习算法FTRL详解EENovRain

本文主要会分三个部分介绍,如果对理论产生背景不感兴趣的话,可以直接看第3部分的工程实现(这一部分google13年那篇工程化的paper介绍得很详细):

【问题描述】

对于loss函数+正则化的结构风险最小化的优化问题(逻辑回归也是这种形式)有两种等价的描述形式,以1范数为例,分别是:

a、无约束优化形式的softregularizationformulation:

b、带约束项的凸优化问题convexconstraintformulation:

【批量(batch)算法】

批量算法中每次迭代对全体训练数据集进行计算(例如计算全局梯度),优点是精度和收敛还可以,缺点是无法有效处理大数据集(此时全局梯度计算代价太大),且没法应用于数据流做在线学习。这里分无约束优化形式和约束优化(与上面问题描述可以对应起来)两方面简单介绍一下一些传统批量算法。

b、不等式约束凸优化形式:1、传统的不等式约束优化算法内点法等;2、投影梯度下降(约束优化表示下),gt是subgradient,直观含义是每步迭代后,迭代结果可能位于约束集合之外,然后取该迭代结果在约束凸集合上的投影作为新的迭代结果(第二个公式中那个符号标识向X的投影):

【在线算法】

如上所述,批量算法有自身的局限性,而在线学习算法的特点是:每来一个训练样本,就用该样本产生的loss和梯度对模型迭代一次,一个一个数据地进行训练,因此可以处理大数据量训练和在线训练。常用的有在线梯度下降(OGD)和随机梯度下降(SGD)等,本质思想是对上面【问题描述】中的未加和的单个数据的loss函数L(w,zi)做梯度下降,因为每一步的方向并不是全局最优的,所以整体呈现出来的会是一个看似随机的下降路线。典型迭代公式如下:

这里使用混合正则化项:,例如可能是1范数与2范数强凸项的混合(后面会看到其实很多都是这种混合正则化的格式,而且是有一定直观含义的)。迭代公式中:gt是loss函数(单点的loss,未加和)的subgradient,与gt相加的那一项是混合正则化项中的第二项的梯度,投影集合C是约束空间(例如可能是1范数的约束空间),跟上面介绍的投影梯度下降类似的做法。

1、简单的在线梯度下降很难产生真正稀疏的解,稀疏性在机器学习中是很看重的事情,尤其我们做工程应用,稀疏的特征会大大减少predict时的内存和复杂度。这一点其实很容易理解,说白了,即便加入L1范数(L1范数能引入稀疏解的简单示例可以产看PRML那本书的第二章,我前面一篇blog的ppt里也大概提了),因为是浮点运算,训练出的w向量也很难出现绝对的零。到这里,大家可能会想说,那还不容易,当计算出的w对应维度的值很小时,我们就强制置为零不就稀疏了么。对的,其实不少人就是这么做的,后面的TruncatedGradient和FOBOS都是类似思想的应用;

2、对于不可微点的迭代会存在一些问题,具体有什么问题,有一篇paper是这么说的:theiteratesofthesubgradientmethodareveryrarelyatthepointsofnon-differentiability。我前后看了半天也没看明白,有熟悉的同学可以指导一下。

二、TruncatedGradient、FOBOS以及RDA(RegularizedDualAveraging)

上面提到了,稀疏性在机器学习中是很重要的一件事情,下面给出常见的三种做稀疏解的途径:

1)、简单加入L1范数

下面会提一下FOBOS(Forward-BackwardSplittingmethod,其实应该叫FOBAS的,历史原因)以及RDA,因为后面的FTRL其实相当于综合了这两种算法的优点:

a、FOBOS,google和伯克利09年的工作:

b、RDA(Regularizeddualaveraging),微软10年的工作,更加理论性一些,这里就直接略过去了,仅对其特点做一个简单介绍:

ok,背景和一些铺垫终于完成了,下面重点进入FTRL的部分。。。

三、FTRL(Follow-the-regularized-Leader)

【发展历程】

FTRL的理论推进和工程应用首先要感谢这个人:H.BrendanMcMahan,google这哥们儿护了三年的坑,直到13年工程性paper出来。发展历程和基本说明如下:

–10年理论性paper,但未显式地支持正则化项迭代;11年证明regretbound以及引入通用的正则化项;11年另一篇的paper揭示OGD、FOBOS、RDA等算法与FTRL关系;13年的paper给出了工程性实现,并且附带了详细的伪代码,开始被大规模应用。

1)PoissonInclusion:对某一维度特征所来的训练样本,以p的概率接受并更新模型;

2.浮点数重新编码

[1]J.Langford,L.Li,andT.Zhang.Sparseonlinelearningviatruncatedgradient.JMLR,10,2009.(截断梯度的paper)

[2]H.B.McMahan.Follow-the-regularized-leaderandmirrordescent:EquivalencetheoremsandL1regularization.InAISTATS,2011(FOBOS、RDA、FTRL等各种方法对比的paper)

[3]L.Xiao.Dualaveragingmethodforregularizedstochasticlearningandonlineoptimization.InNIPS,2009(RDA方法)

[4]J.DuchiandY.Singer.Efficientlearningusingforward-backwardsplitting.InAdvancesinNeuralInformationProcessingSystems22,pages495{503.2009.(FOBOS方法)

[5]H.BrendanMcMahan,GaryHolt,D.Sculley,MichaelYoung,DietmarEbner,JulianGrady,LanNie,ToddPhillips,EugeneDavydov,DanielGolovin,SharatChikkerur,DanLiu,MartinWattenberg,ArnarMarHrafnkelsson,TomBoulos,JeremyKubica,AdClickPrediction:aViewfromtheTrenches,Proceedingsofthe19thACMSIGKDDInternationalConferenceonKnowledgeDiscoveryandDataMining(KDD)(2013)(这篇是那篇工程性的paper)

[6]H.BrendanMcMahan.Auniedanalysisofregular-izeddualaveragingandcompositemirrordescentwithimplicitupdates.Submitted,2011(FTRL理论发展,regretbound和加入通用正则化项)

[7]H.BrendanMcMahanandMatthewStreeter.Adap-tiveboundoptimizationforonlineconvexoptimiza-tion.InCOLT,2010(开始的那篇理论性paper)

THE END
1.数字技术改变传统课堂辽宁省沈阳市博才初级中学学生在智慧课堂上进行英语听说学习。 图片来源:视觉中国 数字时代,如何利用先进的技术推进教育数字化转型、探索智慧教育,受到全世界的共同关注。2月13日至14日,世界数字教育大会在北京召开。中国作为主办方在会上展示了众多数字化教育的应用案例,在5G、AI、大数据等新兴技术的支撑下,传统的教学https://www.tjjw.gov.cn/llsy/2023/02/20/detail_2023022072045.html
2.浅谈在线教育和传统教育的区别最近几年在线教育比较火,所以笔者在这里就浅谈在线教育和传统教育的区别 在线教育主要与网络为载体,改变传统教育教师主宰课堂的局面,使得学生成了学习的主体。 目前,主流的教育还是采用传统大课堂讲课、手工批…https://zhuanlan.zhihu.com/p/26960138
3.在线学习与传统面对面学习相比有何不同?在线学习和传统面对面学习在灵活性、自主学习、互动性、学习资源和评估方式等方面存在差异。https://www.mbalib.com/ask/question-10dcab6ded109f100675365c828af19f.html
4.在线学习方法概述腾讯云开发者社区推荐系统算法常常用到逻辑回归算法,而传统的批量学习算法如 SGD 无法应对大规模、高维的数据集和实时数据流。为了解决这个问题,在线最优化算法如 TG [1]、FOBOS [2]、RDA [3]、FTRL [4,5,6] 应运而生,下面将介绍、对比这些算法。https://cloud.tencent.com/developer/article/1561719
5.在线学习评价的模式与策略动作技能领域涉及骨骼和肌肉的使用、发展和协调。受到时空分离等因素的限制,在线教育关于动作技能领域的评价较为弱化。 在线学习的评价与传统的不同 由于在线学习与传统学习的教育模式在环境、动机、元认知、过程、结果在等方面存在差异,在学习评价中,应当兼顾在线学习的特点,而非将传统学习的评价进行直接迁移。 https://nic.hyit.edu.cn/info/1131/1614.htm
6.在线学习心得体会(精选22篇)一是在线学习具有科学性。传统的课堂学习多是指定学习课题,学员的自主选择少,而在线学习的课程多,可选择面广,学员可根据个人工作需要、兴趣爱好进行课程选择和学习,有效地使学员从“要我学”转变为“我要学”,从而及时弥补自己急需掌握的知识,提高自己的工作能力、理论素养和个人修养,使学习更有效果。 https://www.yjbys.com/xuexi/xinde/3586035.html
7.问鼎云学习在线学习平台重塑在线学习新生态在数字化转型浪潮席卷全球的今天,教育与学习方式正经历着前所未有的变革。从传统的教室讲授到现在的在线学习,技术的进步为知识获取打开了新的窗口。问鼎云学习在线学习平台,不仅满足了个人自主学习的需求,更激发了团队合作学习的潜力,打造了一个集高效性、互动性、趣味性与个性化于一体的在线学习新天地。 https://www.wdxuexi.com/dry-stock-sharing/513515
8.如何实现在线学习的有效互动和个性化—中国教育在线是继MOOC之后改革发展而来的新型教学方法,其借鉴并吸收MOOC在技术平台和知识点的设计优势,通过线上线下、翻转课堂、微课、云课堂等多种教学手段的融合,在很大程度上不但改变成人教育的教学模式,还为学生的学习带来了更多的便利,增强互动性体验,激发了学生学习兴趣,改善了网络在线学习受限于互动,传统课堂学习受限于时空的https://cdce.eol.cn/1031/353032.html
9.在线学习的好处与坏处在线学习自诞生以来人们对其就褒贬不一,家长对孩子在线教育的不放心可以理解。其实,任何一种教育方式的存在,都有他的优缺点,这也包括家长们已经接受了的传统教育模式即班级授课制,接下来就跟随小编一起来了解一下 在线学习的好处与坏处吧 一、在线学习的好处 http://gaoweifuwu.com/pch5/article.php?id=1401
10.传统教学与在线教学的优缺点对比!传统教学在面对面互动、集体学习氛围、结构化教学和资源丰富方面具有优势,但受限于时间地点、个性化不足、资源不均衡和成本较高。在线教学则在灵活性高、个性化学习、资源共享、成本较低和技术支持方面表现突出,但面临缺乏面对面互动、自律性要求高、技术问题、社交机会减少和学习体验差异等挑战。https://m.grazy.cn/article/21599.htm
11.在线学习平台可以随时随地汲取智慧在现代社会中,随着互联网的快速发展,人们的学习方式也发生了巨大变化。与传统的教室教学相比,在线学习平台成为了一种更加方便、灵活的学习方式。通过在线学习平台,学习者可以随时随地汲取智慧,实现自主学习的目标。在线学习平台的优势在于它的灵活性。学https://www.yfhl.net/news/1035.html
12.在线学习和远程教育有什么区别?文章摘要:远程教育和在线学习是传统课堂之外的两种学习模式。虽然经常互换使用,但它们有关键的区别。在线学习是指与两个或两个以上的人进行虚拟互动,无论地点或时间如何。另一方面,远程教育是为无法参加常规课程的学生设计的。两者都具有灵活性、可访问性、成本效益等优势,以及缺乏互动、互联网连接问题和沟通差距等挑战https://www.pxemba.com/news/doctor231107030534023.html
13.在线学习很好,对于学习有很大的帮助,有的人则认为传统的学习a不过对于同一事情,不同的人有不同的看法,有人认为,在线学习很好,对于学习有很大的帮助,有的人则认为传统的学习模式好,因为网络在线学习会让学生产生懒惰思想。 But regarding the identical matter, the different person has the different view, some people believed, the online study is very good, has thehttp://riyu.zaixian-fanyi.com/fan_yi_3639175
14.在线学习的特点1.能够相对自在的组织时  能够自己决议何时学习,早上,下午,晚上,夜晚能够依照自己的作业,学业或者自己答应的时刻,老师也会针对你个人来设定学习方案。随时可学,不比传统的授课形式需求翻山越岭,有时刻的局限性。  2.节省成本  比方http://www.newstartsoft.com/Html/084c6e01-a790-42e6-940e-84f7d08fdc7d.html
15.在线学习Excel,提升你的数据处理技能!5. 在线学习和传统课堂学习有什么不同? 在线学习Excel提供了更大的灵活性和自主学习的机会。你可以根据自己的进度和时间表学习,在线与导师和其他学生交流,并进行实践项目。 结论 在线学习Excel是提升数据处理技能的有效方式。通过选择合适的课程,你可以灵活学习,并与导师互动,从而更好地掌握Excel技能,并在学业和职业中https://www.huoban.com/news/post/155002.html
16.大学生在线英语学习调查问卷调查派4. 您觉得以下哪种内容采用在线学习方式会有更好的效果,其成效优于线下传统学习方式?*(必填, 多选, 至少选择1项) 1)语法2)词汇 3)听力4)口语 5)写作6)翻译 7)阅读8)其他 5. 您会对如下哪类在线英语学习内容感兴趣?*(必填, 多选, 至少选择1项) https://www.diaochapai.com/survey/06d9db38-d193-431c-bcb7-9a0c314d290e
17.热门线上补课预约LOL学习在线开班平台蓝眼科技(云学)LOL学习在线开班平台提供了云端学院开班平台和学员缴款金流等全方位服务,让各行各业能够借由学习在线的平台来开设自己的课程。这个平台不受现实环境的限制,用户可以自己决定开课的学院、影片数量、价格、行销模式、以及课程销售前后的客户服务。此外,学习在线开班平台也https://lol.itraining.com.tw/index-cn.php
18.停课不停学线上学习情况研究报告(通用10篇)综上所述,线上网课教学和传统课堂教学对比,各有利弊。老师们在应用中尽量扬长避短。发挥出网课便捷、资源丰富、不受时间地域限制等优势。同时也要尽可能关注学生学习动态,调整教学思路方法,提高线上教学的实效性。 另外,随着社会发展,5G网络技术的普及,线上教学是大势所趋,我们要顺应时代发展,尽早学会各种信息化教学https://www.unjs.com/fanwenku/311279.html
19.数字化时代全新学习模式探索,开卷在线引领潮流开卷在线是一个致力于数字化时代学习模式创新的平台。它提供了一个便捷、高效的学习环境,让学生和教师能够随时随地享受在线学习的便利。通过开卷在线,人们可以探索全新的数字化学习模式,打破传统学习的束缚,实现个性化、灵活多样的学习方式。这个平台融合了先进的教育技术,支持在线课程、学习社区、智能评估等多种功能,助力http://www.cy-info.cn/post/27167.html
20.美国麻省理工学院创新教学实践的具体做法:从学习科学视角学习科学不仅注重教,也注重学,重视学生的学习过程。混合学习主要采取在线学习和面授相结合的学习方式[20]。翻转课堂将传统教学模式翻转,让学生提前观看教学视频,在课上进行知识的内化。两者都是对传统教学模式的更新。大规模在线开放课程MOOC的出现,为教育的普及与发展带来新的可能性,促进高校教育利用MOOC进行创新教学的https://maimai.cn/article/detail?fid=1536388886&efid=TEkQvu2MMDlLjVmxiu1_yA
21.数据驱动的精准化学习评价机制与方法而且囿于数据和技术的双重缺失,传统学习评价与反馈结果呈现出模糊性和延时性等特征,这制约了其价值实现。随着信息技术与教育的深度融合,学习环境、学习内容、学习交互方式发生翻天覆地的变化,学习评价也随之发生变化。依据教学评价场景的不同,本文从大规模学习评价、课堂学习评价和在线学习评价三个方面,对信息时代学习评价https://www.fx361.com/page/2021/0226/7597189.shtml
22.《斯坦福在线学习》:在线学习并不猛如虎,运用得当而是如虎添翼鉴于线上学校的特殊性,斯坦福在线中学取消了传统的照本宣科式的“课堂”,推出了小班制的”翻转式课堂”。所谓的翻转式课堂,就是学生课外自主预习课程内容,课堂的时间用来进行学生之间或师生之间的讨论互动、解题等参与式的学习。斯坦福在线学校每堂课的上课人数一般为12人,大家在预习的基础上,在课堂上进行讨论,每个https://book.douban.com/review/14448365/
23.线上线下混合式教学模式:优缺点分析改进建议和实践探索线上线下混合式教学模式在教育领域的应用日益广泛,它融合了传统面对面教学和现代在线教育的优点,为学生和教育者提供了更灵活、多样化的学习和教育体验。 本文将探讨线上线下混合式教学模式的优点、挑战以及改进建议,同时通过实践探索和案例分享,展示这一教学模式的实际应用和价值。 https://content.edusoho.com/detail/139