各大公司广泛使用的在线学习算法FTRL详解EENovRain

本文主要会分三个部分介绍,如果对理论产生背景不感兴趣的话,可以直接看第3部分的工程实现(这一部分google13年那篇工程化的paper介绍得很详细):

【问题描述】

对于loss函数+正则化的结构风险最小化的优化问题(逻辑回归也是这种形式)有两种等价的描述形式,以1范数为例,分别是:

a、无约束优化形式的softregularizationformulation:

b、带约束项的凸优化问题convexconstraintformulation:

【批量(batch)算法】

批量算法中每次迭代对全体训练数据集进行计算(例如计算全局梯度),优点是精度和收敛还可以,缺点是无法有效处理大数据集(此时全局梯度计算代价太大),且没法应用于数据流做在线学习。这里分无约束优化形式和约束优化(与上面问题描述可以对应起来)两方面简单介绍一下一些传统批量算法。

b、不等式约束凸优化形式:1、传统的不等式约束优化算法内点法等;2、投影梯度下降(约束优化表示下),gt是subgradient,直观含义是每步迭代后,迭代结果可能位于约束集合之外,然后取该迭代结果在约束凸集合上的投影作为新的迭代结果(第二个公式中那个符号标识向X的投影):

【在线算法】

如上所述,批量算法有自身的局限性,而在线学习算法的特点是:每来一个训练样本,就用该样本产生的loss和梯度对模型迭代一次,一个一个数据地进行训练,因此可以处理大数据量训练和在线训练。常用的有在线梯度下降(OGD)和随机梯度下降(SGD)等,本质思想是对上面【问题描述】中的未加和的单个数据的loss函数L(w,zi)做梯度下降,因为每一步的方向并不是全局最优的,所以整体呈现出来的会是一个看似随机的下降路线。典型迭代公式如下:

这里使用混合正则化项:,例如可能是1范数与2范数强凸项的混合(后面会看到其实很多都是这种混合正则化的格式,而且是有一定直观含义的)。迭代公式中:gt是loss函数(单点的loss,未加和)的subgradient,与gt相加的那一项是混合正则化项中的第二项的梯度,投影集合C是约束空间(例如可能是1范数的约束空间),跟上面介绍的投影梯度下降类似的做法。

1、简单的在线梯度下降很难产生真正稀疏的解,稀疏性在机器学习中是很看重的事情,尤其我们做工程应用,稀疏的特征会大大减少predict时的内存和复杂度。这一点其实很容易理解,说白了,即便加入L1范数(L1范数能引入稀疏解的简单示例可以产看PRML那本书的第二章,我前面一篇blog的ppt里也大概提了),因为是浮点运算,训练出的w向量也很难出现绝对的零。到这里,大家可能会想说,那还不容易,当计算出的w对应维度的值很小时,我们就强制置为零不就稀疏了么。对的,其实不少人就是这么做的,后面的TruncatedGradient和FOBOS都是类似思想的应用;

2、对于不可微点的迭代会存在一些问题,具体有什么问题,有一篇paper是这么说的:theiteratesofthesubgradientmethodareveryrarelyatthepointsofnon-differentiability。我前后看了半天也没看明白,有熟悉的同学可以指导一下。

二、TruncatedGradient、FOBOS以及RDA(RegularizedDualAveraging)

上面提到了,稀疏性在机器学习中是很重要的一件事情,下面给出常见的三种做稀疏解的途径:

1)、简单加入L1范数

下面会提一下FOBOS(Forward-BackwardSplittingmethod,其实应该叫FOBAS的,历史原因)以及RDA,因为后面的FTRL其实相当于综合了这两种算法的优点:

a、FOBOS,google和伯克利09年的工作:

b、RDA(Regularizeddualaveraging),微软10年的工作,更加理论性一些,这里就直接略过去了,仅对其特点做一个简单介绍:

ok,背景和一些铺垫终于完成了,下面重点进入FTRL的部分。。。

三、FTRL(Follow-the-regularized-Leader)

【发展历程】

FTRL的理论推进和工程应用首先要感谢这个人:H.BrendanMcMahan,google这哥们儿护了三年的坑,直到13年工程性paper出来。发展历程和基本说明如下:

–10年理论性paper,但未显式地支持正则化项迭代;11年证明regretbound以及引入通用的正则化项;11年另一篇的paper揭示OGD、FOBOS、RDA等算法与FTRL关系;13年的paper给出了工程性实现,并且附带了详细的伪代码,开始被大规模应用。

1)PoissonInclusion:对某一维度特征所来的训练样本,以p的概率接受并更新模型;

2.浮点数重新编码

[1]J.Langford,L.Li,andT.Zhang.Sparseonlinelearningviatruncatedgradient.JMLR,10,2009.(截断梯度的paper)

[2]H.B.McMahan.Follow-the-regularized-leaderandmirrordescent:EquivalencetheoremsandL1regularization.InAISTATS,2011(FOBOS、RDA、FTRL等各种方法对比的paper)

[3]L.Xiao.Dualaveragingmethodforregularizedstochasticlearningandonlineoptimization.InNIPS,2009(RDA方法)

[4]J.DuchiandY.Singer.Efficientlearningusingforward-backwardsplitting.InAdvancesinNeuralInformationProcessingSystems22,pages495{503.2009.(FOBOS方法)

[5]H.BrendanMcMahan,GaryHolt,D.Sculley,MichaelYoung,DietmarEbner,JulianGrady,LanNie,ToddPhillips,EugeneDavydov,DanielGolovin,SharatChikkerur,DanLiu,MartinWattenberg,ArnarMarHrafnkelsson,TomBoulos,JeremyKubica,AdClickPrediction:aViewfromtheTrenches,Proceedingsofthe19thACMSIGKDDInternationalConferenceonKnowledgeDiscoveryandDataMining(KDD)(2013)(这篇是那篇工程性的paper)

[6]H.BrendanMcMahan.Auniedanalysisofregular-izeddualaveragingandcompositemirrordescentwithimplicitupdates.Submitted,2011(FTRL理论发展,regretbound和加入通用正则化项)

[7]H.BrendanMcMahanandMatthewStreeter.Adap-tiveboundoptimizationforonlineconvexoptimiza-tion.InCOLT,2010(开始的那篇理论性paper)

THE END
1.数字技术改变传统课堂“学生们在‘空中课堂’上学习的视频资源,均来自嘉善县本土名优骨干教师制作的‘五育’数字化课程资源库,城区、乡镇中小学生平时周末、寒暑假期间都可以点击登录、免费上课。”据嘉善县教育研究培训中心信息资源处副主任左文骥介绍,为解决“双减”政策和学生个人学习意愿快速增长所带来的减负提效与个性化教育双向需求,嘉善https://www.tjjw.gov.cn/llsy/2023/02/20/detail_2023022072045.html
2.在线教学发展轨迹在线教学从单向传递、双向互动、到个性化和智能化的迭代发展,第三代在线教学的特征具有全面的技术支撑、优质的教学和学习资源,更重要的是采用web 2.0的功能,创建互动为中心的在线学习环境,通过师生和生生的多种形式的交互,激发学生学习热情和创新思维,促进学生的有意义学习和探究式学习,同时,积极采用新技术,为教师和学https://nic.hyit.edu.cn/info/1131/1615.htm
3.在线学习微百科1 在线学习概述 2 在线学习类型 3 在线学习发展历程 在线学习概述 编辑 线上学习(英语:Online Learning)是一种透过互联网工具来学习或训练的方式。 在线学习类型 编辑 在国内在线学习发展趋势是职业考试和个人能力提高,将一种方便、效率、低成本的学习模式。 分为两类: 职业考试,个人技能提高。 企业内的线上https://ispeak.vibaike.com/8854
4.e会学app官方下载e会学appv3.3.1最新版e会学将建立统一认证系统,与省内各高校的教学系统结合,开展MOOC课程的在线学习、互动、作业、考试等互动教学活动,实现全省MOOC课程学分认证和学分互认。 发展历程: 2015年12月16日,安徽省网络课程学习中心“e会学”平台正式开通上线,安徽省教育厅厅长李和平、中国科学技术大学副校长王晓平、教育厅储常连副厅长等领导出席https://m.qqtn.com/q/387804
5.在线教育的发展历程详解!从录播到直播,再到智能教育平台,在线教育实现了成长的三步跳,在线教育行业利用新技术,致力于为现代人提供更加高效便捷的学习方式,“不懂就问”平台无疑是行业中的佼佼者,也是在线教育未来的领航者,以上就是格子匠为大家介绍的在线教育发展历程的相关内容,格子匠新一代在线教育解决方案,集付费视频、直播、问答、题库、https://m.grazy.cn/article/1641.htm
6.继续教育的发展历程,你了解过吗?很多小伙伴都希望通过继续教育来提升自己的学历,小编在这里为大家整理了继续教育的发展历程,希望能够帮助大家更完整的了解继续教育的相关信息! (1)继续教育理论研究的创始阶段(二十世纪初至二十世纪五十年代末)在继续教育理论研究的创始阶段,个人和团体对继续教育的研究水平还比较低,处于刚刚起步水平。主要是在学习目的、https://www.eol.cn/ceici/e2-wenda-212090.shtml
7.爱奇艺机器学习平台的建设实践机器学习平台的服务的人群包括算法工程师、数据分析师,也包括业务研发工程师,我们希望通过构建高效的离线、实时预测服务,降低用户使用机器学习的成本,提高接入算法的效率,利用数据中台的优势促进数据和模型的规范和分享。 发展历程 简单介绍一下爱奇艺机器学习平台的发展历程。 https://www.51cto.com/article/639734.html
8.学大教育综合性教育文化产业集团4、学大在线 依托学大教育“双螺旋”智慧教育模式,线上线下互补教学,将优质课程呈现于互联网平台,让全国范围的学生享受优质课程学习体验。 5、新高考综合服务 为保障学生健康、个性化成长成才和全面发展,为学生做顶层规划,提供包括新高考生涯规划、综合素质评价、选科指导等一系列服务。 http://m.xueda.com/news/301259.shtml
9.在线课程软件,重塑教育未来之路的利器技术在线课程软件的发展历程 在线课程软件的优势与挑战 在线课程软件的未来趋势 随着科技的飞速发展,我们的生活方式、工作方式乃至教育方式都在发生深刻变革,在线课程软件作为这场教育变革的重要推手,正以其独特的优势改变着我们接受教育的传统方式,在线课程软件不仅打破了时间和空间的限制,使得学习变得更加灵活和自主,而且通过http://www.huayiii.com/post/14318.html
10.品牌消费心理学知识付费用户行为调研报告得到由自媒体罗辑思维孵化,是目前国内领先的在线知识付费平台之一。其核心产品为精品课程及听书,精品课程平均定位为199元,致力于打造精品知识付费内容。 目录: Chapter 1 知识付费行业概览 1.1 发展历程 知识付费并非新兴行业,随着社会生活方式变革演进,在不同时期出现新的模式对行业进行颠覆及整合。知识付费行业最早期为https://www.jianshu.com/p/d2d6ec04f66a
11.高等教育数字化教学的发展历程与未来展望高等教育数字化教学的发展历程与未来展望 于歆杰 [摘 要]我国高等教育在教学数字化方面经历了三个阶段:2013—2015年,为慕课建设阶段,其核心是关注学习;2016—2019年,为混合式教学阶段,其核心是促进交互;2020—2022年,为在线与融合式教学阶段,其核心是获取数据。未来,要有意识地分析、挖掘和应用数据,在高等教育国际https://jgdzz.lj-edu.cn/info/1170/1440.htm
12.案例拆解流利说英语运营体系拆解运营汪成长日记在线教育行业是教育技术变革的产物,在互联网和移动智能设备的发展和普及下,在线教育使得传统教育的时空限制被打破,使教育得到技术、内容、形式及主体等全方位的改变,真正做到因材施教。 2、行业发展历程 我国在线教育行业2013年在资本推动下开始蓬勃发展,并于2017年借助直播形式实现规模化,并逐步走向成熟。近年来,在线https://www.shangyexinzhi.com/article/5165519.html
13.新为股份e新为股份-e-learning平台系统专家,14年研发专注和6000+客户成功案例,新为学习发展系统可为企业事业单位提供专业的e-learning平台,移动学习系统,在线学习系统,在线培训系统,在线学习平台,培训考试平台,培训管理平台,企业学习管理系统,创建学习型组织企业大学首选新为e-learnihttp://www.newlms.cn/products/7/1.html
14.上一个都不能少——义乌大陈二村“循迹溯源”调研记实2023年暑期,笔者多次走访大陈二村,对村里的几代领导干部、村民等进行了访谈调研,切身感受了大陈二村从实现全面小康向建设共同富裕迈进的探索历程。 义乌乡村(视觉中国) 一、大陈二村发展历程 (一)基础设施建设 在共同富裕方面。村庄已经落实了新居370多户,已建综合楼一幢4300余平方米(建筑面积),休闲广场一处4000余http://jinhua.zjol.com.cn/yw18694/202312/t20231226_26540256_ext.shtml
15.人工智能学习心得(通用27篇)书中举了一个例子,非常形象生动:把数据看成水流,深度学习网络看成多层水管网络,通过调节管道和阀门,使输出满足要求。 3.人工智能的发展历程是怎样的? 历史上有过3次AI热潮,第一次因为图灵测试,第二次因为语言识别,都热了一段时间又沉寂下去。 目前,深度学习携手大数据引领的第三次热潮,处于技术曲线的攀升和成熟https://www.yjbys.com/xindetihui/fanwen/3342600.html
16.党课讲稿:深入学习人民政协发展历程做新时代有担当的政协人我今天讲课的题目是:深入学习人民政协发展历程,做新时代有担当的政协人。下面我以中国共产党领导的多党合作和政治协商制度为切入点,从人民政协的诞生和发展、新时代人民政协的使命任务和做有担当的政协人等三个方面和大家进行探讨、交流。一、从人民政协的光辉历程中准确把握政协人的信仰和追求73年前,在中国历史大https://www.wm114.cn/wen/226/451362.html