优化推荐系统在线学习Onlinelearning个人文章

传统学习算法的缺点:1、传统学习算法占用内存大和更新周期慢的问题。2、训练出的模型参数多导致预测慢。模型参数多的情况下,线上predict的时候需要内存大,QPS无法保证。3、无法真正稀疏,浮点运算精度。传统的SGD很难得到真正的稀疏模型(浮点运算很难是真的0,无线接近于0)。

一、目标1、最小化损失函数,即使得整体的损失函数最小化2、快速求解,即快速求目标函数的最优解。

二、流程1、将模型预测结果展现给用户2、收集用户的反馈数据3、再次训练模型重复以上步骤形成闭环的系统。

问题:在线学习与在线优化的问题范围是否一致?在线学习与在线预估工程中如何有效衔接?

一、从在线梯度下降说起(onlinegradientdescent)是传统梯度下降的在线版本。

t表示第t轮迭代,注意上式中的学习率$η_t$每轮都会变,一般设为$η_t=\cfrac{1}{\sqrt{t}}$

二、FTL(FollowtheLeader)。使用任何在过去回合中损失最小的向量,最小化累积损失。

三、FTRL借鉴于FTL,但是在FTL的基础上加上了正则化项。考虑了训练样本本身在不同特征上分布的不均匀性。当某个条件满足时,好像是小于L1正则的参数,直接令某个特征的参数w为0。学习出的模型具有稀疏性。

1、FTRL使用所有学习轮次的梯度代替某一轮次的梯度2、每个特征采用不同的学习率。如果一个特征变化快,则对应的学习率也会下降得快,反之亦然。学习η率越大,则参数w更新幅度越大。3、加入L1正则

一、参数服务器引入原因:模型的维度提升至千万维,当模型维度冲击到亿维时。非并行模型时,过高的模型维度会导致海森矩阵呈指数级上涨。导致内存和网络I/O的极大开销。

作用:解决模型并行问题。将高维模型平均分配到参数服务器集群中的每一台机器,将CPU计算、内存消耗、存储、磁盘I/O、网络I/O等负载和开销均摊。

手段:将参数分片以分布式形式存储和访问。

架构:主从架构,Master负责记录和维护每个参数服务器的心跳和状态;

参数服务器则负责参数分片的存储、梯度计算、梯度更新、副本存储等具体工作。

两种实现方式:全同步:能够在理论层面保证模型收敛。各节点执行任务节奏不一致,会互相等待,引入通信边界,从而造成计算资料的浪费和开销。

全异步:无需等待,充分利用资源。理论上无法验证模型一定收敛(但实践效果好,迭代速度会更快,AUC的加速度会更高,模型效果可以满足业务和线上的要求)

二、sparkspark.mllib中模型的持久化可以直接存入hdfs文件系统。

缺点:目前spark原生支持的机器学习模型比较少;使用第三方的算法模型的话,需要spark集群的2.3以上;而且spark训练出来的模型往往比较复杂,实际线上运行的时候,对内存以及QPS的压力比较大。

三、tensorflow模型上线一般选择tensorflowserving或者clientAPI库来上线,前者适合于较大的模型和应用场景,后者则适合中小型的模型和应用场景。

四、通过PMML实现模型跨语言跨平台共享

缺点是超大模型不适合,不如建立一个单独的环境。如果是tensorflow平台建议使用自带的serving或者tensorflow的java库来实现。

THE END
1.可以免费学课程的网站:总有一款适合你不管您是中小学生、大学生、职场人士,还是对知识满怀热忱的终身学习者,都能够在这些平台里找到契合自身的学习内容。接下来,让我们共同深入探究这些丰富多彩、优质实用的国家免费学习平台。1、国家中小学智慧教育平台 这是一个专门为中小学生精心打造的在线教育平台,具有广泛的适用性,涵盖了从小学低年级到高中阶段的https://baijiahao.baidu.com/s?id=1805012759468151759&wfr=spider&for=pc
2.基于python的在线学习与推荐系统+LW在线学习推荐系统本在线学习与推荐系统也是紧跟科学技术的发展,运用当今一流的软件技术实现软件系统的开发,让家具销售库存管理信息完全通过管理系统实现科学化,规范化,程序化管理。从而帮助信息管理者节省事务处理的时间,降低数据处理的错误率,对于基础数据的管理水平可以起到促进作用,也从一定程度上对随意的业务管理工作进行了避免,同时,https://blog.csdn.net/weixin_41895817/article/details/136821751
3.基于知识图谱的在线学习资源推荐系统的研究与实现最后通过对比实验,验证了本文所提出模型的有效性。(3)构建基于知识图谱的在线学习资源推荐系统。以本文提出的融合连通子图的协同过滤模型为基础,设计并实现了基于知识图谱的学习资源推荐系统,为用户提供个性化的学习资源推荐,从而解决用户的信息迷航与选课困难问题。https://cdmd.cnki.com.cn/Article/CDMD-10290-1022623811.htm
4.30个适合大学生创新创业的项目大学生们经常需要额外的学习资源和辅导。一个在线学习平台可以提供各种学科的视频教程、习题解答和辅导。同时,学生也可以在平台上分享自己的学习心得和经验。 4. 绿色出行共享平台 环保意识越来越重要,而大学生通常是城市出行的主力军。一个绿色出行共享平台可以集成各类公共交通工具和共享单车,提供一站式的出行解决方案https://www.keloop.cn/information/art101840.html
5.面试AI算法岗,你被要求复现顶会了嘛?51CTO博客第五阶段 推荐系统与在线学习 推荐系统一直是机器学习领域的核心,所以在本阶段重点来学习推荐系统领域主流的算法以及在线学习的技术、包括如何使用增强学习来做推荐系统。 在线学习算法很深具有很漂亮的理论基础,在本阶段你都会一一体会到! 【核心知识点】- 基于内容和协同过滤的推荐算法- 矩阵分解,带条件的矩阵分解-https://blog.51cto.com/u_15279692/3405717
6.文章列表基于集成网络的离线到在线强化学习 强化学习有两种基础的训练范式:在线强化学习和离线强化学习。在线强化学习需要让智能体和环境进行交互,利用收集到的数据同步京东零售推荐系统可解释能力详解 本文将介绍可解释能力在京东零售推荐系统中的应用实践。主要内容包括以下几大部分:推荐系统可解释定义、系统架构、排序可解释https://archive.it168.com/user/%E9%99%B6%E7%84%B6
7.静5青年讲座回顾:麦络博士介绍低模型延迟的大规模深度学习推荐系统讲座的开始,麦络博士首先简单介绍了深度学习推荐系统(DLRS)的发展以及面临的挑战。DLRS 需要时刻进行大规模的模型参数更新,降低模型参数更新的延迟对于提升 DLRS 的效率至关重要。当前,深度学习推荐系统在各种互联网服务上被广泛应用,系统时刻作用于数十亿的在线用户,任何微小的表现提升都能带来显著的收益。多项 SOLs(服https://cfcs.pku.edu.cn/news/240785.htm
8.《深度学习推荐系统》(王喆)简介书评在线阅读当当网图书频道在线销售正版《深度学习推荐系统》,作者:王喆,出版社:电子工业出版社。最新《深度学习推荐系统》简介、书评、试读、价格、图片等相关信息,尽在DangDang.com,网购《深度学习推荐系统》,就上当当网。http://product.dangdang.com/28522361.html
9.深度学习推荐系统(豆瓣)深度学习在推荐系统领域掀起了一场技术革命,本书从深度学习推荐模型、Embedding技术、推荐系统工程实现、模型评估体系、业界前沿实践等几个方面介绍了这场技术革命中的主流技术要点。 《深度学习推荐系统》既适合推荐系统、计算广告和搜索领域的从业者阅读,也适合人工智能相关专业的本 科生、研究生、博士生阅读,帮助他们建https://book.douban.com/subject/35013197/
10.构建基于深度学习的电影推荐系统经管之家是国内活跃的在线教育咨询平台! 经管之家新媒体交易平台 提供"微信号、微博、抖音、快手、头条、小红书、百家号、企鹅号、UC号、一点资讯"等虚拟账号交易,真正实现买卖双方的共赢。【请点击这里访问】 构建基于深度学习的电影推荐系统 随着网络技术的不断发展和电子商务规模的不断扩大,商品的数量和种类迅速增https://bbs.pinggu.org/jg/kaoyankaobo_kaoyan_9371741_1.html
11.《深度学习推荐系统(全彩)(博文视点出品)(ChatGPT背后核心技术京东JD.COM图书频道为您提供《深度学习推荐系统(全彩)(博文视点出品)(ChatGPT背后核心技术)》在线选购,本书作者:,出版社:电子工业出版社。买图书,到京东。网购图书,享受最低优惠折扣!https://item.jd.com/12630209.html
12.资源帖丨字节跳动技术Leader们推荐的学习资源《深度学习推荐系统》 作者:王喆 William认为,这本书可以帮助读者了解业界推荐系统的基础知识体系,梳理推荐算法的发展脉络。 《推荐系统实践》 作者:项亮 推荐系统入门必备,非常适合初学者。 计算机视觉 图像算法方向的Leader吴辛隆说,团队同学主要靠学习CV论文来提升自己的技术能力。除了历年顶会的论文之外,他也推荐了业https://maimai.cn/article/detail?fid=1589935106&efid=ROE93ZNmM8sYE6S4rjpy5w
13.在线学习App排行榜OPPO手机在线学习app推荐OPPO手机在线学习App排行榜由点点数据提供。本次排行榜包含了:腾讯视频、高教在线、去哪儿旅行(旅行比价助手)、安居客(海量好房源)、淘宝、美团外卖、优酷*找二手房新房租房,买房产查房价卖房租售商铺写字楼的专业房产应用 *业界强大的二手房新房租房推荐系统,用大数据猜你喜欢的房子 *新房上线VR售楼处,足不出https://www.diandian.com/phb/1335/5-1.html