线上闭门会上新!北航MIT莫纳什和商汤四位专家直播探讨大模型微调与推理部署深度学习新浪财经

「线上闭门会」由智猩猩全新升级推出,将邀请行业、领域专家担任出品人进行策划,探讨人工智能、自动驾驶领域中的最新技术研究与应用。

随着深度学习技术的飞速发展,尤其是最近涌现出的大型基础模型,人工智能领域正在发生翻天覆地的变化。这些模型在图像识别、自然语言处理等各种任务上取得了显著的突破,显示出巨大的潜力。然而,这些大模型往往具有庞大的参数量、计算量和功耗,这给它们的实际应用带来了一定的挑战。特别是在资源受限的环境中,如何实现高效深度学习成为了一个亟待解决的问题。

本次闭门会,MonashUniversity长聘助理教授庄博涵、麻省理工学院在读博士朱力耕和商汤科技研究副总监龚睿昊参与主讲。他们将分别围绕主题《大模型的高效微调和部署》、《边缘设备上的大模型微调训练》和《大语言模型量化和LightLLM高性能推理部署系统设计》,从不同的角度探讨如何提高大模型的效率和性能,并为实际应用场景提供有效的解决方案。

出品人

主题介绍

MonashUniversity长聘助理教授庄博涵:大模型的高效微调和部署

本次闭门会,庄博涵将介绍近两年ZIPLab在高效深度学习领域的部分研究成果,涵盖了从训练、部署到推理的整个流程,例如参数高效微调、可缝合神经网络、高效注意力机制和大模型压缩算法等。

庄博涵是MonashUniversity长聘助理教授、博士生导师,ZIPLab独立PI。目前他专注于高效机器学习算法和理论研究,以及它们在视觉和语言领域的应用,近年来在计算机视觉和机器学习领域的顶级国际会议(如CVPR、NeurIPS)和期刊(如TPAMI)上发表了40多篇论文。他还承担了多个业界项目,部分研究成果已经被业界广泛引用,并转化为工业界实际应用工具,还曾担任多个知名学术会议的高级委员会成员,包括ICML、NeurIPS、ICLR、CVPR和ICCV等。

麻省理工学院在读博士朱力耕:边缘设备上的大模型微调训练

设备上的学习和高效微调可实现持续且保护隐私的定制(例如,根据个性化数据在本地微调大型语言模型)。然而,现有的训练框架是为具有强大加速器(例如GPU、TPU)的云服务器设计的,缺乏对边缘学习的优化,面临资源限制和边缘硬件多样性的挑战。

本次闭门会,朱力耕将介绍一个可在各种边缘设备上进行微调的、微型、稀疏且高效的引擎PockEngine。PockEngine支持稀疏反向传播。它会修剪反向图并通过测量内存节省和延迟减少来稀疏更新模型,同时保持模型质量。

同时,PockEngine也支持多种应用程序、前端(PyTorch/TensorFlow/Jax)和硬件后端(CPU/GPU/DSP)。与现成的TensorFlow(RaspberryPi)相比,PockEngine实现了高达15倍的加速,节省了5.6倍的内存反向传播(JetsonOrin)。值得注意的是,PockEngine能够以550个令牌/秒的速度在NVIDIAJetsonOrin上微调LLaMA2-7B,比PyTorch快7.9倍。

朱力耕师从韩松教授,研究方向主要集中在高效深度学习系统和算法之间。他设计了第一个软硬协同的AutoML算法并可以扩展到大规模的数据集的算法ProxylessNAS,迄今已有1400引用和1300Githubstars,并开发了高效推理系统和深度学习训练系统,项目已经被整合到PyTorch和AutoGluon等框架中,曾被麻省理工学院新闻和IEEESpectrum等媒体报道。

商汤科技研究副总监龚睿昊:大语言模型量化和LightLLM高性能推理部署系统设计

大语言模型动辄上千亿的参数量对于各种平台的高效、低成本部署带来了更大挑战。模型量化和高效的推理系统设计成为提高LLM推理效率的关键。

龚睿昊是商汤科技研究副总监、模型工具链团队负责人,主要负责工业级模型工具链,包括大规模模型训练、多平台部署、模型压缩和软硬件协同技术体系。通过算法和工具实现规模化工业落地,支持智慧城市、智能驾驶、AIOT、手机场景等大量业务模型的模型生产,团队支撑了商量等商汤大模型体系的底层技术搭建,致力于ML+System的综合效率提升。他在ICLR、NeuIPS、CVPR、ICCV、IJCV等期刊会议发表二十余篇论文,多次获得低功耗计算机视觉比赛LPCV冠军、无人机追逐赛亚军等奖项。

报名方式

此次线上闭门会设有专属交流群,将邀请出品人和三位主讲人入群。通过报名的用户将可以受邀入群,并可获得直播地址进行观看。

THE END
1.推荐几个在线练题平台腾讯云开发者社区最近在刷LeetCode,对于这种刷题平台由衷的喜欢,同时发现了几个非常好的在线练习平台,分别是学习Git、SQL、正则表达式的在线练习平台。 看到有人在评论里面问有没有Python的在线练题平台,想起来我这还是个Python的账号呢,汗颜呀,所以补充一下我之前用过的Python在线练题平台。 https://cloud.tencent.com/developer/article/1667969
2.GitHub中适合新手学习机器学习的项目,以及学习三款工具Keras:Keras 是一个高级神经网络库,建立在 TensorFlow 之上,提供了简洁而灵活的接口。你可以学习如何使用 Keras 构建和训练神经网络模型,包括卷积神经网络、循环神经网络等。项目链接:https://github.com/keras-team/keras Fast.ai:Fast.ai 是一个面向初学者和中级学习者的深度学习教育平台,提供了一系列的课程和教程https://blog.csdn.net/itcast_cn/article/details/131403576
3.GitHublearninghub/learninghub:learningNotifications Fork0 Star1 learning-hub又一个OJ的在线编程学习平台. learning-hub.github.io/learning-hub/ License Apache-2.0 license 1star0forksBranchesTagsActivity Star Notifications master BranchesTags Code Folders and files Latest commit 53 Commits https://github.com/learning-hub/learning-hub
4.24常见渗透测试漏洞靶场列表11. MS08067实战型训练平台: http://bachang. 12. 东塔在线靶场: https://labs./index/course/index 0x03 漏洞靶场 1. DVWA: http://www. 2. BWVS: https://github.com/bugku/BWVS 3. BWAPP: https:///projects/bwapp 4. WAVSEP: https://github.com/sectooladdict/wavsep http://www.360doc.com/content/23/0410/06/77981587_1075837858.shtml
5.Taurus:面向机器学习的数据面架构(下)5.2.3. 在线训练 Taurus 的机器学习模型也可以被更新以优化全局指标,这对于单个交换机无法观察到的行为(如下游拥堵)很有帮助。我们将遥测数据包送入控制面的训练应用程序,并使用流量规则配置时间作为估计,评估更新数据面模型权重所需的时间。 图13 显示,更高的采样率(对应更多的批处理数据)收敛速度更快(几十到几https://developer.aliyun.com/article/1111129
6.线上python哪个平台好?Worktile社区3. 分享和共享:可以将Notebook保存为文件或分享到GitHub等平台。 ### 三、Google Colab Google Colab是一个基于云的Python编程环境,可以免费使用。它提供了一个Jupyter Notebook的界面,并且可以直接在云端运行代码。 ### 优势 1. 云端运行:所有代码和数据都存储在云端,无需担心本地环境的配置和限制。 2https://worktile.com/kb/ask/90158.html
7.超全整理:程序员都在用什么工具?“计算机科学里两件最难的事:缓存失效和命名。” Codelf 通过搜索在线开源平台 Github, Bitbucket, Google Code, Codeplex, Sourceforge, Fedora Project 的项目源码,帮开发者从中找出已有的匹配关键字的变量名,从而帮助为变量名苦恼的开发者命名。这个搜索服务支持直接搜索中文。 https://xie.infoq.cn/article/3808624e50341691b5e44c647
8.线上教学质量监测方案2、课程教学方案二:教师使用班级微信群、QQ群等开展互动教学,疑难解答。各任课教师按照班级课表,及时发布学习计划和资源,微课、作业、课件等,指导学生按时完成学习任务。老师在微信群、QQ群等在线平台通过“语音+图片+文字+小视频”的形式进行教学直播,开展实时讨论、作品点评、小视频分享等活动。 https://www.oh100.com/a/202301/5942245.html
9.从零训练一个多模态LLM:预训练+指令微调+对齐+融合多模态+链接另一种做法参考论文Anthropic LLM ,通过三个阶段的训练,包括语言模型预训练,偏好模型预训练,以及偏好模型微调。首先在大规模语料上进行语言模型的预训练,这一步直接采用指令微调后得到的LLM。然后从StackExchange/Reddit/Wikipedia等获取混合对比数据集,进行偏好模型的预训练。最后在人类反馈对比数据上进行微调,训练符合人类https://www.shangyexinzhi.com/article/10160427.html
10.一步一步教你在线免费训练机器学习模型(启用GPU和TPU)由于我无法在这篇文章中涵盖所有在线训练机器学习模型的服务,因此本文将有第二部分。 所有需要学习和实践机器学习的资源都是开源的,可在线获取。从计算、数据集、算法以及免费在线提供的各种高质量教程,你只需要互联网连接和学习的热情。 我希望这篇文章有用,因为它解决了开始走向机器学习和数据科学之路的业界人士所面https://blog.itpub.net/31545819/viewspace-2216969/
11.卷王都在用!100款宝藏级AIGC工具分享,强烈建议收藏!!用户输入想要润色、修改的文本内容,点击“一键优化”之后,它就能自动识别文本类型、风格以及写作目的,用户还能调整想要修改的幅度,平台就能基于原文一键输出英文改写结果,还支持智能纠错、多样改写等AI功能,使语言表达更加地道、简洁。网页链接:https://www.writingo.nethttps://www.changbiyuan.cn/news/2023/news_0711/69335.html
12.AI资料入门:快速获取与利用AI资源的指南AI工具与平台利用指南 1. 开发工具与环境 Jupyter Notebook:集成Python、R或Julia等语言的交互式环境,方便编写、运行和展示代码。 Google Colab:结合了Jupyter Notebook的便利性和Google云服务的计算能力,支持GPU加速,适合AI模型训练。 2. 社区与论坛 参与具有活跃AI社区的论坛如Stack Overflow的AI版块、Reddit的AI论坛https://www.imooc.com/article/349375
13.私有化部署,开源轻量级的团队在线协作工具——Kooteamkooteam是一款轻量级的在线团队协作工具,提供各类文档工具、在线思维导图、在线流程图、项目管理、任务分发,知识库管理等工具。 介绍 kooteam是一款轻量级的在线团队协作工具,提供各类文档工具、在线思维导图、在线流程图、项目管理、任务分发,知识库管理等工具。 同时也是一个免费开源的产品,遵循Apache Licence 2.0开源协议https://news.51cto.com/art/202005/617354.htm
14.有趣的开源社区微信扫码赞助本站 服务器还剩278天 +1年 : 用户总数 2.6w 开源项目 3533 关于本站 HelloGitHub 是一个发现和分享有趣、入门级开源项目的平台。 希望大家能够在这里找到编程的快乐、 轻松搞定问题的技术方案、 大呼过瘾的开源神器, 顺其自然地开启开源之旅。https://hellogithub.com/