对谈陈天奇教授:从0到1,做有趣的事

这次,我们邀请到了TVM、MXNet、XGBoost作者,CMU机器学习和计算机系助理教授陈天奇,他的工作,让各类硬件上原生部署任意大型语言模型成为可能,算力,还是问题么?Enjoy

陈天奇:我的研究风格是问题导向。过去5年我们一直致力于解决的问题,是如何让机器学习面向更多人群,同时可以在更多设备环境下运行。最近的研究重点,一是集中在机器学习系统,不光要解决算法,还要让系统工程本身可以更快速迭代;二是做更多开源软件,让大家直接尝试我们的研究成果,并通过这个方式获得工业界和其他领域的反馈。

随着GenerativeAI和大模型的兴起,我们也希望结合大模型和过往的积淀,探索一些新的方向。

绿洲:大语言模型出来之后,您最新的工作主要是什么?

陈天奇:过去5年有一个集中的方向是机器学习编译。机器学习工程会成为越来越大的问题。为了在更高效的设备上运行,我们需要建设可重复使用的架构,无需在每个硬件平台上重做系统工程。

针对大语言模型内存损耗大等特性,我们最近一个工作的核心就是利用机器学习编译技术,为机器学习部署、训练和本身的支持方面加速。基于这个工作,MAC的一系列项目,令我们可以将一些语言模型部署在手机端、移动端或者通过WebAssembly和WebGPU技术部署在浏览器中,同时也可以在各类显卡,包括英伟达、AMD和苹果上都跑得更快。

语言模型一旦可以在多设备上完成部署,就可以基于这项技术,打造更多开放的解决方案,降低部署开放模型的代价。

绿洲:您做过很多有趣的开源工作,不论早期的ApacheMXNet,到XGBoost、TVM,如何把这些工作串连起来?机器学习十几年的发展,从算法和系统层面,您有些哪些感受?

绿洲:英伟达在大语言模型的发展下获益明显,您的工作势必让硬件竞争更多元化。如何看待类似英伟达公司和开源解决方案这两种路径的发展关系呢?

陈天奇:我认为两者不是竞争关系,我们也做很多英伟达显卡的优化工作。我们的这套解决方案很多时候是可以利用厂商原生库的。英伟达现在的确在多方面都处于领先地位,我们没有打算一定要超过英伟达,英伟达也不是在所有场景下都完美无瑕。我们感兴趣的是如何让整个领域更快地向前跑,无论推动的人是谁。

所以这不是一个必须A和B之间比较的关系,在算力依然处于相对紧缺的阶段,拥有更多可能性让大家一起向前走,才是我们想看到的。

绿洲:具体讲讲英伟达在哪些领域相对是比较领先的?

陈天奇:总的来说是硬件及编程模型。靠传统直堆Silicon的方式,已经很难通过不改编程模型的方式来解决了。随着新卡的发布,编程模型不能直接迁移。

大家目前需要的是一套在新硬件环境和新模型出现的时候,可以快速迭代的解决方案去适配。过去十年为何深度学习发展这么快?是因为深度学习建模本身的门槛被降得非常低。未来5到10年,机器学习工程会变得很重要。对于每一套可能的硬件模型数据组合,都需要特别的工程化解决方案。我们感兴趣的目标就是如何让工程迭代的速度变快。在硬件的迭代上,英伟达目前还是无人能出其右,所以未来如何对新硬件进行更好的支持,是一个很有趣的话题。

不过现在有一个不同,之前是其他厂商都不行,等于0。现在通过我们的解决方案,AMD从不能跑到可以跑,跑得还不错,从其他厂商来看,也是一个进步。从0到1的过程是难能可贵的。

绿洲:既然深度学习的门槛变得很低,那可预见的未来,大语言模型的机器学习工程化门槛也会降得很低吗?

陈天奇:就好像当初我做XGBoost之前,数据科学都很复杂,现在基本调一下效果就不错了。我们希望能够降低机器学习工程的门槛,目前也取得了一些成果。但能降到多低、什么时候降,与研究的方向、研究的投入,特别在开源社区大家的共同努力是不可分割的。

绿洲:在这个方向上,开源界共同努力可能会产生更大激励,而闭源的领先者,更希望作为专业技术「藏起来」?

陈天奇:不说模型,对于机器学习工程基础设施而言,开源闭源都会有促进作用。学术界如果要跟上时代,继续往前走,哪怕是建模,也会有完全闭源的,也有像LLaMa一样开放的。我个人比较相信开源,开源社区迭代会比较快。

绿洲:模型在手机上跑,还存在什么挑战?

陈天奇:我们的解决方案可以直接在手机上跑7B的模型,7B到3B其实没有什么压力,解决方案肯定会成熟。还有看你要不要跑,或者要跑多大的模型,多大的模型它是不是有用,这是另一个问题。

3B我们现在的解决方案直接可以跑,去MAC,我们有一个APPStore的APP下载可以玩一下。7B可能手机会发热,能耗可能会有点问题,高端机可以跑。接下来的问题就是如何与垂直应用整合,以及有没有必要在手机端跑,因为平板,笔记本都可以。在手机端跑是因为大家关心数据不要外传。

我们现在的MAC解决方案,可以让大家在手机上跑,可以在平板上跑,可以在Apple的笔记本上面跑,或者在浏览器里面跑,当然也可以在服务器上面跑,相对来说灵活度会比较大。

绿洲:既然您的方案让大家在手机上就可以跑模型,那这条路径和英伟达等大厂的区别在哪里呢?

陈天奇:为什么要在手机上跑?为什么要在端侧跑?因为有不同应用场景。假设打游戏,如果和NPC每说一句话都要付一毛钱,虽然也不是不行,但如果可以直接在某些场景直接在本机就可以完成不错的任务,我想应该是喜闻乐见的。

譬如要有得力的私人的助手,就必须最大限度披露个人信息,你是否愿意把这些内容发到第三方?在本机是否安全性更强?还有个性化,如何让语言模型更懂你?这些方向都可以演变出不同形态的应用。

电脑刚发明的时候曾有个论断,说世界上只要有8台超级计算机,在几个国家的实验室里就可以满足全球的计算需求,但个人电脑就出现了。如果模型的门槛能进一步降低,是否会出现PersonalAI的时代?这也是我们想实现的方向。

绿洲:假设有几万张A100用于训练模型,你认为哪些问题需要有经验的基础架构师和系统工程师来解决?

绿洲:英伟达、AMD以及苹果都有自己的架构,跑起来有什么区别?

苹果在架构层面具有领先性,特别是Ultra,内存很大。机器直接跑LLaMA模型,最简单的方式就是买一个苹果最新M2笔记本。我们的解决方案在苹果上也可以做。

软件问题需要大家的努力,只要有基础架构,问题也可以解决。当然还是要工程化。我们的解决方案没有限制于推理侧,只是需要打开一些思路。

绿洲:你做的一些工作如XGBoost,影响力都非常大,你是怎么挑选研究问题的呢?

绿洲:有人说您是机器学习编译这个全新学科的创造者,您对这点怎么看?

陈天奇:这也不算是一个全新学科,我们在编译本身有很多积淀和投入。我个人的研究方式属于问题驱动,当时的想法是探索解决机器学习工程问题要用什么方法,那么多硬件后端,如何以最少的能力撬动这个领域?我们觉得自动化是必须之路,编译工程就是其中一条路径。编译本身的定义也在不断演进,我们最新的解决方案可以整合手工方案和自动方案,加速工程迭代。

绿洲:基于树的模型前景如何?

陈天奇:基于树的模型目前还是很多行业必不可少的技术解决方案,数据科学家排名前五的工具,XGBoost依然位列其中。未来每一个方向上的技术都会需要树的模型,在可预见的未来还是非常重要的,特别在于表格数据、金融和其他领域,使用的还是很多的。

绿洲:在研究过程中您有没有遇到一些特别的挑战?

陈天奇:挑战一直存在,科研没有标准答案。尝试也好,失败也好,工业界也好,学术界也好,都会有各种各样往前的目标,都比较卷吧(笑)!但我们很享受能够参与推动这个领域的过程。

绿洲:如何判断自己选择的研究方向,是不是一条相对正确的道路?

陈天奇:判断不了,只有相信。乔布斯有句话:Thejourneyisthereward.很多时候目标不是最终的奖杯,而是走的过程。

至于说一件事情正确与否,譬如12年之前我开始做深度学习,属于一个非常正确又错误的决定,当时的目标是利用深度学习算法解决ImageNet的问题,结果两年半以后,没有任何结果,但是经验积累下来,可以沿用到未来要做的其他内容。关键还是「做觉得有趣的事」。

绿洲:你觉得自己是一个很卷的人吗?

陈天奇:做有趣的事情就不存在卷,主要是享受做的过程(笑)。

THE END
1.算法笔记(三)算法学习技巧1.如何总结各个算法? 首先找出各个算法自己的主要特性,拿出来之后去和其它算法比较,时间复杂度和空间复杂度相互比较,这是建立知识之间联系的一个过程,其次,也要拿出他们的共同点、共同之处,使他们联系更紧密。 2.三遍读书方法? 第一遍快速阅读一遍(在n+1)基础之上,第一遍是为了了解全书内容,让自己有一个把握,https://www.code456.com/article/3598351.html
2.保姆级学习时间线分享零基础如何入门算法竞赛?掌握平面几何和立体几何中的基本算法,如点线距离、线面交、求二维凸包等。 练习 刷洛谷绿题到蓝题,刷题在精而不在多,其实很多时候我们不是不会做某道题,而是想不到该这么做(例如你看了题解发现都是自己会的,但是却想不到得这么用),所以我们应该做一道题就分析这道题是怎么出的,它有哪些套路,而不是单纯https://zhuanlan.zhihu.com/p/646850472
3.怎样高效学习数学?学生在训练中应注重提升心算和笔算的速度与精确度,同时,教师应引导学生理解计算过程中的算理,强化对算法本质的认识。此外,通过例题的多样化练习,可以让学生在实践中不断巩固计算技巧,提高解题能力,为未来的数学学习打下坚实的基础。做得对。在数学计算中,正确性是首要的,只有确保计算结果的正确,才能进一步讨论https://baijiahao.baidu.com/s?id=1818458407474987245&wfr=spider&for=pc
4.对话MiniMax闫俊杰:AGI不是大杀器,是普通人每天用的产品《晚点》:今年 1 月你们是国内第一个推出 MoE 大模型的,其它公司去年主要在迭代 dense(稠密)模型,因为进展更快、更确定。做 MoE 是一场豪赌吗? 闫俊杰:一开始我也认为我们在赌,那几个月别人都在快速进步,走在更稳的路上,而我们在赌一个更难的东西。 https://maimai.cn/article/detail?fid=1830969028&efid=lbz_ey4CvlWopp-qSVrHXQ
5.Contents/premium.mdatmaster·Newslab2020/Contents·GitHub通讯165:Facebook“数据门”究竟是怎么回事? 通讯53:一门叫做“抵制狗屁”的大学课程 654 俄乌战争一周年,俄国媒体怎样了? 2023/2/23 战争状态下的全面审查; 离开的和留下的; “离岸记者”群体。 653 俄亥俄脱轨事故中的媒体表现 2023/2/19 关于事故的已知事实; https://github.com/Newslab2020/Contents/blob/master/premium.md
6.四年级数学除法教案(4)练一练。 180÷30 240÷40 420÷60 设计意图:教学整十数除几百几十数时,主要是让学生运用已学知识进行迁移,自主学习新知。 3.探究估算方法。 (1)师:同学们这么快就把分彩旗的问题解决了,但是我们在生活中往往会碰到这样一些情况:大队辅导员多买了3面彩旗,那么83面彩旗,每班分20面,大约可以分给几个https://mip.jy135.com/jiaoan/929142.html
7.婚嫁择日中“大小利月”的正确用法2、阴年出生女命推算法: 比如女方属丑年出生的,那么大利月就是丑后一位(顺退一位)子月大利,与子相冲之午月也为大利月。(余仿此) 二、结婚小利月的推算方法:阳年出生女取年命地支前两位及其对冲之月;阴年出生女取年命地支后两位及其对冲之月。以下举例说明用法: http://www.360doc.com/content/21/1104/11/34973859_1002703935.shtml
8.精选小学数学教案范文(通用14篇)1、让学生在理解算理的基础上,掌握三位数除以一位数,商中间有0、末尾有0的除法笔算方法。知道0除以任何不是0的数都等于0。 2、在教学中引导学生独立探索计算方法,再交流比较不同的算法,得到简便的方法。并能规范书写、正确笔算。 教学重难点: 商中间、末尾有0的除法笔算过程方法,0的书写。 https://www.fwsir.com/jiaoan/html/jiaoan_20220221102931_1654433.html
9.2013年度山东势学技术奖建议授奖人选和项目公示现将2013年度山东省科学技术最高奖评审委员会,山东省自然科学奖、技术发明奖和科学技术进步奖评审委员会,山东省国际科学技术合作奖评审委员会评审通过的建议授奖人选和项目向社会公示。 山东省科学技术最高奖人选,山东省自然科学奖、技术发明奖和科学技术进步奖一、二等奖人选和项目,山东省国际科学技术合作奖人选在《大https://paper.dzwww.com/dzrb/content/20131118/Articel07002MT.htm
10.悄悄学习Doris,偷偷惊艳所有人ApacheDoris四万字小总结2010Doris3 ,让查询再快一点 随着业务数据量的不断增长,Doris2 系统的问题也逐渐成为业务发展的瓶颈。首先体现在 Doris2 无法满足业务的查询性能需求,主要是对于长时间跨度的查询请求、以及大客户的查询请求。其次,Doris2 在日常运维方面基本上都需要停服后手动操作,比如 Schema Change、集群扩缩容等,一方面用户体验https://xie.infoq.cn/article/b2250c2d887f69d8519a3f50b
11.JAVA算法和数据结构等等进步来自一点一滴的积累资源7. **持续学习与积累**:博客作者强调“进步来自一点一滴的积累”,这表明博客的内容不仅仅是理论知识的介绍,还可能包含作者在实际开发中遇到的问题及解决方案,分享学习过程中的心得和经验。 通过这个项目,开发者可以学习到如何搭建自己的技术博客,同时获取到丰富的 Android 相关知识、设计模式实践以及基础算法的理解,https://download.csdn.net/download/weixin_42099858/16046051
12.统计学权威盘点过去50年最重要的统计学思想,因果推理bootstrap等2.2. 计算上的进步 元算法(利用现有模型和推理步骤的工作流)在统计学中被广泛使用,比如最小二乘法,矩估计(the method of moments),最大似然,等等。 在过去 50 年里所开发的许多机器学习元算法都有一个特征,就是它们会以某种方式拆分数据或模型。学习元算法(Learning Meta-Algorithms)与分治计算方法相关,最著名https://www.thepaper.cn/newsDetail_forward_12835098
13.帖子详情一个照片要选两遍(对于微信,甚至你选进去以后它是不会提示的,需要进去,选好,退出来,再进,才行)。对于后者,那么请问,谁在用呢?有app会操这个心? 对于Picker我想多说一点。太好用了,应用流畅,加载快,不少应用本来图片选择器流畅度低一些,但在NEXT上直接调用picker就极快,还能直接接入系统搜索,很方便,接入系统https://cn.club.vmall.com/mhw/consumer/cn/community/mhwnews/article/id_1000000000001941148/
14.每日热点0424例如,针对青少年进行心理测试时比较关注的隐私保护问题,该科研团队采用区块链算法加密技术,每一个用户单独拥有一个密钥,有效增强了软件应用的安全性。 值得一提的是,相较于传统的评估系统,该科研团队研发的新系统不仅采用了带情境的测试题及多媒体编排技术,有效引导青少年完成测试,而且还采用了心理测试量表的动态组合与https://www.sccdc.cn/Article/View?id=27549
15.中考数学复习方法知识点的归纳总结对我们理清我们所学知识的脉络有很好的帮助。对学过的章节内容做一个框架图或整理一个知识大纲,理清各个知识点之间的联系。对其中的重点,难点、易混淆的知识点应当分门别类。 第三、建立自己的错题本和精题本 同学们可以建立自己的错题本和经典题型本。对于平时的作业,小测试中出现的错题,有选择https://www.oh100.com/zhongkao/5524729.html
16.小学五年级上册数学复习计划(通用15篇)时间过得真快,总在不经意间流逝,我们的工作又进入新的阶段,为了在工作中有更好的成长,立即行动起来写一份计划吧。好的计划都具备一些什么特点呢?以下是小编帮大家整理的小学五年级上册数学复习计划,希望对大家有所帮助。 小学五年级上册数学复习计划 篇1 一、指https://www.ruiwen.com/jihua/5680595.html
17.学习《数学课程标准》心得体会(精选32篇)事实上,熟悉这一教学内容的教师都清楚,只需用一种方法(即用前项除以后项)便可分别求比值和化简比,细心的学生通过练习也能体察到这一点,但道理何在?通过思考,我们可以发现这一教学内容具有以下几点价值:⑴它沟通了分数、除法、比知识间的广泛联系,学生在探究过程中能把新旧知识融汇贯通;⑵在探究过程中能体验研究https://www.yjbys.com/xuexi/xinde/2800504.html
18.面经分享中科院老哥的算法&开发岗面经总结三者具备一者,其实就可以保证你能找到一份算法岗的工作 三者具备两者,其实就具备了收割普遍大厂的offer的能力 三者全具备,那就完全具备了收割大厂核心部门ssp的能力(秋梨膏,带带我好吗) 当然以上三点的前提是,你的编程能力必须过关。 (1)比赛 比赛这方面,最快的捷径就是有人带,如果实在没人带,只能考自己多看多https://cloud.tencent.com/developer/article/1537579
19.AlphaGo联合创始人:人工智能将解决更多现实问题哈萨比斯:不是的。我们之前也可以这样做。这样做不会让程序更强大,这只是为了尝试纯粹的自学,摆脱人为控制的部分。我们认为,这一算法可以在不受控的情况下运转。我们去年让人工智能去玩Atari的游戏,人工智能从像素点的研究起步,这其中没有掺杂任何人类知识。人工智能从屏幕上的随机像素开始。 https://sports.sina.cn/others/qipai/2016-03-12/detail-ifxqhmve9114620.d.html
20.Qt机器学习算法qt应该怎么学mob6454cc6441b6的技术博客Qt机器学习算法 qt应该怎么学,一、学习规划与必要知识点总结1、QT的下载与安装;1)下载:进入官网,下载QT在线下载工具(QT5.15后都必须在线下载):2、学习QT三大件:QTCreator、QTDesigner、QTAssistant3、QT的三种开发方式以及qmake与cmake方式区别:1)使用QTGUI框架,https://blog.51cto.com/u_16099185/9631420