张文涛,北京大学国际机器学习研究中心助理教授、研究员、博士生导师,大数据分析与应用技术国家工程实验室机器学习中心成员。曾任职于腾讯机器学习平台部、AppleAIML以及Mila人工智能实验室。研究兴趣为以数据为中心的机器学习、图机器学习、机器学习系统和交叉学科应用(如Diffusion、多模态和AI4Science)。他近5年在机器学习(ICML/NeurIPS/ICLR)、数据挖掘(KDD/WWW)和数据管理(SIGMOD/VLDB/ICDE)等领域发表CCF-A类论文40余篇,并获得多个最佳论文奖(如第一作者获WWW’22BestStudentPaperAward和通讯作者获APWeb-WAIM’23BestPaperRunnerUpAward),其论文“大规模图神经网络关键技术研究”荣获2023年中国人工智能学会优秀博士学位论文奖(指导教师:崔斌教授)。他领导或参与开源了多个机器学习系统,如大规模图学习系统SGL、分布式机器学习系统Angel、和黑盒优化系统OpenBox。他曾获AppleScholar(2021年度亚太地区唯一)、世界人工智能大会云帆奖、北京大学/北京市/中国人工智能学会优秀博士学位论文奖、中国电子学会科技进步一等奖等多项荣誉。
Q:请简要介绍一下您当前的研究方向和研究工作。
A:我的研究方向主要是Data-centricML(DCML,以数据为中心的机器学习),具体来说分成以下几个方面:
Q:您在求学工作期间有什么或印象深刻或有趣的经历吗?这些经历对您从事机器学习研究及后期的选择产生了哪些影响?
A:读博期间,我先后在腾讯机器学习平台部以及AppleAIML实习了4年。通过与工业界合作,我们可以借助他们的数据和计算资源。更重要的是,我们可以发现很多有影响力和现实意义但未被探索的新问题。这些问题很有可能是实际的业务问题,但稍微提炼和抽象出来就是一个新的Research问题。与其在一个老问题和方向上去卷方法,我更喜欢深入研究发现问题本质,探索完全不同的解题思路。另外,挖坑发现好的研究问题也是一个避免内卷的好方法,而且这类工作往往更有延续性和成体系。最后,研究工作如果能实际部署到工业界环境并产生显著经济效益,也能进一步提升工作影响力。
Q:对您而言,机器学习最独特的魅力是什么?
A:机器学习能够极大地解放生产力,赋能千行百业。自动驾驶、语音识别、智能家居等常见的应用场景都有机器学习模型在背后支持。特别的,以ChatGPT为首的大模型涌现出的令人惊讶的智能,能够帮助甚至取代很多脑力型劳动(如法律、金融和医疗等),给大家带来了一个充满着无限可能和未来的世界。我个人是非常喜欢尝试各类科技产品,目前最能给我科技感的两项技术就是VR(虚拟现实)和LLM(大语言模型),它们背后都有很多机器学习技术在支撑。未来,VR和LLM的结合也是一个很有意思的研究方向,或许能够对未来很多领域(比如教育)带来一些颠覆性的变革。
Q:您对未来在中心的研究和教学工作有哪些规划或期待?
Q:对青年学生做好机器学习科研您有哪些建议?
A:做科研经常会遇到很多挫折,以我自己为例,前两年没有任何论文产出,也经常会陷入焦虑。我个人的经验是:1)每个人因为自身背景的不同,以及研究兴趣不一样,都有最适合自己的研究方向。选择一个适合自己并且感兴趣的方向,比盲目努力重要得多;2)很多时候你的努力都用在了错误的地方,需要经常总结和反思,经常备份和复盘自己的Idea(我的个人习惯是用OneNote随时备份自己的想法);3)当你焦虑和想不到方案的时候,不妨找个同学或者朋友倾诉一下,由于你需要总结和提炼自己的想法,往往在这个过程中就有很多灵光一闪的新思路。
Q:生活中的你有什么兴趣爱好吗?通常通过什么方式来为自己减压?