张峰认为,校企间的产学研合作是一种非常好的协同创新模式。一方面,人大数据库团队有非常深厚的数据库技术积淀,这是项目合作的技术基础,也是高校的优势所在;另一方面,企业会有实际应用需求,会直接涉及到实际开发系统,而这些不断产生的新需求则是技术成果落地的土壤。只有聚焦真实、有用、有挑战的数据库系统研究,才能解决真实的系统研究问题。
张峰表示:“本次获奖是对人大数据库团队的肯定。通过本次合作,我知悉了集科研合作、成果转化、人才培养为一体的产学协同模式,也更深入了解了企业需求,为后续科研思路打开了产业视角,这对我而言意义非凡。”
助力云数据库技术发展
IoT技术和云计算技术的发展催生了边端云计算架构的快速发展,各类异构嵌入式设备接入到互联网。但这些异构设备的容量受限性能较弱,这些设备上的机器学习任务需要传递到第三方云服务平台、由算力更强的GPU服务器完成。而这会带来数据安全的新问题。张峰作为第一作者发表在TPDS上的论文“AnEfficientParallelSecureMachineLearningFrameworkonGPUs”提出了基于安全多方计算的GPU安全机器学习系统,这是国际上较早能够利用GPU的安全机器学习框架工作的研究,荣获TPDS2021年度最佳论文。
相比于不使用GPU的安全机器学习方法,张峰的工作能够在确保数据安全的前提下带来30倍以上的性能提升。他在研究过程中遇到了如何进行复杂计算模式并行、节点内CPU-GPU间数据传输开销、节点间依赖等技术问题,也对应提出了基于分析的自适应GPU优化、节点内计算和访存重叠、节点间数据传输压缩等一系列解决方案。该研究可以让这些新硬件处理更大规模的问题,这就能够缓解新硬件自身的限制,在数据传输、数据存储方面发挥较大作用。
IEEETPDS是中国计算机学会(CCF)推荐的A类期刊,在并行与分布式计算领域享有很高的学术声誉。经统计,2021年TPDS总发文量为297篇,根据惯例会评选出一篇年度最佳论文和一篇最佳论文提名。
三、勇攀科研高峰
人大“数据人”一脉相承
在谈及自身的学习、成长经历时,张峰一直在强调身为人大“数据人”的使命与担当。张峰以前的研究方向是计算机系统结构,来到人大后开始致力于系统结构与数据库技术交叉问题的研究,选择深耕基于语法规则解析的压缩数据直接计算数据库技术。在找到了这样的一个结合点之后,一直在探寻如何对此研究进行系统化的深入,例如,如何同GPU等新硬件设备进行结合、如何并行、如何进行索引等。
▲张峰和同学们在一起
在专注自身研究的同时,张峰也肩负起将人大“数据人”的责任与使命传递给下一代的任务。他从2019年起担任人大信息学院图灵班的班主任,并注意到同学们在学习生活中存在缺少理论联系实际的动手环节问题。作为老师,他积极鼓励同学们在本科阶段就走进实验室。他说:“我也会带本科生一起参与科学研究,不少同学本科阶段就发表了高水平学术论文。”据悉,许多信息学院本科生通过实验室科研早培在数据科学领域发表顶级学术论文,受到国内外同行的认可,在人大、清华、北大等海内外名校直接攻读博士学位。2019级信息学院图灵班更是有本科生就发表了ASPLOS、VLDB等顶会论文,拿到了UIUC等世界名校的PhDoffer。结合人大在数据科学的优势,信息学院有一套完整的“3+X”的新型计算机专业课程体系来培养学生的科研兴趣,《以数据为中心的计算机特色领军人才培养——图灵实验班的教改实践》成果,获评2022年度北京市高等教育教学成果一等奖。