CCFTF23:AI联邦学习的最新应用落地TF动态

北京中国科学院计算技术研究所一层报告厅

随着人工智能技术成功突破算法与算力上的限制,数据成为制约人工智能在各行各业实际应用落地的重要因素。一方面,各个企业所拥有的数据被人为隔离为一个个“数据孤岛”,难以聚沙成塔取长补短;另一方面,由于对数据隐私和安全的日益重视,中国和欧美等国的监管法规也对用户数据的交换传输做出了严格限制与规范。

为了解决这样的数据困境,“联邦学习”(FederatedMachineLearning)作为一种加密的分布式机器学习范式被提出来,可以使得各方在不披露原始数据或数据加密形态下达到共建模型的目的。即在不违反数据隐私法规的情况下,连接数据孤岛,并建立性能卓越的共有模型。

会议主席

范力欣微众银行人工智能首席科学家

个人简介:微众银行人工智能首席科学家范力欣博士,曾任诺基亚技术公司首席科学家,研究领域包括机器学习和深度学习,计算机视觉和模式识别,图像和视频处理等领域。他是60多篇国际期刊和会议出版物的作者,共获得6千多次的引用。范博士也是美国,欧洲和中国提交的近百项专利的发明人。

特邀讲者

范涛微众银行人工智能部高级研究员

主题报告一:FATE:新一代联邦学习技术及应用实战

主题简介:随着大数据的进一步发展,重视数据隐私和安全已经成为了世界性的趋势。同时,大多数行业数据呈现数据孤岛现象。如何在满足用户隐私保护、数据安全和政府法规的前提下,进行跨组织间数据合作是困扰人工智能从业者的一大难题。而“联邦学习”将成为解决这一行业性难题的关键技术。主题将会围绕两方面展开:

1、利用联邦学习进行跨组织间多方联合建模的若干关键技术,这些关键技术如何落地到我们开源项目FATE中。

2、微众银行AI团队已经推动FATE在信贷风控,客户权益定价,监管科技等领域的一系列应用。

秦姝琦腾讯云大数据及AI中心高级研发工程师

主题报告二:神盾沙箱:破局数据合作与隐私保护矛盾的探索与实践

主题简介:随着进入以数据为关键要素的数据经济时代,数据的价值日益彰显,隐私计算技术已经成为学术界和产业界的研究热点,希望能够解开隐私保护和数据流通需求的矛盾,释放数据的价值,打造数据共享共赢生态。

个人简介:秦姝琦,腾讯云大数据及AI中心高级研发工程师,目前负责腾讯云神盾沙箱安全多方计算平台的架构设计及后台建设。在腾讯就职期间,先后负责了dmc、垂直领域公众舆情分析等大数据应用系统的架构设计和开发。曾任职于中国移动、去哪儿网,主要负责智能客服和搜索引擎等项目的开发落地。

朱越华为消费者BG软件部CTO办公室算法专家

主题报告三:精准感知与精确预测,智慧终端的挑战与机遇

个人简介:朱越,华为消费者BG软件部CTO办公室算法专家,负责分布式AI方向。2018年博士毕业于南京大学计算机科学系LAMDA实验室。积极参加国内外的产学界活动,在TKDE、AAAI、ICDM等国际一流期刊或会议上发表多篇学术论文,并多次担任NIPS、AAAI、IJCAI等国际会议程序委员,担任华为和多个国内外大学联合实验室的AI项目负责人角色。2018年加入华为消费者BG软件智慧工程部,负责端侧决策推理算法,带领团队取得巨大突破,并落地实际应用。

张海宁VMware中国研发中心技术总监

主题报告四:联邦学习的云服务架构

主题简介:本次演讲探讨联邦学习和云计算结合的场景,并介绍联邦学习开源项目FATE在Kubernetes上应用的方案。

张钧波京东智能城市事业部AI平台负责人、京东智能城市研究院资深研究员

主题报告五:城市计算与联邦学习:助力智能城市新发展

个人简介:张钧波,博士,京东智能城市事业部AI平台负责人、京东智能城市研究院资深研究员,主管面向城市(时空)大数据的AI平台、算法模型和技术研发。他担任人工智能顶尖国际期刊ACMTIST的编委及IEEETKDE,ACMTKDD等国内外知名期刊审稿人,及KDD、IJCAI、AAAI等CCF-A类会议在内的国内外会议程序委员。在加入京东之前,张钧波博士曾任微软亚洲研究院研究员,联想香港大数据研发中心研究员,在香港中文大学、华为香港诺亚方舟实验室、美国乔治亚州立大学、比利时核研究中心等工作多年,具备近十年的人工智能和时空数据挖掘经验,在ArtificialIntelligence,IEEETKDE等国际期刊和软件学报等国内期刊及KDD,AAAI,IJCAI,ACL,CIKM等国际会议上发表论文40余篇,并在科学出版社专著1部,曾获得中国人工智能学会优秀博士论文提名奖,ACM分会优秀博士论文奖。他是CCF人工智能与模式识别专委会委员。

冯霁创新工场南京国际人工智能研究院执行院长

主题报告六:浅析联邦学习中的安全问题

主题简介:随着人工智能应用的广泛落地,人工智能系统的安全性研究和防范,日益受到学术界和工业界的重视。近年来,联邦学习技术框架的提出,已逐渐成为满足隐私保护需求的人工智能系统的标杆型范式。对于联邦学习技术框架的安全性评估,目前已经十分必要。本报告将围绕联邦学习技术框架,分别介绍联邦学习框架内不同模块可能遇到的潜在攻击方式及相应解决办法,尤其针对数据下毒,信道监听,以及对抗样本等常见攻击手段,在联邦学习框架下进行讨论和分析。为工业实践者在具体部署过程中,提供指导性建议。

王健宗平安科技联邦学习技术部总经理

主题报告七:联邦智能加速AI落地

主题简介:面向实际问题的人工智能解决方案要能有效解决数据不足、割裂、小数据的数据困境,更一定要解决安全、合规、隐私保护的问题,并且还要能够提高模型的效率。目前这样一个AI技术时代,用户隐私保护将成为社会的一个强约束,越来越多的人和企业开始意识到「数据孤岛」的严重性以及数据共享的迫切性。联邦智能在兼顾解决这两个问题(隐私保护与共享),为我们建立一个跨企业、跨数据、跨领域的大数据AI生态提供了良好的技术支持,而连接更多行业和应用场景的联邦智能生态系统。本次报告将为大家解读联邦智能生态的应用组成与发展前景。

个人简介:王健宗博士,平安科技联邦学习技术部总经理,深圳市金融智能机器人研究中心常务副主任,中国人工智能开源软件发展联盟副理事长,平安科技副总工程师,资深人工智能总监,平安联邦学习平台和AutoML平台总设计师,美国佛罗里达大学人工智能博士后,深圳市领军人才,高级工程师。现任中国计算机学会大数据专家委员会委员,高级会员,YOCSEF深圳副主席,曾任美国莱斯大学电子与计算机工程系研究员,专注于联邦学习和人工智能在金融、保险、投资、医疗等领域的研发工作,发表深度学习、云计算、大数据等领域国际论文30余篇,以及专利100多项。多届国内知名大数据人工智能和联邦学习会议出品人。

陈益强中科院计算所泛在计算系统研究中心主任

主题报告八:FedHealth:面向医养结合的联邦迁移学习方法和应用

主题简介:目前面向疾病诊断的智能算法研究是在限定场景下,通过特定的感知方法和特征进行识别分析,其主要缺陷在于限制移动,时空受限,以致无法全面对用户行为画像,并且由于不同医院间的数据孤岛问题,难以实现真正的“大数据”研究。而健康监护需要在普适环境下实现开放域用户行为的智能感知和理解。针对上述问题,近年来我们利用联邦迁移学习的技术框架解决数据和模型的孤岛问题,将范式驱动的限定场景下面向疾病的的诊断模型向普适场景下的健康状态监测进行联邦迁移,从而解决医养结合的应用痛点。演讲将详细描述团队在面向老人、成人以及儿童认知类疾病的医养结合应用研究,包括针对这些问题在算法研究方面做出的独特贡献,以及在此基础上打造的一系列实际应用。

个人介绍:陈益强博士是CCF监事,CCF走进高校工作组组长,CCF杰出会员,CCF杰出演讲者,CCF普适计算专委会副主任。现任中科院计算所泛在计算系统研究中心主任,研究员,博士生导师。入选国家万人计划,科技部中青年领军人才,国家“现代服务业”重点项目总体专家组成员等。他于2003年在中科院计算所获得博士学位,2004年在香港科技大学HKUST开展博士后访问。其研究兴趣是智能人机交互和普适计算,他在IEEETKDE,IEEETMC,IEEETNN,IEEETCSVT等知名国际期刊以及顶级国际会议,如IJCAI,AAAI,ACMMM,Ubicomp等上发表论文100余篇。曾获国家科技进步奖二等奖以及2016中国计算机学会技术发明一等奖(排名第一)及亚太人工智能大会(PRICAI)等国际期刊会议5个最佳论文奖。陈益强博士是欧洲ECMA可穿戴标准的中方负责人,正推动中日韩美瑞等国科学家共同制定面向健康的可穿戴数据标准工作,是IEEESMC下IWCDTC(交互与可穿戴计算及设备技术专业委员会)的共同创始委员,是国家数字音视频标准委员会可穿戴数据标准工作组组长,主持面向健康的AVS-W标准制定工作等。

翁翕,北京大学光华管理学院应用经济系教授

主题报告九:联邦学习之奖励机制设计

主题简介:联邦学习通过将机器学习的计算分散到参与各方的数据库上进行加密的分布式计算,从而可以在不影响数据安全或用户隐私的情形下破解数据孤岛壁垒、实现数据共享。在现实的设计中,数据联邦需要提供足够的经济激励以保证联邦的参与者有激励一直保持参与。因此我们提出联邦学习的机制设计这个问题,来探讨数据联邦应该采取的最优组织和奖励结构。我们首先将提出一个研究联邦学习的奖励机制设计的基本框架,包括核心概念以及它们对应的在联邦学习环境下的数学定义。其次,我们将对联邦学习的奖励机制设计问题按照机制的设定和性质进行分类。最后,我们会给出一些基准定理,帮助联邦学习的从业者在不深入了解博弈论的情形下就能按照他们的最优化目标以及现实场景,选择不同种类的奖励机制。

个人简介:翁翕,现为北京大学光华管理学院应用经济系教授,“日出东方”光华研究学者。他目前主要研究领域为应用微观经济理论,信息经济学和组织经济学。他本科、硕士均毕业于北京大学,博士毕业于美国宾夕法尼亚大学。他的研究成果发表或即将发表于国外顶级学术期刊,如JournalofFinance,ManagementScience,EconomicJournal,AmericanEconomicJournal:Microeconomics,JournalofEconomicTheory(两篇),InternationalEconomicReview(两篇),JournalofEconomicBehavior&Organization,和JournalofEconomics&ManagementStrategy.他主持国家自然科学基金面上项目“组织经济学理论与应用”。翁博士曾获奖项有:2017中国信息经济学青年创新奖,2017北京大学教学优秀奖,2017第十三届北京大学人文社会科学研究优秀成果一等奖,2016北京大学北京银行奖教金,2016中国信息经济学乌家培奖,2015及2016台新金控最佳研究新人奖,2011DavidCassMemorialPrizeinEconomics,2010CESGregoryChowBestPaperAwards.

日程安排

主讲人

主题

09:00-09:10

开场致辞

09:10-09:30

范力欣-微众银行人工智能首席科学家

从数据孤岛到隐私保护:论联邦学习对各行业AI落地之必须及影响

09:30-10:05

范涛-微众银行人工智能部高级研究员

10:05-10:40

秦姝琦-腾讯云大数据及AI中心高级研发工程师

10:40-11:15

朱越-华为消费者BG软件部CTO办公室算法专家

11:15-11:50

张海宁-VMware中国研发中心技术总监

11:50-13:30

午休

13:30-14:05

张钧波-京东智能城市事业部AI平台负责人、京东智能城市研究院资深研究员

THE END
1.机器学习算法:10种常用算法及其实现机器学习算法是人工智能和数据科学领域的核心技术,它们能够从数据中学习规律和模式,并用于预测和决策。本文将介绍10种常用的机器学习算法,探讨它们的原理、应用场景以及Python实现方法。我们将结合开源项目MLAlgorithms,深入了解这些算法的内部工作机制。 为什么要学习机器学习算法? https://blog.csdn.net/helloaiworld/article/details/142791048
2.智能降管理——开启降领域新时代瞪羚云长城战略咨询方式:依托机器学习算法及其他技术建立糖尿病精准模型。 案例:健安华夏建立了基于血糖预测/营养建议的精确糖尿病模型,可预测血糖数据及影响因素,提供个性化控糖方案,实现对糖尿病患者持续、高效管理。 (三)数据库技术与健康要素检测(人工智能+基因型+健康管理) https://www.chinagazelle.cn/news/detail/45e80a28ed074d97b8a56b4ffba42e6d
3.你应该知道的十种机器学习算法机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。 毫无疑问,机器学习/人工智能领域在将来是越来越受欢迎。由于大数据是目前科技行业最热门的趋势,机器学习https://www.wokahui.com/article/industry/2578.html
4.机器学习大概的介绍让即便完全不了解机器学习的人也能了解机器学习接着,我们将这些 数据通过机器学习算法进行处理,这个过程在机器学习中叫做“训练”,处理的结果可以被我们用来对新的数据进行预测,这个结果一般称之为“模型”。对新数据 的预测过程在机器学习中叫做“预测”。“训练”与“预测”是机器学习的两个过程,“模型”则是过程的中间输出结果,“训练”产生“模型”,“模型https://www.elecfans.com/d/685637.html
5.宋旭光:司法裁判的人工智能化及其限度最新文选与人工智能算法和司法裁判理论相对应,下文将分两种进路进行分析:一种是显式编码、封闭规则的算法,即法律专家系统;另一种是机器学习算法,依靠大数据分析实现对判决的预测。前一种进路已经有了数十年的讨论,虽然成果颇丰,但终未显露胜利的迹象,目前也是疲态已显。后一种进路则方兴未艾,野心勃勃。本文讨论的重点就放在http://fxcxw.mzyfz.com/dyna/content.php?id=14711
6.科学网—[转载]联邦学习算法综述摘要:近年来,联邦学习作为解决数据孤岛问题的技术被广泛关注,已经开始被应用于金融、医疗健康以及智慧城市等领域。从3个层面系统阐述联邦学习算法。首先通过联邦学习的定义、架构、分类以及与传统分布式学习的对比来阐述联邦学习的概念;然后基于机器学习和深度学习对目前各类联邦学习算法进行分类比较和深入分析;最后分别从通信https://blog.sciencenet.cn/blog-3472670-1280769.html
7.30了,程序员中的老司机们,30后的路该开向哪里?有一个很有意思的问题,我面试的大部分工程师,哪怕比较资深的,对机器学习都没什么概念,别说 DNN,CNN,LSTM 等,对决策树,SVM,CRF 也完全陌生。相反很多北大清华的应届生,对这些目前热门的机器学习算法都比较熟悉,不少在相关的领域中,使用这些算法发表过论文。换句话说,年轻人搞新算法更有优势。 https://36kr.com/p/1721857474561
8.17个机器学习的常用算法在企业数据应用的场景下, 人们最常用的可能就是监督式学习和非监督式学习的模型。在图像识别等领域,由于存在大量的非标识的数据和少量的可标识数据, 目前半监督式学习是一个很热的话题。而强化学习更多的应用在机器人控制及其他需要进行系统控制的领域。 https://aidc.shisu.edu.cn/78/aa/c13626a161962/page.htm
9.进化计算机器学习进化计算的四种算法进化计算机器学习 进化计算的四种算法 一、遗传算法 进化计算(Evolutionary Computation)包括遗传算法(Genetic Algorithm,GA)、进化策略(Evolutionary Strategies,ES)和基因编程(Genetic Programming)。进化进算是受进化生物学启发而发展起来的计算模型,其实现过程基于达尔文的物竞天择、适者生存的生物进化原理,通过将现实问题https://blog.51cto.com/u_16213577/8939331
10.机器学习决策树算法实战——理论+详细的Python3代码实现作者简介:莫尘,学生一枚,努力学习机器学习,深度学习的相关知识,目前正在研究自然语言处理方向。文本选自莫尘的CSDN博客。 一、前言 本篇讨论决策树的原理和决策树构建的准备工作,机器学习决策树的原理,以及如何选择最优特征作为分类特征,决策树构建,决策树可视化,使用决策树进行分类预测,决策树的存储和读取以及sklearn实战https://dy.163.com/article/DT9SBK1C05198NMR.html
11.台风科学研究为防灾减灾强支撑台风尺度估算研究采用了静止气象卫星红外观测数据、中国气象局和联合台风警报中心(JTWC)的最佳路径资料,以及少量的台风中心和外围飞机观测报数据;选用多层感知器(MLP)、广义回归神经网络(GRNN)等5种典型的机器学习算法,建立卫星观测及台风本体物理属性信息与台风特征大风半径之间的非线性关系。 https://www.cma.gov.cn/2011xwzx/2011xqxxw/2011xqxyw/202305/t20230531_5541701.html
12.AlphaZero加强版AlphaTensor问世,发现史上最快矩阵乘法算法大量研究利用ML技术进行大脑相关研究,例如将高维非线性模式分类方法应用于功能磁共振成像图像,以区分与谎言和真相相关的大脑活动的空间模式;一种结合常规和灌注磁共振的计算机辅助分类方法,用于鉴别诊断脑瘤类型和分级;利用SVM通过分析头皮EEG,通过构建特定于患者的分类器来检测癫痫发作;各种机器学习算法(如SVM、NN和随机森https://www.medsci.cn/article/show_article.do?id=97c6e419443f
13.用反向传播算法解释大脑学习过程?Hinton等人新研究登上Nature子刊机器之心报道 魔王、Jamin、杜伟 反向传播可以解释大脑学习吗?近日 Hinton 等人的研究认为,尽管大脑可能未实现字面形式的反向传播,但是反向传播的部分特征与理解大脑中的学习具备很强的关联性。该研究将之前的相关研究置于「NGRAD」框架下,NGRAD 算法利用活动状态的差异驱动突触更新,这与反向传播类似。 https://www.thepaper.cn/newsDetail_forward_7047242
14.《常用算法之智能计算(三)》:机器学习计算因为机器学习计算中涉及了大量的统计学理论,机器学习与统计推断的联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习计算关注可以实现的、行之有效的学习算法,很多推论问题具有无程序可循的难度,所以部分的机器学习研究是开发简单、处理容易的近似算法。http://www.kepu.net/blog/zhangjianzhong/201903/t20190327_475625.html