SchölkopfBengio等新作解读:因果表征学习——连接因果和机器学习的桥梁

开通VIP,畅享免费电子书等14项超值服

首页

好书

留言交流

下载APP

联系客服

2021.03.03

作者:蔡心宇审校:龚鹤扬陆超超

为了回答这些问题,让我们从表征学习说起。表征学习RepresentationLearning是机器学习中的重要问题,良好的表征是机器学习算法成功的重要条件;正因如此,近十年来深度学习借助神经网络强大的表达能力、海量的数据以及强大的算力,自动地从数据中学习表征,取代了传统的人工制作的特征,取得了瞩目的成就。由深度学习三巨头之二的YoshuaBengio和YannLeCun牵头创办的深度学习顶会,即命名为国际学习表征会议InternationalConferenceonLearningRepresentations,足见表征学习的重要性。

尽管深度学习在近十年极大地推动了机器学习的发展,但是仍有许多问题亟待解决,例如将知识迁移到新问题上的能力。许多关键问题都可以归结为OOD(out-of-distribution)问题。因为统计学习模型需要独立同分布(i.i.d.)假设,若测试数据与训练数据来自不同的分布,统计学习模型往往会出错。然而在很多情况下,i.i.d.的假设是不成立的,而因果推断所研究的正是这样的情形:如何学习一个可以在不同分布下工作、蕴含因果机制的因果模型(CausalModel),并使用因果模型进行干预或反事实推断。

如果说微分方程是对物理系统全面详尽的表述,那么统计模型(StatisticalModel)可被看作表面的粗糙的描述。它无法预测干预的效果,但是的优点在于通常可以从观察数据中学习,而前者通常需要专家来提出。因果建模则存在于这两个极端之间,它期望能够像物理模型一样预测干预的效果,但同时可以在一些假设下,通过数据驱动的方法找到这样的模型,来取代专家知识。

因果科学与CausalAI读书会

1.Pearl,Judea,MadelynGlymour,andNicholasP.Jewell.Causalinferenceinstatistics:Aprimer.JohnWiley&Sons,2016.(本书中译版《统计因果推理入门(翻译版)》已由高等教育出版社出版)

2.Peters,Jonas,DominikJanzing,andBernhardSchlkopf.Elementsofcausalinference:foundationsandlearningalgorithms.TheMITPress,2017.

THE END
1.人工智能三大算法机器学习深度学习与强化学习的融合与应用前景人工智能三大算法的概述 人工智能(AI)作为一个多学科交叉领域,其核心在于模拟人类智能行为。随着技术的发展,人们提出了许多不同类型的人工智能方法,其中机器学习、深度学习和强化学习是其中最为重要的三个子集,它们分别代表了从基础到高级别的人工智能技术。 机器学习https://www.xstkmqmgl.cn/zhi-neng/481943.html
2.多智能体强化学习知乎mob6454cc70863a的技术博客多智能体强化学习知乎,系统简介基于ROBO-MAS多智能体自主协同高频投影定位系统通过采用ROBO-MAS桌面型群体智能机器人,在小型实验场地内通过高频光电投影定位技术实现机器人位置感知和数据通讯,实现“开放式群体智能研究和多智能体自主协同”的研究目标。系统为群体智能研https://blog.51cto.com/u_16099271/12897860
3.深度强化学习离线强化学习(OfflineReinforcementLearnin应用场景:在线强化学习适用于那些需要实时决策和快速适应环境变化的任务,比如机器人控制、自动驾驶等。 离线强化学习更侧重于利用预先收集好的数据进行策略学习,而在线强化学习则更侧重于通过与环境的交互实时地学习和优化策略。https://blog.csdn.net/qq_40718185/article/details/139231769
4.机器学习——强化学习与深度强化学习腾讯云开发者社区近年来,强化学习(Reinforcement Learning, RL)在多个领域取得了巨大的进展。从早期简单的迷宫导航问题到今天 AlphaGo 击败围棋世界冠军,强化学习的潜力得到了充分展现。而随着深度学习的引入,深度强化学习(Deep Reinforcement Learning, DRL)更是将这一技术推向了前.https://cloud.tencent.com/developer/article/2455966
5.科学网—[转载]群视角下的多智能体强化学习方法综述多智能体深度强化学习方法结合了深度学习、强化学习与多智能体系统理论等技术,赋予智能体更强的感知、推理、决策和学习能力,并在许多应用场景中展现出强大的潜力。目前,国内外相关领域学者从不同视角对多智能体强化学习的相关研究进行了综述分析。Yang等人[1]借助博弈理论相关知识,研究了基于博弈(特别是元博弈)理论的https://blog.sciencenet.cn/home.php?mod=space&uid=3472670&do=blog&id=1422698
6.2020届计算机科学方向毕业设计(论文)阶段性汇报深度学习在视频分析中的应用 在本次汇报中,我将介绍毕设课题选定的视频分析具体任务:时序动作检测(Temporal Action Proposal)的相关内容,包括任务背景、最近研究成果、数据情况以及切入点等。我还将汇报过去一阶段的工作内容和下一阶段的工作计划。 范舟 基于强化学习的推荐与广告合并算法设计 https://zhiyuan.sjtu.edu.cn/html/zhiyuan/announcement_view.php?id=3709
7.基于深度强化学习的水面无人艇路径跟踪方法6.针对上述现有技术的不足,本发明所要解决的技术问题是:如何提供一种基于深度强化学习的水面无人艇路径跟踪方法,无需进行环境和无人艇运动建模并且具备自适应能力,从而能够进一步提高无人艇路径跟踪控制的稳定性和准确性。 7.为了解决上述技术问题,本发明采用了如下的技术方案: https://www.xjishu.com/zhuanli/54/202210772926.html/
8.ICLR上新强化学习扩散模型多模态语言模型,你想了解的前沿本周,全球最负盛名的人工智能盛会之一 ICLR 大会将在奥地利维也纳举办。所以,今天的“科研上新”将为大家带来多篇微软亚洲研究院在 ICLR 2024 上的精选论文解读,涉及领域涵盖深度强化学习、多模态语言模型、时间序列扩散模型、无监督学习等多个前沿主题。 https://www.msra.cn/zh-cn/news/features/new-arrival-in-research-11
9.语义分割和强化学习在自动驾驶中的应用基于“语义分割和强化学习在自动驾驶中的应用”的文献综述,评价各主流技术的性能、优点和缺陷 - 飞桨AI Studiohttps://aistudio.baidu.com/aistudio/projectdetail/5456947
10.深度学习技术在自动驾驶中的应用AET在过去的十年里,自动驾驶汽车技术取得了越来越快的进步,主要得益于深度学习和人工智能领域的进步。作者就自动驾驶中使用的深度学习技术的现状以及基于人工智能的自驱动结构、卷积和递归神经网络、深度强化学习范式进行了详细的阐述。并对这些方法在自动驾驶场景感知、路径规划、行为仲裁和运动控制算法进行综述,同时就目前自动http://www.chinaaet.com/article/3000110152
11.论文精读与思考:深度强化学习的组合优化研究进展论文基本信息 作者:李凯文、张涛、王锐等 作者单位:国防科技大学 期刊:自动化学报 时间:2021年11月组合优化问题 链接:基于深度强化学习的组合优化研究进展 (aas.nhttps://www.jianshu.com/p/3887528006d0
12.机器学习,能为5G通信技术带来哪些新挑战?2、机器学习技术介绍 随着人工智能技术的发展,为传统方法无法解决的难题提供了新的思路,作为人工智能技术的一个主要分支,机器学习通过从以前的数据中学习并提取特征来解决复杂的问题。 机器学习主要分为三个分支:监督学习、无监督学习和强化学习。图一说明了人工智能(Artificial Intelligence,AI)、机器学习(Machine Learninhttps://www.xakpw.com/single/31167
13.AlphaGo背后的公司,11年从亏损6个亿到盈利6千万!基于学习到的奖励和从不同任务中获得的大量经验数据集,使用批量强化学习离线学习机器人策略,这种方法可以训练agent执行具有挑战性的操作任务,如堆叠刚性物体。 堆叠的新基准 最近,DeepMind推出了RGB堆叠,作为基于视觉的机器人操作任务的新基准。 在这里,机器人必须学会如何抓住不同的物体,并使它们相互平衡。这不同于以前https://www.niaogebiji.com/article-81978-1.html
14.达摩院决策智能实验室杨超:SafeRL介绍及在电网调度中的应用我们可以把强化学习和数学建模两种方法进行结合,以让每一时刻都不违反约束,我们以知识模型作为 safety layer 来进行安全约束保障。通过与求解的深度结合,可以使 policy 更好地感知到约束集区域,配合可行性检验、warm-start 机制以及冗余约束识别,从而尽可能减少 safety layer 的调用频次及求解耗时。 https://www.thepaper.cn/newsDetail_forward_18423330