SchölkopfBengio等新作解读:因果表征学习——连接因果和机器学习的桥梁

开通VIP,畅享免费电子书等14项超值服

首页

好书

留言交流

下载APP

联系客服

2021.03.03

作者:蔡心宇审校:龚鹤扬陆超超

为了回答这些问题,让我们从表征学习说起。表征学习RepresentationLearning是机器学习中的重要问题,良好的表征是机器学习算法成功的重要条件;正因如此,近十年来深度学习借助神经网络强大的表达能力、海量的数据以及强大的算力,自动地从数据中学习表征,取代了传统的人工制作的特征,取得了瞩目的成就。由深度学习三巨头之二的YoshuaBengio和YannLeCun牵头创办的深度学习顶会,即命名为国际学习表征会议InternationalConferenceonLearningRepresentations,足见表征学习的重要性。

尽管深度学习在近十年极大地推动了机器学习的发展,但是仍有许多问题亟待解决,例如将知识迁移到新问题上的能力。许多关键问题都可以归结为OOD(out-of-distribution)问题。因为统计学习模型需要独立同分布(i.i.d.)假设,若测试数据与训练数据来自不同的分布,统计学习模型往往会出错。然而在很多情况下,i.i.d.的假设是不成立的,而因果推断所研究的正是这样的情形:如何学习一个可以在不同分布下工作、蕴含因果机制的因果模型(CausalModel),并使用因果模型进行干预或反事实推断。

如果说微分方程是对物理系统全面详尽的表述,那么统计模型(StatisticalModel)可被看作表面的粗糙的描述。它无法预测干预的效果,但是的优点在于通常可以从观察数据中学习,而前者通常需要专家来提出。因果建模则存在于这两个极端之间,它期望能够像物理模型一样预测干预的效果,但同时可以在一些假设下,通过数据驱动的方法找到这样的模型,来取代专家知识。

因果科学与CausalAI读书会

1.Pearl,Judea,MadelynGlymour,andNicholasP.Jewell.Causalinferenceinstatistics:Aprimer.JohnWiley&Sons,2016.(本书中译版《统计因果推理入门(翻译版)》已由高等教育出版社出版)

2.Peters,Jonas,DominikJanzing,andBernhardSchlkopf.Elementsofcausalinference:foundationsandlearningalgorithms.TheMITPress,2017.

THE END
1.机器学习中常见4种学习方法13种算法一. 4大主要学习方法 1.1 监督式学习 在监督式学习下,输入数据被称为“训练数据”,每组训练数据有一个明确的标识或结果,如对防垃圾邮件系统中“垃圾邮件”“非垃圾邮件”,对手写数字识别中的“1“,”2“,”3“,”4“等。在建立预测模型的时候,监督式学习建立一个学习过程,将预测结果与“训练数据”的实际结果https://blog.csdn.net/m0_51634403/article/details/128760229
2.在机器学习领域,有几种主要的学习方式在企业数据应用的场景下, 人们最常用的可能就是监督式学习和非监督式学习的模型。在图像识别等领域,由于存在大量的非标识的数据和少量的可标识数据, 目前半监督式学习是一个很热的话题。而强化学习更多的应用在机器人控制及其他需要进行系统控制的领域。 https://www.elecfans.com/d/1641474.html
3.网络工程专业人才培养方案(2022)5. 工具性知识。掌握数学、外语、计算机与信息技术应用、社会调查与研究方法、专业论文写作等知识。 6. 法律与管理知识。掌握从事网络工程专业所需的法律、法规、标准及工程管理、网络管理、经济决策知识。 (2)能力要求 1.工程知识学习能力。能够融会贯通数学、自然科学、工程基础和专业知识解决复杂网络工程问题的能力https://www.csust.edu.cn/jtxy/info/1148/20900.htm
4.机器学习与数据挖掘:方法和应用PDF扫描版[16MB]电子书下载机器学习与数据挖掘:方法和应用分为5个部分,共18章,较为全面地介绍了机器学习的基本概念,并讨论了数据挖掘和知识发现中的有关问题及多策略学习方法,具体地阐述了机器学习与数据挖掘在工程设计,文本、图像和音乐,网页分析、计算机病毒和计算机控制,医疗诊断、生物医疗信号分析和水质分析中的生物信号处理等方面的应用情况https://www.jb51.net/books/258508.html
5.《机器学习方法与岩土工程应用》(林沛元赵辰洋仉文岗薛亚东著当当网图书频道在线销售正版《机器学习方法与岩土工程应用》,作者:林沛元 赵辰洋 仉文岗 薛亚东 著,出版社:中国建筑工业出版社。最新《机器学习方法与岩土工程应用》简介、书评、试读、价格、图片等相关信息,尽在DangDang.com,网购《机器学习方法与岩土工程应用》,就http://product.dangdang.com/29651077.html
6.机器学习方法在二进制分析中的应用与思考腾讯云开发者社区机器学习方法在二进制分析中的应用与思考 1. 二进制分析的现状 众所周知,程序语言从高层到底层约莫是源码,中间代码(IR),汇编码到二进制。在这过程中,一方面是为了解决跨平台所导致的问题,另一方面也是为了节省内存,编译器做了很多层次的优化。由此可见,从高层到低层的代码,信息缺失是非常严重的,从而导致从低层https://cloud.tencent.com/developer/article/1447653
7.使用AmazonSageMaker构建机器学习应用亚马逊AWS官方博客使用Amazon SageMaker 构建机器学习应用 随着社会的发展和科技进步,人工智能变得无处不在,然而,人工智能广泛应用仍然面临着巨大的挑战:一是掌握人工智能专业知识的人才不足;二是构建和扩展人工智能的技术产品有难度;三是在生产经营中部署人工智能应用费时且成本高。最终导致缺乏低成本、易使用、可扩展的人工智能产品和http://aws.amazon.com/cn/blogs/china/building-machine-learning-applications-with-amazon-sagemaker/
8.数字化观察(100)华夏银行吴永飞等:数字金融领域小样本学习技术然而,产业数字金融风控所使用的数据要素情况不同于以往,特别是对公客户场景化、生态化细分后,数据样本量很小,难以满足风控建模的需要;而小样本学习目前在机器学习与数据挖掘领域仍属世界性难题。本文从小样本学习技术创新入手,深入探索数字经济时代下面向产业数字金融的小样本学习应用研究与实践。https://bank.hexun.com/2022-05-31/206058282.html