机器学习是如何区分猫和狗的?

今天我们将送出三本由图灵新知提供的优质科普书籍《生命是什么》

《生命是什么》是浙江大学教授、科普作家、“文津图书奖”“吴大猷金奖”“菠萝化学奖”““全球华语科幻星云奖”得主王立铭最新科普力作。本书通过生动的文笔和有趣有料的生物学故事,揭开了生命科学神秘的面纱,不仅生动地解读了生命的定义及奥秘,而且详细地追溯了生命的起源和演化,展现了人类探索生命奥秘的伟大历程,讲述了科学家在揭示生命奥秘过程中的重要发现。

作者:ChrisBudd翻译:Aprilis审校:Nothing

最近人工智能方面最重要的发展之一就是机器学习了。它主要着眼于智能,而不是传统计算机程序意义上指定机器做什么东西,也就是说机器自己可以学习,这样它就可以直接从经验(或者数据)中学会如何处理复杂的任务。

即使是很简单的机器学习算法也能区分照片上的猫和狗

伴随着计算机速度的提高和算法的进步,机器学习的发展也非常迅速。从中衍生的算法已经对我们的生活造成了深刻的影响,而且有时候比人类做得更好。那么问题来了,机器学习到底是如何工作的?

从经验中学习

为了保证这件事有一定的可行性,假设你有以前招聘时收到的简历。每一份简历都有被录用或没有被录用的记录。你把这些简历的一半用来训练机器,让它发现这些简历是否被成功录用的模式。因此,如果你给机器一份简历,它就能知道这份简历是否可以被录用。训练完机器,你用另一半的简历来做测试。假设成功率很高,你就会相信机器可以胜任筛选简历的工作了。在上述的每一个阶段,都没有人的干预。这样的一个过程,以现在的计算机的能力是完全可以做到的。

基本要点

为了让机器学习的过程更加透明化,我们用开发可识别手写数字的机器的非常具体的例子来考虑模式识别的问题。这样的机器应该能够做到:不管一个手写的数字写得怎么样,它都能识别出来。

即使对人类来说,手写的数字都能难得像密文一样

第二,我们要训练机器利用这些提取的信息来学习辨别数字。完成这个过程的一个很普遍的方法就是神经网络。这个技术基于我们对大脑如何工作的认识。第一步是,创造大量的“神经元”并把它们互相连接。这些神经元可以互相发送信息。第二步,让神经网络去求解大量的结果已知的问题。通过这个过程,它就“学会”了神经元之间应该如何连接,所以它就能成功地识别数据中哪些模式可以产生正确的结果。

这种神经网络的早期例子是称为感知器的单层系统,它可以模拟单个神经元。感知器的概念是FrankRosenblatt在1962年提出的。感知器的典型结构如下所示。

感知器有n个输入,从X1,X2到Xn,每个输入都乘以一个权重因子Wi再相加,和为

如果这个结果比某个临界值C大,就返回1,否则,就返回0。

就是说,当

就返回1,而

就返回0。

在我们的例子中,Xi就是提取的图像的特征,决策就是这个数字是3还是4。训练感知器的过程包括找到合适的权重因子wi和临界值C使得感知器识别到正确的数字。要做到这一点,需要谨慎使用基于统计的数学优化算法。

一个例子

举个例子,设想我们只从图像中提取两个特征X1,X2,X1可以是图像中直线的数目,X2是图像中交叉点的数目。每个手写的数字3和4都有这两个值,这样就可以在坐标中表示出来。由于数字“3”中没有直线也没有交叉的点,所以就可能对应接近坐标(0,0)的点。而数字“4”中有三条直线和一个交叉的点,所以它在坐标中对应(3,1)附近的点。

这样一来,感知器中计算的和就是

对一个给定的w1,w2和C,令方程等于0就决定了一条直线l。如果,使用图像来训练机器,感知器设法找到w1,w2和C的值使得l可以把3和4对应的点全部分开,如下图所示,这样它就可以有很大概率可以正确识别一个新的图像中的数字是3还是4。如果存在这样的一条直线l,这样的数据就叫做线性可区分。

设想红色的点来自图像中的数字“3”,蓝色的点来自数字“4”。如果算法使用C=2,X1=X2=1,这样加权和等于0对应的直线如图所示。对于蓝色的点来说,它对应的加权和大于0,对于红色的点来说,其对应的加权和小于0,所以算法总能给出正确的结果。

如果数据点不能被一条直线分开——如果数据不是线性可区分的——你可以在更高的维度上做这件事并希望在更高的维度上它们是线性可区分的。一个非常简单的例子,你可以把点画到屏幕以外的地方,画在三维的空间中。当然了,实际上通常都会使用更复杂的办法。另外,如果你从图像中提取的特征不只是两个,也可以在更高的维度上使用相同的办法。

感知器的方法在区分猫和狗方面也适用。

这些图演示了随着可获得的数据的增加,算法如何更新直线的选择(也就是,常数C和W1,W2)

神经网络和深度学习

简单的感知器可以被训练做很多简单的任务,但很快就达到它的极限了。很明显,通过将许多感知器耦合在一起可以实现更多,但这种发展必须等待更强大的计算机的出现。当感知层连接在一起产生神经网络时,取得了重大突破。这种神经网络的典型结构如下所示。在这种情况下,输入组合以触发第一层感知器。这些输出组合起来触发下一层,最后这些组合起来给出输出。

层数越多,就可以拥有“更深层次”的网络。然后通过为上面的每个连接分配权重来训练这样的网络。这个过程有点类似于大脑加强或减弱神经通路的方式。深度学习描述了训练这种神经网络的过程。

由于新的数学优化算法的发展,结合广泛的(谷歌的DeepMind更广泛)计算机能力,现在已经可以做到。在为网络找到合适的权重Wi的过程结束时,你会有一个黑盒子,它可以非常快速地运行并且可以做决策。

不同的方法

在有监管学习中,由网络的使用者预先提供一组示例输入和输出对。然后,学习方法要找到一个神经网络,该网络提供与示例匹配的输出。将神经网络的输出与示例的输出进行比较的常用方法是找出正确输出和实际输出之间的均方误差。然后训练网络以使该误差最小化。它的一个非常标准的应用是在统计学中的曲线拟合,但它也同样适用于手写识别和其他模式识别问题。

为了学习下象棋,alphazero和自己下了700000局

近年来,机器学习的数学算法取得了很大进展。卷积神经网络(CNN)是这些方法的一个令人兴奋的新的扩展,同时它也非常重要。它将图像处理技术与深度神经网络相结合。它们可用于人脸识别,甚至可用于检测情绪。它们现在被用于许多其他应用,包括医学诊断。

随着更快的训练算法和越来越多的数据的推动,诞生了更复杂、更深层次的网络,这让机器学习进展迅猛。但让机器去做可能改变生命的决定(例如医疗诊断)是否安全而且符合伦理道德?

原文链接:

互动问题

【互动问题:让机器去做可能改变生命的决定(例如医疗诊断)是否安全而且符合伦理道德?】

编辑:loulou

↓点击标题即可查看↓

1.日本数学鬼才的幻象魔术,千万人已看瞎

2.这场意外里,安卓手机毫发无伤,苹果设备居然近乎全灭

3.学物理的,随时随地都能把天聊死

4.微博一个假测试,让全网网民都压力过大了?

6.“我对普通的人类没有兴趣,你们只要能求出超排列的准确公式,就尽管来找我吧!以上”

7.到底几点睡觉才算是熬夜?

8.一幅图读懂量子力学(下)

9.数学和物理太难?这些动图让你秒懂抽象概念

10.癌细胞既然可以无限增殖,岂不是可以用来做口粮?|No.129

THE END
1.神经网络的持续学习:在线学习与非监督学习在深度学习领域,神经网络的持续学习是一个重要的研究方向。在线学习和非监督学习是两种常见的持续学习方法。本文将从背景、核心概念、算法原理、最佳实践、应用场景、工具推荐等多个方面进行深入探讨。 1. 背景介绍 神经网络的持续学习是指在网络训练过程中,通过不断地接受新的数据和信号,使网络能够不断地更新和优化自https://blog.csdn.net/universsky2015/article/details/135782662
2.在线深度学习mob64ca12d6c78e的技术博客在这个代码示例中,我们首先利用make_classification生成样本数据,然后构建了一个简单的神经网络并进行了初始训练。与传统的训练模式不同,我们在最后通过简单地调用model.fit()方法更新模型,模拟了在线学习的过程。 甘特图和类图 为了更好地理解在线深度学习的过程,可以用甘特图展示不同阶段的任务安排,以下是一个简单的甘特https://blog.51cto.com/u_16213326/11689672
3.机器学习——神经网络与深度学习:从基础到应用随着新算法、新模型和新硬件的出现,深度学习的应用前景愈发广阔。同时,深度学习在可解释性、数据需求、模型偏见等方面也面临许多挑战。未来,随着技术的不断进步,神经网络和深度学习将为人类生活带来更多可能性。https://cloud.tencent.com/developer/article/2456527
4.BrilliantBrilliant是一个在线学习平台,提供Introduction to Neural Networks课程介绍神经网络知识,让学生理解神经网络的基础知识,学习构建和调节神经网络,并应用神经网络解决实际问题。 Introduction to Neural Networks是Brilliant平台上的一门神经网络入门课程。这门课程面向初学者,介绍神经网络的基本概念、模型与算法。学习者可以在这https://www.aizhinan.cn/tools/2320.html
5.在线网课学习课堂《神经网络理论及应用(北工商)》单元测试考核在线网课学习课堂《神经网络理论及应用(北工商)》单元测试考核答案.docx,注:不含主观题 第1题 判断题 (1分) 人工神经元是一个多输入、多输出的信息处理单元 第2题 判断题 (1分) 人工神经元数学模型决定该节点本身的信息处理能力 第3题 单选题 (1分) 人工神经网络的激活函数https://max.book118.com/html/2022/0429/8132040142004075.shtm
6.今我来思,堆栈泛化(StackedGeneralization)7. 其他, 在线学习, 神经网络,遗传学习, 群体智能 等: -在线学习 Online stacking (OS) Linear perceptron with online random tree Random bit regression (RBR) Vowpal Wabbit (VW) Follow the Regularized Leader (FTRL) -神经网络Artificial neural network (ANN) https://www.jianshu.com/p/46ccf40222d6
7.李凌轩2).矿山机械的常用零部件(齿轮箱、润滑系统、传动轴等)的故障在线诊断技术 3).客户端、控制中心、数据库系统、在线物联网络平台的界面开发及其应用软件的开发 4).基于各类神经网络技术、在线学习技术等的在线诊断的故障专家系统的研发 涉及的主要理论基础: http://kzgc.neuq.edu.cn/info/1022/1217.htm
8.ai笔记在线阅读 这些课程专为已有一定基础(基本的编程知识,熟悉Python、对机器学习有基本了解),想要尝试进入人工智能领域的计算机专业人士准备。介绍显示:“深度学习是科技业最热门的技能之一,本课程将帮你掌握深度学习。” 在这5堂课中,学生将可以学习到深度学习的基础,学会构建神经网络,并用在包括吴恩达本人在内的多位https://github.com/kevenlau/deeplearning_ai_books
9.《零基础学机器学习》(黄佳)简介书评在线阅读人工智能教程籍,深入浅出神经网络与深度学习入门,基于python框架算法,机器学习入门小白书,与小冰一起课堂培训丰富的实战案例赠送全书实例源代码、案例数据集。 作者:黄佳出版社:人民邮电出版社出版时间:2020年12月 手机专享价 ¥ 当当价降价通知 ¥85.30 http://product.dangdang.com/29159728.html
10.DeepLearningSpecialization(DeepLearning.AI)Coursera深度学习专业为您提供了一条通往人工智能世界的道路,帮助您获得提升职业生涯水平的知识和技能。在学习过程中,您还将获得来自行业和学术界深度学习专家的职业建议。 应用的学习项目 学习结束后,您将能够 - 构建和训练深度神经网络,实现矢量化神经网络,确定架构参数,并将 DL 应用于您的应用程序 - 使用最佳实践来训练https://www.coursera.org/specializations/deep-learning
11.深度学习与神经网络有什么区别?深度学习和神经网络是人工智能领域中的两个重要概念,它们在很多方面有着相似之处,但也存在一些区别。本文将从定义、结构、应用等方面来探讨深度学习与神经网络的区别。 定义 深度学习是一种基于人工神经网络的机器学习算法,在大量数据上训练多层神经网络模型,实现对复杂问题的高效处理。而神经网络则是一种模拟生物神经系https://www.cda.cn/bigdata/201326.html
12.Science:神经网络模型的特征学习机制澎湃号·湃客澎湃新闻神经网络一直在推动人工智能的突破,包括现在在金融、人力资源和医疗保健等各个领域中广泛使用的大语言模型。神经网络通过反向传播和梯度下降等方法,在输入数据上自动地“发现”有意义的模式或特征。揭秘特征学习的机制一直是悬而未决的问题,但这是提高神经网络性能和可解释性的关键。 https://www.thepaper.cn/newsDetail_forward_26894581
13.神经网络3神经网络的学习算法 4神经网络的应用领域 神经元模型 编辑本段 神经网络神经元是神经网络的基本单元,其被设计成类比人类神经元的构造和工作原理。神经元由三个部分组成:树突、细胞体和轴突。树突接受来自其他神经元的电信号,而细胞体会将这些信号进行加权和求和,判断是否要产生输出信号。如果细胞体的加权和大于一https://vebaike.com/doc-view-943.html