AI十大流行算法实用资讯青少年人工智能资源与创新平台互联网教育智能技术及应用国家工程实验室

机器学习是该行业的一个创新且重要的领域。我们为机器学习程序选择的算法类型,取决于我们想要实现的目标。

现在,机器学习有很多算法。因此,如此多的算法,可能对于初学者来说,是相当不堪重负的。今天,我们将简要介绍10种最流行的机器学习算法,这样你就可以适应这个激动人心的机器学习世界了!

让我们言归正传!

1.线性回归

线性回归(LinearRegression)可能是最流行的机器学习算法。线性回归就是要找一条直线,并且让这条直线尽可能地拟合散点图中的数据点。它试图通过将直线方程与该数据拟合来表示自变量(x值)和数值结果(y值)。然后就可以用这条线来预测未来的值!

这种算法最常用的技术是最小二乘法(Leastofsquares)。这个方法计算出最佳拟合线,以使得与直线上每个数据点的垂直距离最小。总距离是所有数据点的垂直距离(绿线)的平方和。其思想是通过最小化这个平方误差或距离来拟合模型。

例如,简单线性回归,它有一个自变量(x轴)和一个因变量(y轴)

2.逻辑回归

逻辑回归(Logisticregression)与线性回归类似,但它是用于输出为二进制的情况(即,当结果只能有两个可能的值)。对最终输出的预测是一个非线性的S型函数,称为logisticfunction,g()。

这个逻辑函数将中间结果值映射到结果变量Y,其值范围从0到1。然后,这些值可以解释为Y出现的概率。S型逻辑函数的性质使得逻辑回归更适合用于分类任务。

3.决策树

决策树(DecisionTrees)可用于回归和分类任务。

在这一算法中,训练模型通过学习树表示(Treerepresentation)的决策规则来学习预测目标变量的值。树是由具有相应属性的节点组成的。

在每个节点上,我们根据可用的特征询问有关数据的问题。左右分支代表可能的答案。最终节点(即叶节点)对应于一个预测值。

每个特征的重要性是通过自顶向下方法确定的。节点越高,其属性就越重要。

决定是否在餐厅等候的决策树示例。

4.朴素贝叶斯

朴素贝叶斯(NaiveBayes)是基于贝叶斯定理。它测量每个类的概率,每个类的条件概率给出x的值。这个算法用于分类问题,得到一个二进制“是/非”的结果。看看下面的方程式。

朴素贝叶斯分类器是一种流行的统计技术,可用于过滤垃圾邮件!

5.支持向量机(SVM)

支持向量机(SupportVectorMachine,SVM)是一种用于分类问题的监督算法。支持向量机试图在数据点之间绘制两条线,它们之间的边距最大。为此,我们将数据项绘制为n维空间中的点,其中,n是输入特征的数量。在此基础上,支持向量机找到一个最优边界,称为超平面(Hyperplane),它通过类标签将可能的输出进行最佳分离。

超平面与最近的类点之间的距离称为边距。最优超平面具有最大的边界,可以对点进行分类,从而使最近的数据点与这两个类之间的距离最大化。

例如,H1没有将这两个类分开。但H2有,不过只有很小的边距。而H3以最大的边距将它们分开了。

6.K-最近邻算法(KNN)

K-最近邻算法(K-NearestNeighbors,KNN)非常简单。KNN通过在整个训练集中搜索K个最相似的实例,即K个邻居,并为所有这些K个实例分配一个公共输出变量,来对对象进行分类。

K的选择很关键:较小的值可能会得到大量的噪声和不准确的结果,而较大的值是不可行的。它最常用于分类,但也适用于回归问题。

用于评估实例之间相似性的距离可以是欧几里得距离(Euclideandistance)、曼哈顿距离(Manhattandistance)或明氏距离(Minkowskidistance)。欧几里得距离是两点之间的普通直线距离。它实际上是点坐标之差平方和的平方根。

KNN分类示例

7.K-均值

K-均值(K-means)是通过对数据集进行分类来聚类的。例如,这个算法可用于根据购买历史将用户分组。它在数据集中找到K个聚类。K-均值用于无监督学习,因此,我们只需使用训练数据X,以及我们想要识别的聚类数量K。

该算法根据每个数据点的特征,将每个数据点迭代地分配给K个组中的一个组。它为每个K-聚类(称为质心)选择K个点。基于相似度,将新的数据点添加到具有最近质心的聚类中。这个过程一直持续到质心停止变化为止。

8.随机森林

随机森林(RandomForest)是一种非常流行的集成机器学习算法。这个算法的基本思想是,许多人的意见要比个人的意见更准确。在随机森林中,我们使用决策树集成(参见决策树)。

为了对新对象进行分类,我们从每个决策树中进行投票,并结合结果,然后根据多数投票做出最终决定。

(a)在训练过程中,每个决策树都是基于训练集的引导样本来构建的。

(b)在分类过程中,输入实例的决定是根据多数投票做出的。

9.降维

由于我们今天能够捕获的数据量之大,机器学习问题变得更加复杂。这就意味着训练极其缓慢,而且很难找到一个好的解决方案。这一问题,通常被称为“维数灾难”(Curseofdimensionality)。

降维(Dimensionalityreduction)试图在不丢失最重要信息的情况下,通过将特定的特征组合成更高层次的特征来解决这个问题。主成分分析(PrincipalComponentAnalysis,PCA)是最流行的降维技术。

主成分分析通过将数据集压缩到低维线或超平面/子空间来降低数据集的维数。这尽可能地保留了原始数据的显著特征。

可以通过将所有数据点近似到一条直线来实现降维的示例。

10.人工神经网络(ANN)

人工神经网络(ArtificialNeuralNetworks,ANN)可以处理大型复杂的机器学习任务。神经网络本质上是一组带有权值的边和节点组成的相互连接的层,称为神经元。在输入层和输出层之间,我们可以插入多个隐藏层。人工神经网络使用了两个隐藏层。除此之外,还需要处理深度学习。

人工神经网络的工作原理与大脑的结构类似。一组神经元被赋予一个随机权重,以确定神经元如何处理输入数据。通过对输入数据训练神经网络来学习输入和输出之间的关系。在训练阶段,系统可以访问正确的答案。

如果网络不能准确识别输入,系统就会调整权重。经过充分的训练后,它将始终如一地识别出正确的模式。

每个圆形节点表示一个人工神经元,箭头表示从一个人工神经元的输出到另一个人工神经元的输入的连接。

接下来是什么?现在,你已经了解了最流行的机器学习算法的基础介绍。你已经准备好学习更为复杂的概念,甚至可以通过深入的动手实践来实现它们。如果你想了解如何实现这些算法,可以参考Educative出品的GrokkingDataScience课程,该课程将这些激动人心的理论应用于清晰、真实的应用程序。

THE END
1.必知!人工智能10大热门算法!人工智能算法有哪些模型原理:逻辑回归是一种机器学习算法,专为解决二分类问题而设计。该算法能够将连续的输入变量映射到离散的输出结果,通常以二进制形式表示。通过应用逻辑函数,逻辑回归将线性回归的预测结果转换到(0,1)的范围内,从而生成分类的概率。 模型训练:逻辑回归模型的训练依赖于已知分类的样本数据。在训练过程中,通过优化模型的https://blog.csdn.net/m0_74914256/article/details/141901236
2.编程35种算法汇总编程35种算法是编程世界的核心,它们可以解决各种问题。从搜索和排序到图算法和动态规划,每种算法都有其独特的应用场景。通过掌握这些算法,您将能够更好地理解编程世界的奥秘,并且能够更高效地解决问题。无论您是新手还是有经验的程序员,学习和掌握这些算法都是必不可少的。希望本文对您有所帮助,并能够激发您在https://baijiahao.baidu.com/s?id=1781330184170815567&wfr=spider&for=pc
3.智能降管理——开启降领域新时代瞪羚云长城战略咨询目前美国有70%的人享有健康管理服务,而中国享有这项服务的人不足0.1%,随着中国经济不断提高,对健康管理需求将扩大。 ③国家政策支持及行业规划出台 表2-1国家部分相关政策、战略及行业报告列表 ④人工智能技术的大力提升 以深度卷积神经网络为核心的深度学习算法,加速了人工智能技术发展,带动了健康管理领域与其的跨界https://www.chinagazelle.cn/news/detail/45e80a28ed074d97b8a56b4ffba42e6d
4.性能提升成本降低,这是分布式强化学习算法最新研究进展分布式强化学习是一个综合的研究子领域,需要深度强化学习算法以及分布式系统设计的互相感知和协同。考虑到 DDRL 的巨大进步,我们梳理形成了 DDRL 技术的展历程、挑战和机遇的系列文章。我们在 part 1 部分回顾了经典的 DDRL 框架,在本部分,我们利用三篇论文,具体分析 DDRL 的今生 --- 最新研究进展。 https://www.thepaper.cn/newsDetail_forward_26353658
5.太全了!自学机器学习算法学习路线图,有配套视频+实战项目,完全自学机器学习需要学习以下几个主要方面的内容: 一、数学基础线性代数: 【1】理解向量、矩阵的基本运算,如加法、减法、乘法等。 【2】掌握矩阵的特征值与特征向量的概念及计算方法,这在主成分分析等算法中非常关键。 【3】熟悉线性方程组的求解,对于理解线性回归等算法的原理有重要作用。 https://www.bilibili.com/read/cv37461164
6.科学网—[转载]联邦学习算法综述摘要:近年来,联邦学习作为解决数据孤岛问题的技术被广泛关注,已经开始被应用于金融、医疗健康以及智慧城市等领域。从3个层面系统阐述联邦学习算法。首先通过联邦学习的定义、架构、分类以及与传统分布式学习的对比来阐述联邦学习的概念;然后基于机器学习和深度学习对目前各类联邦学习算法进行分类比较和深入分析;最后分别从通信https://blog.sciencenet.cn/blog-3472670-1280769.html
7.学习,是治愈焦虑的良药只有不断学习、奔跑、更新自己的知识体系,外界发生的变化才不足以影响我们。 相反,如果我们在焦虑的时期选择躺平、摆烂,却不去学习,还抱怨不休,那么我们就会陷入双重困境,无法自拔。 二、建立一套有意识的学习算法 1.人的学习风格天然存在差异 我曾采访过很多人,包括小朋友,发现每个人的学习方法都不一样。在课堂上https://36kr.com/p/2375197738412036
8.你应该知道的十种机器学习算法机器学习/人工智能领域在将来是越来越受欢迎。由于大数据是目前科技行业最热门的趋势,机器学习非常强大,可以根据大量数据做出预测或计算建议。使用大量数据训练的深度学习算法,构建出一个能够理解人类语言并自动生成语言的模型。ChatGPT、文心一言等等,都是机器学习的伟大产物。 https://www.51cto.com/article/771973.html
9.强化学习(Qfuncation,DQN)基本介绍目前强化学习的算法 基本算法分类 强化学习的算法基本上都包含了价值函数。一种价值函数是关于状态的价值函数 ,用来评判agent所处状态的好坏;另一种价值函数是关于状态-动作的价值函数 ,用来评判当前状态s下所采取的行动a的好坏。 关于model-free 和 model-based的区别(个人觉得这位网友的评论比较容易理解): https://www.jianshu.com/p/230bae5ca3d1
10.目标跟踪入门——目标跟踪算法综述电子创新网Imgtec社区深度学习不需要自己设计特征,它可以自己在数据中学习到目标的特征,同时也有自己的分类器,也就是说将寻找特征和分类结合在一起。深度学习的效果也是非常的好,在最近的图像比赛中,冠军都是使用深度学习来实现的。目前的深度学习算法包括R-CNN,Fast R-CNN,Faster R-CNN等深度分类方法,也包括 YOLO(you only look oncehttps://imgtec.eetrend.com/blog/2019/100017436.html
11.深度学习高手笔记卷1:基础算法京东集团副总裁,京东零售技术委员会数据算法通道会长 前言 目前人工智能(artificial intelligence,AI)在计算机界非常火热,而其中深度学习(deep learning,DL)无疑是更为火热的一个领域,它在计算机视觉、自然语言处理、语音识别、跨模态分析、风控建模等领域均取得了突破性的进展。而且近年来该领域的优秀论文、落地项目也层https://www.epubit.com/bookDetails?id=UB7d8623610d375
12.强化学习系列案例强化学习实验环境Gym和TensorFlow强化学习系列案例 | 强化学习实验环境Gym和TensorFlow 查看本案例完整的数据、代码和报告请登录数据酷客(cookdata.cn)案例板块。 强化学习算法的实现需要合适的平台和工具。本案例将首先介绍目前常用的强化学习实现平台Gym的基本使用方法,再介绍实验工具TensorFlow的基本操作方法,为之后构建和评估强大的强化学习算法打下坚实https://cloud.tencent.com/developer/article/1619441
13.《集异璧之大成》阅读笔记及杂谈(附录一):人机博弈当然在游戏的算法当中使用的不仅仅是蒙特卡洛算法,其它还有很多——不同算法对应不同问题,构建一个足够复杂的,更高可玩性的,更贴近现实的游戏数据系统。蒙特卡洛算法也常用于机器学习,特别是强化学习的算法中。一般情况下,针对得到的样本数据集创建相对模糊的模型,通过蒙特卡洛方法对于模型中的参数进行选取,使之于原始数https://www.gameres.com/846786.html
14.算法数据结构体系学习班马士兵教育官网注意原“算法与数据结构基础班”已经过期。所有内容都被现在的“算法数据结构体系学习班”重新讲述,还增加了内容,增加了题目练习。原“算法与数据结构基础班”的所有内容,对应现在的“算法数据结构体系学习班”的1-23节。 注意原“算法与数据结构进阶班”已经过期。所有内容已经被现在的“算法数据结构体系学习班”和“https://www.mashibing.com/course/339
15.统计学习方法(豆瓣)—— 引自章节:第一篇 监督学习 算法2.2 (感知机学习算法的对偶形式) (3) 如果 y_i(\sum_{j=1}^N \alpha_j y_j x_j \dot x_i+b) \le 0, \alpha_i \leftarrow \alpha_i+\eta b \leftarrow b + \eta y_i (查看原文) https://book.douban.com/subject/10590856/
16.年,寻找反向传播的生物机制神经元生物大脑传播算法Richards 团队的最新研究表明,「我们目前已经达到这样的水平: 通过相当真实的神经元模拟,我们可以训练锥体神经元网络来完成各种任务,」Richards表示。「然后使用这些模型的稍微抽象的版本,我们可以利用锥体神经元网络,来学习人们在机器学习中所做的那种困难的任务。」 https://www.cn-healthcare.com/articlewm/20210225/content-1192821.html