机器学习中入门级必学的算法有哪些?人工智能

KNearestNeighbor算法又叫KNN算法,这个算法是机器学习里面一个比较经典的算法,总体来说KNN算法是相对比较容易理解的算法。

如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。

两个样本的距离可以通过如下公式计算,又叫欧式距离,关于距离公式会在后面进行讨论

应用场景为:房价预测、销售额度预测、贷款额度预测

什么是线性回归?

线性回归(Linearregression)是利用回归方程(函数)对一个或多个自变量(特征值)和因变量(目标值)之间关系进行建模的一种分析方式。

特点:只有一个自变量的情况称为单变量回归,多于一个自变量情况的叫做多元回归。

线性回归用矩阵表示举例:

那么怎么理解呢?我们来看几个例子:

期末成绩:0.7×考试成绩+0.3×平时成绩

房子价格=0.02×中心区域的距离+0.04×城市一氧化氮浓度+(-0.12×自住房平均房价)+0.254×城镇犯罪率

上面两个例子,我们看到特征值与目标值之间建立了一个关系,这个关系可以理解为线性模型。

逻辑回归(LogisticRegression)是机器学习中的一种分类模型,逻辑回归是一种分类算法,虽然名字中带有回归。由于算法的简单和高效,在实际中应用非常广泛。

这里就可以发现一个特点了,就是两个类别之间都属于判断,逻辑回归就是解决二分类问题的利器。

要想掌握逻辑回归,必须掌握两点:

逻辑回归中,其输入值是什么?

如何判断逻辑回归的输出?

输入:

激活函数:sigmoid函数

判断标准

回归的结果输入到sigmoid函数当中,输出结果:[0,1]区间中的一个概率值,默认为0.5为阈值。

逻辑回归最终的分类是通过属于某个类别的概率值来判断是否属于某个类别,并且这个类别默认标记为1(正例),另外的一个类别会标记为0(反例)。(方便损失计算)

输出结果解释(重要):假设有两个类别A,B,并且假设我们的概率值为属于A(1)这个类别的概率值。现在有一个样本的输入到逻辑回归输出结果0.55,那么这个概率值超过0.5,意味着我们训练或者预测的结果就是A(1)类别。那么反之,如果得出结果为0.3那么,训练或者预测结果就为B(0)类别。

关于逻辑回归的阈值是可以进行改变的,比如上面举例中,如果你把阈值设置为0.6,那么输出的结果0.55,就属于B类。

决策树:是一种树形结构,其中每个内部节点表示一个属性上的判断,每个分支代表一个判断结果的输出,最后每个叶节点代表一种分类结果,本质是一颗由多个判断节点组成的树。

怎么理解这句话?通过一个对话例子

上面案例是女生通过定性的主观意识,把年龄放到最上面,那么如果需要对这一过程进行量化,该如何处理呢?

此时需要用到信息论中的知识:信息熵,信息增益。

集成学习通过建立几个模型来解决单一预测问题。它的工作原理是生成多个分类器/模型,各自独立地学习和作出预测。这些预测最后结合成组合预测,因此优于任何一个单分类的做出预测。

基于位置信息的商业推送,新闻聚类,筛选排序。

图像分割,降维,识别;离群点检测;信用卡异常消费;发掘相同功能的基因片段。

一种典型的无监督学习算法,主要用于将相似的样本自动归到一个类别中。

在聚类算法中根据样本之间的相似性,将样本划分到不同的类别中,对于不同的相似度计算方法,会得到不同的聚类结果,常用的相似度计算方法有欧式距离法。

THE END
1.最强总结,十大机器算法!!5.决策树算法 决策树,是一种特殊的树结构,由一个决策图和可能的结果(例如成本和风险)组成,用来辅助决策。机器学习中,决策树是一个预测模型,树中每个节点表示某个对象,而每个分叉路径则代表某个可能的属性值,而每个叶节点则对应从根节点到该叶节点所经历的路径所表示的对象https://mp.weixin.qq.com/s?__biz=MzI2OTE0ODY5Mw==&mid=2247525985&idx=1&sn=cf011faecac3617cd721a09791cd1da5&chksm=eb8e093e1bfc7026142b9dd8a53980d31da949fb7292dbc425fc5f054948dfd63e7892331949&scene=27
2.17个机器学习的常用算法!腾讯云开发者社区17 个机器学习的常用算法! 1. 监督式学习: 在监督式学习下,输入数据被称为“训练数据”,每组训练数据有一个明确的标识或结果,如对防垃圾邮件系统中“垃圾邮件”“非垃圾邮件”,对手写数字识别中的“1“,”2“,”3“,”4“等。在建立预测模型的时候,监督式学习建立一个学习过程,将预测结果与“训练数据”的https://cloud.tencent.com/developer/article/1874962
3.机器学习十大经典算法机器学习典型算法机器学习算法是计算机科学和人工智能领域的关键组成部分,它们用于从数据中学习模式并作出预测或做出决策。本文将为大家介绍十大经典机器学习算法,其中包括了线性回归、逻辑回归、支持向量机、朴素贝叶斯、决策树等算法,每种算法都在特定的领域发挥着巨大的价值。 https://blog.csdn.net/lsb2002/article/details/131966792
4.机器学习的常见算法有哪些?百度试题 结果1 题目机器学习的常见算法有哪些?相关知识点: 试题来源: 解析 答:机器学习的常见算法包括逻辑回归、支持向量机、神经网络、决策树、随机森林等。反馈 收藏 https://easylearn.baidu.com/edu-page/tiangong/questiondetail?id=1791333817575455449&fr=search
5.机器学习常见算法类型都有哪些算法是程序员在学习软件编程开发技术的时候需要重点掌握的一个编程开发技术知识,而今天我们就通过案例分析来了解一下,机器学习常见算法类型都有哪些。 1.分类算法 这是一种监督学习方法。有很多算法帮助我们解决分类问题,比如K近邻、决策树、朴素贝叶斯、贝叶斯网络、逻辑回归、SVM等算法。人工神经网络和深度学习也往往用https://www.douban.com/note/782408490/
6.数据分析中常用的机器学习算法有哪些?数据分析中常用的机器学习算法有哪些? 在数据分析领域,机器学习算法是一种重要的工具,可以帮助我们从数据中挖掘模式、进行预测和做出决策。下面将介绍几种常用的机器学习算法。 线性回归(Linear Regression):线性回归是一种用于建立变量之间线性关系的监督学习算法。它通过拟合一个线性方程来预测输出变量的值。线性回归https://www.cda.cn/view/204542.html
7.TensorFlow机器学习常用算法解析和入门上图为基于ICA的人脸识别模型。实际上这些机器学习算法并不是全都像想象中一样复杂,有些还和高中数学紧密相关。 后面讲给大家一一详细单独讲解这些常用算法。 强化学习 13)Q-Learning算法 Q-learning要解决的是这样的问题:一个能感知环境的自治agent,怎样通过学习选择能达到其目标的最优动作。 https://www.w3cschool.cn/tensorflow/tensorflow-s8uq24ti.html
8.5种常见的机器学习算法51CTO博客在本章中,我们将介绍5种常见的机器学习算法。它们不但本身非常有效,也常用于构建更复杂的算法。 1 线性回归 线性回归(linear regression)是一种流行的回归算法,从样本特征的线性组合(linear combination)中学习模型。 1.1 问题陈述 给定一个有标签的样本集 https://blog.51cto.com/u_13127751/5267787
9.机器学习主要的算法有哪些,分别适用什么应用嘲?机器学习主要的算法有哪些,分别适用什么应用场景? 决策树 逻辑回归(LR) 支持向量机(SVM)https://www.jianshu.com/p/d60990b643f4
10.科学网—[转载]联邦学习算法综述尽管联邦学习和分布式机器学习有部分相似的地方,但是在应用领域、系统设计、优化算法方面,联邦学习有自己的特征。在数据量庞大、所需计算资源较高时,分布式机器学习(如参数服务器)有明显的优势,它将独立同分布(independently identically distribution,IID)的数据或模型参数存储在各个分布式节点上,中心服务器调动数据和计算https://blog.sciencenet.cn/blog-3472670-1280769.html
11.《常用算法之智能计算(三)》:机器学习计算在给出机器学习计算各种算法之前,最好是先研究一下什么是机器学习和如何对机器学习进行分类,才能更好的理解和掌握一些具体的机器学习算法并将其用于实际问题的计算和处理。 学习是人类具有的一种重要智能行为,但究竟什么是学习,长期以来却众说纷纭。社会学家、逻辑学家和心理学家都各有自己不同的看法和说法。比如,http://www.kepu.net/blog/zhangjianzhong/201903/t20190327_475625.html