机器学习中入门级必学的算法有哪些?人工智能

KNearestNeighbor算法又叫KNN算法,这个算法是机器学习里面一个比较经典的算法,总体来说KNN算法是相对比较容易理解的算法。

如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。

两个样本的距离可以通过如下公式计算,又叫欧式距离,关于距离公式会在后面进行讨论

应用场景为:房价预测、销售额度预测、贷款额度预测

什么是线性回归?

线性回归(Linearregression)是利用回归方程(函数)对一个或多个自变量(特征值)和因变量(目标值)之间关系进行建模的一种分析方式。

特点:只有一个自变量的情况称为单变量回归,多于一个自变量情况的叫做多元回归。

线性回归用矩阵表示举例:

那么怎么理解呢?我们来看几个例子:

期末成绩:0.7×考试成绩+0.3×平时成绩

房子价格=0.02×中心区域的距离+0.04×城市一氧化氮浓度+(-0.12×自住房平均房价)+0.254×城镇犯罪率

上面两个例子,我们看到特征值与目标值之间建立了一个关系,这个关系可以理解为线性模型。

逻辑回归(LogisticRegression)是机器学习中的一种分类模型,逻辑回归是一种分类算法,虽然名字中带有回归。由于算法的简单和高效,在实际中应用非常广泛。

这里就可以发现一个特点了,就是两个类别之间都属于判断,逻辑回归就是解决二分类问题的利器。

要想掌握逻辑回归,必须掌握两点:

逻辑回归中,其输入值是什么?

如何判断逻辑回归的输出?

输入:

激活函数:sigmoid函数

判断标准

回归的结果输入到sigmoid函数当中,输出结果:[0,1]区间中的一个概率值,默认为0.5为阈值。

逻辑回归最终的分类是通过属于某个类别的概率值来判断是否属于某个类别,并且这个类别默认标记为1(正例),另外的一个类别会标记为0(反例)。(方便损失计算)

输出结果解释(重要):假设有两个类别A,B,并且假设我们的概率值为属于A(1)这个类别的概率值。现在有一个样本的输入到逻辑回归输出结果0.55,那么这个概率值超过0.5,意味着我们训练或者预测的结果就是A(1)类别。那么反之,如果得出结果为0.3那么,训练或者预测结果就为B(0)类别。

关于逻辑回归的阈值是可以进行改变的,比如上面举例中,如果你把阈值设置为0.6,那么输出的结果0.55,就属于B类。

决策树:是一种树形结构,其中每个内部节点表示一个属性上的判断,每个分支代表一个判断结果的输出,最后每个叶节点代表一种分类结果,本质是一颗由多个判断节点组成的树。

怎么理解这句话?通过一个对话例子

上面案例是女生通过定性的主观意识,把年龄放到最上面,那么如果需要对这一过程进行量化,该如何处理呢?

此时需要用到信息论中的知识:信息熵,信息增益。

集成学习通过建立几个模型来解决单一预测问题。它的工作原理是生成多个分类器/模型,各自独立地学习和作出预测。这些预测最后结合成组合预测,因此优于任何一个单分类的做出预测。

基于位置信息的商业推送,新闻聚类,筛选排序。

图像分割,降维,识别;离群点检测;信用卡异常消费;发掘相同功能的基因片段。

一种典型的无监督学习算法,主要用于将相似的样本自动归到一个类别中。

在聚类算法中根据样本之间的相似性,将样本划分到不同的类别中,对于不同的相似度计算方法,会得到不同的聚类结果,常用的相似度计算方法有欧式距离法。

THE END
1.图解十大经典机器学习算法入门传统的机器学习算法包括决策树、聚类、贝叶斯分类、支持向量机、EM、Adaboost等等。这篇文章将对常用算法做常识性的介绍,没有代码,也没有复杂的理论推导,就是图解一下,知道这些算法是什么,它们是怎么应用的。 人工智能领域知识面广泛,推荐专注于人工智能在线教育的平台—深蓝学院。深蓝学院由中科院自动化所毕业博士团队https://blog.csdn.net/jrunw/article/details/79205322
2.机器学习十大经典算法入门[通俗易懂]腾讯云开发者社区机器学习十大经典算法入门[通俗易懂] 大家好,又见面了,我是你们的朋友全栈君。 一,SVM(Support Vector Machine)支持向量机a. SVM算法是介于简单算法和神经网络之间的最好的算法。 b. 只通过几个支持向量就确定了超平面,说明它不在乎细枝末节,所以不容易过拟合,但不能确保一定不会过拟合。可以处理复杂的非线性https://cloud.tencent.com/developer/article/2098380
3.17个机器学习的常用算法在这种学习模式下,输入数据作为对模型的反馈,不像监督模型那样,输入数据仅仅是作为一个检查模型对错的方式,在强化学习下,输入数据直接反馈到模型,模型必须对此立刻作出调整。常见的应用场景包括动态系统以及机器人控制等。常见算法包括Q-Learning以及时间差学习(Temporal difference learning) https://aidc.shisu.edu.cn/78/aa/c13626a161962/page.htm
4.机器学习入门介绍(非常易懂)TheChosenOne(3)有些算法只可以解决分类问题,有些算法只可以解决回归问题,而有的算法既可以解决分类问题,又可以解决回归问题。 (4)一些情况下,一些回归任务可以根据实际情况将其转换为分类任务。 7、机器学习主要分为非监督学习、监督学习、半监督学习以及增强学习四种大类算法,其中监督学习主要分为分类问题和回归问题。 https://www.cnblogs.com/Yanjy-OnlyOne/p/11278951.html
5.TensorFlow机器学习常用算法解析和入门上图为基于ICA的人脸识别模型。实际上这些机器学习算法并不是全都像想象中一样复杂,有些还和高中数学紧密相关。 后面讲给大家一一详细单独讲解这些常用算法。 强化学习 13)Q-Learning算法 Q-learning要解决的是这样的问题:一个能感知环境的自治agent,怎样通过学习选择能达到其目标的最优动作。 https://www.w3cschool.cn/tensorflow/tensorflow-s8uq24ti.html
6.如何选择机器学习算法Python 入门(第 1 天) 训练和部署图像分类 构建训练管道 (Python) 与Azure 机器学习交互 处理数据 自动化机器学习 训练模型 使用基础模型 负责任地开发和监视 使用管道协调工作流 概述 设计器(拖放 ML) 什么是设计器 算法备忘单 如何选择算法 转换数据 https://docs.microsoft.com/zh-cn/azure/machine-learning/studio/algorithm-choice
7.一文看懂机器学习「3种学习方法+7个实操步骤+15种常见算法」机器学习研究和构建的是一种特殊算法(而非某一个特定的算法),能够让计算机自己在数据中学习从而进行预测。 所以,机器学习不是某种具体的算法,而是很多算法的统称。 机器学习包含了很多种不同的算法,深度学习就是其中之一,其他方法包括决策树,聚类,贝叶斯等。 https://easyai.tech/ai-definition/machine-learning/
8.算法小白的机器学习入门实践,从零到上线总之一句话,可预见的未来策略会继续膨胀,维护难度也会进一步提升。意识到技术风险后,组内讨论认为如果使用机器学习方案一方面可降低解决方案的复杂度(降低维护成本),另一方面利于后期场景扩展和能力迁移。至少也应该能做到模型解决通用场景,在此基础上再定制优化策略(降低开发成本)。 https://www.jianshu.com/p/c0beb46b92d6
9.常用机器学习算法汇总比较(完)51CTO博客常用机器学习算法汇总比较的最后一篇,介绍提升(Boosting)算法、GBDT、优化算法和卷积神经网络的基本原理、优缺点。 9. 提升(Boosting)方法 简述 提升方法(boosting)是一种常用的统计学习方法,在分类问题中,它通过改变训练样本的权重,学习多个分类器,并将这些分类器进行线性组合,提供分类的性能。 https://blog.51cto.com/u_8985428/3835836
10.Python机器学习基础教程中文pdf高清版[28MB]电子书下载《Python机器学习基础教程》是机器学习入门书,以Python语言介绍。主要内容包括:机器学习的基本概念及其应用;实践中最常用的机器学习算法以及这些算法的优缺点;在机器学习中待处理数据的呈现方式的重要性,以及应重点关注数据的哪些方面;模型评估和调参的高级方法,重点讲解交叉验证和网格搜索;管道的概念;如何将前面各章的方法https://www.jb51.net/books/658226.html
11.统计学习方法(豆瓣)李航 日本京都大学电气工程系毕业,日本东京大学计算机科学博士。曾任职于日本NEC公司中央研究所,微软亚洲研究院高级研究员及主任研究员,现任华为诺亚方舟实验室首席科学家。北京大学、南开大学、西安交通大学客座教授。研究方向包括信息检索、自然语言处理、统计机器学习及数据挖掘。 https://book.douban.com/subject/10590856/
12.ai新手入门教程——机器学习算法现在,让我们来进一步了解机器学习算法,它是实现人工智能的核心。1. 监督学习(Supervised Learning)在监督学习中,我们有一组带有标签的数据,其中包含了输入和输出的对应关系。我们的目标是通过训练模型,使其能够根据输入预测正确的输出。常见的监督学习算法包括线性回归、逻辑回归和支持向量机(SVM)等。2. 无监督学习https://baijiahao.baidu.com/s?id=1777538928850108541&wfr=spider&for=pc
13.初学机器学习?推荐从这十大算法入手这篇博文中的十大机器学习算法是专门写给初学者的。这些算法大多数都是我在孟买大学攻读计算机工程学士学位的时候,在“数据存储和挖掘“课程中学到的。“数据存储和挖掘“课程是一个非常棒的机器学习算法领域的入门课程。由于最后两个算法(集成方法)广泛运用于 Kaggle 比赛中,我专门把它们也写到了文章中。希望你喜欢这https://36kr.com/p/1721961660417