机器学习模型,全面总结!

附注:除了以上两大类模型,还有半监督学习和强化学习等其他类型的机器学习模型。半监督学习是指在有部分标签数据的情况下,结合监督学习和无监督学习的方法进行模型训练。强化学习是指通过让计算机自动与环境交互,学习出如何最大化奖励的策略。

不同的机器学习模型适用于不同的任务和场景。在实际应用中,需要根据具体的问题和数据特点选择合适的模型和方法。同时,机器学习也需要结合具体领域的知识和业务需求来进行深入研究和应用。

有监督学习通常是利用带有专家标注的标签的训练数据,学习一个从输入变量X到输入变量Y的函数映射。Y=f(X),训练数据通常是(n×x,y)的形式,其中n代表训练样本的大小,x和y分别是变量X和Y的样本值。

有监督学习可以被分为两类:

1.11线性回归

线性回归是指完全由线性变量组成的回归模型。在线性回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。

1.12逻辑回归

用于研究Y为定类数据时X和Y之间的影响关系情况,如果Y为两类比如0和1(比如1为愿意和0为不愿意,1为购买和0为不购买),此时就叫二元逻辑回归;如果Y为三类以上,此时就称为多分类逻辑回归。

自变量并不一定非要定类变量,它们也可以是定量变量。如果X是定类数据,此时需要对X进行哑变量设置。

1.13Lasso

Lasso方法是一种替代最小二乘法的压缩估计方法。Lasso的基本思想是建立一个L1正则化模型,在模型建立过程中会压缩一些系数和设定一些系数为零,当模型训练完成后,这些权值等于0的参数就可以舍去,从而使模型更为简单,并且有效防止模型过拟合。被广泛用于存在多重共线性数据的拟合和变量选择。

1.14K近邻(KNN)

KNN做回归和分类的主要区别在于最后做预测时候的决策方式不同。KNN做分类预测时,一般是选择多数表决法,即训练集里和预测的样本特征最近的K个样本,预测为里面有最多类别数的类别。KNN做回归时,一般是选择平均法,即最近的K个样本的样本输出的平均值作为回归预测值。但它们的理论是一样的。

1.15决策树

决策树中每个内部节点都是一个分裂问题:指定了对实例的某个属性的测试,它将到达该节点的样本按照某个特定的属性进行分割,并且该节点的每一个后继分支对应于该属性的一个可能值。分类树叶节点所含样本中,其输出变量的众数就是分类结果。回归树的叶节点所含样本中,其输出变量的平均值就是预测结果。

1.16bp神经网络

bp神经网络是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。bp神经网络的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的分类错误率最小(误差平方和最小)。

BP神经网络是一种多层的前馈神经网络,其主要的特点是:信号是前向传播的,而误差是反向传播的。具体来说,对于如下的只含一个隐层的神经网络模型:

BP神经网络的过程主要分为两个阶段,第一阶段是信号的前向传播,从输入层经过隐含层,最后到达输出层;第二阶段是误差的反向传播,从输出层到隐含层,最后到输入层,依次调节隐含层到输出层的权重和偏置,输入层到隐含层的权重和偏置。

1.17支持向量机(SVM)

支持向量机回归(SVR)用非线性映射将数据映射到高维数据特征空间中,使得在高维数据特征空间中自变量与因变量具有很好的线性回归特征,在该特征空间进行拟合后再返回到原始空间。

支持向量机分类(SVM)是一类按监督学习方式对数据进行二元分类的广义线性分类器,其决策边界是对学习样本求解的最大边距超平面。

1.18朴素贝叶斯

在给定一个事件发生的前提下,计算另外一个事件发生的概率——我们将会使用贝叶斯定理。假设先验知识为d,为了计算我们的假设h为真的概率,我们将要使用如下贝叶斯定理:

该算法假定所有的变量都是相互独立的。

集成学习是一种将不同学习模型(比如分类器)的结果组合起来,通过投票或平均来进一步提高准确率。一般,对于分类问题用投票;对于回归问题用平均。这样的做法源于“众人拾材火焰高”的想法。

集成算法主要有三类:Bagging,Boosting和Stacking。本文将不谈及stacking。

1.21GBDT

GBDT是以CART回归树为基学习器的Boosting算法,是一个加法模型,它串行地训练一组CART回归树,最终对所有回归树的预测结果加和,由此得到一个强学习器,每一颗新树都拟合当前损失函数的负梯度方向。最后输出这一组回归树的加和,直接得到回归结果或者套用sigmod或者softmax函数获得二分类或者多分类结果。

1.22adaboost

adaboost给予误差率低的学习器一个高的权重,给予误差率高的学习器一个低的权重,结合弱学习器和对应的权重,生成强学习器。回归问题与分类问题算法的不同点在于误差率计算的方式不同,分类问题一般都采用0/1损失函数,而回归问题一般都是平方损失函数或者是线性损失函数。

1.23XGBoost

xgboost是GBDT的一种高效实现,和GBDT不同,xgboost给损失函数增加了正则化项;且由于有些损失函数是难以计算导数的,xgboost使用损失函数的二阶泰勒展开作为损失函数的拟合。

1.24LightGBM

1.25CatBoost

catboost是一种基于对称决策树算法的GBDT框架,主要解决的痛点是高效合理地处理类别型特征和处理梯度偏差、预测偏移问题,提高算法的准确性和泛化能力。

1.26随机森林

随机森林分类在生成众多决策树的过程中,是通过对建模数据集的样本观测和特征变量分别进行随机抽样,每次抽样结果均为一棵树,且每棵树都会生成符合自身属性的规则和分类结果(判断值),而森林最终集成所有决策树的规则和分类结果(判断值),实现随机森林算法的分类(回归)。

1.27ExtraTrees

extra-trees(极其随机的森林)和随机森林非常类似,这里的“及其随机”表现在决策树的结点划分上,它干脆直接使用随机的特征和随机的阈值划分,这样我们每一棵决策树形状、差异就会更大、更随机。

无监督学习问题处理的是,只有输入变量X没有相应输出变量的训练数据。它利用没有专家标注训练数据,对数据的结构建模。

将相似的样本划分为一个簇(cluster)。与分类问题不同,聚类问题预先并不知道类别,自然训练数据也没有类别的标签。

2.11K-means算法

聚类分析是一种基于中心的聚类算法(K均值聚类),通过迭代,将样本分到K个类中,使得每个样本与其所属类的中心或均值的距离之和最小。与分层聚类等按照字段进行聚类的算法不同的是,快速聚类分析是按照样本进行聚类。

2.12分层聚类

分层聚类法作为聚类的一种,是对给定数据对象的集合进行层次分解,根据分层分解采用的分解策略。层次聚类算法按数据分层建立簇,形成一棵以簇为节点的树。如果按自底向上进行层次分解,则称为凝聚的层次聚类,比如AGNES。而按自顶向下的进行层次分解,则称为分裂法层次聚类,比如DIANA。一般用的比较多的是凝聚层次聚类。

降维指减少数据的维度同时保证不丢失有意义的信息。利用特征提取方法和特征选择方法,可以达到降维的效果。特征选择是指选择原始变量的子集。特征提取是将数据从高纬度转换到低纬度。广为熟知的主成分分析算法就是特征提取的方法。

2.21PCA主成分分析

2.22SVD奇异值分解

2.23LDA线性判别

线性判别的原理是将样本投影到一条直线上,使得同类样本的投影点尽可能接近,不同样本的投影点尽可能远离;在对新样本进行分类时,将其投影到同样的直线上,再根据投影点的位置来确定新样本的类别。

上一篇:

下一篇:

14个文本转图像AIAPI

什么是API定义?

前端需要的免费在线API接口

API对现代网上银行至关重要的10个理由

10个搜索引擎结果页面(SERP)API

幂简集成是创新的API接口平台,一站搜索、试用、集成国内外API接口。

THE END
1.面试题人工智能工程师高频面试题汇总:机器学习深化篇(题目+答案随着人工智能技术的突飞猛进,AI工程师成为了众多求职者梦寐以求的职业。想要拿下这份工作,面试的时候得展示出你不仅技术过硬,还得能解决问题。所以,提前准备一些面试常问的问题,比如机器学习的那些算法,或者深度学习的框架,还有怎么优化模型,这些都是加分项,能有效https://www.elecfans.com/d/6388383.html
2.面试题人工智能工程师高频面试题汇总:机器学习深化篇(题目+C. 减轻了神经元死亡问题 D. 输出范围更宽 答案: C 解析: Leaky ReLU通过在负值区域引入一个斜率,减轻了ReLU中的神经元死亡问题。 10 PReLU与Leaky ReLU的主要区别是什么? A. PReLU在负值区域的斜率是固定的 B. PReLU在负值区域的斜率是可以学习的 https://blog.51cto.com/u_15343919/12843670
3.《机器学习实战指南:CSDN经验集成》腾讯云开发者社区此外,还可以进行特征工程,如创建新的特征、使用公共数据集来增加训练数据、进行特征选择去除不相关和嘈杂的特征等。如果模型性能 “太过优秀”,可能存在数据泄露问题,可以使用 SHAP 值 debug 数据泄露问题,将与目标变量高度相关且权重非常高的特征从训练数据中删除。https://cloud.tencent.com/developer/article/2478542
4.文档总结与问答,AI智能分析,提升工作效率AI智能分析技术,尤其是自然语言处理(NLP)和机器学习(ML)的应用,是这一领域的核心通过深度学习模型,如Transformer架构的BERT、GPT系列等,AI能够理解和解析人类语言,从而实现文档内容的自动总结与问题回答。 1. **文档总结**:这一过程涉及文本理解、信息抽取、主题归纳等多个步骤AI首先分析文档的词汇、句法结构,识别关http://www.noahtech.cn/list/xiezuo/10193.html
5.Android端的在线通知(或消息)和离线通知(或消息)有什么区别?问题详述移动推送Android端的在线通知(或消息)和离线通知(或消息)有什么区别?问题解答当前应用在网络畅通且应用处于前台或者短暂退到后台,移动推送接收到的通知(或消息)都属于在线消息。当应用进程被杀死或者网络不畅通,移动推送接收到的通知(或消息)都属于离线https://help.aliyun.com/knowledge_detail/57497.html
6.常见问题和群组有什么区别? 一个聊天室支持100万人。聊天室和群组最大的区别在于,聊天室的消息没有推送通知和离线保存,也没有常驻成员的概念,只要进入聊天室即可接收消息,开始聊天, 一旦退出聊天室,不再会接收到任何消息、通知和提醒。注意:进入聊天室会自动获取最近50条消息,客户端目前不支持创建聊天室 实时音视频怎么收费?https://docs.jiguang.cn/jmessage/guideline/faq
7.常见问题·国产操作系统麒麟操作系统——麒麟软件官方网站③ 离线安装(获取到相关的软件包):sudo dpkg -i 软件包名8) 银河系统都能安装安卓模拟器么? A: 现在只有飞腾和鲲鹏版本的系统能安装安卓模拟器。9) 可以安装apk应用软件吗? A: 不可以安装,只能使用软件商店已有的“手机APP”的应用。10) deb和rpm有什么区别? https://www.kylinos.cn/support/problem
8.第五次全国经济普查专项试点数据处理问题解答(一)3.清查阶段使用的APP加载离线地图包出现问题如何处理? 答:在普查区划分与绘图系统中重新制作离线地图包,然后在清查APP中重新加载。如果仍有问题通过数据处理联络群或电话联系国家进行技术支持。 4.制作离线地图包时,新建任务中的地图级别代表什么? 答:地图级别选择是指地图比例尺的级别。建议地图级别选择1-14级。 https://www.yueyang.gov.cn/tjj/22746/22753/67182/67186/content_2080266.html
9.在线/离线规划机器之心在线/离线规划 简介 规划问题是希望在运动期间在线计算目标的轨迹,以允许机器人对移动目标的环境变化和运动过程中遇到的误差作出反应。然而,解决这些问题,是一定困难的。这源于搜索空间的高维度,障碍物的几何性质,优化的成本函数,和机器人的运动学和动力学模型。来在给定的合理的计算资源里,这些问题都会妨碍它足够快的https://www.jiqizhixin.com/graph/technologies/6b18674f-9092-4262-8f6e-b6c5db69b8a3
10.疫情防控期间本科教学常见问题指导手册(教师篇)二、“雨课堂”网络教学平台常见问题 1.如何下载安装? 登录https://changjiang.yuketang.cn/下载安装。 2.安装完了如何找到雨课堂? 雨课堂是嵌入到PPT中的一款插件,安装完成后可以直接打开PPT,PPT上面最右端如果有”雨课堂”三个字,即安装成功。 3.雨课堂对老师和学生的网络要求分别最低是多少? https://jwc.yangtzeu.edu.cn/info/1083/6475.htm
11.关于用户在线与离线的判断有关问题php教程关于用户在线与离线的判断问题!首先需求是做一个显示在线用户昵称和在线人数。 然后个人的思路是在用户表里面做一个字段用来标记用户在线(1)或者不在线(0),当用户登录的时候就设置这个字段为1,当用户通过正常渠道(即点击安全退出)退出的时候就设置这个字段为0.这https://m.php.cn/faq/214049.html
12.在线问题与离线问题离线类问题2. 离线问题 实例在决策前全部已知的问题。 3. 在线算法 可以以序列化的方式一个个的处理输入,也就是说在开始时并不需要已经知道所有的输入。相对的,对于一个离线算法,在开始时就需要知道问题的所有输入数据,而且在解决一个问题后就要立即输出结果。例如,选择排序在排序前就需要知道所有待排序元素,然而插入排序就https://blog.csdn.net/xhtchina/article/details/125138586
13.SMTXOS社区版安装使用中常见问题合集–SmartX自SMTX OS 社区版发布以来,有许多用户下载了和尝试部署 SMTX OS ,在过程中遇到一些问题并在社区中提问,本文是将这些有代表性的问题集合在一起,并按照不同阶段进行分类,希望能帮助用户快速获得解决问题的思路。https://www.smartx.com/blog/2022/02/smtx-os-faqs/
14.美团配送资金安全治理之对账体系建设离线对账主要是通过固定的周期进行对账。最短周期为T+1。它的好处是适用性较强,基本可以覆盖所有的对账场景。而在线对账又分为实时对账和准实时对账。实时对账和准实时对账的区别主要是实时对账耦合在结算链路中,可以在发现问题数据时,对结算流程进行拦截,而准实时对账是异步进行的,不具备拦截能力。在线对账有一定的https://tech.meituan.com/2018/03/21/balance-accounts.html
15.手表显示不在线怎么办?教你解决定位手表离线问题如果以上几种方法都无法解决手表离线的问题,那么可以尝试重启手表和手机。关闭手表和手机的蓝牙和WiFi功能,然后重新开启,重新连接手表和手机,看看能否解决离线问题。 总之,手表离线问题的原因有很多种,解决问题的方法也有很多种。家长们需要耐心地https://b2b.baidu.com/q/aland?q=031F7824061D03777B721D1306161D3C0A7D79256A7674050D2A742B773F7F610772031F7824092206160703052B&id=qidaeb7597ea1cda720b0dd52a25b995b1a&answer=5098605037271444146&utype=2
16.在旅行商问题上模拟杜宾车辆的ROS软件包。通过比较离线和在线initiation_to_research:用于在旅行商问题上模拟杜宾车辆的ROS软件包。通过比较离线和在线路径规划算法(蒙特卡洛树搜索算法与蚁群优化算法)来选择航点,并使用人工电位场进行行驶 Tp**wd上传206KB文件格式zip 要求 ROS口才: : 科尔康: sudo apt install python3-colcon-common-extensionshttps://www.coder100.com/index/index/content/id/1298402
17.中公网校课程帮助中心针对性处理您的问题。 人工客服工作时间: 9:00-22:00,节假日不休 请选择您需要帮助的问题 购买课程后无法进入听课中心 获取听课网址 用户名密码丢失 更多问题 在线观看视频时遇到的问题 PC端在线问题 安卓移动端在线问题 更多问题 下载(离线)观看视频时遇到的问题 PC端离线问题 安卓移动端离线问题 更多问题 课程https://www.eoffcn.com/help
18.打印机安装后不在线(如何解决打印机离线问题)当我们安装新的打印机后,有时候会遇到打印机不在线的问题。这个问题可能会导致我们无法正常打印文件,给我们的工作和生活带来不便。接下来,我们将介绍一些解决打印机离线问题的方法。 1. 检查打印机连接状态 首先,我们需要检查打印机是否连接到电脑或网络。如果是USB连接,我们需要检查USB线是否插好,如果是网络连接,我们http://www.yczaixian.cn/183594.html
19.GPT时代更要关注教育的“美丽风险”与上一代“数字移民”相异,当下年轻一代被称作“数字原住民”。在线与离线生活自始至终都是不可分割、相互缠绕。因此教师也需相应地变革新时代的教育实践,不再将传统的教与学复刻在新一代身上,而是基于对其在线与离线的真实生活建构与之契合的课程与教学。 https://studio.jndjg.cn/index.php?r=studiowechat/news/details&sid=300123&id=4704
20.图书馆信息咨询通用12篇其表现形式是:第一,提供多层次的咨询服务接口,包括FAQ链接、帮助与指导手册、用户讨论组以及通过E-mail或论坛等交互方式实现用户与虚拟信息咨询人员的在线或离线交流。第二,设立交互式咨询台,直接解答用户需要解决的问题。 (六)开展读者利用图书馆教育 对刚走进大学校门的大学生进行图书馆入门的指导教育,进行信息知识https://sbglywx.xueshu.com/haowen/25477.html
21.萤石云远程访问不在线问题故障排查配件申请萤石云远程访问不在线问题故障排查 解决方案 产品中心 服务支持 iVMS-4200 海康交付助手 设备网络搜索 海康互联智能物联云平台 智能问答 接线图查询 升级包与驱动下载 维修申请 合作伙伴 关于我们 开放平台 一、海康录像机,提示不在线 1. 确认录像机的LAN口与路由器已用网线连接好。进入录像机主菜单—系统配置—网络https://www.hikvision.com/cn/support/ServiceCenter/FAQ/2019102909/
22.在线匹配问题研究进展:如何应对一般图以及顶点全在线的挑战?匹配问题的在线模型也很自然地成为了在线优化中最早被探索的问题之一,并长期处于在线优化领域的核心地位。在STOC90会议中,Karp, Vazirani和Vazirani三位学者首次提出了在线二分图匹配模型:假设存在一个潜在的二分图 其中一侧顶点为离线顶点(直接给定),而另一侧顶点为在线顶点(逐步到达)。我们要求算法在任何一个在线顶点https://www.orsc.org.cn/wechat/article/detail?id=760
23.qq离线请留言什么意思(qq显示的离线请留言和离线有什么区别)今天来给大家分享一下关于qq离线请留言什么意思的问题,以下是对此问题的归纳整理,让我们一起来看看吧。 qq离线请留言什么意思 qq离线请留言的意思是好友不在线,但是已经设置接收离线消息了,即使不在线也可以收到;但不超过24小时没有登录QQ。QQ离线的意思是好友不在线,且超过24小时没有登录QQ。 http://www.wengnai.com/html/706009.html
24.什么是在线编程和离线编程的区别?Worktile社区在线编程和离线编程主要的区别在于是否需要实时连接到目标设备或系统。1、在线编程是指开发者在与目标系统建立连接的情况下进行的编程活动,通常用于立即测试和调试程序。2、离线编程则是指开发者在没有连接到目标系统的情况下编写和测试代码,通常在代码完成后一次性部署到目标设备上。 https://worktile.com/kb/p/1816207
25.案例9:使用计算—离线和在线使用的主要区别注:由于变量初始化的问题,必须避免将外部输出位号使用于任何计算的右侧(RHS)。如果有任何外部输出位号处于RHS侧,则计算的结果质量通常将设置为“BAD”。 带回家的消息 SMOCPro内置的计算引擎对在线和离线实现的行为可能造成不同的结果。这种差异是由离线软件包仿真在线嵌入的方式引起的。更具体地,在离线环境下,当一https://www.jianshu.com/p/28da66d9eafb
26.抖音显示今天在线和在线有什么不同关注问题 写回答 讨论回答 (6) zol201298 抖音好友显示在线和今天在线的区别就在于,显示在线说明你和好友正在同时看抖音,对方还在线,如果显示今天在线是对方已经离线了,但是今天看过抖音。抖音可以显示好友在线状态,有的用户发现有好友显示的是几分钟或几小时前在线,而有的好友显示的却是今天在线,其实抖音里显https://wap.zol.com.cn/ask/x_15961691.html
27.如何在Mac上录制语音备忘录:在Mac上在线/离线录制音频第3 部分:如何使用免费在线工具在 Mac 上录制音频 第4 部分。 在 Mac 上录制语音备忘录的常见问题解答 第1部分:如何使用Apple Voice Memos App在Mac上录制Voice Memos 就像在 iPhone 上使用语音备忘录应用程序一样,您可以在 Mac 上免费录制和编辑语音备忘录。在运行 macOS Mojave 及更高版本的 MacBook Pro 和https://www.apeaksoft.com/zh-CN/recorder/how-to-record-voice-memo-on-mac.html
28.快手客服离线分流功能这9个问题你知道答案吗?3、日常客服咨询问题如何反馈给平台,如何通过「经营助手」反馈问题给平台呢? 找到窗口中的「经营助手」并点击。 在展开的界面中,点击「意见反馈」 选择要反馈的模块,填写好反馈内容并提交 4、能否关闭离线留言消息,这个离线留言消息是否影响客服接待? 离线留言消息默认打开,当店铺客服都不在线时,买家咨询会由系统自动https://www.shuaishou.com/school/infos74785.html