人工智能算法综述(一)鬼柒

“那一些被认作常识的东西,是不是只是时代的附属品?从整个历史的长河去看待,也许是一些莫名其妙或者残忍至极的怪事而已”

2017-2018这两年因为一些爆炸式的AI应用,导致又把公众的视野转向这个方向发展,自图灵提出“图灵测试”之后,AI已经爆发了两次热潮,相应的也跌入了两次低谷,目前看应该是进入了第三次的热潮,但是之后是迎来“奇点”,还是第三次低谷,尚不可知。

--------------(这看上去像一根线)--------------------

闲话少说,为各位呈上各类流弊的算法简介(通俗易懂的说明,具体细节不表),可能会有些地方讲的不对,希望能得到一点友情提醒,我会立马修正。

CNN:卷积神经网络

我在上一篇关于tensorflow(谷歌开源AI框架)的踩坑日志有说过一点关于卷积神经网络的基本原理。

就是卷积层+N层神经网络BP层(也叫全链接层)关于BP的原理我之前有写过一篇了,翻回去看看就有了。

那卷积层具体是什么呢?很像是一个滤镜层,我们知道实际上图像是由每个像素点组成的矩阵,然后每个像素点又可以由RGB3原色的数值表示范围是(0-255)如果做一次灰度处理,那么每个像素点就是由0-255的灰度数值表示。那图像就等同于一个2维的数字矩阵。当然如果颜色想保留的话,不做灰度处理的话,RGB就等同于3个不同的矩阵,长宽是一样的。里面的数值不同而已。

那我们回到卷积层,就是拿一个卷积核在这个矩阵上滚一遍(矩阵相乘)得出一个新的矩阵。卷积核也是一个小的2维矩阵,不同数值的卷积核,可以对这张图片提取的信息不同,这就是图像的特征,比如说把一个专门提取竖线的卷积核在原始图片上滚一遍,就能获得一个全部都是竖线的特征图。如果我们要做一个竹子的识别器,肯定要用这个特征了。但是如果要做一个篮球的识别器,就用不上了,用或者不用,这是由BP层决定的。但是提取的工作还是要做的,但是怎么决定卷积核应该是由什么数值构成呢?随机!因为这个算法比较通用,可以做成识别各种东西,所以卷积核应该是任意特征都能提取的,那只要生成1000,1W,或者1亿个卷积核,每个都在这个图像上滚一遍,就能提取1亿种特征了。如果最后BP层只用到其中一个特征就能识别竹子或者篮球。那岂不是非常浪费,所以卷积核的数量要根据识别复杂度而定。否则计算量很可怕。

当然CNN里面还有很多细节,比如池化层,归一化,dropout。

池化层也有几种不同的方法,如果是求均值就是meanpooling,求最大值就是maxpooling

池化就是降维比较好理解一点吧,为了减少计算量。

归一化(Normalization,也叫规范化)是为了让数据在网络中传输的时候不要太大,或者太小,或者太稀疏。

听说效果不错。

dropout是指随机的把一些特征失效掉来训练这个网络,这样泛化能力比较强。我自己实践过一次,但是感觉训练过程变得更久了,波动更大了。慎用。

这里列了一些tensorflow内置的一些梯度下降优化器GradientDescentOptimizer,AdagradOptimizer,MomentumOptimizer,AdamOptimizer

CNN的算法里面有很多参数要调,比如说网络的层数,初始学习率,dropout的概率等等,这类统称为超参数

虽然我们刚才说的都是图像上的,但是文字跟音频也可以转化成这种输入,类似说1*N的矩阵。

----------------------(这看上去跟第一根线没什么区别)----------------------

RL:强化学习(reinforcementlearning)

关于RL的详细内容可以看Deepmind的公开课

强化学习核心的原理是:

造一个agent(智能代理者)跟环境(state)交互(action)然后根据获得的反馈(reward)反复训练后,这个agent可以在遇到任意的state时都能选择最优的决策(action),这个最优的决策会在未来带来最大化的reward。

RL解决的问题是连续决策问题,就是有一系列的决策之后才会获得奖励的现实问题。比方说某baby3岁,暂且先叫A酱,A酱还不会拿杯子喝东西。我们知道最优策略就是

:靠近杯子,拿起来,倒进嘴巴里。

但是她一开始的时候并不知道看到一个杯子在远处,究竟是应该靠近,还是远离。而且就算反复做了这2件事,也没有一些立即奖励给她(喝到东西)。所以说奖励是滞后的,但是我们希望可以对动作的打分,根据分数的高低让智能体选出最佳的决策,比方说靠近杯子10分,远离杯子-10分。如果每一步都有这样的标量作为衡量标准的话,那么她就可以知道要获得奖励的最优策略是什么了,当然有些动作在不同的场景下会导致不同的效果,所以这里的打分要针对state-actionpair(不同状态对应不同的动作)评分。

所以RL的作用就是经过反复的训练,为每对state-action提供一个分数。这就Valuebased(基于分数的算法,其中的一种的RL算法实现方式)。

如果先假设最终的奖励分数是100分。那么究竟前一步应该分配多少分呢?然后前前一步又是多少?这里就用到了贝尔曼方程

s:state

a:action

Q就是我上面讲的分数。然后Qπ指的就是最优策略下的分数函数。

P是指状态s下决定某动作a之后=》下一个状态s的转移概率。(比方说A酱虽然见到了杯子,然后她使用了动作a1(拿起来)但是不一定能够成功,这里有个转移概率P)。

R是指立即奖励。

这里我们可以看到,当前的Q值是由两部分组成,当前R值+下一个状态的Q值。

假设折扣率这里是0.5,最终的奖励分数是100分。

反过来推导的话,A酱在喝到杯中物的时候Q值等于R值,因为没有下一个状态了。在往前一个动作(拿起杯子)因为只有1个动作,而且立即奖励R=0,所以Q值等于0+0.5*100=50。

然后再往前面一步,状态1(见到杯子)的时候选择(靠近),所以Q值是0+0.5*(0+0.5*100)=25

这是我们通过已知最优策略然后用贝尔曼方程反推Q值,这样便于理解Q值的含义。

虽然不知道最优策略,但是如果我们有一个所有状态所有动作的记录Q值的表,只要反复通过上面的过程推导就能知道这个大表的所有值,最终就能通过这个大表知道最优策略。

这就是Q-learning算法的逻辑。

当然Q-learning是不实用的,因为如果state跟action有非常多,这个表数据量要爆炸的。

RL很早很早就有了。

因为alphaGo就是基于RL的,主要用了蒙特卡罗树搜索算法(MCTS)然后RL这两年又被大神们推进了好多优化。

我摘一段放这里说明一下实现RL算法的几种类别:

RL现阶段比较实用的算法是:

DQN,DDPG,A3C,DPPO等

摘一张图大家看看

横轴是训练次数,纵轴是超过人类水平百分比,100%就是等同于平均的人类玩游戏的水平,在57款雅达利游戏中的平均表现。

2017-2018年一些很有趣的开源应用示例,以及使用的算法

CNN:图像识别人脸识别风格迁移

RL:alphaGO游戏代打机器人控制阿里商品推荐系统

GANs:风格迁移草图生成实体图猫脸转狗脸去掉图像遮挡年龄转移超分辨率

RNNLSTM:翻译模型,生成古诗,生成对联,PSD生成HTML代码

THE END
1.深度学习算法的一些发展趋势多标签学习趋势小样本学习和零样本学习:致力于提高模型从少量数据中学习的能力,以及在没有见过特定类别数据时的泛化能力,通过迁移学习、元学习等技术,使模型能够快速适应新任务和新数据,对于数据稀缺或标注成本高昂的场景具有重要意义。 3.模型性能优化 高效训练与推理:研究更高效的训练算法和优化技巧,以加快模型的收敛速度,减少训练时https://blog.csdn.net/weixin_47362565/article/details/144280516
2.人工智能论文探索深度学习与智能算法的前沿应用人工智能论文探索:深度学习与智能算法的前沿应用 人工智能研究的新纪元 ai论文中的深度学习技术如何重新塑造数据处理和模式识别领域? 在过去几年中,人工智能(AI)研究经历了一个飞速发展的阶段,这主要归功于深度学习技术。这种基于神经网络的机器学习方法已经被证明能够处理复杂任务,如图像识别、自然语言处理以及决策支持系https://www.jvahvb5c.cn/zhi-neng/497383.html
3.智能算法与学术创新:AI在论文写作中的应用语法文章文献AI 中的智能算法在论文写作中有着广泛的应用,以下是千笔 AI 在论文写作中的一些主要应用: 内容生成与创新 快速生成初稿:千笔 AI 能够依据用户输入的关键词或主题,在短时间内生成逻辑连贯的论文初稿,为研究人员节省大量构思和撰写的时间。比如,输入 “人工智能在医疗影像诊断中的应用”,它可以迅速生成包含研究背景、https://www.163.com/dy/article/JJ4VJHKB0556B30Q.html
4.毕业论文神经网络优化学习算法综述经管文库(原毕业论文神经网络优化学习算法综述 https://bbs.pinggu.org/thread-13136271-1-1.html
5.“我把4500多篇NeurIPS2024论文,做成了AI搜索”新的优化方法、强化学习用来帮助机器人的技术等等,然后很快就能给出搜索结果。 在结果中,它有显示论文题目、摘要、作者以及此次海报展示位置,可以说是很细致了。 进一步地,你可以选择一篇或者多篇论文进行进一步的“盘问”。 实测可以选择10篇左右的论文,再多服务器就支撑不住了。 https://www.thepaper.cn/newsDetail_forward_29604749
6.面向流数据分类的在线学习综述?流式数据中增量学习一个从输入变量到类标变量的映射函数,以便对 随时到达的测试数据进行准确分类.在线学习范式作为一种增量式的机器学习技术,是流数据分类的有效工具.主要 从在线学习的角度对流数据分类算法的研究现状进行综述.具体地,首先介绍在线学习的基本框架和性能评估方法, 然后着重介绍在线学习算法在一般流数据上https://jos.org.cn/jos/article/pdf/5916
7.深度学习跟踪算法综述跟踪方法学深度学习跟踪算法综述 跟踪方法学 以前写过一个“自动驾驶中的目标跟踪”介绍,这次重点放在深度学习和摄像头数据方面吧。 先提一下以前说的那篇综述: "Survey on Leveraging Deep Neural Networks for Object Tracking" Daimler公司研发组2017年写的一篇综述,主要总结当时深度学习如何在多目标跟踪应用的工作。https://blog.51cto.com/u_16099218/11767614
8.TCCT通讯Newsletter2017No.01时间序列数据挖掘的相似性度量研究综述 控制与决策, 2017 Vol. 32 (01): 1-11 Abstract | PDF 论文 亓祥波 朱云龙 张丁一 求解PFSP的双种群协同学习算法 控制与决策, 2017 Vol. 32 (01): 12-20 Abstract | PDF 李滔 王士同 适合大规模数据集且基于LLM的0阶TSK模糊分类器 控制与决策, 2017 Vol. 32https://tcct.amss.ac.cn/newsletter/2017/201701/journal.html
9.深度学习+度量学习的综述本文约6000字,建议阅读10分钟本综述探讨了深度度量学习的意义、问题、背景、最新改进和与深度学习的关系,详述了其问题、样本选择和度量损失函数,以及现状和未来。 1 介绍 如今,机器学习的应用广泛,包括人脸识别、医疗诊断等,为复杂问题和大量数据提供解决方案。机器学习算法能基于数https://mp.weixin.qq.com/s?__biz=MzI1MjQ2OTQ3Ng==&mid=2247635390&idx=1&sn=e8d9df6f2dacc23beb336e181a88a2d8&chksm=e9efd835de985123f8596dcdfbc6eaca9dce3c93f4999b58669e9c2c4d84ba46104e3687fe0a&scene=27
10.[转载]基于强化学习的数据驱动多智能体系统最优一致性综述这种控制算法采用策略迭代(policy iteration, PI)技术,仅要求对系统动力学有部分了解。2009年, Doya K提出了将强化学习技术应用到求解连续时间系统的控制器中。参考文献提出了利用积分强化学习(integral reinforcement learning,IRL)的在线学习算法,用于解决系统模型部分未知的线性或非线性系统的最优跟踪控制问题。强化学习https://wap.sciencenet.cn/blog-951291-1276281.html
11.目标跟踪入门——目标跟踪算法综述电子创新网Imgtec社区目标跟踪入门——目标跟踪算法综述 最近需要学习计算机视觉中的目标跟踪方面的内容,在学习前做了个调研,对该领域的主要发展做下总结。 介绍 目标跟踪是计算机视觉领域的一个重要分支,是模式识别,图像处理,计算机视觉,机器学习等学科的交叉研究,有着广泛的应用,如视频监控,虚拟现实,人机交互,图像理解,无人驾驶等。https://imgtec.eetrend.com/blog/2019/100017436.html
12.深度学习(Deeplearning)综述卷积神经网络(Convolutional Neural Networks, CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks),是深度学习(deep learning)的代表算法之一 。卷积神经网络具有表征学习(representation learning)能力,能够按其阶层结构对输入信息进行平移不变分类(shift-invariant classification),因此也被称为https://www.jianshu.com/p/c8a46f00b06d
13.高分遥感驱动的精准土地利用与土地覆盖变化信息智能计算模型与的属性信息,而“建”、“水”、“土”、“生”、“地”等各类地理图斑又明显地具有多尺度空间粒特点,因此以图斑为记录对象的属性表天然具有鲜明的多粒度特性与层次化特征,可遵循粒计算的原理约简X(降维),并以较大的泛化力提炼X与y间的映射关系,从而在目标空间Y中构建形成针对不同求解目标y的迁移学习算法集http://www.jors.cn/jrs/article/html/202107001
14.机器学习算法的分布式实现研究综述.docxMapReduce以及Spark.它们实现了不同的并行编程模型:消息传递或者数据并行.本文首先介绍了分布式计算和机器学习的基本概念,并以逻辑回归为例说明了一般迭代算法的求解过程.然后分别介绍了各种分布式框架的体系设计,编程接口,以及迭代算发在其中实现的过程.最后比较了三种框架的异同,并未来展望了分布式框架在机器学习中的应用https://www.renrendoc.com/paper/227177230.html
15.深度学习算法简要综述译站深度学习正在吞食这个世界。 这个炒作再大约2012年开始,那是神经网络再图像识别任务上达到了超越人类的表现,但只有少部分人预测到了将会发生什么。 在过去的十年,越来越多的算法涌现出来。越来越多的公司将他们运用在他们的日常业务中。 在这里,我试图覆盖这些年出现的所有重要的深度学习算法和架构,它们在许多方面有着https://www.yanxishe.com/TextTranslation/2456
16.从起源到具体算法,这篇深度学习综述论文送给你从起源到具体算法,这篇深度学习综述论文送给你 来源:机器之心 本文为大家从最基础的角度来为大家解读什么是深度学习,以及深度学习的一些前沿发展。 自2012 年多伦多大学 Alex Krizhevsky 等人提出 AlexNet 以来,深度学习作为一种机器学习的强大方法逐渐引发了今天的 AI 热潮。随着这种技术被应用到各种不同领域,人们https://cloud.tencent.com/developer/article/1070477
17.基于优化理论的支持向量机学习算法研究【摘要】: 支持向量机是借助优化方法解决机器学习问题的新工具.近年来,支持向量机越来越受到人们的广泛关注,在其理论研究和算法实现方面都取得了重大进展,下载全文 更多同类文献 个人查重>> 个人AIGC检测>> 文献综述>> (如何获取全文? 欢迎:购买知网充值卡、在线充值、在线咨询) CAJViewer阅读器支持CAJ、https://cdmd.cnki.com.cn/Article/CDMD-10701-2009195330.htm
18.从传统方法到深度学习,人脸关键点检测方法综述原标题:从传统方法到深度学习,人脸关键点检测方法综述 机器之心专栏 作者:余霆嵩 人脸关键点检测是人脸识别和分析领域中的关键一步,它是诸如自动人脸识别、表情分析、三维人脸重建及三维动画等其它人脸相关问题的前提和突破口。近些年来,深度学习方法由于其自动学习及持续学习能力,已被成功应用到了图像识别与分析、语音识https://tech.ifeng.com/a/20171217/44807875_0.shtml
19.Nature综述:国内顶尖课题组都在用,科研成果取得大的突破!1 机器学习简介 1.1 机器学习四要素 1.2 数据模块 1.3 核心和高级 API 2 回归算法与应用 2.1线性回归 2.2 Lasso 回归 2.3 Ridge 回归 2.4 ElasticNset 弹性网络 3 分类算法与应用 3.1 逻辑回归 3.2 朴素贝叶斯 3.3 KNN 3.4 SVC 3.5决策树 3.6 随机森林 https://www.biodiscover.com/reaseach/742102.html