神经网络+增强学习ordi

M-P模型很简单,仅仅是一种单个神经元上的建模,并没有形成网络,没法去完成一些特定的任务。由此人们提出了神经网络的概念,而早期的研究,由于当时硬件水平和计算条件的限制,神经网络结构一般比较简单。

上面我们提到两层神经网络,其中隐层的权值是需要我们学习的,而这个权值我们不能直接获取,所以我们利用输出层得到输出结果和期望输出的误差来间接调整隐层的权值。BP算法的学习过程由信号的正向传播和误差的反向传播两个过程组成。

BP网络有三个要素:

网络拓扑结构便是我们之前总结的两层神经网络结构,我们主要从传递函数和学习算法进行整理阐述下。

可以看出根据上面的S函数,我们会整合所有输入,输出一个新的值,从之前生物学的原理来看也就是说神经元是否被激活。

有三层神经网络,我们自然而然就会想到将神经网络加入更多层,扩展到深度神经网络,但是一个非常显著的问题就是参数的个数,比如之前我们的三层神经网络每层有1000个节点,那么我们需要调整的权值参数就达到了10^9量级,这问题限制了很大程度上限制了深度神经网络的发展。这就要把大哥叫出来帮忙了,就是近期一直火热的deeplearning,由于本人在这方面也是门外汉,只从经典的卷积神经网络(CNN)进行一些归纳整理。

根据网上的资料总结,CNN的核心点有三个:

上面我们给出了MDP的定义,作为一个智能体(agent),当它在决定下一步应该走什么时,最简单的方式就是看下Reward函数的值是多少,即比较走不同动作的回报,从而做出决定。但是就像下棋的时候,我们每走一步都会向后考虑,所谓“走一步看三步”,所以这里我们只看一步即一次Reward函数是不够的,这就引出了值函数(ValueFunction)也叫折算累积回报(discountedcumulativereward)。

噗噗噗,终于写到这里了,综上我们将马里奥只能AI需要用到的算法简单整理了下(如有任何谬误请指出^v^)。下面我们结合两种成熟的算法,归纳整理马里奥AI的两种实现方式。

所谓NEAT算法即通过增强拓扑的进化神经网络(EvolvingNeuralNetworksthroughAugmentingTopologies),算法不同于我们之前讨论的传统神经网络,它不仅会训练和修改网络的权值,同时会修改网络的拓扑结构,包括新增节点和删除节点等操作。NEAT算法几个核心的概念是:

综上便是从最基本的神经网络算法+增强学习,到将这些算法用在智能AI上的一些基本整理,长舒一口气,整理了好久。。。关于智能AI的应用有很多,也跟好多小伙伴讨论过,包括智能测试、新式游戏、游戏平衡性调整以及AI机器人的加入。这个领域除了枯燥的理论知识还能玩游戏,想想有点小激动。总结完毕,如有任何纰漏还请指出,我会尽快修改,谢谢^v^。

THE END
1.AI在自然语言处理中的突破:从理论到应用腾讯云开发者社区多模态学习:融合视觉、听觉和文本等多种模态的信息,实现更智能的交互和理解。 跨语言模型:开发能够理解和生成多种语言的统一模型,消除语言障碍。 人机协作:通过增强人机协作能力,提高工作效率和用户体验。 结论 自然语言处理技术的突破,不仅推动了理论研究的发展,也在实际应用中取得了丰硕成果。从机器翻译到情感分析,再https://cloud.tencent.com/developer/article/2479408
2.一文详细归纳算法数据增强方法需要关注的是,数据增强样本也有可能是引入片面噪声,导致过拟合。此时需要考虑的是调整数据增强方法,或者通过算法(可借鉴Pu-Learning思路)选择增强数据的最佳子集,以提高模型的泛化能力。 常用数据增强方法可分为:基于样本变换的数据增强及基于深度学习的数据增强。 https://blog.csdn.net/2301_78285120/article/details/132388494
3.强化学习详解:理论基础与核心算法解析本文详细介绍了强化学习的基础知识和基本算法,包括动态规划、蒙特卡洛方法和时序差分学习,解析了其核心概念、算法步骤及实现细节。 关注作者,复旦AI博士,分享AI领域全维度知识与研究。拥有10+年AI领域研究经验、复旦机器人智能实验室成员,国家级大学生赛事评审专家,发表多篇SCI核心期刊学术论文,上亿营收AI产品研发负责人。https://www.jianshu.com/p/09c44358b4a6
4.总结62种在深度学习中的数据增强方式业界新闻Local Augment,即局部增强的原理是将图像切分成小块,并在每个小块上应用不同类型的数据增强 目的是潜在地改变目标偏差属性,但产生显着的局部特征 虽然这种增强并不主宰全局结构,但提供了非常多样化的图像特征,这对于神经网络以更通用的方式学习局部特征至关重要 https://www.jindouyun.cn/document/industry/article/183115
5.2021届计算机科学方向毕业设计(论文)阶段性汇报基于多智能体增强学习的交互式图像分割算法研究 本课题旨在利用强化学习算法,将与人类的不断交互的信息引入到图像分割的过程中,从而实现交互式的图像分割,增加分割的准确率和收敛速度,最终降低分割所需要的标注成本。 目前现已基于开源的ppo强化学习算法进行修改,完成了算法主体部分的代码框架搭建,并且完善了数据处理、https://zhiyuan.sjtu.edu.cn/html/zhiyuan/announcement_view.php?id=3943
6.一文梳理ICML2022中图机器学习热点和趋势▲ 图局部增强算法。来源:Liu等人[64] 下一篇是 Yu,Wang 和 Wang 等人 [66] 提升GNN 速度的工作。普通的邻域采样算法,例如 GraphSAGE,会导致邻域以指数速度增长和过时的历史 embedding。这篇论文则是提出了 GraphFM,利用 momentum 和 1-hop 邻域来更新每个点的历史 embedding。在此之前,momentum 常用于各种自https://www.zhuanzhi.ai/document/551b27b7936ef0889d86181f1f2c3e88
7.基于深度学习的水下图像增强算法研究所以,本文针对水下图像存在的局部或整体模糊、色彩饱和度低等问题,提出一种基于深度学习的水下图像增强算法。首先,采用一种残差递归对抗网络模型对水下图像进行去模糊处理。该模型采用多尺度体系结构,每个尺度上网络模型保持一致,均采用包含四个残差块的递归块结构和卷积长短时记忆网络单元构成。由于模型中使用递归结构,https://wap.cnki.net/lunwen-1020122283.html
8.图像增强算法综述①?增强图像的整体效果或是局部细节, 从而提高整体与部分的对比度,?抑制不必要的细节信息,?改善图像的质量,?使其符合人眼的视觉特性.?首先,?本文从 图像增强算法的基本原理出发,?归纳了直方图均衡图像增强,小波变换图像增强,偏微分方程图像增强,分数阶 微分的图像增强,基于 Retinex 理论的图像增强和https://c-s-a.org.cn/csa/article/pdf/7956
9.学习报告:脑电图数据增强——解决睡眠分期任务中的类别失衡问题该文章提出了五种数据增强的方法,包括重复少数类(DAR)、脑电图信号形态变化(DAMC)、信号分割和重组(DASR)、数据集到数据集的传输(DAT),以及最先进的生成算法GAN(DAGAN)。 1.重复少数类(DAR) 少数类的重复样本是一种简单的方法,通过简单地从少数类[2]中随机复制选定的样本。在训练过程中对该方法进行了验证。https://www.scholat.com/teamwork/teamwork/showPostMessage.html?id=13309
10.图像增强算法综述基于局部自适应对比度增强算法的木板条纹识别. 信息与电脑(理论版). 2020(22): 57-59 . 97. 苏航,文畅,谢凯,贺建飚. 最大熵轮廓提取下的脸部区域自适应提取算法. 计算机工程与设计. 2019(01): 197-202 . 98. 王园园,赵耀宏,罗海波,李方舟. 海面红外图像的动态范围压缩及细节增强. 红外与激光工程. http://www.chineseoptics.net.cn/en/article/id/9522
11.神经网络在低照度图像增强中的应用相比于传统的图像增强算法,RetinexNet具有以下优点: 强大的特征提取能力:卷积神经网络可以有效地提取图像的局部特征和全局特征,从而更好地捕捉到图像的细节和纹理信息。 自动学习增强策略:RetinexNet通过训练自动学习增强策略,避免了传统增强方法中需要手动调整参数的问题。 适用于不同场景:RetinexNet可以适用于不同的低https://developer.baidu.com/article/detail.html?id=2302053