神经网络求解混合整数规划 本文对DeepMind近期的神经网络求解MIP(混合整数规划)的论文进行了一些初步解读。事实上,相较于此领域近期的类似工... 

本文对DeepMind近期的神经网络求解MIP(混合整数规划)的论文进行了一些初步解读。

事实上,相较于此领域近期的类似工作,DeepMind的工作在MIP的求解开发某些环节,如分支定界,启发式算法上所做的利用神经网络的尝试,更加的精细化和高度工程化。

其中数组x叫做决策变量,数组c是这些决策变量的目标系数,矩阵A是线性约束矩阵,Z是整数集合。整数规划在现实世界中的用途极为广阔。

例如在航空航天、能源电网、生产制造、交通物流、军事与通讯等领域都起着不可替代的基础建模与求解功能。

鉴于DeepMind此次的论文主要涉及分支算法和启发式算法,我们分别重点从这两个方向进行探讨。

设想一类较特殊的整数规划问题,如可行性问题,它没有目标函数,只需要找到一组整数解即可完成。那么在找到整数解之前,其Gap就是100%,找到之后就是0%。

如果某个启发式(或者割平面)算法,在开启和关闭的的情况下,分别可以于1小时和3小时找到可行解。

则如果以两小时为观察点,则可以说在开启这项算法的前提下,实现的Gap提升就是无穷多倍,而若以半小时或者三个小时作为观察点,则Gap没有提升。

因此在训练集上获得的经验,必然会对求解最后的测试集有帮助。而这些帮助能否泛化推广到任何通用问题集上,高度存疑。分支算法与NeuralBranching分支(Branching)算法是整数规划求解器的核心框架。求解MIP通常需要求解多个LP(线性规划)问题完成。其中第一个LP问题是原始问题去掉全部的整数约束得来。

如果第一个LP问题的最优解碰巧满足整数条件,则这个解也是整数规划的最优解。如果LP松弛问题的解不都满足整数条件,则可以通过分支算法继续寻找整数解。分支算法通过选择一个取值不为整数的变量x=x*进行分支,通过分别添加x≤floor(x*)(即取值不大于x*的最大整数下界)和x≥ceil(x*)(即取值不小于x*的最小整数上界)这两个约束来把原始问题分解为两个子问题。

原整数规划问题的最优解一定在这两个分支之一。接下来继续求解这两个新的问题,并以此类推,直到找到最优的整数解或者证明整数解不存在为止。

不难看出,分支算法的本质是枚举,在有n个0-1变量的混合整数规划问题里,最坏情况要遍历所有2的n次方个分支节点。

该算法原理非常简单,即通过分别对当前LP(线性规划)问题的各个取值不为整数的变量进行分支,求解全部的分支后的LP问题,并通过LP的目标函数值判断选取哪个分支是可以最快的完成MIP求解。

这些启发式算法又大致可以分为四类:取整(Rounding)、下潜(Diving)、子问题(Sub-MIP)和上述三类之外的其他算法。

取整(Rounding)启发式算法顾名思义,是在LP松弛解不满足整数约束时,对不满足的变量进行取整,以期望获得整数解。

下潜(Diving)启发式算法的本质是深度优先搜索,它在LP松弛解不满足整数约束时,从当前节点出发,不断的选取最佳分支进行深度优先搜索,直到找到整数解或证明子问题为不可行为止。这两类算法虽然原理简单,但是也都有多种实现变种,在这里不展开讨论。子混合整数规划问题(Sub-MIP)的启发式算法是一个大类,它通过构造并求解子MIP问题来寻找高质量的整数解。在构造子问题的时候,又有多种构造方式,例如:固定或缩紧变量,添加约束以及修改目标函数值。

其中如固定变量类的算法,比较有名的有松弛导向邻域搜索(Relaxationinducedneighborhoodsearch或简称RINS),它的工作原理是当某个整数变量在LP松弛解中的值与当前最好整数解中的值一致,则将该变量固定在这个整数值。

如果大量变量可以被固定,则可以把这个固定变量后的子问题当作一个全新的MIP求解,以期望可以找到高质量的整数解。由于大量的变量被固定了,子问题的搜索空间会变小,且预求解可以进一步的削减问题的规模,因此解子问题会相对容易些。DeepMind提出的NeuralDiving这个算法,是通过机器学习和神经网络,给定一个问题结构,预判如何固定部分整数变量的取值,然后去求解子MIP。

因此,尽管用到了Diving这个词,但是我们认为它还是可以归类为求解子问题的启发式算法。可以看出这个算法在原理上和上述的RINS有诸多相似之处,只是固定变量的方式不同。虽然思路和很多既有启发式算法形式类似,但NeuralDiving还是有它的独特之处。NeuralDiving最大的优势之一,是它可以在正式求解原始问题之前,即生成多组差异化的部分变量取值,启动启发式算法。

我们遇到的实际问题只有数千个整数变量,需要求每隔15分钟求解一次,并且要在15分钟内尽快解完。我们通过深度神经网络等机器学习的方法去预测MIP模型最优解中每个决策变量取1的概率。

从而固定部分置信度最高的变量和对中间置信度的部分变量添加多变量分支的割平面,使得最后的问题可行的概率最高。

这样的方法能够有效减少分支定界树的搜索规模,一方面能够实现快速收敛,另一方面能够快速寻找到高质量的初始解。最后的实验显示,借助该方法在达到相同质量解(Gap=0.01%)的速度提升为5-10倍左右。

其中不乏有原始问题3分钟无法完成求解,而结合使用机器学习算法仅需10秒就能完成求解的时候。这种速度的提升对需要每15分钟都需要快速计算决策的SCUC问题非常重要。电网中的优化也是DeepMind指出的智能化MIP可以重点发力的领域。但是,值得着重指出的是,电网另一个特性就是对于安全性和鲁棒性的极端要求。

而在新问题的数据结构突发巨变,历史数据已经不能指导未来的时候,例如战争,自然或者人为因素导致的发电厂和输电线路的极大变化,机器学习能起到的作用会弱化很多。

这个时候,更多的时候还是依靠MIP求解器自身六个模块那些独立于数据之外的经典算法的实现能力。另一个例子是中国邮政的路由网络规划问题。我们在实践中遇到的此类问题通常需要求解数十万整数变量的MIP来决定发车安排。

如果直接抛给求解器,则往往需要花费一至两个小时才能找到第一个整数解(Gap在30%左右甚至更差)。通过观察,我们发现尽管无法预测全部的发车安排,但是可以预测部分高概率的车辆安排。

我们进而通过机器学习历史数据,形成了一套根据线性约束关系生成数千发车安排的部分初始解的方法。在此基础上,我们通过临时固定这些决策变量,构造子MIP问题,用求解器快速的计算、补全子问题的解。

这个子问题由于部分关键变量确定,使得预求解模块可以对问题规模进行大幅度的削减,促成快速求解。尽管这个子问题的最优解不是原始问题的最优解,但在实践中这个解(Gap在10%之内)明显优于花费一至两小时算出的第一个可行解。

所以无论是分支策略,初始解固定,甚至割平面产生,都可以通过机器学习技术获得,从而加速问题的MIP模型求解。而且也确实有很多学者在这个问题上取得了相对多的进展。

这些技术展示出来的潜力是值得欢呼的,但是在现实中求解MIP问题,需要的数学技巧和工程经验是极其厚重的。传统的MIP求解工具有数十年的理论论证和理论分析基础。

THE END
1.人工智能深入了解神经网络 通过Frank La La|2019 年 2 月 神经网络是很多高级的人工智能 (AI) 解决方案的基本元素。但是,很少人取消 derstand 这一概念的核心数学或结构化基础。虽然初始研究神经网络返回日期数十年来,它不是直到最近的计算能力和训练数据集的大小进行它们实际供常规使用。 https://docs.microsoft.com/zh-cn/archive/msdn-magazine/2019/february/artificially-intelligent-a-closer-look-at-neural-networks
2.线性神经网络与统计线性模型的融合摘要:本文聚焦于线性神经网络与统计线性模型的融合,深入探讨其原理、方法及应用意义。首先分别阐述线性神经网络和统计线性模型的基本架构与特性,包括线性神经网络的神经元结构、前向传播与反向传播算法,以及统计线性模型如线性回归、逻辑回归等的数学表达式和假设条件。详细分析融合的动机,如结合两者优势以提高模型的预测准确https://blog.csdn.net/ashyyyy/article/details/144364459
3.混合神经网络混合神经网络的意思混合神经网络 混合神经网络的意思 可以把神经网络看作复合函数。你输入一些数据,它会输出一些数据。适用于有大量数据,能容忍一定误差,不能用一些规则简单归纳的问题。 拓扑结构是指网络中各个站点相互连接的形式,在局域网中明确一点讲就是文件服务器、工作站和电缆等的连接形式。现在最主要的拓扑结构有总线型拓扑、https://blog.51cto.com/u_16099211/7613933
4.《混合神经网络技术(第二版)》(田雨波)简介书评混合神经网络技术(第二版)客服无忧-金牌电商客服实战Excel在会计与财务管理工作中的案例应用非线性随机时滞神经网络-稳定性分析与脉冲镇定Excel篇-实战大数据分析 科学出版社自营店当当自营 进入店铺收藏店铺 商品详情 开本:16开 纸张:胶版纸 包装:平装胶订 http://product.dangdang.com/23807282.html
5.混合神经网络混合神经网络这一术语可以有两种含义。生物神经网络与人工神经元模型相互作用,以及带有符号部分的人工神经网络(或者反过来说,带有连接主义部分的符号计算)。至于第一种含义,混合网络中的人工神经元和突触可以是数字或模拟的。对于数字变体,电压钳被用来监测神经元的膜电位,计算模拟人工神经元和突触,并通过诱导突触刺激生物https://vibaike.com/176423/
6.MLP/CNN混合神经网络学术百科与"MLP/CNN混合神经网络"相关的文献前1条更多文献>> 1.基于混沌神经元的延时滥用入侵检测模型 在研究混沌神经元延时特性的基础上 ,构建了MLP/CNN混合前馈型神经网络 .提出基于混沌神经元的滥用入侵检测模型 ,它既具备MLP的分类功能 ,又具有混沌神经元的延时、收集和思维 详情>> https://wiki.cnki.com.cn/HotWord/2663679.htm
7.神经网络原理通用12篇4.3.2 用光学或光电混合器件实现神经网络硬件系统 光学技术在许多方面有着电子技术无法比拟的优点:光具有并行性,这点与神经计算机吻合;光波的传播交叉无失真,传播容量大;可实现超高速运算。现在的神经计算机充其量也只有数百个神经,因此用“电子式”还是可能的,但是若要把一万个神经结合在一起,那么就需要一亿条导线,https://sszn.xueshu.com/haowen/92731.html
8.JC文献分享混合效应神经网络模型混合效应神经网络模型(mixed effect neutral network,MENN),即将非线性函数放入到混合效应模型中,可以使用下面函数进行表示。 (4)MENN参数估计 传统的神经网络一般使用最小二乘法或极大似然法进行参数估计,MENN更多使用极大似然法进行参数估计,估计公式如下图所示。 03.研究结局 3.1 选择神经元数量 神经网络参数包括三https://www.360doc.cn/article/53859747_1032035185.html
9.分层混合专家神经网络HME,HME(HierarchicalMixturesofExpert6) hierarchical hybrid neural networks(HHNN) 分级混合神经网络补充资料:Hopfield神经网络模型 Hopfield神经网络模型 Hopfield neural network model 收敛于稳定状态或Han加Ing距离小于2的极限环。 上述结论保证了神经网络并行计算的收敛性。 连续氏pfield神经网络中,各个神经元状态取值是连续的,由于离散H6pfield神经网络http://www.dictall.com/indu/184/183040961C1.htm
10.清华创新架构芯片量产!全球首款可重构超低功耗语音AI芯片这三款芯片的设计方案一问世,就收获了国际学术界的认可。比如Thinker-I首次出现在2017VLSI国际研讨会上时,外界评价它“突破了神经网络计算和访存瓶颈,实现了高能效多模态混合神经网络计算。” 而清微智能CEO王博的本科和硕士均在北京邮电大学计算机通信专业就读,他与清华大学Thinker团队的相识,却来自一段同学缘分。 https://zhidx.com/p/150991.html
11.基于神经网络模型参考自适应实现混合动力汽车电子差速控制系统的设计本文所设计的混合动力汽车采用轮毂驱动技术,根据轮毂驱动电动汽车的技术特点,提出一种基于神经网络模型参考自适应的控制方法.实现混合动力驱动汽车的电子差速控制。 2 现有的电子差速技术 当汽车低速运行时,由ACKERMANN和JEANTAND提出的模型广泛应用于汽车的电子差速控制。如图1所示。 https://www.elecfans.com/d/1558302.html
12.《基于神经网络的混合非线性电阻率反演成像》(江沸菠,戴前伟,冯德京东JD.COM图书频道为您提供《基于神经网络的混合非线性电阻率反演成像》在线选购,本书作者:,出版社:中南大学出版社。买图书,到京东。网购图书,享受最低优惠折扣!https://item.jd.com/11884775.html
13.基于混合多级深度神经网络系统的半导体制造过程自动化视觉故障本文引入了一种新颖的混合多级叠加深度神经网络系统(SH-DNN)混合多级系统,该系统允许通过经典的计算机视觉管道在像素大小内定位最精细的结构,而分类过程由深度神经网络实现。所提系统将重点从其结构的详细程度转移到与任务相关的更感兴趣的领域。正如创建的测试环境所示,基于 SH-DNN 的多级系统超越了当前基于学习的自动https://www.niuren.com/News/Details/73.html
14.量子深度学习:快速了解量子卷积神经网络关于量子卷积神经网络(QCNNs)你需要知道的一切,包括这些方法相较于经典计算方法的优势和局限性 芬兰埃斯波的IQM量子计算机 by Ragsxl 近几年来,量子计算的投资显著增加https://www.imooc.com/article/361385
15.《神经网络与深度学习》混合式教学案例库《神经网络与深度学习》混合式教学案例库包括“基础理论案例”、“专题技术案例”、“综合应用案例”三类案例,每个案例提供案例简介、原理与方法、程序说明及源码解析、程序运行指南、参考文献等文档,和完整的源代码和数据。 使用案例库展开教学,有利于将理论与实践应用相结合,引导学生从主动获取专业知识、发现问题、分析https://jsjxy.xust.edu.cn/info/1069/3713.htm
16.学习报告:数据集特征对使用混合深层神经网络的起重机操作员疲劳该论文提出了一种混合深度神经网络架构,以探索和分析哪些数据集的特征和相应的数据采集方法适合起重机操作员的疲劳检测。它是结合CNN和LSTM进行疲劳检测而设计的。首先,采用这种混合深度神经网络架构对重新标记的三个数据集进行训练:NTHU-DDD、UTA-RLDD和YawDD。然后,使用训练后的模型评估起重机操作员在模拟起重机操作过https://www.scholat.com/teamwork/showPostMessage.html?id=10862
17.片上集成光学神经网络综述(特邀)中国激光[73]Zhang L H, Li C Y, He J Y, et al. Optical machine learning using time-lens deep neural networks[J]. Photonics, 2021, 8(3): 78. [74]陈宏伟, 于振明, 张天, 等. 光子神经网络发展与挑战[J]. 中国激光, 2020, 47(5): 0500004. https://www.opticsjournal.net/Articles/OJdcf7e12569999709/FullText
18.神经网络与深度学习卷积神经网络最初被独特设计并且应用于图像的分类和识别。它采用了三个基本概念:局部感受野(local receptive fields),共享权重(shared weights),和混合(pooling)。卷积神经网络结合了传统图像处理中的思路,这种结构更适合表现图像的整体特点和特征的提取,除了图像,这个模型也被广泛应用于其他应用场景。 https://www.jianshu.com/p/972843df274a
19.Science最新:用机器学习建模人类的风险认知澎湃号·湃客图8中神经网络学到的混合模型中对应的效用函数和主观概率。值得注意的是,一个策略中习得效用函数显然是损失厌恶的,而对应的主观概率则如同前景理论预测的,对小概率的时间高估,而低估了大概率时的确定性,而另一个策略则是基本理性的。通过找出在什么场景下,人们会选择理性的策略:什么时候人们会如前景理论预测的,什么https://www.thepaper.cn/newsDetail_forward_13264651
20.图9神经网络学习算法的实时性; (4)?神经网络控制器和辨识器的模型和结构; 根据神经网络在控制器中的作用不同,神经网络控制器可分为两类,一类为神经控制,它是以神经网络为基础而形成的独立智能控制系统;另一类为混合神经网络控制,它是指利用神经网络学习和优化能力来改善传统控制的智能控制方法,如自适应神经网络控制等https://max.book118.com/html/2016/0629/46804310.shtm