模拟退火算法伪代码

Transcript 模拟退火算法伪代码

模拟退火算法_
简要介绍
指导教师：钟翠萍
主讲人：崔旭辉
爬山算法 ( Hill Climbing )
• 介绍模拟退火前，先介绍爬山算法。
爬山算法是一种简单的贪心搜索算法，
该算法每次从当前解的临近解空间中
选择一个最优解作为当前解，直到达
到一个局部最优解。
爬山算法实现很简单，其主要缺点是会陷入局部最优解，而
不一定能搜索到全局最优解。如图1所示：假设C点为当前解，
爬山算法搜索到A点这个局部最优解就会停止搜索，因为在A
点无论向那个方向小幅度移动都不能得到更优的解。
图1
•
爬山法是完完全全的贪心法，每次都鼠目寸光的
选择一个当前最优解，因此只能搜索到局部的最
优值。
• 模拟退火其实也是一种贪心算法，但是它的搜索
过程引入了随机因素。模拟退火算法以一定的概
率来接受一个比当前解要差的解，因此有可能会
跳出这个局部的最优解，达到全局的最优解。
以图1为例，模拟退火算法在搜索到局部最优解A
后，会以一定的概率接受到E的移动。也许经过
几次这样的不是局部最优的移动后会到达D点，
于是就跳出了局部最大值A。
图1
• 关于爬山算法与模拟退火，有一个有趣的比喻：
• 爬山算法：兔子朝着比现在高的地方跳去。它
找到了不远处的最高山峰。但是这座山不一定
是珠穆朗玛峰。这就是爬山算法，它不能保证
局部最优值就是全局最优值。
• 模拟退火：兔子喝醉了。它随机地跳了很长时
间。这期间，它可能走向高处，也可能踏入平
地。但是，它渐渐清醒了并朝最高方向跳去。
这就是模拟退火。
模拟退火算法简介：
• 模拟退火算法(Simulated Annealing，SA)最早的
思想是由N. Metropolis[1]等人于1953年提出。
• Metropolis准则提出
• 固体在恒定温度下达到热平衡的过程可以
用MorteCarol算法方法加以模拟，虽然该
方法简单，但必须大量采样才能得到比较
精确的结果，因而计算量很大。
• 鉴于物理系统倾向于能量较低的状态，而
热运动又妨碍它准确落到最低态。采样时
着重选取那些有重要贡献的状态则可较快
达到较好的结果。因此，Metropolis等在
1953年提出了重要的采样法，即以概率接
受新状态。
Metropolis准则：
假设在状态xold时，系统受到某种扰动而使其
状态变为xnew。与此相对应，系统的能量也从
E(xold)变成E(xnew)，系统由状态xold变为状态
xnew的接受概率p：
模拟退火算法原理：
• 模拟退火算法来源于固体退火原理，将固体加温至充分高，
再让其徐徐冷却，加温时，固体内部粒子随温升变为无序
状，内能增大，而徐徐冷却时粒子渐趋有序，在每个温度
都达到平衡态，最后在常温时达到基态，内能减为最小。
物理退火过程：
（1）加温过程
（2）等温过程
（3）冷却过程
• 根据Metropolis准则，粒子在温度T时趋于平衡的
概率为exp(-ΔE/(kT))，其中E为温度T时的内能，
ΔE为其改变量，k为Boltzmann常数。
• 用固体退火模拟组合优化问题，将内能E模拟为目
标函数值f，温度T演化成控制参数t。
• 即得到解组合优化问题的模拟退火算法：由初始
解i和控制参数初值t开始，对当前解重复“产生
新解→计算目标函数差→接受或舍弃”的迭代，
并逐步衰减t值，算法终止时的当前解即为所得近
似最优解。
• 这是基于蒙特卡罗迭代求解法的一种启发式随机
搜索过程。退火过程由冷却进度表(Cooling
Schedule)控制，包括控制参数的初值t及其衰减
因子Δt、每个t值时的迭代次数L和停止条件S。
• 根据热力学的原理，在温度为T时，出现能量差为dE的降
温的概率为P(dE)，表示为：
P(dE) = exp( dE/(kT) )
• 其中k是一个常数，exp表示自然指数，且dE<0。这条公式
说明的就是：温度越高，出现一次能量差为dE的降温的概
率就越大；温度越低，则出现降温的概率就越小。又由于
dE总是小于0（否则就不叫退火了），因此dE/kT < 0 ，
所以P(dE)的函数取值范围是(0,1) 。
• 随着温度T的降低，P(dE)会逐渐降低。
• 我们将一次向较差解的移动看做一次温度跳变过程，我们
以概率P(dE)来接受这样的移动。
模拟退火算法描述：
•
若J( Y(i+1) )>= J( Y(i) )
则总是接受该移动。
•
若J( Y(i+1) )< J( Y(i) ) (即移动后的解比当前解要
差)，则以一定的概率接受移动，而且这个概率随着时间
推移逐渐降低（逐渐降低才能趋向稳定）。
(即移动后得到更优解)，
• 这里的“一定的概率”的计算参考了金属冶炼的退火过程，
这也是模拟退火算法名称的由来。
模拟退火算法模型：
• 模拟退火算法可以分解为解空间、目标函数和初始解三部分。
• 模拟退火的基本思想:
(1) 初始化：初始温度T(充分大)，初始解状态S(是算法迭代的起点)，
每个T值的迭代次数L
自然常数e为底的
(2) 对k=1，……，L做第(3)至第6步：
指数函数
(3) 产生新解S′
(4) 计算增量Δt′=C(S′)-C(S)，其中C(S)为评价函数
(5) 若Δt′<0则接受S′作为新的当前解，否则以概率exp(-Δt′/T)接
受S′作为新的当前解.
(6) 如果满足终止条件则输出当前解作为最优解，结束程序。终止条件
通常取为连续若干个新解都没有被接受时终止算法。
(7) T逐渐减少，且T->0，然后转第2步。
算法对应演示图：
第一步是由一个产生函数从
当前解产生一个位于解空间
的新解。
为便于后续的计算和接受，
减少算法耗时，通常选择由
当前新解经过简单地变换即
可产生新解的方法。
如对构成新解的全部或部分
元素进行置换、互换等，注
意到产生新解的变换方法决
定了当前新解的邻域结构，
因而对冷却进度表的选取有
一定的影响。
算法对应演示图：
第二步是计算与新解所
对应的目标函数差。
因为目标函数差仅由变
换部分产生，所以目标
函数差的计算最好按增
量计算。事实表明，对
大多数应用而言，这是
计算目标函数差的最快
方法。
算法对应演示图：
第三步是判断新解是否被
接受。
判断的依据是一个接受准
则，最常用的接受准则是
Metropolis准则: 若
Δt′<0则接受S′作为新
的当前解S，否则以概率
exp(-Δt′/T)接受S′作
为新的当前解S。
算法对应演示图：
第四步是当新解被确定接受
时，用新解代替当前解。
这只需将当前解中对应于产
生新解时的变换部分予以实
现，同时修正目标函数值即
可。此时，当前解实现了一
次迭代。可在此基础上开始
下一轮试验。而当新解被判
定为舍弃时，则在原当前解
的基础上继续下一轮试验。
模拟退火算法参数的选择：
冷却进度表
我们称调整模拟退火法的一系列重要参数为冷却进度表。它控
制参数T的初值及其衰减函数，对应的MARKOV链长度和停止条
件，非常重要。
一个冷却进度表应当规定下述参数：
1．控制参数t的初值𝑡0 ;
2．控制参数t的衰减函数；
3．马尔可夫链的长度𝐿𝑘 。（即每一次随机游走过程，要迭代
多少次，才能趋于一个准平衡分布，即一个局部收敛解位置）
4．结束条件的选择
• 有效的冷却进度表判据：
一．算法的收敛：主要取决于衰减函数和马
可夫链的长度及停止准则的选择。
二．算法的实验性能：最终解的质量和CPU的
时间。
参数的选取：
一）控制参数初值𝑡0 的选取
一般要求初始值 𝑡0 的值要充分大，即一开始即处于高温状态，
且Metropolis的接收率约为1。
(1) 均匀抽样一组状态，以各状态目标值的方差为初温。
(2) 随机产生一组状态，确定两两状态间的最大目标值差
|Δmax|，然后依据差值，利用一定的函数确定初温。比如，
𝑡0 =－Δmax/pr ，其中pr为初始接受概率。
二）衰减函数的选取
• 衰减函数用于控制温度的退火速度，一个常用的函数为：
T(n + 1) = K*T(n)，其中K是一个非常接近于1的常数。
模拟退火算法的全局搜索性能也与退火速度密切相关。一般
来说，同一温度下的“充分”搜索(退火)是相当必要的，但
这需要计算时间。实际应用中，要针对具体问题的性质和特
征设置合理的退火平衡条件。
三）马可夫链长度L的选取
在衰减参数T的衰减函数已选定的前提下，L应选得在控制参
数的每一取值上都能恢复准平衡。
四）终止条件
有很多种终止条件的选择，各种不同的条件对算法
的性能和解的质量有很大影响，我们只介绍一个常
用的终止条件。即上一个最优解与最新的一个最优
解的之差小于某个容差，即可停止此次马尔可夫链
的迭代。
模拟退火算法伪代码
•
代码
•
•
•
•
•
•
•
•
•
•
•
/*
* J(y)：在状态y时的评价函数值
* Y(i)：表示当前状态
* Y(i+1)：表示新的状态
* r：用于控制降温的快慢
* T：系统的温度，系统初始应该要处于一个高温的状态
* T_min ：温度的下限，若温度T达到T_min，则停止搜索
*/
while( T > T_min )
{
dE = J( Y(i+1) ) - J( Y(i) ) ;
•
•
•
•
•
•
•
•
•
•
•
if ( dE >=0 ) //表达移动后得到更优解，则总是接受移动
Y(i+1) = Y(i) ; //接受从Y(i)到Y(i+1)的移动
else
{
// 函数exp( dE/T )的取值范围是(0,1) ，dE/T越大，则exp( dE/T )也
if ( exp( dE/T ) > random( 0 , 1 ) )
Y(i+1) = Y(i) ; //接受从Y(i)到Y(i+1)的移动
}
T = r * T ; //降温退火，0<r<1 。r越大，降温越慢；r越小，降温越快
/*
* 若r过大，则搜索到全局最优解的可能会较高，但搜索的过程也就较长。若r过小，则搜索的过程会很快，但最终可能会达到一个局部
最优值
*/
i ++ ;
}
•
•
•
使用模拟退火算法解决旅行商问题
• 旅行商问题，即TSP问题（Travelling Salesman Problem）是数学领
域中著名问题之一。假设有一个旅行商人要拜访n个城市，他必须选
择所要走的路径，路经的限制是每个城市只能拜访一次，而且最后要
回到原来出发的城市。路径的选择目标是要求得的路径路程为所有路
径之中的最小值。
• 使用模拟退火算法可以比较快的求出TSP的
一条近似最优路径。
• 解空间：解空间S是遍访每个城市恰好一次的所有路经，
解可以表示为{w1,w2 ,……, wn}，w1, ……, wn是
1,2,……,n的一个排列，表明w1城市出发，依次经过
w2, ……, wn城市，再返回w1城市。初始解可选为
(1,……, n)。
• 目标函数：目标函数为访问所有城市的路径总长度。
• 我们要求的最优路径为目标函数为最小值时对应的路径。
• 新路径的产生：
随机产生1和n之间的两相异数k和m，不妨假设k<m，
则将原路径：
(w1,w2,…,wk,wk+1,…,wm,wm+1,…,wn)
变为新路径：
(w1,w2,…,wm,wk+1,…,wk,wm+1,…,wn)上述变换方
法就是将k和m对应的两个城市在路径序列中交换位
置。
• 模拟退火算法是一种随机算法，并不一定
能找到全局的最优解，可以比较快的找到
问题的近似最优解。如果参数设置得当，
模拟退火算法搜索效率比穷举法要高。
• 优点：计算过程简单，通用，鲁棒性强，
适用于并行处理，可用于求解复杂的非线
性优化问题。
• 缺点：收敛速度慢，执行时间长，算法性
能与初始值有关及参数敏感等缺点
• 经典模拟退火算法的缺点：
(1)如果降温过程足够缓慢，多得到的解的性
能会比较好，但与此相对的
是收敛速度太慢;
(2)如果降温过程过快，很可能得不到全局最
优解。
模拟退火算法的改进：
(1) 设计合适的状态产生函数，使其根据搜索进程的
需要表现出状态的全空间分散性或局部区域性。
(2) 设计高效的退火策略。
(3) 避免状态的迂回搜索。
(4) 采用并行搜索结构。
(5) 为避免陷入局部极小，改进对温度的控制方式。
(6) 选择合适的初始状态。
(7) 设计合适的算法终止准则。
也可通过增加某些环节而实现对模拟退火算法的改进。主要的
改进方式包括：
(1) 增加升温或重升温过程。在算法进程的适当时机，将温度适当提
高，从而可激活各状态的接受概率，以调整搜索进程中的当前状态，避免
算法在局部极小解处停滞不前。
(2) 增加记忆功能。为避免搜索过程中由于执行概率接受环节而遗失
当前遇到的最优解，可通过增加存储环节，将一些在这之前好的态记忆下
来。
(3) 增加补充搜索过程。即在退火过程结束后，以搜索到的最优解为初始
状态，再次执行模拟退火过程或局部性搜索。
(4) 对每一当前状态，采用多次搜索策略，以概率接受区域内的最优状态，
而非标准SA的单次比较方式。
(5) 结合其他搜索机制的算法，如遗传算法、混沌搜索等。
(6)上述各方法的综合应用。
Thanks!

模拟退火算法伪代码

Transcript 模拟退火算法伪代码

Directory