改进爬山算法之四:概率爬山法(Probabilistic Hill Climbing,PHC)

        概率爬山法(Probabilistic Hill Climbing,PHC)是一种局部搜索算法,它结合了随机性和贪婪搜索的特点,是对爬山算法(Hill Climbing Algorithm)的一种变体或扩展。与传统的爬山法不同,PHC不是总是选择最优的邻居作为下一步的移动,而是以一定的概率选择最优邻居,同时以一定的概率接受非最优或甚至更差的邻居。这种方法有助于算法跳出局部最优解,增加找到全局最优解的可能性。

一、爬山算法基础

定义:爬山算法是一种局部搜索算法,常用于解决优化问题。它模拟了登山者寻找山峰的过程,通过逐步改进当前的解决方案,以期达到一个局部最优解。

核心思想:从当前解出发,通过与相邻解的比较来寻找更优解。每次迭代中,算法会探索当前解的周围区域,寻找能够带来改进的潜在解,并更新当前解为最优的候选解。

应用场景:爬山算法广泛应用于数学建模、机器学习中的参数调优、运筹学中的路径规划、生物信息学中的蛋白质结构预测等领域。

前面说过的几种爬山法变体在选择下一步时的区别:

(1)爬山算法(Hill Climbing Algorithm,HCA)是在邻域内搜索最优解作为下一步方向;

(2)随机化爬山法(Stochastic Hill Climbing)是随机选择下一个移动的邻近解作为下一步方向;

(3)首次爬山法(First-Choice Hill Climbing)是选择第一个比当前解好的解作为下一步方向;

(4)最陡上升爬山法(Steepest-Ascent Hill Climbing)是邻域内搜索使目标函数值增长最快的解作为下一步方向。

二、基本原理

概率爬山法的核心思想是在每一步都以一定的概率接受更优的邻居,同时以一定的概率接受非最优的邻居。这种随机性可以帮助算法逃离局部最优解,探索更广泛的搜索空间。

(1)随机性引入:在爬山算法的搜索过程中,通过引入随机因素来增加算法的多样性,从而有可能跳出局部最优解。这类似于随机重启爬山算法(Stochastic Hill Climbing),在搜索过程中以一定的概率重新选择起始点或接受较差的解。

(2)概率选择:在比较当前解与邻居解时,不是简单地选择最优解,而是根据一定的概率分布来选择解。例如,可以设置一个温度参数,根据当前解与邻居解的差异和温度参数来决定接受邻居解的概率。这种方法类似于模拟退火算法(Simulated Annealing),它结合了概率机制和温度下降策略来探索解空间。

三、算法步骤

(1)初始化:在搜索空间中随机选择一个初始状态。

(2)选择邻居:从当前状态选择一组邻居。

(3)评估邻居:计算每个邻居的状态值(或目标函数值)。

(4)选择下一步:以一定的概率p选择最优邻居作为下一步的移动,或者以1−p的概率随机选择一个邻居(包括当前状态)。

(5)更新状态:将选择的邻居作为新的状态。

(6)检查停止条件:如果达到最大迭代次数或满足其他停止条件,则停止算法;否则,返回步骤2。

图1 概率爬山法流程图

四、概率爬山法的数学公式

(1)初始化解:设初始解为X_{0},通常是在解空间内随机选择的。X_{0}\sim U(\Omega )其中U(\Omega )表示从解空间\Omega中均匀随机选择一个解。

(2)邻域解生成:对于当前解X_{i},生成一个或多个邻域解

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/64248.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Unity中实现人物残影效果

今天火柴人联盟3公测了,看到一个残影的效果,很有意思,上网查询了一下实现方式, 实现思路: 将角色的网格复制出来,然后放置到新建的物体的MeshFilter组件上,每隔几十毫秒在玩家的位置生成一个&a…

C#实现调用DLL 套壳读卡程序(桌面程序开发)

背景 正常业务已经支持 读三代卡了,前端调用医保封装好的服务就可以了,但是长护要读卡,就需要去访问万达,他们又搞了一套读卡的动态库,为了能够掉万达的接口,就需要去想办法调用它们提供的动态库方法&…

自动挡有什么优势

自动挡汽车相比手动挡汽车具有多方面的优势,以下是对这些优势的详细阐述: 一、操作简便性 无需手动换挡:自动挡汽车不需要驾驶员手动操作离合器和换挡杆,只需通过油门和刹车踏板来控制车速,大大降低了驾驶难度。这使…

菜鸟带新鸟——基于EPlan2022的部件库制作(3D)

设备逻辑的概念: 可在布局空间 中和其它对象上放置对象。可将其它对象放置在 3D 对象上。已放置的对象分到组件的逻辑结构中。 将此属性的整体标识为设备逻辑。可使用不同的功能创建和编辑设备逻辑。 设备的逻辑定义 定义 / 旋转 / 移动 / 翻转:组…

小程序基础 —— 07 创建小程序项目

创建小程序项目 打开微信开发者工具,左侧选择小程序,点击 号即可新建项目: 在弹出的新页面,填写项目信息(后端服务选择不使用云服务,开发模式为小程序,模板选择为不使用模板)&…

Android Java 版本的 MSAA OpenGL ES 多重采样

最近多次被小伙伴问到 OpenGL 多重采样,其实前面文章里多次讲过了,就是构建2个缓冲区,多重采样缓冲区和目标解析缓冲区。 代码流程 // Framebuffer IDs private int msaaFBO; private int msaaColorBuffer; private int msaaDepthBuffer;pr…

Markdown语法字体字号讲解

学习目录 语法详解改变字体样式[电脑要自带该样式字体]改变局部字号全局字体字号的设置使用场景及应用实例 > 快来试试吧😃 👇 👇 👈点击该图片即可跳转至Markdown学习网站进行 Markdown语法字体字号讲解👈点击这里…

Spring boot处理跨域问题

Spring boot处理跨域问题 方案一方案二推荐解决方案注意 方案一 实现WebMvcConfigurer的addCorsMappings方法 Configuration public class InterceptorConfig implements WebMvcConfigurer {Overridepublic void addCorsMappings(CorsRegistry registry) {registry.addMappin…

TOTP双因素认证(2FA)php简单实现

TOTP身份验证的工作原理基于时间戳和密钥。用户需要在设置阶段将密钥与相应的身份验证器进行绑定。通常,用户会在需要使用TOTP动态验证码的APP或网站上获得一个密钥,然后将该密钥添加到TOTP验证器工具上。验证器会根据当前的时间戳和密钥生成一个一次性密…

day21——web自动化测试(3)Unittest+Selenium实战小案例

【没有所谓的运气🍬,只有绝对的努力✊】 目录 今日目标: 1、UnitTest框架 2、UnitTest 核心用例 2.1 TestCase 2.2 TestSuite 2.3 TestRunner 2.4 TestLoader 2.5 TestLoader 与 TestSuite的区别 2.6 Fixture 3、断言 3.1 1230…

【Flink运行时架构】系统构架

SMP架构 数据处理系统的架构最简单的实现方式就是单节点,但是随着数据量的增大,为了使单节点的机器性能更加强大,需要增加CPU数量和加大内存来提高吞吐量。这就是所谓的SMP(Symmetrical Multi Processing,对称多处理)架构。 但是这种架构带来…

CountDownLatch应用举例

定义 CountDownLatch是juc下的一个多线程锁,下面是jdk对它的定义 A synchronization aid that allows one or more threads to wait until a set of operations being performed in other threads completes. 翻译如下 一种同步辅助工具,允许一个或多个…

ADC(二):外部触发

有关ADC的基础知识请参考标准库入门教程 ADC(二):外部触发 1、TIM1的CC1事件触发ADC1DMA重装载2、TIM3的TRGO事件(的更新事件)触发ADC1DMA重装载3、TIM3的TRGO事件(的捕获事件)触发ADC1DMA重装载4、优化TIM3的TRGO事件(的捕获事件)触发ADC1D…

磁盘分区格式

MBR和GPT ‌磁盘分区形式主要有两种:MBR和GPT。‌‌ MBR(Master Boot Record) MBR是一种较旧的分区形式,首次引入于1983年的IBM PC DOS 2.0。它位于驱动器的第一个扇区,包含460字节的引导代码、64字节的磁盘分区表和…

几个支持用户名密码的代理链工具: glider, gost, proxychains+microsocks

几个支持用户名密码的代理链工具: glider, gost, proxychainsmicrosocks gost -L:7777 -Fsocks5://192.168.2.20:7575 -Fsocks5://user:passwd1.1.1.1:10086 -Dgost:(https://github.com/ginuerzh/gost) 参考 https://www.quakemachinex.com/blog/279.html

量子退火与机器学习(1):少量数据求解未知QUBO矩阵,以少见多

文章目录 前言ー、复习QUBO:中药配伍的复杂性1.QUBO 的介入:寻找最佳药材组合 二、难题:QUBO矩阵未知的问题1.为什么这么难? 三、稀疏建模(Sparse Modeling)1. 欠定系统中的稀疏解2. L1和L2的选择: 三、压缩感知算法(C…

【连续学习之SSL算法】2018年论文Selfless sequential learning

1 介绍 年份:2018 期刊: arXiv preprint Aljundi R, Rohrbach M, Tuytelaars T. Selfless sequential learning[J]. arXiv preprint arXiv:1806.05421, 2018. 本文提出了一种名为SLNID(Sparse coding through Local Neural Inhibition and…

关于SNAT、DNAT及浮动地址

SNAT、DNAT SNAT、DNAT就是实现代理的功能。 SNAT 类似于客户端代理:内网主机通过共享公网 IP 地址访问外部服务。DNAT 类似于服务端代理:外部请求通过公网 IP 转发到内网主机上的服务。 没有大网地址的内部主机想要作为客户端访问外部网络(主…

结构方程模型【SEM】:嵌套分层数据及数据分组分析

结构方程模型(System of Equations Model,简称SEM),在生态学和环境科学中通常指的是一组描述生态系统中能量、物质和信息流动的数学方程。这些方程可以是确定性的,也可以是随机的,它们共同构成了一个模型&a…

hot100_56. 合并区间

以数组 intervals 表示若干个区间的集合,其中单个区间为 intervals[i] [starti, endi] 。 请你合并所有重叠的区间,并返回 一个不重叠的区间数组,该数组需恰好覆盖输入中的所有区间 。数据结构 二维链表存储每个区间 方法 先对每个区间的…