【paper】基于分布式采样的多机器人编队导航信念传播模型预测控制

  • Distributed Sampling-Based Model Predictive Control via Belief Propagation for Multi-Robot Formation Navigation
  • RAL 2024.4
  • Chao Jiang 美国 University of Wyoming

预备知识

马尔可夫随机场(Markov Random Field, MRF)

马尔可夫随机场(MRF)是用于建模多个随机变量之间相互依赖关系的概率图模型。具有以下特点:

  1. MRF通过无向图表示,节点代表随机变量,边表示变量之间的相互依赖关系。
  2. 每个节点的条件分布仅依赖于其邻居节点,而不依赖于其他节点。
  3. 其核心思想是通过局部相互作用来捕捉全局行为。

信念传播(Belief Propagation, BP)

信念传播是一种在图模型(如MRF)上进行推断的算法。它可以用于计算边缘概率分布或最大后验概率估计。主要有两种形式:

  • 标准(BP):适用于树结构或无环图。在这些图中,BP可以精确地计算边缘概率分布。
  • 循环(Loopy BP):适用于包含环的图。虽然在有环的图中BP不一定收敛或给出精确解,但在实践中它常常表现良好,能提供近似解。

步骤:

  1. 初始化:将每个节点的初始信念设置为其先验概率。
  2. 节点之间交换消息,包括关于一个节点的信念如何影响另一个节点。
  3. 边缘概率计算:通过聚合消息计算每个节点的边缘概率。

Q1 Background:本文试图解决一个什么样的问题?

  • 具有复杂系统动力学和不确定性模型的随机最优控制问题
  • 多机器人最优轨迹优化问题
    在这里插入图片描述
    👉20x20的带有静态障碍物的方形环境。轮式机器人数量N=7。初始位置均匀随机分布在左下角的5×5m区域,初始航向从[0,2π)采样。
    👉编队目标:使6个机器人将自己定位成正六边形,1个机器人位于编队中心。每个机器人与其最近邻居的距离为1.2m。最大通信范围dmax=1.5 m,最小机器人间距离dmin=0.6 m。最大控制vmax=1.2 m/s。

Q2 What’s Known:之前解决这个问题有哪些方法?

  • 基于优化的方法:动态规划 | SCP | MPC
    • 缺点:依赖梯度,需要计算导数,不太适合非光滑动力学或成本函数。随着函数的复杂性(例如,非凸性、局部极小值)的增加,这些方法可能变得低效,甚至无法找到可行解。使用基于梯度的优化的现有MPC方法在平滑优化问题中大多是成功的。
  • 基于采样的方法:路径积分控制 | 交叉熵 | 信息论MPC | 变分推理MPC
    • 定义:使用由前向预测模拟产生的随机轨迹样本来实现最优控制。
    • 优点:不依赖于模型的精确梯度的计算,接受更通用的动力学。随机前向搜索提供了一种解释不确定性的原则性方法,使算法不太容易出现局部极小值。

Q3 What’s New:本文是用什么样的方法如何解决这个问题的?

👉基于分布式采样的MPC算法:将多机器人最优控制公式化为图形模型上的概率推理(probabilistic inference over graphical model),并利用信念传播(leverages belief propagation通过分布式计算实现推理。可以产生基于采样的随机优化的各种分布式最优控制算法。

👉具体Method如下:

建模

  • Model:经典的轮式机器人 - 两轮驱动非完整Robot
    在这里插入图片描述
    x x x, y y y是2D位置, θ \theta θ是航向角, v l v_l vl v r v_r vr代表左轮输入速度和右轮输入速度, l l l是左右轮距离

  • Proximity Graph
    无向图,如果 i i i j j j 的欧几里得距离 ≤ d m a x d_{max} dmax(通信范围限制),则 i i i, j j j存在边,且它们俩互为邻居。
    所以边集是时变的:在这里插入图片描述

  • 避碰和避障
    在这里插入图片描述
    在这里插入图片描述
    X o \mathcal{X}_o Xo是障碍物占用的位置(膨胀后)

  • 导航和编队保护
    保持编队移动到目标位置,同时避碰
    即跟踪参考轨迹 ∥ x i , t − x r , t ∥ , ∀ t ∈ [ 0 , T ] \|x_{i,t}-x_{r,t}\|,\forall t\in[0,T] xi,txr,t,t[0,T],参考轨迹 x r , t x_{r,t} xr,t 通过全局运动规划器获得(环境图全局给定),编队由相对位置 Δ p i j \Delta p_{ij} Δpij确定,当所需编队保持不变时,以下等式成立:
    在这里插入图片描述

  • MPC轨迹优化问题
    在这里插入图片描述
    τ i ≜ { x i , t + k , u i , t + k } k = 0 M − 1 \tau_i\triangleq\{x_{i,t+k},u_{i,t+k}\}_{k=0}^{M-1} τi{xi,t+k,ui,t+k}k=0M1是状态控制序列, N N N是智能体数量, M M M是控制时域

key:使用什么样的方法求解这个MPC轨迹优化问题

推理问题

  • 目标:找到最优轨迹上的概率分布,从而找到每个机器人的最优控制。
  • 概述:首先将多机器人团队建模为一个马尔可夫随机场(MRF)的概率图形模型,然后通过局部消息传递将信念传播(BP)用于分布式推理。最后,开发了一种基于采样的MPC算法来获得每个机器人的最优控制。
    在这里插入图片描述
    在这里插入图片描述
  1. 采样轨迹
    输入: t t t时刻状态 x x x和当前的置信分布 q ( U ) q(U) q(U)
    根据 q ( U ) q(U) q(U)对轨迹 τ \tau τ进行采样,得到 L L L个样本
    计算每个样本轨迹的观测似然 p ( O ∣ τ ) p(O|\tau) p(Oτ)
  2. 传递样本轨迹和消息
    i i i 发送轨迹样本给邻居 j j j,并接受邻居 j j j的轨迹样本
    i i i 计算并传递消息 m k , i ( τ ) m_{k,i}(\tau) mk,i(τ) i i i除了 j j j外的所有邻居 k k k对轨迹 τ i \tau_i τi的估计
    i i i 接受 j j j 计算的消息( j j j除了 i i i外的所有邻居 k k k对轨迹 τ j \tau_j τj的估计
  3. 更新当前置信分布
    根据收到的所有邻居机器人的消息和当前时刻的观测信息更新当前的置信分布 q ( U ) q(U) q(U)

在这里插入图片描述

Q4 What’s the Contribution:本文还有什么其他的贡献吗?

  • 主要贡献是完全分布式框架,每个机器人只需要局部信息。它将基于采样的优化方法[6]、[7]、[8]、[9]、[10]扩展到多机器人问题。
  • 对比CMPC,计算速度快
  • 对比基于ADMM求解的MPC,计算速度快且成功率高(分别为82%和98%)

Q5 What’s the Inspiration

  • 模型比较常规,文章重点在于怎么求解问题,把基于采用的随机最优控制(变分推理)用到了求解DMPC问题中,核心思想还是每个机器人根据其他机器人的信息和自己的观测不断调整和优化自身的轨迹,达到全局最优的控制目标。
  • 求解都比较数学,MRF和BP的地方没太看懂,这部分对我的工作没太大用处,但如果有人能看懂这个数学部分把他做到无人机再加个真机实验应该能写个好文章

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/13580.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

域内 dcsync 权限维持

一、原理 DCSync 是域渗透中经常会用到的技术,其被整合在了 Mimikatz 中。在 DCSync 功能出现之前,要想获得域用户的哈希,需要登录域控制器,在域控制器上执行代码才能获得域用户的哈希。 Mimikatz的DCSync 功能: 该…

java8总结

java8总结 java8新特性总结1. 行为参数化2. lambda表达式2.1 函数式接口2.2 函数描述符 3. Stream API3.1 付诸实践 java8新特性总结 行为参数化lambda表达式Stream Api 1. 行为参数化 定义:行为参数化,就是一个方法接受多个不同的行为作为参数&#x…

【机器学习】前沿探索,如何让前端开发更加搞笑

在当今数字化时代,机器学习的崛起为前端开发带来了巨大的机遇和挑战。随着人工智能和数据科学的不断进步,前端工程师不再局限于传统的界面设计和交互体验,而是开始探索如何将机器学习技术融入到他们的工作中,以创造更加智能、个性…

面了一个程序员,因为6休1拒绝了我

人一辈子赖以生存下去的主要就考虑三件事,职业,事业,副业,有其1-2都是很不错的。如果还没到40岁,那不妨提前想下自己可能遇到的一些情况,提前做一些准备,未雨绸缪些。 今年整体就业大环境也一般…

【手写大跟堆详解】

文章目录 大跟堆介绍大跟堆的结构大跟堆的应用场景大跟堆的代码实现 大跟堆介绍 大根堆(Max Heap)是一种特殊的二叉树结构,它满足以下两个条件: 1.完全二叉树:大根堆是一棵完全二叉树,即除了最后一层外&am…

Qt_电脑wifi相关操作

项目描述: 在做项目时用到了获取wifi的操作。在网上查找了好久资料,这里做一些总结。 这里有显示当前电脑wifi连接状态,列出wifi列表,连接断开wifi等函数。欢迎大家留言添加文章内容。 使用范围: windows电脑(中文的环境) 使用技术:windows的cmd命令。和对字符串的解析…

C语言学习笔记--运算符与表达式(7521字爆肝)

上午好,本来想上午改简历下午学习c语言的,但想了一下上午精力充沛还是用来学习比较好,虽然现在失业了,但住在我姨家有吃有住的,再次感谢我姨,我要抓紧时间修改简历,然后找个工作搬出去&#xff…

【回忆版】数据科学思维与大数据智能分析 2024考试

填空(18分)18个 1.对数变换对大数值的范围进行压缩,对小数值的范围进行扩展 2.提取出大量高频率项与低频率项相关联的虚假模式,即交叉支持(cross-support)模式 3.信息论中() 4.几种…

[数据集][目标检测]弹簧上料检测数据集VOC+YOLO格式142张2类别

数据集格式:Pascal VOC格式YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):142 标注数量(xml文件个数):142 标注数量(txt文件个数):142 标注类别…

yolov8训练自己数据集时出现loss值为nan。

具体原因目前暂未寻找到。 解决办法 将参数amp改成False即可。 相关资料: https://zhuanlan.zhihu.com/p/165152789 https://github.com/ultralytics/ultralytics/issues/1148

【BUG】Edge|联想电脑 Bing 搜索报错“Ref A: 乱码、 Ref B:乱码、Ref C: 日期” 的解决办法

文章目录 省流版前言解决办法 详细解释版前言问题描述与排查过程解决办法与总结 省流版 前言 我也不清楚咋滴了,Bing 搜索突然偶尔报错: 换了代理关了插件都报错。 参考: 我在用bing搜索时出现了如下代码,导致bing无法使用&am…

1 计算机硬件-CPU-校验码-存储系统-输入输出设备-总线结构

计算机硬件 考情分析:趋势很小,22年考过,根据趋势以后考的可能较小 基本组成:运算器,控制器,储存器,输入设备,输出设备运算器和控制器也统称为中央处理单元(CPU&#xf…

深度学习——图像分类(CNN)—测试模型

测试模型 1.导入必要的库2.加载测试数据集3.假设CSV文件中的图像文件名是完整的路径4.随机选择一张图片进行展示5.加载图像6.使用模型进行预测7.设置模型的预测结果8.计算准确率9.指定test文件夹路径10.读取名为image_path的图片11.加载图像12.检查图像是否为空 训练的模型是上…

eNSP学习——OSPF单区域配置

目录 相关命令 实验背景 实验目的 实验步骤 实验拓扑 实验编址 实验步骤 1、基础配置 2、部署单区域OSPF网络 3、检查OSPF单区域的配置结果 OSPF——开放式最短路径优先 基于链路状态的协议,具有收敛快、路由无环、扩展性好等优点; 相关命令 […

【JAVA基础之内部类】匿名内部类

🔥作者主页:小林同学的学习笔录 🔥小林同学的专栏:JAVA之基础专栏 目录 1.内部类 1.1 概述 1.1.1 什么是内部类 1.1.2 什么时候使用内部类 1.2 内部类的分类 1.3 成员内部类 1.3.1 获取成员内部类对象的两种方式 1.3.2 经典面试…

用C语言把一棵普通二叉树安排得明明白白

1. 树的相关术语 结点的度:一个结点含有的子树的个数称为该结点的度; 如上图:A的为6 叶结点或终端结点:度为0的结点称为叶结点; 如上图:B、C、H、I...等结点为叶结点 非终端结点或分支结点:度不…

【Linux】-Tomcat安装部署[12]

目录 简介 安装 安装部署JDK环境 解压并安装Tomcat 简介 Tomcat是由Apache开发的一个Servlet容器,实现了对Servlet和JSP的支持,并提供了作为Web服务器的一些特有功能,如Tomcat管理和控制平台、安全域管理和Tomcat阀等。 简单来说&#…

【软件工程】【23.10】p2

关键字: 软件复用技术、过程途径、特定需求是文档核心、数据字典条目、高内聚低耦合独立性、数据流图映射模块结构图、UML依赖、用例图关系、RUB迭代、程序规格说明等价类划分、有效性测试的目标、喷泉模型面向对象、软件验证过程、CMMI

【Linux】Centos7安装RabbitMQ

【Linux】Centos7安装RabbitMQ 下载 从 rabbitmq 的 GitHub 仓库下载 https://github.com/rabbitmq/rabbitmq-server/releases rabbitmq 是 erlang 语言编写的,需要先安装 erlang https://github.com/rabbitmq/erlang-rpm/releases 安装 使用rz命令上传 erlang 和 …

Polar 网站被黑

Polar 网站被黑 开题,挺好看的前端,可惜啥也没有。 信息搜集一波,扫目录出现几个敏感目录,但是没什么用。 继续搜集,在返回包中发现了HINT F5XDAXZQNZSV6ZRRNZSF63JTF4base32解码后是一个路由/n0_0ne_f1nd_m3/&#x…