基于场景图的零样本目标导航

基于场景图的零样本目标导航

bicheng/2025/2/4 11:06:58/文章来源:https://blog.csdn.net/BigDavid123/article/details/145432577

参考论文：SG-Nav：Online 3D Scene Graph Prompting for LLM-based Zero-shot Object Navigation

0 前言

基于现成的视觉基础模型VFMs和大语言模型LLM构建了无需任何训练的零样本物体巡航框架SG-Nav。

通过VLMs将机器人对场景的观测构建为在线的3D场景图，并以prompt LLM使其充分理解图结构信息，从而进行机器人探索的预测

LLM+Zero-shot

一、研究背景
（1）视觉导航
目标：让机器人能在环境中自由探索或按指定路线移动，以找到特定物体

目标导航和视觉语言导航

目标导航细分为基于图像、文本和简单物体类别的三种形式。视觉语言导航则通过一系列具体指令指导机器人行动。

（2）视觉导航分类
在这里插入图片描述
（3）零样本物体目标导航

要求机器人不经训练部署到全新环境和全新物体类别

二、相关工作
（1）SemEXP：模块化物体目标导航
在这里插入图片描述
（2）PONI：基于边界的物体目标导航

（3）ESC：将LLM引入零样本物体目标导航

三、方法设计
（1）研究动机：建立3D场景图，利用LLM的常识推理能力完成物体导航
（2）框架概述

建立在线3D场景图、CoT推理目标位置、路径规划、目标重感知

在这里插入图片描述
SG-Nav主要就是上图

（3）3D场景图结构
在这里插入图片描述
（4）在线建图：密集连接和剪枝

（5）高效率的在线建图设计

（6）边界点选择策略和底层路径规划

（7）可解释的层次化CoT

（8）重感知技术

四、实验验证
（1）实验设置

（2）对比零样本方法
在这里插入图片描述
（3）消融实验

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/bicheng/70003.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

开屏广告-跳过神器

开屏广告-跳过神器

给大家介绍一款超实用的软件——SKIP，它堪称李跳跳的最佳平替！这款软件已经在Github开源免费，完全无需担心内置源问题，也无需导入任何规则。安装完成后，即可直接使用，非常便捷！ 首次打开软件时…

阅读更多...

大模型本地化部署（Ollama + Open-WebUI）

大模型本地化部署（Ollama + Open-WebUI）

文章目录环境准备下载Ollama模型下载下载Open-WebUI 本地化部署的Web图形化界面本地模型联网查询安装 Docker安装 SearXNG本地模型联网查询环境准备下载Ollama 下载地址：Ollama网址安装完成后，命令行里执行命令 ollama -v查看是否安装成功。安装成…

阅读更多...

自制虚拟机(C/C++)(三、做成标准GUI Windows软件，扩展指令集，直接支持img软盘)

自制虚拟机(C/C++)(三、做成标准GUI Windows软件，扩展指令集，直接支持img软盘)

开源地址:VMwork 要使终端不弹出， #pragma comment(linker, "/subsystem:windows /ENTRY:mainCRTStartup") 还要实现jmp near 0x01类似的本次的main.cpp #include <graphics.h> #include <conio.h> #include <windows.h> #includ…

阅读更多...

【游戏设计原理】97 - 空间感知

【游戏设计原理】97 - 空间感知

一、游戏空间的类型将游戏设计中的空间设计单独提取出来，可以根据其结构、功能和玩家的交互方式划分为以下几种主要类型。这些类型可以单独存在，也可以组合使用，以创造更加复杂和有趣的游戏体验。 1. 线性空间定义：空间设计是…

阅读更多...

基于开源AI智能名片2 + 1链动模式S2B2C商城小程序视角下的个人IP人设构建研究

基于开源AI智能名片2 + 1链动模式S2B2C商城小程序视角下的个人IP人设构建研究

摘要：本文深入探讨在开源AI智能名片2 1链动模式S2B2C商城小程序的应用场景下，个人IP人设构建的理论与实践。通过剖析个人IP人设定义中的“诉求”“特质”“可感知”三要素，结合该小程序特点，阐述其对个人IP打造的影响与推动作用&…

阅读更多...

数据库和数据表的创建、修改、与删除

数据库和数据表的创建、修改、与删除

1.标识符命名规则数据库名、表名不得超过30个字符，变量名限制为29个必须只能包含A-Z,a-z,0-9,_共63个字符数据库名、表名、字段名等对象名中间不能包含空格同一个MySQL软件中，数据库不能同名；同一个库中，表不能重名&#…

阅读更多...

算法日记10:SC62求和（单调栈）（共享求解）

算法日记10:SC62求和（单调栈）（共享求解）

一、题目二、题解： 1、首先，我们看到题目的第一个想法，就是把样例答案如何求解给列出来，图例如下 2、通过分析样例，可以很清晰的发现每一个数字都有其管辖的区间，因此我们可以想到能否找到一个数字它所管…

阅读更多...

Revit二次开发自适应族添加放样融合

Revit二次开发自适应族添加放样融合

大多数博客给出的方案都是如何在有自适应族的情况下进行修改定位点或是将数据传入自适应族,如何直接在族文件中创建自适应模型并将点转换为自适应点,连接自适应点成为自适应路径这种方式没有文章介绍. 下面的代码中给出了如何在自适应族文件中创建参照点并转换为自适应点连接…

阅读更多...

基于VMware的ubuntu与vscode建立ssh连接

基于VMware的ubuntu与vscode建立ssh连接

1.首先安装openssh服务 sudo apt update sudo apt install openssh-server -y 2.启动并检查ssh服务状态到这里可以按q退出之后输入命令 ： ip a 红色挡住的部分就是我们要的地址，这里就不展示了哈 3.配置vscode 打开vscode 搜索并安装：…

阅读更多...

解决SetWindowCompositionAttribute使控件文本透明的问题

解决SetWindowCompositionAttribute使控件文本透明的问题

用以下参数调用该API，能实现类似Aero的模糊透明效果。参数具体含义见 https://zhuanlan.zhihu.com/p/569258181 http://www.memotech.de/WindowComposition/Text.txt http://www.memotech.de/WindowComposition/WindowComposition.zip DWORD accent[4] { 3,0,0,0 …

阅读更多...

使用 DeepSeek-R1 与 AnythingLLM 搭建本地知识库

使用 DeepSeek-R1 与 AnythingLLM 搭建本地知识库

一、下载地址Download Ollama on macOS 官方网站：Ollama 官方模型库：library 二、模型库搜索 deepseek r1 deepseek-r1:1.5b 私有化部署deepseek，模型库搜索 deepseek r1 运行cmd复制命令：ollama run deepseek-r1:1.5b 私有化…

阅读更多...

SQL入门到精通理论+实战 -- 在 MySQL 中学习SQL语言

SQL入门到精通理论+实战 -- 在 MySQL 中学习SQL语言

目录一、环境准备 1、MySQL 8.0 和 Navicat 下载安装 2、准备好的表和数据文件： 二、SQL语言简述 1、数据库基础概念 2、什么是SQL 3、SQL的分类 4、SQL通用语法三、DDL（Data Definition Language）：数据定义语言 1、操…

阅读更多...

Java篇之继承

Java篇之继承

目录一. 继承 1. 为什么需要继承 2. 继承的概念 3. 继承的语法 4. 访问父类成员 4.1 子类中访问父类的成员变量 4.2 子类中访问父类的成员方法 5. super关键字 6. super和this关键字 7. 子类构造方法 8. 代码块的执行顺序 9. protected访问修饰限定符 10. 继承方式…

阅读更多...

使用SpringBoot发送邮件|解决了部署时连接超时的bug|网易163|2025

使用SpringBoot发送邮件|解决了部署时连接超时的bug|网易163|2025

使用SpringBoot发送邮件文章目录使用SpringBoot发送邮件1. 获取网易邮箱服务的授权码2. 初始化项目maven部分web部分 3. 发送邮件填写配置EmailSendService [已解决]部署时连接超时附：Docker脚本Dockerfile创建镜像启动容器 1. 获取网易邮箱服务的授权码温馨提示…

阅读更多...

TensorFlow简单的线性回归任务

TensorFlow简单的线性回归任务

如何使用 TensorFlow 和 Keras 创建、训练并进行预测 1. 数据准备与预处理 2. 构建模型 3. 编译模型 4. 训练模型 5. 评估模型 6. 模型应用与预测 7. 保存与加载模型 8.完整代码 1. 数据准备与预处理我们将使用一个简单的线性回归问题，其中输入特征 x 和标…

阅读更多...

vue入门到实战三

vue入门到实战三

目录 3.1 v-bind 3.1.1 v-bind指令用法编辑3.1.2 使用v-bind绑定class 3.1.3 使用v-bind绑定style 3.2.1 v-if指令 3.2.1 v-if指令 3.2.2 v-show指令 3.3 列表渲染指令v-for 3.3.1 基本用法 3.3.2 数组更新 3.3.3 过滤与排序 3.4 事件处理 3.4.1 使用v-on指令…

阅读更多...

《苍穹外卖》项目学习记录-Day10订单状态定时处理

《苍穹外卖》项目学习记录-Day10订单状态定时处理

利用Cron表达式生成器生成Cron表达式 1.处理超时订单查询订单表把超时的订单查询出来，也就是订单的状态为待付款，下单的时间已经超过了15分钟。 //select * from orders where status ? and order_time < (当前时间 - 15分钟) 遍历集合把数据库…

阅读更多...

解决MacOS安装软件时提示“打不开xxx软件，因为Apple无法检查其是否包含恶意软件”的问题

解决MacOS安装软件时提示“打不开xxx软件，因为Apple无法检查其是否包含恶意软件”的问题

macOS 系统中如何开启“任何来源”以解决安装报错问题？ 大家好！今天我们来聊聊在使用 macOS 系统时，遇到安装应用软件时出现报错的情况。这种情况常常发生在安装一些来自第三方开发者的应用时，因为 macOS 会默认阻止不明开发者的…

阅读更多...

【FreeRTOS 教程六】二进制信号量与计数信号量

【FreeRTOS 教程六】二进制信号量与计数信号量

目录一、FreeRTOS 二进制信号量： （1）二进制信号量作用： （2）二进制信号量与互斥锁的区别： （3）信号量阻塞时间： （4）信号量的获取与…

阅读更多...

C++模板编程——可变参函数模板之折叠表达式

C++模板编程——可变参函数模板之折叠表达式

目录 1. 什么是折叠表达式 2. 一元左折 3. 一元右折 4. 二元左折 5. 二元右折 6. 后记上一节主要讲解了可变参函数模板和参数包展开，这一节主要讲一下折叠表达式。 1. 什么是折叠表达式折叠表达式是C17中引入的概念，引入折叠表达式的目的是为了…

阅读更多...

推荐文章

最新文章