AutoNeRF:Training Implicit Scene Representations with Autonomous Agents

论文概述

        《AutoNeRF》是由Pierre Marza等人撰写的一篇研究论文,旨在通过自主智能体收集数据来训练隐式场景表示(如神经辐射场,NeRF)。传统的NeRF训练通常需要人为的数据收集,而AutoNeRF则提出了一种使用自主智能体高效探索未知环境并利用这些经验自动构建隐式地图表示的方法。本文比较了不同的探索策略,包括手工设计的基于前沿的探索、端到端方法以及由高层规划器和低层路径跟随器组成的模块化方法

        这些模型在四种下游任务(经典视点渲染、地图重建、规划和姿态精炼)上的表现进行了评估,结果显示使用自主收集的数据训练NeRF在未见过的环境中仅通过一次探索即可完成建模,并且模块化的探索模型优于其他经典和端到端的基线方法。最后,论文展示了AutoNeRF在重建大规模场景方面的能力,使其成为执行场景特定适应的有用工具。

1. 引言 

  • 背景与动机

    • 随着计算机视觉和机器人技术的发展,隐式场景表示(如神经辐射场,NeRF)在生成新视角图像方面表现卓越。然而,训练这些模型需要大量的精心收集的数据。
    • 本文提出的AutoNeRF方法,通过自主智能体高效探索未知环境,自主收集数据,训练高质量的隐式场景表示模型。
  • 研究目标

    • 开发一种能自主收集数据的智能体,使其在探索未知环境时,能够自动构建NeRF模型。
    • 评估这些模型在不同下游任务(如视角渲染、地图重建、规划和姿态精炼)中的表现。

2. 相关工作

  • 神经场景表示

    • NeRF通过神经网络表示3D场景的结构,使用差分体积渲染损失从2D图像监督中重建3D场景。
    • 隐式表示技术在新视角合成、实时SLAM和语义增强方面表现出色。
  • 机器人领域的应用

    • 现有的隐式表示技术主要集中在离线场景的训练和推理,而在机器人领域的在线应用还需进一步探索。
  • 主动学习和自主场景探索

    • 传统方法大多依赖于静态数据集上的帧选择,本文提出的方法在大规模动态室内场景中进行主动探索,提升数据收集效率。

3. 方法 

整体框架 

图3:模块化探索策略

图3展示了AutoNeRF中使用的模块化探索策略框架。该框架主要由三个部分组成:全局策略、局部策略和NeRF训练过程。以下是对每个组成部分的详细描述。

1. 全局策略

全局策略负责探索过程中的高级决策,预测智能体应该导航到的中间航点。全局策略的输入是一组语义地图,包括占据信息、已探索区域和语义分割信息。该策略通过卷积神经网络实现,并使用强化学习技术,特别是近端策略优化(PPO)进行训练。

  • 输入:堆叠的语义地图(占据、探索、语义)。
  • 输出:中间航点。
  • 训练:强化学习(PPO)。
2. 局部策略

局部策略负责向全局策略提供的航点导航。它通过采取离散动作使智能体朝着航点移动(在本例中为25步)。这些动作包括向前移动和向左或向右转向。局部策略使用快速行进法(Fast Marching Method),一种经典的路径规划算法,高效地导航到目标航点。

  • 输入:中间航点。
  • 输出:离散导航动作(前进、左转、右转)。
  • 算法:快速行进法。
3. NeRF训练

当智能体通过探索收集到数据后,使用这些数据训练NeRF模型。收集的数据包括图像及其相应的相机位姿。NeRF模型训练旨在预测3D空间中任何点的颜色、密度和语义类别。训练过程包括沿着从相机发出的射线采样点,并优化预测输出使其与真实图像匹配,使用体积渲染技术进行优化。

  • 输入:探索过程中收集的图像和相机位姿。
  • 输出:3D场景表示(密度、颜色、语义)。
  • 训练:体积渲染优化。
其他组成部分
  • 奖励函数:使用不同的奖励函数来训练全局策略,关注诸如已探索区域覆盖或障碍物重要性等方面。
  • 评估:训练好的NeRF模型在几个下游任务上进行评估,包括新视角渲染、地图重建、规划和姿态精炼。

总结

图3概括了AutoNeRF框架的整体架构和流程。它展示了探索策略(全局和局部)如何协同工作进行导航和数据收集,以及如何利用这些数据训练NeRF模型进行3D场景重建。这种模块化的方法确保了高效的探索和高质量的3D建模,实现了通过自主收集的数据进行隐式场景表示的构建。

  • 3.1 任务描述

    • 智能体在未知场景中初始化,通过执行离散动作收集观测数据,这些数据用于训练NeRF模型。
    • 训练过程包括从智能体的视角收集图像和深度信息,并通过这些信息优化NeRF模型的参数。
  • 3.2 探索策略训练

    • 使用模块化探索策略,主要由全局策略负责探索方向的决策。
    • 奖励信号包括覆盖面积、障碍物覆盖、语义对象覆盖和视点覆盖等。
  • 3.3 具体实现

    • 模块化探索策略由高层规划器(负责整体探索策略)和低层路径跟随器(负责具体行动)组成。
    • 高层规划器使用强化学习训练,目标是最大化覆盖新区域的奖励信号。
    • 低层路径跟随器通过快速行进方法导航,确保智能体能高效到达目标位置。

 

4. 实验

  • 实验设置

    • 在不同测试场景中使用训练好的探索策略收集数据,并训练NeRF模型。
    • 评估这些模型在下游任务(如视角渲染、地图重建、规划和姿态精炼)中的表现。
  • 结果分析

    • 实验结果表明,AutoNeRF能够在仅一次探索中有效收集数据并训练NeRF模型。
    • 模块化探索策略在多项任务上表现优越,证明其在未知环境中自主探索和数据收集的有效性。

 

 

5. 结论

  • 总结

    • AutoNeRF展示了自主智能体在探索未知环境中的高效数据收集能力,能够利用这些数据训练高质量的隐式场景表示模型。
    • 这种方法在多种下游任务中表现出色,为机器人领域的场景特定适应提供了有力工具。
  • 未来工作

    • 进一步优化探索策略,提高智能体在复杂环境中的适应性。
    • 探索更多的下游任务应用,验证AutoNeRF在不同场景中的泛化能力。
论文细节补充
  • 训练数据集

    • 论文中使用了多种室内环境数据集进行训练和测试,以验证方法的有效性。
    • 包括模拟的房间布局和真实世界的室内场景。
  • 技术细节

    • NeRF模型的训练过程涉及优化损失函数,使得预测的颜色和密度与观测数据一致。
    • 强化学习策略的训练过程涉及多个探索步骤和奖励信号的设计,以引导智能体高效探索新区域。
  • 评估方法

    • 通过比较不同探索策略的覆盖面积和重建质量,评估智能体的探索效率。
    • 使用标准的视角渲染、地图重建、规划和姿态精炼任务,验证模型在下游任务中的性能。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/838594.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Spring Boot | Spring Boot 中 自定义“用户退出控制“、获取“登录用户信息“

目录: 一、SpringBoot 中 自定义 "用户授权管理" ( 总体内容介绍 ) :二、 自定义 "用户退出控制" ( 通过 "HttpSecurity类" 的 logout( )方法来实现 "自定义用户用户登录控制" ) :1.基础项目文件准备2.实现 "自定义身份认证"…

springboot005学生心理咨询评估系统

springboot005学生心理咨询评估系统 亲测完美运行带论文:获取源码,私信评论或者v:niliuapp 运行视频 包含的文件列表(含论文) 数据库脚本:db.sql其他文件:ppt.ppt论文:开题.doc论文&#xf…

WT99C262-SG LoRa开发板使用教程

WT99C262-SG模块是全新一代的Wi-FiBLELoRa无线扩频模块,基于启明云端WTLRC262-SG系列模组设计开发的新一代LoRa扩频芯片方案设计的无线串口模块。具有多种传输方式,LoRa扩频技术,且模组大部分管脚均已引出至两侧排针,开发人员可根…

爬虫界的“闪电侠”:异步爬虫与分布式系统的实战秘籍

Hi,我是阿佑,前文给大家讲了,如何做一个合法“采蜜”的蜜蜂,有了这么个自保的能力后,阿佑今天就将和大家踏入 —— 异步爬虫 的大门! 异步爬虫大法 1. 引言1.1 爬虫框架的价值:效率与复杂度管理…

卷轴分红商城模式:适用于多种的商业营销模式

卷轴分红商城模式是一种基于区块链技术的去中心化积分商城系统,通过智能合约和数字资产分红实现积分流通和价值回馈,适用于多种场景。 什么是卷轴分红商城模式: 这是一个去中心化的积分商城系统,消费者在商城消费时,可…

番外篇 | 一文读懂卷积神经网络(CNN)的基础概念及原理

前言:Hello大家好,我是小哥谈。卷积神经网络(Convolutional Neural Network,CNN)是一种深度学习模型,主要用于图像识别和计算机视觉任务。本文旨在对卷积神经网络进行详细的讲解,从基本原理到实际应用,帮助读者全面了解CNN的工作原理、优势和基本组成等,以及其在现实生…

异步编程CompletableFuture总结

文章目录 1. 简介:2. 比较1、传统方式2、使用CompletableFuture:异步执行返回值 3、组合处理:anyOfallof : 4. 异步回调:thenAcceptthenApplywhenComplete等同于 thenAccepthandel()等同于thenApply 5. 常用方法:1、su…

Python——IO编程

IO在计算机中指Input/Output,也就是输入和输出。由于程序和运行时数据是在内存中驻留,由CPU这个超快的计算核心来执行,涉及到数据交换的地方,通常是磁盘、网络等,就需要IO接口。 比如你打开浏览器,访问新浪…

Linux查看进程命令ps和top

Linux 是一种自由和开放源代码的操作系统,它的使用在全球范围内非常广泛。在 Linux 中,进程是操作系统中最重要的组成部分之一,它代表了正在运行的程序。了解如何查看正在运行的进程是非常重要的,因为它可以帮助你了解系统的运行状…

Python 白底黑字图片去除红色水印

Python 白底黑字图片去除红色水印 import os from PIL import Imagedef remove_color(image_path, new_image_path):"""初始化:param image_path: 图片路径:param new_image_path: 新图片路径"""# 打开图片并转换为RGBA格式img Image.open(imag…

java入门1.1.2

前言: 第一:一坨垃圾的迭代,还是垃圾 第二:本内容为对类,对象,构造函数的最新抽象理解 正片 先将类,对象,还要构造函数翻译成英文 class,object,construc…

汇中 SCL-61D2超声水表汇中通讯协议

RS-485串行通讯接口设置表 通用代码注释 读取正向仪表数据 DD的内容为 通讯示例 主机命令:2A 41 4A 仪表响应:26 41 4A 00 00 13 63 00 00 07 72 00 00 10 34 00 33 读取负向仪表数据:(单向型仪表无此命令) DD的内容…

selenium发展史

Selenium Core 2004 年,Thoughtworks 的工程师 Jason Huggins 正在负责一个 Web 应用的测试工作,由于这个项目需要频繁回归,这导致他不得不每天做着重复且低效的工作。为了解决这个困境,Jason 开发了一个运行在 JavaScript 沙箱中…

2010-2024年各地级市社会信用体系建设匹配DID数据

2010-2024年各地级市社会信用体系建设匹配DID数据 1、时间:2010-2024年 2、指标:行政区划代码、年份、所属省份、地区、社会信用体系建设示范区 3、范围:310个地级市 4、来源:国家发改委 5、指标解释: 社会信用体…

跨平台应用开发进阶(五十四)cordova自定义插件

文章目录 一、前言二、cordova 自定义插件2.1 cordova 安装2.2 cordova 创建 android 工程2.3 使用 cordova 官方提供的插件2.4 创建自定义插件 三、拓展阅读 一、前言 在前期博文《ReactNative进阶(一):ReactNative 学习资料汇总》中&#…

C++基础与函数解析 | 函数的声明与定义 | 函数调用 | 函数详解 | 函数重载 | 重载解析 | 递归函数 | 内联函数 | 函数指针

文章目录 一、函数基础1.基本函数定义2.函数的声明与定义3.函数调用 二、函数详解1.参数2.函数体3.返回类型 三、函数重载与重载解析1.函数重载2.重载解析 四、函数相关的其他内容1.递归函数2.内联函数3.constexpr函数(C11起)4.consteval 函数 (C20 起 )…

Redis - hiredis源码安装和接口使用介绍

一、hiredis源码安装说明 本文创作基于 hiredisv1.2.0版本 1.简介 hiredis是一个用于与Redis交互的C语言客户端库。它提供了一组简单易用的API,使开发人员可以轻松地连接到Redis服务器,并执行各种操作,如设置和获取键值对、执行命令、订阅和…

C语言 | Leetcode C语言题解之第92题反转链表II

题目: 题解: struct ListNode *reverseBetween(struct ListNode *head, int left, int right) {// 因为头节点有可能发生变化,使用虚拟头节点可以避免复杂的分类讨论struct ListNode *dummyNode malloc(sizeof(struct ListNode));dummyNode…

案例实践 | 招商局集团基于长安链的双循环航运贸易应用

案例名称-招商局双循环航运贸易联盟链 ■ 建设单位 招商局集团 ■ 用户群体 货主企业、物流企业、基础设施运营商等各参与主体 ■ 应用成效 已赋能产业链上下游超1.2万家中小微企业,累计提供普惠金融超830亿元 案例背景 作为全球贸易大国,我国约…

风电功率预测 | 基于CNN卷积神经网络的风电功率预测(附matlab完整源码)

风电功率预测 风电功率预测完整代码风电功率预测 基于卷积神经网络(Convolutional Neural Network, CNN)的风电功率预测可以通过以下步骤实现: 数据准备:收集与风电场发电功率相关的数据,包括风速、风向、温度、湿度等气象数据以及风电场的历史功率数据。 数据预处理:对…