Radiance Field Learners As UAVFirst-Person Viewers 翻译

作为无人机第一人称视角的辐射场学习者

引言。第一人称视角(FPV)在无人机飞行轨迹的革新方面具有巨大的潜力,为复杂建筑结构的导航提供了一条令人振奋的途径。然而,传统的神经辐射场(NeRF)方法面临着诸如每次迭代采样单个点以及需要大量视图进行监控等挑战。UAV视频由于视点有限和空间尺度变化大而加剧了这些问题,导致不同尺度下的细节渲染不足。作为回应,我们引入了FPV-NeRF,通过三个关键方面来解决这些挑战:(1)时间一致性。利用时空连续性确保帧之间的无缝一致性;(2)全局结构。在点采样过程中结合各种全局特征保持了空间完整性;(3)局部粒度。采用综合框架和多分辨率监控进行多尺度场景特征表示,解决了无人机视频空间尺度的复杂性。此外,由于公开可用的FPV视频的稀缺性,我们引入了一种创新的视图合成方法,该方法使用NeRF从无人机镜头生成FPV视角,增强了无人机的空间感知。在无人机领域,我们的新数据集涵盖了从室外到室内的各种轨迹,与传统的NeRF场景有着显著的不同。通过包括内部和外部建筑结构的广泛实验,FPV-NeRF展示了对无人机飞行空间的上级理解,在我们精心策划的无人机数据集中优于最先进的方法。请浏览我们的项目页面以获取更多信息:https://fpv-nerf.github.io/。

关键词:计算机视觉;空间感知;神经辐射场;第一人称视角;无人机

1 引言

        在计算机视觉方面,机器人导航的进步,包括Visual-SLAM和MVS,以及计算机图形学的创新,如Novel视图合成已成为环境监测和灾难响应等应用程序的组成部分。这些需求建立了神经辐射场(NeRF)作为一种新兴的范例,使用多层感知器网络进行场景表示,并擅长从新颖的相机姿势渲染高质量的图像。

        尽管NeRF取得了成功,但由于其在训练中依赖于来自像素的单个射线,因此在UAV捕获的多尺度视频中遇到了挑战,从而限制了其有效性。首先,该模型缺乏时间一致性,导致新视图生成过程中序列不平滑。其次,NeRF努力构建一个全面的全球结构,特别是在低纹理区域,如纯色表面或草地。第三,当原始视频视角不足时,特别是在建筑物等结构周围,难以渲染局部细节。因此,当应用于从复杂的无人机轨迹生成新颖的第一人称视角时,例如从外部到内部的缩放(图1),NeRF的质量会下降,突出了其在处理不同场景和视角方面的局限性。

        在前面讨论的基础上,我们介绍FPV-NeRF,这是一个为无人机量身定制的第一人称视图合成框架,利用了神经辐射场的力量。配备第一人称视角(FPV)的无人机提供身临其境的视频,提供独特的视角,将观众直接置于行动之中。广泛的研究表明,人类从FPV视频中掌握了全面的空间理解,在第一和第三视角之间进行心理转换,并对环境进行整体把握。如果无人机可以将第三人称视角转换为第一人称视角,那么它就展示了类似于人类的空间认知能力。我们的FPV-NeRF作为无人机的强大和可解释的骨干,在多尺度空间结构识别方面表现出色,同时承认并超越了现有NeRF的局限性。

        具体来说,FPV-NeRF将整个空域划分为区域,递归地将它们分解为子区域。这种多尺度空间构造器根据无人机的飞行轨迹动态调整三维模型组成,同时考虑全局和局部视角。与以前的NeRF不同,FPV-NeRF仅依靠MLP层进行颜色预测,优化了估计的UAV飞行空间中所有点的全局局部特征。我们提出的方法包括:I)多尺度摄像机空间估计,集中于使用相邻时间帧来对环境空间建模的轨迹重构。轨迹空间经过划分,根据UAV在相邻帧中的位置和姿态应用不同的坐标畸变函数。II)利用全局-局部场景编码器的第一人称视角视频生成:i)指示每个块的一般特征的可学习的体积嵌入; ii)基于位置提供连续特征的点位置嵌入,利用各种频率分量增强多尺度编码; iii)提供用于分辨率渲染和等级之间的交叉注意的全局特征的等级嵌入。III)对于训练,我们提出了具有三项的综合损失函数,结合了用于视差对准的最优传输和用于相邻区域之间的平滑一致性的有界变化。

        从本质上讲,FPV-NeRF体现了几个吸引人的特性:首先,它实现了改进的时间一致性。视频序列中相邻帧之间的鲁棒相关定时机制和空间相干性使FPVNeRF能够构造更连续和平滑的整体结构。第二,它增强了全球结构的完整性。通过对不同分辨率之间的交叉注意力的精心设计和体积特征的获取,每个点的特征的训练都考虑了周围点的上下文,降低了忽略低上下文元素的风险。第三,它在提供本地粒度方面表现出色。将空间细分为具有不同翘曲函数的区域,结合采样点的坐标位置到包括高频分量的高维特征的变换,确保了局部细节的高保真度恢复。FPV-NeRF是一个直观而通用的分类框架;它兼容不同的基于NeRF的第一人称视图生成方法。在§4.3中,FPV-NeRF优于参数化的对等体,即:1.61-7.77的峰值信噪比和0.021-0.145的SSIM。在基于体素的架构下,FPV-NeRF在以前常用的NeRF数据集上的性能也优于SOTA方法,即,NeRF-360-V2数据集的峰值信噪比为0.03-3.07,LLFF数据集的峰值信噪比为0.01-1.65。在§4.4中,我们的多尺度摄像机空间估计方法将UAV数据集性能提高了1.52-5.23 PSNR。此外,我们的全局-局部编码器显著提高了性能(1.124.36 PSNR),并且我们的综合损失的结合进一步提高了性能(1.49-4.85 PSNR)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/52199.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

PyQt5 QSS

一、 二、 三、课堂练习 1.课时122.QSS基础_哔哩哔哩_bilibili import sys, os from PyQt5 import QtCore, QtGui, QtWidgets from PyQt5.QtWidgets import * from PyQt5.QtGui import * from PyQt5.QtCore import * from PyQt5.QtPrintSupport import QPrinter,QPageSetup…

【Mac】植物大战僵尸杂交版 for Mac(经典策略塔防游戏)游戏介绍

游戏介绍 植物大战僵尸杂交版 for Mac是一款非常受欢迎的策略塔防游戏,植物大战僵尸游戏以其独特的主题、幽默的风格和富有挑战性的关卡设计而著称。玩家需要种植各种植物来防御入侵的僵尸,每种植物都有其特定的功能和攻击方式。植物大战僵尸杂交版&…

Android 上下滑隐藏显示状态栏

一、DisplayPolicy类中监听滑动事件,然后发送广播事件 Android12类路径: frameworks/base/services/core/java/com/android/server/wm/DisplayPolicy.javamSystemGestures new SystemGesturesPointerEventListener(mUiContext, mHandler,new SystemGest…

SQL注入(head、报错、盲注)

目录 【学习目标、重难点知识】 【学习目标】 【重难点知识】 1. 报错注入 1.1 那么什么是报错注入呢? 1.2 报错注入原理 extractvalue函数 updatexml函数 1.3 靶场解析 靶场练习 2. HEAD注入 2.1 相关全局变量 2.2 靶场解析 burp暴力破解 靶场练习 3…

PostgreSQL的pg_dump中 --inserts参数测试

PostgreSQL的pg_dump中 --inserts参数测试 1 准备测试数据 创建表yewu1.t1,并插入1000000条数据。 white# create table yewu1.t1 (id int,name varchar(20)); CREATE TABLE white# DO $$ white$# DECLARE aa INTEGER; white$# BEGIN white$# FOR aa IN 1..1…

java常见面试题汇总

🌏个人博客主页:意疏-CSDN博客 希望文章能够给到初学的你一些启发~ 如果觉得文章对你有帮助的话,点赞 关注 收藏支持一下笔者吧~ 阅读指南: 开篇说明一、封装 继承 多态1.封装2.继承3.多态 二、什么是重载…

初始化列表 / 隐式转换 / 静态

目录 初始化列表隐式转换单参数的隐式类型转换多参数的隐式类型转换explicit关键字 static 初始化列表 大部分时候成员变量在对象实例化的时候调用构造函数就整体定义了,注意此时只有定义,不算初始化。而定义后的值的值是在构造函数里面给的。我们知道构…

Java并发编程(20)—— ConcurrentHashMap详解

ConcurrentHashMap是Java并发很重要的组件,也是大厂面试经常考察的对象,下面我就全面来详解ConcurrentHashMap 1. ConcurrentHashMap ConcurrentHashMap是Java集合框架中的一个线程安全的哈希表实现,它支持高效地并发访问和修改操作。 我们知道HashMap是线程不安全的,在多线…

DataWorks函数

文章目录 0、MaxCompute预置的函数分类1、日期函数2、数学函数3、算术运算符4、窗口函数5、聚合函数6、字符串函数7、复杂类型函数8、加密函数9、其他函数 0、MaxCompute预置的函数分类 函数类型说明日期函数支持处理DATE、DATETIME、TIMESTAMP等日期类型数据,实现…

oracle liunx 常用命令

前言 Oracle Linux 是一个企业级的 Linux 发行版,基于 Red Hat Enterprise Linux (RHEL)。在 Oracle Linux 上使用常用的 Linux 命令来管理系统和数据库是很普遍的。以下是一些常用的 Oracle Linux 命令和它们的功能说明: 1. 文件和目录管理 ls&#…

<数据集>无人机航拍不同高度牧羊识别数据集<目标检测>

数据集格式:VOCYOLO格式 图片数量:6065张 标注数量(xml文件个数):6065 标注数量(txt文件个数):6065 标注类别数:1 标注类别名称:[sheep] 序号类别名称图片数框数1sheep6065149785 使用标注工具&…

每日一题~abc 367 D+E(F 在上一篇)(区间和相关的计数问题前缀map,建图+倍增)

D题意: 环形的休息区,编号为 1-N,顺时针方向,从休息区i 到i1 需要的代价是 ai, 从休息区 s 顺时针走到休息区 t ( s!t )所需的最小步数是 M 的倍数。 找出可能的配对数 (s,t) 1.解决环形的问题:…

【51单片机】ds18b20驱动,11.0592MHZ,使用DS18b20

文章目录 ds18b20.h #include <reg52.h> #include <intrins.h> #include <math.h>// 管脚定义 sbit DS18B20_DATA_PIN = P1 ^ 0; // DS18B20数据口定义/******************************************************************************* * 函 数 名 …

Macos M1 IDEA本地调试 HBase 2.2.2

# 1. 前提 执行 mvn clean package assembly:single -DskipTests没问题&#xff0c;并在hbase-assembly/target目录下生成hbase-2.2.2-bin.tar.gz 文件夹 证明Maven 下载依赖没问题 1.1 报错 1 这里应该是报错找不到 com.google.protobuf:protoc:exe:osx-aarch_64:3.5.1 …

leetcode滑动窗口问题

想成功先发疯&#xff0c;不顾一切向前冲。 第一种 定长滑动窗口 . - 力扣&#xff08;LeetCode&#xff09;1456.定长子串中的元音的最大数目. - 力扣&#xff08;LeetCode&#xff09; No.1 定长滑窗套路 我总结成三步&#xff1a;入-更新-出。 1. 入&#xff1a;下标为…

docker inspect输出内容详解,推测容器运行命令

原始输出 [{"Id": "c2496d852ee3affd295a177e9f26f163a53da8d11e3708d6a479f189f707ad0b","Created": "2024-08-04T02:43:24.909341103Z","Path": "/startup.sh","Args": [],"State": {&quo…

lambda 表达式可以传递引用为什么需要引用捕获

当 lambda 表达式被传递或存储在其他地方时&#xff0c;通过引用捕获可以确保它始终访问正确的外部变量。—— 引用捕获可以精确地控制被捕获的引用变量的作用域。如果一个 lambda 表达式被存储在一个容器中&#xff0c;并且在不同的时间点被调用&#xff0c;引用捕获可以确保它…

入门STM32—外部中断

外部中断的存在使得微控制器能够及时响应外部事件&#xff0c;避免频繁的轮询操作&#xff0c;从而提高系统的实时性、效率和低功耗性能。 1.什么是外部中断&#xff1f; 外部中断是指微控制器接收到外部引脚的信号变化时触发的中断。STM32F103系列微控制器支持多个外部中断线…

鸿蒙(API 12 Beta3版)【DRM会话管理(C/C++)】数字版权保护开发

DRM会话管理&#xff08;MediaKeySession&#xff09;支持媒体密钥管理及媒体解密等&#xff0c;MediaKeySession实例由系统管理里的MediaKeySystem实例创建和销毁。 开发步骤 导入NDK接口&#xff0c;接口中提供了DRM相关的属性和方法&#xff0c;导入方法如下。 #include &…

学习嵌入式第二十九天

ipc进程间通信方式 PC&#xff0c;即进程间通信&#xff08;Inter-Process Communication&#xff09;&#xff0c;是操作系统中不同进程之间交换数据的一种机制。以下是一些常见的IPC方式&#xff1a; 管道&#xff1a;用于父子进程或兄弟进程之间的通信。消息队列&#xff…