将要上市的自动驾驶新书《自动驾驶系统开发》中摘录各章片段 4

在这里插入图片描述
第十三章 车联网

数字化设备正变得越来越普遍并且相互联系。这些设备向数字生态系统智能部分的演进创造了迄今为止尚未解决安全问题的新颖应用。一个特定的例子是车辆,随着车辆从简单的交通方式发展到具有新的感知和通讯功能的智能实体,就成为智能城市的活跃成员。

在第三章3.1.7节已经简单介绍了车联网(V2X)的基础,即DSRC和Cellular-V2X通信技术。车联网包括通过V2V(车对车),V2I(车对基础设施)和V2P(车对行人)交互而与公共网络进行通信的车辆,其收集和实时共享有关路网状况的关键信息。

使用车载单元,车辆可以彼此(V2V)和与路边单元(V2I)进行通信。这可以实现多种其他形式的通信,例如车对宽带云(V2B)(其中车与监视数据中心进行通信),车对人(V2H)这种脆弱的道路使用者即行人或自行车进行通信,或者车辆对传感器(V2S)即车辆与环境中嵌入的传感器进行通信。

对于自动驾驶的车辆而言,和高清地图的作用类似,车联网本身就是一种传感器的延伸,可以看成为“传感器”。

与自动驾驶技术中常用的摄像头或激光雷达相比,V2X技术具备突破视觉死角和跨越遮挡物获取信息的能力,同时也可以和其他车辆及设施共享实时驾驶状态信息,还可以通过研判算法产生预测信息。另外,V2X是唯一不受天气状况影响的“传感器”技术,无论雨、雾或强光照射都不会影响其正常工作。因此V2X技术广泛应用于交通运输尤其是自动驾驶领域。

本章介绍车联网在自动驾驶应用的技术。13.1讨论智能网联汽车(CAV)的发展;13.2介绍车联网的社交特性及其AI元素;13.3对各种边缘计算进行分析;13.4则讨论车辆-路端的协同方法;13.5介绍车辆通过车联网进行协同感知的技术;13.6讨论编组车队的规划与控制。

​关于感知协同的分析片段:

在这里插入图片描述
第十四章 神经渲染

合成照片级逼真的图像和视频是计算机图形学的核心,也是几十年来研究的焦点。传统意义上,场景的合成图像是用渲染算法(如光栅化或光线跟踪)生成的,这些算法将特别定义的几何和材质属性表示作为输入。总的来说,这些输入定义了实际场景和渲染的内容,称为场景表征(场景由一个或多个目标组成)。用可微分渲染的损失函数从观测中重建这样的场景表征被称为逆图形学或逆渲染。

神经渲染是一个迅速兴起的领域,它可以紧凑地表示场景,通过神经网络从现有的观察中学习渲染。神经渲染的主要思想是将经典(基于物理学的)计算机图形学的见解与深度学习的最新进展相结合。与经典计算机图形学类似,神经渲染的目标是以一种可控的方式生成照片般真实的图像。例如,新视点合成、重打光、场景变形和合成。

"神经渲染 "这个术语经常被用于两个不同的概念。第一种范式,是神经网络被训练为从一些2-D输入信号(如语义标签或栅格化的智体几何)直接映射到输出图像,即把神经网络训练为一个渲染引擎。而另外一种范式,是一个神经网络代表一个特定场景的形状或外观,并且代表用一个传统的图形 "引擎 "进行渲染,是以分析而不是学习方式去定义。与之前的范式不同,这个神经网络并不学习如何渲染,而是学习以3-D方式表征一个场景,然后根据图像生成的物理学原理渲染该场景。神经辐射场(NeRF)就是这样的技术之一,其利用体渲染生成场景图像。

本章14.1是原始NeRF理论介绍,14.2讨论NeRF的加速方法,包括自动积分(AutoInt)方法和Plenoxels模型,而14.3是讨论动态场景的渲染技术,在14.4分析重打光方法, 14.5介绍NeRF的泛化问题,最后14.6介绍最新的质量改进方法。

关于NeRF的泛化分析片段:

在这里插入图片描述
第十五章 扩散模型

给定感兴趣分布的观测样本x,生成模型的目标是学习对其真实数据分布p(x)建模。一旦完成学习,可以根据该近似模型随意生成新的样本。此外,在某些公式下,能够用学习模型来评估观测或采样数据的似然。

生成对抗网络(GAN)对复杂分布的采样过程进行建模,以对抗方式学习。另一类生成模型被称为“基于似然”,试图学习一种为观测数据样本分配一个高似然的模型,包括自回归(AR)模型、归一化流(NF)和变分自编码器(VAE)。有一种类似的方法,是基于能量的建模(EBM),其中一个分布被学习为一个任意灵活的能量函数,然后归一化。

深度学习中生成模型类根据隐含参数随机生成观测结果。然而,目前的生成模型面临四大问题,即生成过程缓慢(采样效率低)、数据处理类型单一(泛化能力弱)、次优的似然和模型需要降维等。

最近,扩散模型凭借其强大的生成能力,成为生成模型的热门之一。应用领域包括计算机视觉、语音生成、生物信息学和自然语言处理等。

迄今为止,在计算机视觉领域中,扩散模型已被应用于各种生成式建模任务,如图像生成(image generation)、图像超分(mage super-resolution)、图像修复(image inpainting)、图像编辑(image editing)和图像翻译(image-to-image translation)等。此外,扩散模型学习的潜表征在鉴别性任务中也很有用,例如图像分割、分类和异常检测。

扩散概率模型最初是由非平衡热力学(non-equilibrium thermodynamics)启发而提出的潜变量生成模型。这类模型由两个过程组成,第一个是正向过程,在多个尺度上添加噪声,逐步干扰数据分布。然后,第二个是反向过程,学习恢复数据结构。

本章涉及扩散模型的理论和应用。15.1讨论带Langevin动力学的基于分数生成网络;15.2介绍去噪扩散概率模型;15.3分析去噪扩散隐式模型(DDIMs);15.4则讨论封装以前方法的SDE框架;15.5介绍扩散模型在图像和视频合成的应用;15.6讨论另一个应用图像-图像翻译;15.7介绍扩散模型的应用文本-图像/视频生成; 15.8总结扩散模型的一些改进方法。

关于文本-到-图像/视频合成的讨论片段:

在这里插入图片描述
—完----

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/835281.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Leecode438:找到字符串中所有字母异位词

做这道题的过程中遇到了很多问题,但其实都是自己不够仔细导致的。这道题的思想归根结底就是维护一个滑动窗口,然后在滑动的过程中不断维护不断判断,直到移到最后端然后返回一个维护好的list列表。

调试代码问题汇总

1.最常见的就是数据库密码不对。根据调试视频将你的数据库密码设置正确,数据库密码是数字的优先直接连如果不成功可以加个双引号或者单引号。 提示:java.sql.SQLException: Access denied for user rootlocalhost (using password: YES) 2.原本配置好的…

Three.js基础练习——渲染一个立方体

1.学习内容参考了 three.js入门教程--零基础也能学会_threejs菜鸟教程-CSDN博客 本章内容包含渲染立方体,并配合ui工具食用~ 2.效果图 import * as THREE from three import * as dat from dat.gui import { OrbitControls } from three/addons/controls/OrbitC…

Istio中的全局限流方案

Istio中的全局限流方案 在k8s网格(istio)环境中, 可以通过创建Envfoyfilter的方式来配置限流。 在istio官方文档中,提供了两种限流方式: 本地限流全局限流 本地限流的细节这里不再赘述, 主要讲解全局限流的配置方式…

解决 git 因输入密码错误而导致的报错无法推送问题

报错内容如下: > git push origin master:master fatal: unable to access https://gitee.com/spring-in-huangxian-county/web-tts-vue.git/: OpenSSL SSL_connect: Connection was reset in connection to gitee.com:443 出错原因 根本原因是本机存储的 账户…

LeetCode题练习与总结:反转链表Ⅱ--92

一、题目描述 给你单链表的头指针 head 和两个整数 left 和 right &#xff0c;其中 left < right 。请你反转从位置 left 到位置 right 的链表节点&#xff0c;返回 反转后的链表 。 示例 1&#xff1a; 输入&#xff1a;head [1,2,3,4,5], left 2, right 4 输出&#…

c++ poencv Project2 - Document Scanner

惯例先上结果图&#xff1a; 本文提供一种文本提取思路&#xff1a; 1、首先图像预处理&#xff1a;灰度转换、高斯模糊、边缘提取&#xff0c;膨胀。 Mat preProcessing(Mat img) {cvtColor(img, imgGray, COLOR_BGR2GRAY);GaussianBlur(imgGray, imgBlur, Size(3, 3), 3, …

uni-app(三):离线打包与插件引用(Android)

离线打包与插件引用 1.下载Android离线SDK2.使用Android Studio打开离线打包项目并更新Gradle3.解决报错4.构建5.配置AppKeya.查看证书b.申请AppKeyc.配置AppKey 6.生成本地打包App资源7.拷贝App资源到Android项目中8.修改 appid9.修改Android项目配置文件10.下载证书并配置11.…

海康威视漏洞综合利用工具-HikvisionExploitGUI

0x01 前言 在攻防演练中&#xff0c;海康威视一直是红队攻击的重点目标之一&#xff0c;红队通常需要快速打点&#xff0c;尽快发现系统中的漏洞&#xff0c;并利用它们获取权限。 0x02 工具简介 工具支持检测海康威视综合安防管理平台多种常见漏洞。提供直观友好的图像化界…

区块链中的加密算法及其作用

区块链技术以其去中心化、不可篡改、透明公开的特性&#xff0c;在全球范围内引发了广泛的关注和讨论。其中&#xff0c;加密算法作为区块链技术的核心组成部分&#xff0c;对于维护区块链网络的安全、确保数据的完整性和真实性起到了至关重要的作用。本文将详细介绍区块链中常…

LLM 可以从简单数据中学习吗?

在 10 月份的一次周会结束后&#xff0c;我提到 SFT 训练后的 Loss 曲线呈现阶梯状&#xff0c;至于为什么&#xff0c;并没有人有合理的解释&#xff0c;加上当时的重心是提升次日留存率&#xff0c;Loss 曲线呈现阶梯状与次日留存率的关系还太远&#xff0c;即使有问题&#…

torch.searchsorted

torch.searchsorted 官方文档链接&#xff1a;torch.searchsorted — PyTorch 2.3 documentation 该函数用于在已排序的序列中查找要插入的值的位置&#xff0c;以保持序列的顺序&#xff0c; torch.searchsorted(sorted_sequence, values, *, out_int32False, rightFalse, s…

Python - 金三银四心路历程 之 数据结构与算法 刷题

目录 一.引言 二.心路历程 三.刷题经历 四.刷题历程 五.总结 一.引言 <夜深人静写算法> 是 23 年 12 月底博主打算跳槽时开始做刷题准备做的专栏&#xff0c;前后准备了大约一个月&#xff0c;刷题完毕后简单准备了项目和简历后就开始加入找工作大军了&#xff0c;最…

【机器学习】逻辑化讲清PCA主成分分析

碎碎念&#xff1a;小编去年数学建模比赛的时候真的理解不了主成分分析中的“主成分”的概念&#xff01;&#xff01;但是&#xff0c;时隔两年&#xff0c;在机器学习领域我又行了&#xff0c;终于搞明白了&#xff01;且看正文&#xff01;再分享一个今天听到的播客中非常触…

Web3 Tools - Base58

Base58编码 Base58编码是一种用于表示数字的非常见的编码方法。它通常用于加密货币领域&#xff0c;例如比特币和其他加密货币的地址表示。 什么是Base58编码&#xff1f; Base58编码是一种将数字转换为人类可读形式的编码方法。与常见的Base64编码不同&#xff0c;Base58编码…

JCR一区 | Matlab实现1D-2D-GASF-CNN-GRU-MATT的多通道输入数据分类预测

JCR一区 | Matlab实现1D-2D-GASF-CNN-GRU-MATT的多通道输入数据分类预测 目录 JCR一区 | Matlab实现1D-2D-GASF-CNN-GRU-MATT的多通道输入数据分类预测分类效果基本介绍程序设计参考资料 分类效果 基本介绍 基本介绍 Matlab实现1D-2D-GASF-CNN-GRU-MATT的多通道输入数据分类预…

Ascent DMS AE电源说明书和设备连接调试教程

Ascent DMS AE电源说明书和设备连接调试教程

世上最全前端开发教程(HTMLCSS)

HTML介绍 HTML&#xff0c;全称为HyperText Markup Language&#xff0c;即超文本标记语言&#xff0c;是一种用来创建网页的标准标记语言。HTML使用一系列的标签&#xff08;Tags&#xff09;来定义网页的不同部分和它们的行为&#xff0c;比如段落、链接、图片等。 CSS介绍 …

《这就是ChatGPT》读书笔记

书名&#xff1a;这就是ChatGPT 作者&#xff1a;[美] 斯蒂芬沃尔弗拉姆&#xff08;Stephen Wolfram&#xff09; ChatGPT在做什么&#xff1f; ChatGPT可以生成类似于人类书写的文本&#xff0c;它基本任务是弄清楚如何针对它得到的任何文本产生“合理的延续”。当ChatGPT写…

数据库基础语法二

一、数据库 1、登陆数据库 2、创建数据库zoo 3、修改数据库zoo字符集为gbk 4、选择当前数据库为zoo 5、查看创建数据库zoo信息 6、删除数据库zoo mysql -uroot -p #登陆数据库 create database zoo; #创建数据库zoo alter database zoo character set gbk collate gbk_…