[自动驾驶 SoC]-3 英伟达Orin

NVIDIA® Jetson AGX OrinTM series (资料来源:nvidia-jetson-agx-orin-technical-brief.pdf)

1 整体介绍

1) Orin SoC结构

Orin SoC,如下图所示,由一个NVIDIA Ampere architecture GPU, Arm® Cortex®-A78AE CPU, 下一代深度学习核视觉处理加速器, 视频编码器和视频解码器组成。

2) Orin和Xavier配置对比

3) AGX ORIN分为32GB、64GB两种模块

2 核心模块说明

1) GPU

GPU由两个GPC组成,共计16个SM单元,192KB L1 Cache和4MB L2 Cache。每个SM具备128个CUDA核(共计2048个-5.3 FP32 TFLOPs)和4个第三代Tensor核(共计64个-170 sparse TOPs INT8)。

2) Tensor核

 主要提供矩阵乘法累加计算,支持16个半精度HMMA和32个整型IMMA,并且支持稀疏计算。

3) TensorRT和cuDNN

TensorRT 是一个深度学习推理的运行时库和优化器,提供低的延迟和高吞吐量,用于解析训练好的模型,通过将模型量化到 INT8 格式、优化 GPU 内存和带宽利用(如内核节点融合)以及选择最佳的数据层和算法,最大化推理性能。

cuDNN提供了深度神经网络常见操作的高度优化实现,例如卷积前向和反向、交叉相关、池化前向和反向、softmax 前向和反向以及张量变换功能等。

4) DLA

DLA 2.0 提供了高效能的架构,增加了本地缓冲区,提高了能效并减少了 DRAM 带宽。同时DLA 2.0 引入了结构化稀疏性、深度卷积和硬件调度器等新特性,支持最多 105 INT8 稀疏 TOPs 性能,相比 Jetson AGX Xavier DLA 的 11.4 INT8 密集 TOPs 大幅提升。

用户可以使用 TensorRT 加速 DLA 上的模型,NVIDIA DLA 设计用于从 GPU 卸载深度学习推理,使 GPU 能够运行更复杂的网络和动态任务;TensorRT 支持在 DLA 上运行 INT8 或 FP16 的网络,并支持卷积、反卷积、全连接、激活、池化、批量归一化等层。

5) CPU

CPU使用ARM Cortex-A78AE CPU 取代了 NVIDIA Carmel CPU,包含 12 个 CPU 核心,每个核心具有 64KB 的指令 L1 缓存和 64KB 的数据缓存,以及 256KB 的 L2 缓存,每个集群还具有 2MB 的 L3 缓存,最高支持 2.2 GHz 的 CPU 频率。

6) AI性能对比

3 实例介绍

1)自动泊车系统

1.1) 环境感知:摄像头捕捉停车场景,LiDAR扫描周围环境。

处理单元:CUDA核心处理图像预处理,Tensor核心运行YOLO等物体检测模型识别停车位和障碍物。

1.2) 路径规划:计算最优泊车路径。

处理单元:ARM CPU核(可结合DLA核-支持3D建模、路径规划、语义理解等)运行路径规划算法(如 A* 或 Dijkstra 算法),生成泊车轨迹。

1.3) 传感器融合:融合摄像头和LiDAR数据,生成准确的停车场景。

处理单元:CUDA核心处理数据融合,ARM CPU核进行高层次决策生成统一环境模型。

1.4) 车辆控制:执行泊车操作。

处理单元:ARM CPU核控制转向和速度,实现平稳泊车。

2) 计算机视觉处理

NVIDIA Jetson AGX Orin 通过 PVA 和 VIC 提供了强大的计算机视觉处理能力,结合 VPI 软件库,可以灵活地在多种硬件组件上运行复杂的视觉算法,从而优化计算资源的利用。

2.1)可编程视觉加速器(PVA)

双7路 VLIW(超长指令字)矢量处理单元:可以并行处理多个指令,提高计算效率。

双 DMA 引擎:用于高效的数据传输,减少数据传输的瓶颈。

Cortex-R5 子系统:负责控制和调度任务,提供实时处理能力。

PVA 支持:滤波,对图像进行平滑或增强处理;图像扭曲,调整图像的几何形状;图像金字塔,多分辨率图像表示,用于检测不同尺度的特征;特征检测,检测图像中的关键点;快速傅里叶变换(FFT),用于频域分析。

2.2)视频成像合成器(VIC)2D 引擎

VIC 支持的图像处理功能:镜头畸变校正,增强时间噪声减少,频锐化增强,颜色空间转换,图像缩放,图像混合与合成。

2.3)视觉编程接口(VPI)

VPI 是一个软件库,旨在实现计算机视觉和图像处理算法的硬件加速。它支持在 PVA、VIC、CPU 和 GPU 上运行计算机视觉任务,从而有效地分配计算资源。例如,基本图像处理(如框滤波、卷积、图像重缩放和重映射);复杂计算机视觉算法(如 Harris 角点检测、KLT 特征跟踪、光流、背景减法等)。

2.4) 立体视差估计(Stereo Disparity Estimation)流水线示例

输入:来自立体相机的左图像和右图像。

处理步骤:

a) 镜头畸变校正和图像缩放:由 VIC 处理。

b) 颜色转换为灰度图像:由 GPU 处理。

c) 特征检测和立体匹配:由 PVA 和 NVENC 处理。

输出:生成输入图像之间的视差估计,反映场景深度。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/30785.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

华为 IPV6 配置

[r1]ipv6 必须先在设备上开启IPV6服务 [r1]interface GigabitEthernet 0/0/1 r1-GigabitEthernet0/0/1]ipv6 enable 再在接口上激活IPV6服务,才能配置ipv6地址 配置 ipv6 地址 [r1-GigabitEthernet0/0/1]ipv6 address 2001::1/64 [r1-GigabitEthernet0/0/…

企业防盗版,如何保障上网安全

信息化的发展企业日常办公越来越依赖互联网。然而,终端及普通PC在访问互联网过程中,会面临各种不容忽视的风险。这些风险包括: 员工主动故意的数据泄漏:员工可能故意泄露敏感信息。后台应用程序外发信息:一些应用程序…

代码覆盖率:衡量测试的有效性

在软件开发领域,确保代码的可靠性和稳健性至关重要。实现这一目标的关键实践之一是通过测试。但是,测试本身需要进行测量和评估,以确保其有效性。这就是代码覆盖率发挥作用的地方。代码覆盖率是一种指标,它量化了测试期间程序源代…

Qt正则表达式

需求:对输入的内容进行限制 只能以字母或下划线开始不能以数字开始 不能有中文 字母,数字,下划线混合使用 QRegExp rx("^[A-Za-z_][A-Za-z0-9_]*$");QRegExpValidator validator(rx);QLineEdit edit;edit.setValidator(&va…

荷兰花海元宇宙:探索虚拟世界的花卉之美

随着科技的不断发展,元宇宙已经成为了一个热门话题。在这个虚拟世界中,人们可以体验到许多现实生活中无法实现的事物。而荷兰花海元宇宙则是一个将现实世界中的花卉美景与虚拟世界相结合的创新项目,让人们在元宇宙中也能欣赏到荷兰花海的美丽…

遥感图像地物覆盖分类,数据集制作-分类模型对比-分类保姆级教程

遥感图像地物覆盖分类,数据集制作-分类模型对比-分类保姆级教程 在遥感影像上人工制作分类数据集采用python+gdal库制作数据集挑选分类模型(RF、KNN、SVM、逻辑回归)选择随机森林模型建模分类遥感图像预测在遥感影像上人工制作分类数据集 1.新建shp文件 地理坐标系保持和影像…

本地大模型服务 Ollama:从安装到使用

文章目录 前言一、下载安装1.1 官网安装1.2 压缩包安装1.3 docker 安装二、命令行使用2.1 常用命令2.2 模型列表2.3 使用三、Open-WebUI3.1 安装3.2 修改语言3.3 使用参考前言 Ollama 是专为在本地机器上便捷部署和运行大型语言模型(LLM)而设计的开源框架,它有如下几个特点…

如何应对 Android 面试官 -> MVVM 实战一个新闻客户端 (上)

前言 本章我们基于重构的方式进行一个 MVVM 的实战,我们将一个新闻列表的普通实现,一步一步的改造成 MVVM 的架构模式,一共分为上中下三个章节; 传统方式实现 首先咱们来看具体实现的最终效果,就是一个新闻列表页面&a…

connect-caption-and-trace——用于共同建模图像、文本和人类凝视轨迹预测

介绍 论文地址:https://arxiv.org/abs/2105.05964 源码地址:https://github.com/facebookresearch/connect-caption-and-trace 在过去,计算机视觉和自然语言处理领域的模型和算法的发展只有偶尔的重叠,但近年来,这两…

python-04

str.spilt() str.spilt(str" ", num string.count(str)); str:分隔符,默认为所有的空字符,包括空格、换行符"\n"、制表符"\t"等。 num:分隔次数 str "小时候 总有他们在耳边叮咛嘱咐 小…

案例分享:高科技企业产品管理部门设置和产品经理岗位设置

汉捷咨询曾遇到过一则有关产品管理部门建设和产品经理岗位设置的典型案例,本文中与大家分享,希望能为大家带来一些思考和启发。 A公司决策层最近为产品管理部门设置的事情颇为头痛。A公司是北京一家IC设计企业,多年来排名行业前3名&#xff…

opencv 打开图片后,cv::mat存入共享内存的代码,如何设置队列?

参考 https://blog.csdn.net/BrilliantAntonio/article/details/120606129 分析 执行Add操作时,随机产生一个大写英文字母模拟产品,放入缓冲区,同时调整队尾指针end.执行Remove操作时,将当前缓冲区资源清空,同时调整…

羊毛群的商业逻辑

前言 近几个月,同事们在用餐时偶尔会分享一些群分享的领券链接。 起初,这引起了我一些疑惑。经过一番了解,我发现这个看似充满优惠的社群,实则是一个展现商业智慧的舞台。 在这里,商家找到了一个有效的营销渠道&…

OpenCV--Mat属性和深浅拷贝

Mat属性和深浅拷贝 代码和笔记 代码和笔记 import cv2 import numpy as np""" Mat属性 dims:维度 rows:行数 cols:列数 depth:像素的位深 channels:通道数 RGB 3 size:矩阵大小 type:类型 data:存放数据Mat的深浅拷贝-在python中即ndarray的深浅拷贝 "&qu…

第四届人工智能、机器人和通信国际会议(ICAIRC 2024)

第四届人工智能、机器人和通信国际会议(ICAIRC 2024) 2024 4th International Conference on Artificial Intelligence, Robotics, and Communication 2024年12月27-29日 | 中国厦门 重要信息 会议官网:www.icairc.net 录用通知时间&…

▶《强化学习的数学原理》(2024春)_西湖大学赵世钰 Ch1 基本概念

PPT 截取有用信息。 课程网站做习题。总体 MOOC 过一遍 1、视频 学堂在线 习题 2、相应章节 过电子书 复习 3、总体 MOOC 过一遍 学堂在线 课程页面链接 中国大学MOOC 课程页面链接 B 站 视频链接 PPT和书籍下载网址: 【github链接】 onedrive链接: 【…

基于低代码开发平台的科技管理系统构建:简化运维,提升效率

随着科技的发展,企业对管理系统的需求日益增长。为了满足这一需求,本文介绍了一种基于低代码开发平台的科技管理系统构建方法。通过简化开发流程、提高运维效率,该系统能够帮助企业实现科技管理的高效运作。 引言 在当今信息化时代&#xff0…

Python4 操作MySQL数据库

通过python的pymysql库连接到本地的MySQL数据库,并执行查询操作来获取数据,然后打印出每一行的数据,这里以一个简单的学生表为例进行介绍。 1. MySQL的安装与数据准备 首先需要安装MySQL,在安装完成之后使用Navicat与本地数据库…

Docker 部署项目,真的太雅了~

大家好,我是南城余! 最近在找工作,正好手里有台服务器,之前项目上线用的宝塔部署项目上线,在公司实习了一年后,发现如今项目部署都使用的是容器化部署方案,也就是类似于和 Docker 一样的部署方案…

对于图片转3d人脸方面的研究

1.一个开源的可以运行的项目(face3d/README.md at master yfeng95/face3d GitHub) 在配置好环境后,让我们一个一个py文件运行它(我将给出中文注释) 1)1_pipeline.py 将一个3d头像的mat文件转换为jpg…