自动驾驶#芯片-1

概述

汽车是芯片应用场景之一,汽车芯片需要具备车规级。  车规级芯片对加工工艺要求不高,但对质量要求高。需要经过的认证过程,包括质量管理标准ISO/TS 16949、可靠性标准 AEC-Q100、功能安全标准ISO26262等。  汽车内不同用途的芯片要求也不同,美国制定的汽车电子标准把其分为5级。汽车各系统对芯片要求由高到低依次是:动力安 全系统 > 车身控制系统 > 行驶控制系统 > 通信系统 > 娱乐系统。

 自动驾驶芯片产品趋势:一体化

 云和边缘计算的数据中心,以及自动驾驶等超级终端领域,都是典型的复杂计算场景,这类场景的计算平台都是典型的大算 力芯片。大芯片的发展趋势已经越来越明显的从GPU、DSA的分离趋势走向DPU、超级终端的再融合,未来会进一步融合成超 异构计算宏系统芯片。

 BOSCH给出了汽车电气架构演进示意图。从模块级的ECU到集中相关功能的域控制器,再到完全集中的车载计算机。每个阶段 还分了两个子阶段,例如完全集中的车载计算机还包括了本地计算和云端协同两种方式。

 英伟达一体化方案(thor 芯片官网信息)

2022年NVIDIA 创始人兼首席执行官黄仁勋公布了一款令人惊艳的超级芯片——DRIVE Thor。这款车规级系统级芯片 (SoC) 基于最新 CPU 和 GPU 打造,可提供每秒 2000 万亿次浮点运算性能,在大幅度提升性能的同时降低整体系统的运行成本。

DRIVE Thor 将逐步接替 DRIVE Orin,以最新的计算技术,加速智能汽车技术在行业内的部署,赋能汽车制造商的 2025 年车型。

借助DRIVE Thor,汽车制造商可以在单个系统级芯片上高效整合数字仪表盘、信息娱乐、泊车、辅助驾驶等多种功能,从而极大地提高开发效率和软件更新迭代的速度。

DRIVE Thor 能够被配置为多种模式,可以将其 2000 TOPS 和 2000 TFLOPS 全部用于自动驾驶工作流,也可以进行拆分,将其配置为一部分用于驾驶舱 AI 和信息娱乐功能,一部分用于辅助驾驶。

与当前的 NVIDIA DRIVE Orin 一样,DRIVE Thor可以利用高效的 NVIDIA DRIVE 软件开发套件,且已获得 ASIL-D级功能安全产品认证。同时,DRIVE Thor 基于可扩展架构打造,因而开发人员可以将过去的软件开发成果无缝移植到新平台。

DRIVE Thor,快如闪电

除了原始性能之外,DRIVE Thor 在深度神经网络 (DNN) 准确性方面也实现了惊人的飞跃。

此外,DRIVE Thor 也是首个采用推理 Transformer 引擎的NVIDIA自动驾驶汽车平台。Transformer 引擎是 NVIDIA GPU Tensor Core 的一个全新组件。Transformer 网络将视频数据作为单个感知帧来处理,使计算平台能够随着时间的推移具有处理更多数据的能力。

凭借着 8 位浮点(FP8)的精度,DRIVE Thor为汽车领域引入了一种新的数据处理方式。传统意义上讲,开发人员在从32 位浮点转换为 8 位整数 (8-int) 的数据格式时,会发现准确性有所下降。DRIVE Thor的FP8精度有助于促进数据的转换,允许开发人眼在不牺牲准确性的情况下进行数据传输。

此外,DRIVE Thor还采用了升级后的ARM Poseidon AE内核,这也让其成为业界最高性能的处理器之一。

一芯多用 多域计算

DRIVE Thor 不仅功能强劲,且运行高效。

DRIVE Thor能够进行多域计算,这意味着它可以将自动驾驶、车载信息娱乐等功能划分为不同的任务区间,同时运行,互不干扰。多计算域隔离能力,可支持时间关键型的进程不间断同时运行,也就是说,车辆在一台计算机上可以同时运行 Linux、QNX 和 Android。

这些类型不同的功能,通常由分布在车辆各处的数十个电子控制单元控制。如今,汽车制造商可借助DRIVE Thor隔离特定任务的能力,告别分布式的电子控制单元,整合全车功能。

汽车制造商可以借助 DRIVE Thor 在单个 SoC 上整合智能汽车所有功能

此外,DRIVE Thor芯片也可以让车辆所有的显示器、传感器等都连接到单一芯片上,极大地简化了汽车制造的复杂程序,这也是汽车电子电气架构从分布式向集中式演进的大势所趋。

NVLink-C2C 芯片互连技术

单独使用一个 DRIVE Thor 即可实现卓越性能,那么两个一起呢?用户可以单独使用 DRIVE Thor 芯片,也可以通过最新的 NVLink-C2C 芯片互连技术同时连接两个 Thor芯片,使两个芯片作为单一操作系统的统一平台。NVLink-C2C 的优势在于它能够以最小的开销在超高速数据传输链路中共享、调度和分发任务。在软件定义汽车的发展趋势下,这为汽车制造商带来足够大的算力冗余和灵活性,支持软件定义车辆的开发,这些车辆可通过安全的 OTA 更新持续升级。

 高通一体化方案

 2020年CES上,高通推出全新自动驾驶平台高通Snapdragon Ride,自动驾驶芯片“骁龙 Ride”。  该平台包括安全系统级芯片SoC(ADAS应用处理器)、安全加速器(自动驾驶专用加速器)和自动驾驶软件栈,可支持L1-L5 级别的自动驾驶;安全系统级芯片SoC和安全加速器的功能安全安全等级为ASIL-D级;平台高度可扩展、开放、完全可定制化, 且能够提供功耗高度优化的自动驾驶解决方案;平台将于2020年上半年交付OEM和Tire1进行前期开发,搭载该平台的汽车预 计将于2023年投产。

 Snapdragon Ride视觉系统是基于4纳米制程的系统级芯片(SoC)打造,集成了专用高性能的Snapdragon Ride SoC和Arriver下一 代视觉感知软件栈,并采用基于定制神经网络架构开发的800万像素广角摄像头。

 就在英伟达发布 Thor 两天后,高通就推出“业内首个集成式汽车超算 SOC”Snapdragon Ride Flex,单颗算力 600TOPS 以上, 综合 AI 算力能够达到 2000TOPS。Snapdragon Ride Flex确切的说是一个SoC产品家族,其包括Mid、High、Premium三个级别。 最高级的Ride Flex Premium SoC再加上外挂的AI加速器(可能是NPU,MAC阵列)组合起来,就可以实现2000TOPS的综合AI算 力。Snapdragon Ride Flex作为一个超算芯片家族,其最大的目标是实现车内的中央计算——即同时为智能驾驶、智能座舱、通 信等能力提供计算支持,这也与英伟达Thor雷神芯片一致。

向先进制程延伸

 高端自动驾驶芯片向先进制程延申:用于L1-L2 自动驾驶的芯片只需要28nm制程即可制造,L3 及以上的高阶自动驾驶对算力 的要求越发苛刻,规划中针对L4/L5 自动驾驶的SoC芯片普遍需要7nm,甚至5nm的先进制程。先进的制程可以影响功耗,先 进的制程又可以影响集成度;而功耗则影响可靠性,集成度影响性能。  目前的 5nm制程芯片尚处于研发或发布状态,均未进入量产阶段;不过 7nm芯片中,已有 Orin、FSD、EyeQ5、8155 等芯片实 现量产,其他芯片则在未来几年陆续实现量产,这预示着先进制程车用芯片开始进入量产加速期。

 高算力

 三种主流架构

当前主流的AI芯片主要分为三类,GPU、FPGA、ASIC。GPU、FPGA均是前期较为成熟的芯片架构,属于通用型芯片。

CPU遵循的是冯·诺依曼架构,其核心是存储程序/数据、串行顺序执行。因此CPU的架构中需要大量的空间去放置存储单 元(Cache)和控制单元(Control),相比之下计算单元(ALU)只占据了很小的一部分,所以CPU在进行大规模并行计 算方面受到限制,相对而言更擅长于处理逻辑控制。

 GPU(GraphicsProcessing Unit),即图形处理器,是一种由大量运算单元组成的大规模并行计算架构,早先由CPU中分出 来专门用于处理图像并行计算数据,专为同时处理多重并行计算任务而设计。GPU中也包含基本的计算单元、控制单元 和存储单元,但GPU的架构与CPU有很大不同,其架构图如下所示。

 与CPU相比,CPU芯片空间的不到20%是ALU,而GPU芯片空间的80%以上是ALU。即GPU拥有更多的ALU用于数据并行处理。

CPU 由专为顺序串行处理而优化的几个核心组成,而 GPU 则拥有一个由数以千计的更小、更高效的核心组成的大规模并 行计算架构,这些更小的核心专为同时处理多重任务而设计。

 CPU和GPU之所以大不相同,是由于其设计目标的不同,它们分别针对了两种不同的应用场景。CPU需要很强的通用性来 处理各种不同的数据类型,同时又要逻辑判断又会引入大量的分支跳转和中断的处理。这些都使得CPU的内部结构异常复 杂。而GPU面对的则是类型高度统一的、相互无依赖的大规模数据和不需要被打断的纯净的计算环境。

 GPU 的众核体系结构包含几千个流处理器,可将运算并行化执行,大幅缩短模型的运算时间。 目前 GPU 已经发展到了较为成熟的阶段。利用 GPU 来训练深度神经网络,可以充分发挥其数以千计计算核心的高效并行 计算能力,在使用海量训练数据的场景下,所耗费的时间大幅缩短,占用的服务器也更少。如果针对适当的深度神经网络进行合理优化,一块 GPU 卡可相当于数十甚至上百台 CPU服务器的计算能力,因此 GPU 已经成为业界在深度学习模型 训练方面的首选解决方案。

芯片关键评估指标

国内外智驾域控制器方案

资料引用:

海通国际-电子行业:自动驾驶芯片研究框架-230115.pdf (dfcfw.com)

英伟达官网

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/30039.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何卸载windows系统自带游戏

为了清晰地指导如何卸载Windows系统自带游戏,我们可以参考以下步骤进行: 方法一:通过控制面板卸载 打开控制面板进入程序和功能在控制面板中,找到并点击“程序和功能”。在程序列表中,找到你想要卸载的自带游戏。 方…

AI一键生成PPT工具:AIPPT网站分享

PowerPoint演示文稿作为商业沟通、教育培训以及日常汇报的重要工具,一份精美的ppt可以帮助我们提升演示效果以及显示我们的专业性。为了提升ppt的制作效率,我们可以使用AI一键智能生成ppt工具,这样我们就可以快速制作出高大上的PPT了。下面小…

Web攻防:SQL注入 - MySQL 盲注

SQL注入 - MySQL 盲注 1. 基于布尔 SQL 盲注1.1 LEFT() 函数1.1.1 介绍:1.1.2 注入语法:1.1.3 案例 (SQLi-Labs:Less-8) 1.2 ASCII() 函数 SUBSTR() 函数1.2.1 介绍:1.2.2 注入语法:1.2.3 案例 (SQLi-Labs&#xff1a…

Java——可变参数

一、可变参数 1、介绍 Java的可变参数(Varargs)是一种语法特性,允许一个方法接受不定数量的参数。可变参数的使用通过在参数类型后面添加省略号(...)实现。这使得方法在调用时可以传入不同数量的参数,而不…

Android device/xxx/system/common/overlay编译产物

MTK 如下代码编译的产物在 framework-res.apk 编译配置文件在device/mediatek/system/common/目录下的Android.bp device/mediatek/system/common/overlay/telephony/frameworks/base/core/res/res/values-mcc655-mnc01/config.xml 在Android U上面还在overlay目录中进行了产…

python是TIOBE编程语言排名第一的编程语言,它有什么优点?它的使用场景有哪些?用python打印数字1--100,用python打印九九乘法表怎么写?

Python是TIOBE编程语言排行榜排名第一的编程语言 。 python是一种解释性、交互式、面向对象的跨平台的语言。 python设计者及名称由来 Guido van Rossum 荷兰人---吉多范罗苏姆,是 Python 编程语言的最初设计者,在 Python 社区一直担当终身仁慈独裁者&…

教你如何安装 IntelliJ IDEA

安装 IntelliJ IDEA 的步骤通常如下,这里提供的是基于 Windows 系统的安装指南。 下载 IntelliJ IDEA 1. 访问 JetBrains 官方网站:[https://www.jetbrains.com/idea/download/](Download IntelliJ IDEA – The Leading Java and Kotlin IDE) 2. 选择适…

vue+echarts实现tooltip轮播

效果图如下: 实现步骤如下: 定义一个定时器 timer:null, len: 0,页面一加载就清空定时器,此操作是为了防止重复加载时会设置多个定时器在setOption后设置定时器 this.myChart.clear() this.myChart.setOption(option); this.autoShowTool…

java 面试题--基础

文章目录 基础java SE 、 EE 、 ME 的区别jdk 和 jre 区别?java 的日志级别基本数据类型 特性关键字finalabstractsuperswitchfortry catch 接口和抽象类的区别接口抽象类适用场景 类的加载循序静态代码块 传参问题访问修饰符运算符 反射java 里的应用为什么反射的性…

禹晶、肖创柏、廖庆敏《数字图像处理(面向新工科的电工电子信息基础课程系列教材)》Chapter 10插图

禹晶、肖创柏、廖庆敏《数字图像处理(面向新工科的电工电子信息基础课程系列教材)》 Chapter 10插图

YOLOv8旋转目标检测Yolov8n-obb详细实例+rolabelimg

一、Yolov8环境搭建 首先创建虚拟环境下载安装(其实就是yolov8的环境)再大概写一下步骤,没有想详细的看本人另外一篇:YOLOv8环境搭建_yolov8环境配置-CSDN博客 1、下载安装anaconda 2、创建虚拟环境 conda create -n my_yolov8…

【Gradio】Chatbot | 如何使用 Gradio Blocks 创建自定义聊天机器人

简介 重要提示:如果您刚开始接触,我们建议使用 gr.ChatInterface 来创建聊天机器人——它是一个高级抽象,使得可以快速创建漂亮的聊天机器人应用程序,往往只需一行代码。在这里了解更多信息。 本教程将展示如何使用 Gradio 的低级…

vue3中实现3D地图——three.js

需求点 地图区域大小随着父盒子大小变动,窗口缩放自动适配每个区域显示不同颜色和高度,描边每个区域显示名字label和icon点击区域改变其透明度,并且弹窗显示信息窗口点击点也可以可以自由放大缩小,360度旋转 包 npm install d3^…

背景渐变动画登录页

b站视频演示效果: 效果图: 完整代码: <!DOCTYPE html> <html lang="en"> <head><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1.0"><title>背景…

大模型商业化:李开复向左,张亚勤向右

文&#xff5c;白 鸽 “零一万物坚决做To C&#xff0c;不做赔钱的To B&#xff0c;要做能赚钱的To B。”2024年6月14日&#xff0c;在智源大会上&#xff0c;零一万物创始人李开复如此坚定地说道。 而与之相对&#xff0c;中国工程院院士、清华大学智能产业研究院&…

2024/06/18--代码随想录算法8/17| 股票问题

121.买卖股票的最佳时机 力扣链接 动规五部曲 确定dp数组&#xff08;dp table&#xff09;以及下标的含义 dp[i][0] 表示第i天持有股票所得最多现金,dp[i][1] 表示第i天不持有股票所得最多现金确定递推公式 dp[i][0] max(dp[i-1][0], -price[i]) dp[i][1]max(dp[i-1][1], …

QTimeEdit、QDateEdit、QDateTimeEdit、QCalendarWidget

实验 QTime和字符串相互转换 QDate和字符串相互转换 QDateTime和字符串相互转换 QCalendarWidget使用 year&#xff0c;month&#xff0c;day&#xff0c;minute&#xff0c;second&#xff0c;msec&#xff0c;dayOfWeek, dayto方法/属性的使用 布局 datetimeexample.cpp #inc…

智慧之选:Vatee万腾平台,引领未来的创新引擎

在数字化浪潮席卷全球的今天&#xff0c;我们身处一个信息爆炸、技术革新的时代。在这样的大背景下&#xff0c;选择一个能够引领我们走向未来的平台显得尤为重要。而Vatee万腾平台&#xff0c;正是这样一个不容错过的智慧之选。 Vatee万腾平台&#xff0c;作为一个集创新、科技…

PostgreSQL源码分析——口令认证

认证机制 对于数据库系统来说&#xff0c;其作为服务端&#xff0c;接受来自客户端的请求。对此&#xff0c;必须有对客户端的认证机制&#xff0c;只有通过身份认证的客户端才可以访问数据库资源&#xff0c;防止非法用户连接数据库。PostgreSQL支持认证方法有很多&#xff1…

Stable Diffusion 3 Medium 正式开源

Stable Diffusion 3 Medium 正式开源 Stability AI宣布Stable Diffusion 3 Medium现已开源&#xff0c;这是最新的文本生成图像AI模型&#xff0c;被官方声称为“迄今为止最先进的开源模型”&#xff0c;其性能超过了Midjourney 6。 这款Stable Diffusion 3 Medium模型拥有2…