[每周一更]-(第94期):认识英伟达显卡

在这里插入图片描述

英伟达显卡:引领图形计算的领先者,显卡也常称为GPU(图形处理器 Graphics processing unit),是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上执行绘图运算工作的微处理器。以图形处理器为核心的主板扩展卡也称显示卡或“显卡”。

英伟达(NVIDIA)是全球领先的人工智能计算公司,其显卡产品在图形处理、深度学习、科学计算等领域具有举足轻重的地位。英伟达的显卡产品以其出色的性能、高度的可靠性和广泛的应用领域而闻名于世。以下是对英伟达显卡的介绍、参数指标、性能以及市场常见的对比。

做显卡目前市面上出名的就是:英伟达和AMD,自己的两台主机上也分别配置的有英伟达的GTX1060和1050Ti(现在消费级都已经40系,自感落伍),AMD的显卡早起有用过,如Radeon HD 7790,英伟达是专注做显卡,而AMD不光显卡,还有CPU还很顶,前几期之前也有介绍;

显卡的常见使用场景是:剪辑、游戏、计算等,详细的就如下:

  1. 游戏: 游戏是显卡最为常见的使用场景之一。显卡负责处理图形渲染,将游戏中的虚拟场景和角色呈现在显示器上。高性能的显卡可以提供更流畅、更逼真的游戏画面和更高的帧率,提升游戏体验。

  2. 图形设计和数字内容创作: 图形设计师、动画师、影视制作人等专业人士常常使用显卡进行图形渲染、视频编辑和3D建模等工作。显卡提供了强大的图形处理能力,加速了设计和创作过程,并提高了工作效率。

  3. 科学计算和工程仿真: 显卡不仅可以用于图形处理,还可以用于科学计算和工程仿真。GPU加速技术可以大幅提高计算密集型任务的运行速度,包括分子动力学模拟、气候模拟、流体动力学仿真等领域。

  4. 深度学习和人工智能: 显卡在深度学习和人工智能领域也发挥着重要作用。由于深度学习算法的并行计算特性,GPU的并行计算能力能够大幅加速训练和推理过程,成为深度学习模型训练的重要工具。

  5. 数据可视化和大数据分析: 在数据科学领域,显卡可以用于数据可视化、大数据分析和数据挖掘等任务。通过GPU加速技术,可以更快地处理大规模数据集,并通过可视化方式展现数据分析结果。

  6. 虚拟现实和增强现实: 虚拟现实(VR)和增强现实(AR)技术需要大量的图形处理能力来实时渲染虚拟场景和交互元素。显卡可以提供高性能的图形处理,为VR和AR应用提供流畅的用户体验。

1. 介绍

英伟达的显卡产品主要分为消费级和专业级两大类别。消费级显卡主要面向游戏玩家和普通消费者,提供了高性能的图形处理能力和优秀的游戏体验;专业级显卡则主要面向科研、工程设计、数字内容创作等专业领域,具有更高的计算性能和可靠性。

2.种类

英伟达(NVIDIA)的显卡种类众多,涵盖了消费级、专业级和数据中心级等多个领域。以下是一些主要的英伟达显卡系列:

  1. GeForce系列: 主要面向消费级市场,包括游戏玩家和个人用户。GeForce系列显卡拥有强大的图形处理性能,提供出色的游戏体验和图形渲染效果。常见的产品包括RTX 30系列(如RTX 3080、RTX 3070等)和GTX系列(如GTX 1660 Ti、GTX 1650等),最新是40系,如RTX 4090,从20系列产品新命名为RTX,而未沿用推出多年的GTX,以突显支援光线跟踪的特色。
  2. Quadro系列: 面向专业级市场,包括设计师、工程师、数字内容创作者等专业用户。Quadro系列显卡具有优秀的计算性能和专业级的驱动支持,适用于CAD、CG、视频编辑等专业应用。
  3. Tesla系列: 面向数据中心和高性能计算市场,用于机器学习、深度学习、科学计算等领域。Tesla系列显卡拥有强大的计算能力和高效的并行处理能力,支持CUDA和TensorFlow等深度学习框架。
  4. TITAN系列: 旗舰级产品,面向高端消费者和专业用户。TITAN系列显卡集合了英伟达最先进的技术和性能,拥有超高的计算能力和显存容量,适用于高端游戏、深度学习、科学研究等领域。
  5. Ampere架构: 是英伟达最新一代的GPU架构,采用了先进的光线追踪技术和AI加速器,提供了更高的性能和更低的功耗。Ampere架构显卡包括RTX 30系列和A100等产品。

3.市场常见的对比

在市场上,英伟达显卡通常与其主要竞争对手AMD的显卡进行对比。两者在性能、价格、功耗等方面都有各自的优势和特点。以下是英伟达显卡和AMD显卡常见的对比:

  • 性能比较: 英伟达显卡在游戏性能和图形处理能力上通常表现更强,而AMD显卡在计算性能和成本效益上有一定优势。
  • 功耗和散热: 英伟达显卡的功耗和散热控制通常较好,能够在更低的功耗下实现更高的性能,而AMD显卡在功耗和散热方面可能略逊一筹。
  • 价格比较: 英伟达显卡通常定位在高端市场,价格相对较高,而AMD显卡在中低端市场具有更好的性价比。

总的来说,英伟达显卡以其优秀的性能、可靠性和广泛的应用领域而受到用户的青睐,不断推动着图形计算和人工智能技术的发展。在选择显卡时,用户可以根据自己的需求和预算考虑英伟达显卡以及其他竞争对手的产品,并进行综合评估和对比。

4.NVIDIA 架构 演进过程

NVIDIA的GPU架构经历了多次演进,不断推动着图形处理和计算领域的发展。以下是NVIDIA GPU架构的演进过程的主要里程碑:

  1. Tesla架构:
  • 推出时间:2006年
  • Tesla架构是NVIDIA推出的第一个通用并行计算架构,为高性能计算和科学计算提供了强大的计算能力。Tesla架构引入了CUDA(Compute Unified Device Architecture)计算模型,为GPU计算的兴起奠定了基础。
  1. Fermi架构:
  • 推出时间:2010年
  • Fermi架构是NVIDIA第一代支持双精度浮点计算的GPU架构,提供了更高的计算性能和更广泛的应用领域。Fermi架构引入了NVIDIA的Parallel Thread Execution(PTX)指令集,为GPU计算的发展打开了新的可能性。
  1. Kepler架构:
  • 推出时间:2012年
  • Kepler架构是NVIDIA第一代支持动态并行调度的GPU架构,提供了更高的能效和更优化的性能。Kepler架构引入了GPU Boost技术,可以根据工作负载动态调整核心频率,提高了GPU的功效比。
  1. Maxwell架构:
  • 推出时间:2014年
  • Maxwell架构是NVIDIA注重能效和性能平衡的一代GPU架构,引入了多项能效优化技术和新的图形渲染技术。Maxwell架构支持Dynamic Super Resolution(DSR)和Multi-Frame Sampled Anti-Aliasing(MFAA)等新功能。
  1. Pascal架构:
  • 推出时间:2016年
  • Pascal架构是NVIDIA的第一代基于16nm FinFET工艺的GPU架构,具有更高的性能和更低的功耗。Pascal架构引入了NVIDIA的深度学习加速器(NVIDIA Deep Learning Accelerator),为深度学习应用提供了更强大的支持。
  1. Volta架构:
  • 推出时间:2017年
  • Volta架构是NVIDIA的下一代GPU架构,主要针对高性能计算和深度学习应用。Volta架构引入了Tensor Core加速器,支持深度学习矩阵运算,并提供了更高的计算性能和更强大的AI加速能力。
  1. Turing架构:
  • 推出时间:2018年
  • Turing架构是NVIDIA的下一代游戏和工作站GPU架构,引入了实时光线追踪技术(RTX)和人工智能加速器(Tensor Core)。Turing架构为游戏图形提供了更高的真实感和渲染效果,并提供了更强大的AI加速能力。
  1. Ampere架构:
  • 推出时间:2020年
  • Ampere架构是NVIDIA的最新一代GPU架构,采用了8nm制程工艺,引入了第二代Tensor Core和NVIDIA RT Core等新技术,提供了更高的计算性能和更强大的人工智能加速能力。Ampere架构主要用于数据中心、高性能计算和深度学习领域。
  1. Hopper 架构:
  • 推出时间:2022年
  • NVIDIA Hopper™ 架构的新一代加速计算平台。与上一代产品相比,该平台实现了数量级的性能飞跃。 Hopper 采用尖端台积电4 nm制程,配备超过800 亿个电晶体,具有五项突破性创新技术,是NVIDIA H200与H100 Tensor 核心GPU的动力所在,相互结合之下,相较于上一代NVIDIA Megatron 530B聊天机器人(全球最大的生成语言模型),人工智慧推论的速度提升30 倍。NVIDIA Hopper 架构利用专为加速人工智慧模型训练而设计的Transformer Engine,进一步提升Tensor 核心技术。

5.显卡性能指标

显卡性能的指标有很多,以下是其中一些主要的指标:

  1. CUDA核心数(NVIDIA)/ 流处理器数(AMD): CUDA核心数或流处理器数是显卡中用于并行计算的处理单元数量。核心数越多,显卡的并行计算能力越强大,性能也通常更高。

  2. 显存容量: 显存容量决定了显卡可以处理的数据量大小。对于需要处理大型图像、视频或模型的任务,较大的显存容量可以提高性能和效率。

  3. 核心频率: 核心频率是指GPU核心的运行速度,通常以MHz或GHz为单位。较高的核心频率意味着GPU可以更快地处理图形和计算任务。

  4. 显存频率: 显存频率是显卡显存模块的运行速度,通常以GHz为单位。较高的显存频率可以提高数据传输速度,提高显卡的整体性能。

  5. 带宽: 显存带宽是指显卡与显存之间的数据传输速度,通常以GB/s为单位。较高的带宽可以提高数据传输效率,加快图形渲染和计算速度。

  6. 功耗(TDP): TDP(Thermal Design Power)是显卡在满负荷运行时的最大热设计功耗,通常以瓦特(W)为单位。较高的功耗可能需要更好的散热系统,但也可能意味着更高的性能。

  7. 性能指标(例如FLOPS): 性能指标用于评估显卡在不同工作负载下的性能表现,通常以每秒浮点运算次数(FLOPS)为单位。较高的性能指标意味着显卡在计算密集型任务中具有更好的性能。

6.英伟达和AMD的部分参数

  1. NVIDIA GeForce RTX 3080:
  • VRAM容量:10GB GDDR6X
  • CUDA核心数:8704
  • 核心频率:1440 MHz
  • 显存频率:19 Gbps
  • TDP:320W
  • 性能指标:29.8 TFLOPS(浮点计算性能)
  1. NVIDIA GeForce RTX 3070:
  • VRAM容量:8GB GDDR6
  • CUDA核心数:5888
  • 核心频率:1500 MHz
  • 显存频率:14 Gbps
  • TDP:220W
  • 性能指标:20.3 TFLOPS
  1. NVIDIA GeForce RTX 3060 Ti:
  • VRAM容量:8GB GDDR6
  • CUDA核心数:4864
  • 核心频率:1410 MHz
  • 显存频率:14 Gbps
  • TDP:200W
  • 性能指标:16.2 TFLOPS
  1. AMD Radeon RX 6900 XT:
  • VRAM容量:16GB GDDR6
  • 流处理器数:5120
  • 核心频率:2015 MHz
  • 显存频率:16 Gbps
  • TDP:300W
  • 性能指标:23.0 TFLOPS
  1. AMD Radeon RX 6800 XT:
  • VRAM容量:16GB GDDR6
  • 流处理器数:4608
  • 核心频率:2015 MHz
  • 显存频率:16 Gbps
  • TDP:300W
  • 性能指标:20.7 TFLOPS

参考

  • GeForce
  • 图形处理器
  • hopper-architecture

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/4314.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

CVPR2022 ACmix 注意力模块 | On the Integration of Self-Attention and Convolution

论文名称:《On the Integration of Self-Attention and Convolution》 论文地址:2111.14556 (arxiv.org) 卷积和自注意力是两种强大的表示学习技术,通常被认为是两种截然不同的并列方法。在本文中,我们展示了它们之间存在一种强烈…

排序试题解析(二)

8.4.3 01.在以下排序算法中,每次从未排序的记录中选取最小关键字的记录,加入已排序记录的 末尾,该排序算法是( A ). A.简单选择排序 B.冒泡排序 C.堆排序 D.直接插入排序 02.简单选择排序算法的比较次数和移动次数分别为( C )。…

【小沐学Java】VSCode搭建Java开发环境

文章目录 1、简介2、安装VSCode2.1 简介2.2 安装 3、安装Java SDK3.1 简介3.2 安装3.3 配置 4、安装插件Java Extension Pack4.1 简介4.2 安装4.3 配置 结语 1、简介 2、安装VSCode 2.1 简介 Visual Studio Code 是一个轻量级但功能强大的源代码编辑器,可在桌面上…

如何使用小浪助手快速下载学浪中的视频?

今天给大家准备好了一个工具,小浪助手,它可以帮你们快速下载学浪中的视频 小浪助手我已经打包好了,有需要自己取一下 学浪下载工具链接:https://pan.baidu.com/s/1_Sg-EGGXKc4bMW-NPqUqvg?pwd1234 提取码:1234 --…

【语音识别】搭建本地的语音转文字系统:FunASR(离线不联网即可使用)

参考自: 参考配置:FunASR/runtime/docs/SDK_advanced_guide_offline_zh.md at main alibaba-damo-academy/FunASR (github.com)参考配置:FunASR/runtime/quick_start_zh.md at 861147c7308b91068ffa02724fdf74ee623a909e alibaba-damo-aca…

电脑教程1

一、介绍几个桌面上面的软件 1、火绒:主要用于电脑的安全防护和广告拦截 1.1 广告拦截 1.打开火绒软件点击安全工具 点击弹窗拦截 点击截图拦截 拦截具体的小广告 2、向日葵远程控制:可以通过这个软件进行远程协助 可以自己去了解下 这个软件不要…

模块四:一维前缀和模板——DP34 【模板】前缀和

文章目录 题目描述算法原理解法一:暴力解法(时间复杂度为O(n*q))解法二:前缀和(时间复杂度为O(n)O(q))细节问题 代码实现CJava 题目描述 题目链接:DP34 【模板】前缀和 根据描述第一句可得数组长度应设为n 1 算法原理 解法一…

编写一个函数fun,它的功能是:实现两个字符串的连接(不使用库函数strcat),即把p2所指的字符串连接到p1所指的字符串后。

本文收录于专栏:算法之翼 https://blog.csdn.net/weixin_52908342/category_10943144.html 订阅后本专栏全部文章可见。 本文含有题目的题干、解题思路、解题思路、解题代码、代码解析。本文分别包含C语言、C++、Java、Python四种语言的解法完整代码和详细的解析。 题干 编写…

个人学习-前端相关(2):ECMAScript 6-箭头函数、rest、spread

ES6的箭头函数 ES6允许使用箭头函数,语法类似java中的lambda表达式 let fun1 function(){} //普通的函数声明 let fun2 ()>{} //箭头函数声明 let fun3 (x) >{return x1} let fun4 x >{return x1} //参数列表中有且只有一个参数,()可…

kubebuilder(3)实现operator

在前面的文章我们已经了解了operator项目的基本结构。现在我们来写一点简单的代码,然后把我们的crd和operator部署到k8s集群中。 需求 这是一个真实的需求,只不过做了简化。 在开发公司自己的paas平台,有一个需求是,用户在发版…

236基于matlab的三维比例导引法仿真

基于matlab的三维比例导引法仿真,可以攻击静止/机动目标。1.三维空间内的比例导引程序,采用龙哥库塔积分法;2.文件名为bili3dnew的.m文件是主函数,执行时需调用目标机动子函数、导引律子函数、数值积分法子函数;3.文件…

统计建模——模型——python为例

统计建模涵盖了众多数学模型和分析方法,这些模型和方法被广泛应用于数据分析、预测、推断、分类、聚类等任务中。下面列举了一些常见的统计建模方法及其具体应用方式: 目录 1.线性回归模型: ----python实现线性回归模型 -------使用NumPy…

【C++】---STL容器适配器之queue

【C】---STL容器适配器之queue 一、队列1、队列的性质 二、队列类1、队列的构造2、empty()3、push()4、pop()5、size()6、front()7、back() 三、队列的模拟实现1、头文件(底层:deque)2、测试文件3、底层:list 一、队列 1、队列的…

Java基础_集合类_List

List Collection、List接口1、继承结构2、方法 Collection实现类1、继承结构2、相关类(1)AbstractCollection(2)AbstractListAbstractSequentialList(子类) 其它接口RandomAccess【java.util】Cloneable【j…

Kafka学习笔记01【2024最新版】

一、Kafka-课程介绍 官网地址:Apache KafkaApache Kafka: A Distributed Streaming Platform.https://kafka.apache.org/ kafka 3.6.1版本,作为经典分布式订阅、发布的消息传输中间件,kafka在实时数据处理、消息队列、流处理等领域具有广泛…

容器安全-镜像扫描

前言 容器镜像安全是云原生应用交付安全的重要一环,对上传的容器镜像进行及时安全扫描,并基于扫描结果选择阻断应用部署,可有效降低生产环境漏洞风险。容器安全面临的风险有:镜像风险、镜像仓库风险、编排工具风险,小…

Python_AI库 Matplotlib的应用简例:绘制与保存折线图

本文默认读者已具备以下技能: 熟悉Python基础语法,以自行阅读python代码块熟悉Vscode或其它编辑工具的应用 在数据可视化领域,Matplotlib无疑是一个强大的工具。它允许我们创建各种静态、动态、交互式的可视化图形,帮助我们更好…

python中如何用matplotlib写雷达图

#代码 import numpy as np # import matplotlib as plt # from matplotlib import pyplot as plt import matplotlib.pyplot as pltplt.rcParams[font.sans-serif].insert(0, SimHei) plt.rcParams[axes.unicode_minus] Falselabels np.array([速度, 力量, 经验, 防守, 发球…

新科技辅助器具赋能视障生活:让盲人出行融入日常

随着科技日新月异的发展,一款名为蝙蝠避障专为改善盲人日常生活的盲人日常生活辅助器具应运而生,它通过巧妙整合实时避障与拍照识别功能,成功改变了盲人朋友们的生活格局,为他们提供了更为便捷、高效的生活体验。 这款非同…

注意力机制:SENet详解

SENet(Squeeze-and-Excitation Networks)是2017年提出的一种经典的通道注意力机制,这种注意力可以让网络更加专注于一些重要的featuremap,它通过对特征通道间的相关性进行建模,把重要的特征图进行强化来提升模型的性能…