现代图形API综合比较:Vulkan | DirectX | Metal | WebGPU

Vulkan、DirectX、Metal 和 WebGPU 等低级图形 API 正在融合为类似于当前 GPU 构建方式的模型。 图形处理单元 (GPU) 是异步计算单元,可以处理大量数据,例如复杂的网格几何形状、图像纹理、输出帧缓冲区、变换矩阵或你想要计算的任何数据。

NSDT工具推荐: Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 可编程3D场景编辑器 - REVIT导出3D模型插件 - 3D模型语义搜索引擎 - Three.js虚拟轴心开发包 - 3D模型在线减面 - STL模型在线切割 

GPU 并不总是这样,最初它们是一组基于固定硬件的功能,几乎没有可编程性。 随着应用程序突破了这些不可编程系统的功能极限,这种情况发生了变化,这保证了 GPU 制造商和应用程序开发人员之间的竞争不断突破其设计的极限 [Peddie 2023]。 帧缓冲区和光栅器 [Fatahalian 2018] 带来了可编程着色器、通用 GPU (GPGPU) 计算,以及最近添加的用于人工智能光线遍历加速和张量处理的硬件。 图形 API 伴随着这些变化而不断发展,增加了固定图形管道、计算着色器以及最近的光线遍历功能(DirectX 12 和 Vulkan 光线追踪)。

让我们看一下图形 API 之间的一些相似点和不同点。 我们将介绍以下 C++ API:

  • 🌋 Vulcan
  • ❎DirectX 12.x
  • ✖️DirectX 11.x
  • 🤖 Metal
  • 🕸️WebGPU
  • ⚪ OpenGL

OpenGL的设计起源于计算机图形学的早期,被设计为状态机,因此它的接口与现代图形API有很大不同。 DirectX 11 虽然比 OpenGL 更接近现代 GPU 架构,但试图通过将 Vulkan、DirectX 12 和 Metal 目前让开发人员负责的任务委托给驱动程序来简化开发人员的工作。 [罗素 2014]

了解现代图形 API 的遗产是很有用的,因此它们会在相关的地方被提及。

1、执行顺序

无论 API 如何,图形应用程序通常都遵循以下执行顺序:

  1. 初始化 API - 创建访问 API 内部工作所需的核心数据结构。
  2. 加载资源 - 创建加载着色器等内容所需的数据结构、描述图形管道、创建和填充命令缓冲区以供 GPU 执行,以及将资源发送到 GPU 独占内存。
  3. 更新资源 - 将任何uniforms更新到着色器并在此处执行应用程序级逻辑。
  4. 呈现 - 将命令缓冲区列表发送到命令队列并呈现结果。
  5. 重复 2、3 和 4,直到应用程序发出关闭信号。
  6. 销毁 - 等待 GPU 完成所有剩余工作,并销毁所有数据结构和句柄。

因此,我们将按此顺序跟踪 Graphics API 数据结构的创建和使用。

2、导入依赖项

依赖关系示例

APIStructure
Vulkan#include <vulkan/vulkan.hpp>
DirectX 12#include <d3d12.h>
DirectX 11#include <d3d11.h>
Metal#import <Metal/Metal.h>
WebGPURequires Canary Browser with Flags
OpenGLVaries by OS

启动新应用程序时,你需要包含对外部 API 的所有依赖项,图形 API 也不例外。 根据 API,你的项目中可能还需要其他库,例如着色器编译器。

OpenGL 是所有其他图形 API 的例外,因为根据操作系统和你的个人设置,可以从不同位置进行多种导入。

3、着色器编译器

APIStructure
Vulkan#include "glslang/Include/revision.h"
DirectX 12#include <D3Dcompiler.h>
DirectX 11#include <D3Dcompiler.h>
Metal#import <Metal/Metal.h>
WebGPUN/A
OpenGLvoid glShaderSource(...)

Vulkan 要求你使用生成 SPIR-V 的外部着色器编译器,例如 glslang 或 DirectX Shader Compiler。

对于 DirectX,建议你使用 DirectX 着色器编译器而不是附带的编译器,因为它支持更新的着色器模型版本以及更多优化和速度。

金属着色器可以在运行时编译,也可以在构建时使用 MacOS 路径中包含的 metallib 命令行工具进行编译。

OpenGL 不需要外部库来编译着色器,因为它包含在库中,但它也支持 SPIR-V 作为 OpenGL 4.6 中 GLSL 的可选替代方案。

WebGPU 着色器是纯文本字符串,因此无需编译它们,尽管在生产中去除空格和缩小/损坏符号是个好主意。

4、初始化API

  • 入口API
APIStructure
Vulkanvk::Instance
DirectX 12IDXGIFactory4
DirectX 11IDXGIFactory
MetalCAMetalLayer
WebGPUGPU
OpenGLVaries by OS

图形 API 的入口点通常允许你访问 API 的内部类。

Vulkan 的入口点涉及选择你打算使用的 API 版本以及您想要的任何扩展或层,例如错误检查、窗口表面等。

DirectX 11 和 12 要求您创建一个工厂,以及一个可选的调试数据结构。

在 Metal 上,NSWindow 需要有一个带有 CAMetalLayer 的 NSView(它是 QuartzCore 的一部分)。 一旦层存在并附加到窗口,该窗口就可以使用 Metal API 的其余部分。

对于 OpenGL,最接近入口点的是操作系统特定的上下文,你可以在创建操作系统窗口后请求该上下文。

  • 物理设备
APIStructure
Vulkanvk::PhysicalDevice
DirectX 12IDXGIAdapter1
DirectX 11IDXGIAdapter
MetalMTLDevice
WebGPUGPUAdapter
OpenGLglGetString(GL_VENDOR)

物理设备允许你查询重要的设备特定详细信息,例如内存大小和功能支持。

金属是这里唯一的异常值,因为物理和逻辑设备都由相同的数据结构共享。

OpenGL 无法查询任何设备详细信息,除非使用制造商专有的扩展。 你可以获得一些杂项数据,例如驱动程序供应商名称、渲染器和 OpenGL 版本。

  • 逻辑设备
APIStructure
Vulkanvk::Device
DirectX 12ID3D12Device
DirectX 11ID3D11Device
MetalMTLDevice
WebGPUGPUDevice
OpenGLN/A

设备使你可以访问 API 的核心内部功能,例如创建纹理、缓冲区、队列、管道等图形数据结构。这种类型的数据结构在所有现代图形 API 中大部分都是相同的,并且具有非常丰富的功能。 他们之间几乎没有什么变化。

Vulkan 和 DirectX 12 通过设备创建内存数据结构来提供对内存的控制。

  • 队列
APIStructure
Vulkanvk::Queue
DirectX 12ID3D12CommandQueue
DirectX 11ID3D11DeviceContext
MetalMTLCommandQueue
WebGPUGPUQueue
OpenGLN/A

队列允许你将任务排入队列以供 GPU 执行。 GPU 是一种异步计算设备,因此这里的想法是始终保持忙碌状态,同时控制何时将项目添加到队列中。

Vulkan 队列要求你在创建设备之前指定设备将使用哪些队列。

  • 命令池
APIStructure
Vulkanvk::CommandPool
DirectX 12ID3D12CommandAllocator
DirectX 11ID3D11DeviceContext
MetalMTLCommandQueue
WebGPUGPUDevice
OpenGLN/A

命令池是一种允许你创建命令缓冲区的数据结构。

Metal 的突出之处在于队列也是分配命令缓冲区的数据结构。

5、帧后台API

  • 窗口表面
APIStructure
Vulkanvk::Surface
DirectX 12ID3D12Resource
DirectX 11ID3D11Texture2D
MetalCAMetalLayer
WebGPUGPUCanvasContext
OpenGLVaries by OS

窗口表面API允许你将所有绘制调用绑定到操作系统特定的窗口。

在 DirectX 上,由于只有 Windows / Xbox 作为 API 的目标,因此最接近表面的是从交换链接收的纹理后台缓冲区。 交换链接收您的窗口句柄,并从那里创建 DirectX 驱动程序内部的表面。

由于 MacOS 和 iOS 窗口具有分层结构,其中应用程序包含视图,视图可以包含层,因此 Metal 中最接近表面的东西要么是金属层,要么是包裹它的视图。

  • 交换链
APIStructure
Vulkanvk::Swapchain
DirectX 12IDXGISwapChain3
DirectX 11IDXGISwapChain
MetalCAMetalDrawable
WebGPUGPUCanvasContext
OpenGLVaries by OS

交换链在给定窗口的不同后台缓冲区之间翻转,并控制渲染的各个方面,例如刷新率和后台缓冲区交换行为。

Metal 和 OpenGL 在这里脱颖而出,因为 API 缺乏交换链的概念,而是将其留给操作系统窗口 API。

  • 帧缓冲区
APIStructure
Vulkanvk::Framebuffer
DirectX 12ID3D12Resource
DirectX 11ID3D11RenderTargetView
MetalMTLRenderPassDescriptor
WebGPUGPURenderPassDescriptor
OpenGLGLuint

帧缓冲区是在基于光栅的图形管道执行期间用作输出的输出纹理组。

DirectX 12 和 11 没有为此提供显式数据结构,而是你可以传递一组视图。

6、初始化资源

  • 纹理
APIStructure
Vulkanvk::Image & vk::ImageView
DirectX 12ID3D12Resource
DirectX 11ID3D11Texture2D
MetalMTLTexture
WebGPUGPUTexture & GPUTextureView
OpenGLGLuint

纹理是存储颜色信息的数据数组,并用作渲染的输入/输出。 Vulkan、DirectX 12 和 WebGPU 引入了对给定纹理拥有多个视图的想法,这些视图可以以不同的编码格式或颜色空间查看该纹理。 Vulkan 引入了图像和缓冲区的托管内存的概念,因此纹理是图像、使用时的图像视图(可以有多个)以及仅设备中或 CPU-GPU 可访问空间中的内存的三元组。

对于 Vulkan 中管理内存的更传统方式,我强烈推荐 AMD Vulkan 内存分配器。 对于 DirectX 12,同一作者发布了 AMD D3D12 内存分配器。

  • 缓冲区
APIStructure
Vulkanvk::Buffer & vk::BufferView
DirectX 12ID3D12Resource
DirectX 11ID3D11Buffer
MetalMTLBuffer
WebGPUGPUBuffer & GPUBufferView
OpenGLGLuint

缓冲区是一个数据数组,例如网格的位置数据、颜色数据、索引数据等。类似的图像规则也适用于 Vulkan 和 WebGPU 中的缓冲区。

  • 着色器
APIStructure
Vulkanvk::ShaderModule
DirectX 12ID3DBlob
DirectX 11ID3D11VertexShader or ID3D11PixelShader
MetalMTLLibrary
WebGPUGPUShaderModule
OpenGLGLuint

着色器往往是已编译的着色器(HLSL、GLSL、MSL 等)代码块的句柄,该代码将馈送到给定的管道。

  • 着色器绑定
APIStructure
Vulkanvk::PipelineLayout & vk::DescriptorSet
DirectX 12ID3D12RootSignature
DirectX 11ID3D11DeviceContext::VSSetConstantBuffers(...)
Metal[MTLRenderCommandEncoder setVertexBuffer: uniformBuffer]
WebGPUGPUPipelineLayout
OpenGLGLint

大多数现代图形 API 都具有绑定数据结构,以帮助将统一的缓冲区和纹理连接到需要该数据的图形管道。 Metal 的独特之处在于,您可以在命令编码器中使用 setVertexBuffer 绑定制服,与 Vulkan、DirectX 12 和 WebGPU 相比,它的架构变得更加容易。

  • 流水线
APIStructure
Vulkanvk::Pipeline
DirectX 12ID3D12PipelineState
DirectX 11Various State Calls
MetalMTLRenderPipelineState
WebGPUGPURenderPipeline
OpenGLVarious State Calls

管道是对执行光栅绘制调用、计算调度或光线跟踪调度时将执行的内容的总体描述。

DirectX 11 和 OpenGL 在这里是独一无二的,它们没有用于图形管道的专用对象,而是使用调用在执行绘制调用之间设置管道状态。

  • 命令缓冲区
APIStructure
Vulkanvk::CommandBuffer
DirectX 12ID3D12GraphicsCommandList
DirectX 11ID3D11DeviceContext
MetalMTLRenderCommandEncoder
WebGPUGPUCommandEncoder
OpenGLIntenal to Driver or with GL_NV_command_list

命令缓冲区是一个异步计算单元,你可以在其中描述 GPU 执行的过程,例如绘制调用、将数据从 CPU-GPU 可访问内存复制到 GPU 独占内存,以及动态设置图形管道的各个方面,例如当前剪刀。

以前,你会声明希望 GPU 按程序执行什么,并且 GPU 会执行这些任务,但 GPU 本质上是异步的,因此驱动程序将负责确定何时将任务调度到 GPU。

  • 命令列表
APIStructure
Vulkanvk::SubmitInfo
DirectX 12ID3D12CommandList[]
DirectX 11ID3D11CommandList
MetalMTLCommandBuffer
WebGPUGPUCommandEncoder[]
OpenGLIntenal to Driver or with GL_NV_command_list

命令列表是批量推送到 GPU 的命令缓冲区组。 这样做的原因是为了保持 GPU 持续忙碌,从而减少 CPU 和 GPU 之间的不同步 [Foley 2015]。

  • 围栏
APIStructure
Vulkanvk::Fence
DirectX 12ID3D12Fence
DirectX 11ID3D11Fence
MetalMTLFence
WebGPUN/A
OpenGLglFenceSync

Fence 是用于同步 CPU 和 GPU 的对象。 CPU 和 GPU 都可以被指示在栅栏处等待,以便对方能够赶上。 这可用于管理资源分配和释放,从而更轻松地管理总体图形内存使用情况。 [萨特兰等人。 2018]

  • 栅栏
APIStructure
VulkanvkCmdPipelineBarrier
DirectX 12D3D12_RESOURCE_BARRIER
DirectX 11N/A
MetalMTLFence
WebGPUN/A
OpenGLglMemoryBarrier

命令缓冲区内更细粒度的同步形式。 Hans-Kristian Arntzen 写了一篇关于 Vulkan 同步的文章,值得一看。

  • 信号量
APIStructure
Vulkanvk::Semaphore
DirectX 12HANDLE
DirectX 11HANDLE
Metaldispatch_semaphore_t
WebGPUN/A
OpenGLVaries by OS

信号量是用于引入操作之间的依赖关系的对象,例如在将命令缓冲区提交到设备队列之前获取交换链中的下一个图像之前等待。

Vulkan 的独特之处在于信号量是 API 的一部分,而 DirectX 和 Metal 将其委托给操作系统调用。

7、空间、对齐

每个图形 API 可以有不同的轴方向、NDC 坐标方向、矩阵对齐、纹理对齐等默认值,在大多数情况下,这不是什么大问题,只需在你的片段着色器中翻转 UV 中的 y 值即可。

  • 纹理对齐
APIStructure
VulkanBottom Left
DirectX 12Top Left
DirectX 11Top Left
MetalTop Left
WebGPUBottom Left
OpenGLBottom Left

DirectX 使用左上角作为像素空间坐标,大多数闭源 API 也是如此,而开源则选择使用左下角。

8、结束语

虽然这些 API 中的每一个都有细微的差别,但它们在设计上非常接近。 由库架构师决定他们所需的 API 限制在哪里,无论是像 Metal/WebGPU 一样简洁,还是像 Vulkan 一样复杂。


原文链接:现代图形API综合比较 - BimAnt

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/1643.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

早期javeweb技术 JSP JDBC JSTJ Servlet BooStrap

你好,我是Qiuner. 为记录自己编程学习过程和帮助别人少走弯路而写博客 这是我的 github gitee 如果本篇文章帮到了你 不妨点个赞吧~ 我会很高兴的 &#x1f604; (^ ~ ^) 想看更多 那就点个关注吧 我会尽力带来有趣的内容 jar包放在web-web-inf中 Boot strap框架 container是两…

【Go语言快速上手(三)】数组, 切片与映射

&#x1f493;博主CSDN主页:杭电码农-NEO&#x1f493;   ⏩专栏分类:Go语言专栏⏪   &#x1f69a;代码仓库:NEO的学习日记&#x1f69a;   &#x1f339;关注我&#x1faf5;带你学习更多Go语言知识   &#x1f51d;&#x1f51d; GO快速上手 1. 前言2. 数组详解3. 切…

平面设计简介:快速了解

在互联网飞速发展的时代&#xff0c;平面设计仍然是很多设计师的职业选择&#xff0c;平面设计也被称为设计的启蒙星。平面设计是什么&#xff0c;无论是想转行进入平面设计行业还是平面设计新秀&#xff1f;什么是平面设计&#xff1f;只有了解这一点&#xff0c;我们才能在未…

制造业信息安全实践——企业信息安全运营规划

前言 制造业作为一个庞大的传统产业&#xff0c;涵盖了汽车、船舶、飞机、家电、新能源等众多领域。当前&#xff0c;无论是国内还是国外的制造业都面临着一个共同的挑战&#xff1a;在计算机和信息时代的背景下&#xff0c;如何跟上IT技术的发展步伐&#xff1f;如何让传统产…

4月21日Linux运维用户相关的添加,分组,修改权限等shell脚本开发第一天

4月21日运维用户相关的添加&#xff0c;分组&#xff0c;修改权限等shell脚本开发第一天 第一天主要实现前2个功能 ​ 主要卡在了&#xff1a; 正确的写法如下&#xff0c;注意[]中的空格&#xff0c;要求很严格&#xff01;&#xff01;&#xff01; #!/bin/bash # 先查看已…

抖音ip地址怎么换位置

抖音&#xff0c;作为一款短视频分享平台&#xff0c;已经成为了许多人展示生活、分享才艺的重要舞台。然而&#xff0c;在抖音的使用过程中&#xff0c;你是否想过更换自己的IP地址位置呢&#xff1f;更换IP地址不仅可以帮助你访问一些地域限制的内容&#xff0c;还可以为你的…

micro-app的css样式隔离

手写微前端micro-app-CSS隔离 子应用的CSS可能会对基座应用或者其他子应用产生的影响 首先现在我们把react页面放入到vue2的页面大家也能看到一些问题了&#xff0c;在react中的index.css中对body的一些css样式&#xff0c;已经影响了基座应用的css。 为了看的更明显&#x…

RabbitMQ学习记录

核心概念 Brocker&#xff1a;消息队列服务器实体 Exchange(消息交换机)&#xff1a;它指定消息按什么规则&#xff0c;路由到哪个队列。 Queue(消息队列载体)&#xff1a;每个消息都会被投入到一个或多个队列。 Binding(绑定)&#xff1a;它的作用就是把exchange和queue按…

提示框增加HTML效果

预期效果&#xff1a;this.$modal.confirm(是否确认删除该条基础设施数据项&#xff1f;请注意删除该路口基础设施点位将并带删除点位下的所有设施)将两句话换行显示且第二句话字体变为红色 官方案例&#xff1a; this.$alert(<strong>这是 <i>HTML</i> 片段…

【团体程序设计天梯赛】L2-052 吉利矩阵

思路&#xff1a; 直接回溯枚举每一个位置填的数&#xff0c;二维肯定是不方便的&#xff0c;我们转成一维&#xff0c;下标x从0到n*n-1。二维数组下标从0到n-1&#xff0c;在一维中下标为x的点在二维中对应行是x/n&#xff0c;列是x%n。 每个数最小能填的是0&#xff0c;最大…

Allegro 导入 EMN 文件,报错“WARNING(SPMHXL-48)”

问题描述&#xff1a; Allegro–> Import–> IDF 导入ME 生成的emn文件&#xff0c;总是出现如下警告&#xff1a; “WARNING(SPMHXL-48): There is existing geometry on Board Geometry / Outline.This geometry may conflict with the IDF data.Review the board out…

【开发篇】本章包括消息订阅、客服配置与使用实战(小程序之云函数开发入门到使用发布上线实操)

客服回复效果图展示 消息订阅效果图展示 一、客服配置 客服消息使用指南传送门 <button open-type="contact" class="fab" ><view class="item"

文本嵌入新方案:合合信息acge模型荣登C-MTEB榜首

目录 0 写在前面1 文本嵌入&#xff1a;LLM落地的根基2 C-MTEB&#xff1a;acge荣夺榜一2.1 max tokens2.2 文本分类2.3 文本聚类 3 acge demo演示与体验总结 0 写在前面 随着信息技术的发展和应用场景的不断扩大&#xff0c;人们需要处理和利用大量的文档信息。而传统的手动处…

C语言实现贪吃蛇项目(2)

先来看看效果&#xff1a; 20240420_212115 文章目录&#xff1a; 3.项目实现3.0宽字符的打印3.01本地化操作setlocale函数宽字符的打印 3.1贪吃蛇结构的创建和维护3.11贪吃蛇结构的创建3.12贪吃蛇的维护 3.2初始化游戏3.21.打印欢迎界面、隐藏光标和设置窗口大小3.22.绘制地图…

js作业微博发言

微博 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><meta http-equiv"X-UA-Compatible" content&q…

《星尘传说》游戏完整源码(源码+引擎+客户端+服务端+教程+工具),云盘下载

《星尘传说》是一款奇幻类大型多人在线角色扮演电脑客户端游戏&#xff0c;该游戏设置有两大阵营&#xff0c;六个国家以及22个职业&#xff0c;采用3D卡通风格&#xff0c; 有兴趣的&#xff0c;可以架设个外网&#xff0c;让大家一起玩。 《星尘传说》游戏完整源码&#xff0…

【JAVA进阶篇教学】第三篇:JDK8中Stream API使用

博主打算从0-1讲解下java进阶篇教学&#xff0c;今天教学第三篇&#xff1a;JDK8中Stream API使用。 Java 8 中的 Stream API 提供了一种便捷、高效的方式来处理集合数据&#xff0c;它支持函数式编程风格的操作&#xff0c;包括过滤、映射、归约等。Stream API 可以大大简化集…

【LAMMPS学习】八、基础知识(3.6)计算热导率

8. 基础知识 此部分描述了如何使用 LAMMPS 为用户和开发人员执行各种任务。术语表页面还列出了 MD 术语&#xff0c;以及相应 LAMMPS 手册页的链接。 LAMMPS 源代码分发的 examples 目录中包含的示例输入脚本以及示例脚本页面上突出显示的示例输入脚本还展示了如何设置和运行各…

c语言利用控制台实现贪吃蛇

使用控制台实现贪吃蛇需要的技能加点&#xff1a; 控制台设置&#xff08;包含于stdlib.h&#xff09;&#xff1a; 定义命令行窗口高/宽&#xff1a; system("mode con cols100 lines30"); system() 函数是一个C标准库函数&#xff0c;它允许程序执行操作系统命令…

(九) 盘古UI,日期和时间选择控件,自定义多种场景!

(九) 盘古UI,日期和时间选择控件,自定义多种场景! 盘古UI,较为全面的自定义UI框架,帮助你绝对的快速开发!(长期维护中) 控件位置: 主要控件: com.smart.pangu_ui_lib.widget.PanguSelectDateView 内部使用的时间弹窗:pop: com.smart.pangu_ui_lib.pop.PopSelectDate demo地址…