GAMES104:04游戏引擎中的渲染系统1:游戏渲染基础-学习笔记

文章目录

  • 概览:游戏引擎中的渲染系统
    • 四个课时概览
  • 一,渲染管线流程
  • 二,了解GPU
    • SIMD 和 SIMT
    • GPU 架构
    • CPU到GPU的数据传输
    • GPU性能限制
  • 三,可见性
    • Renderable可渲染对象
    • 提高渲染效率
    • Visibility Culling 可见性裁剪
  • 四,纹理压缩(Texture Compression)
  • 五,Cluster-Based Mesh Pipeline
  • 总结


概览:游戏引擎中的渲染系统

  • 游戏渲染面临的挑战

    1. 渲染量大、算法复杂、all in one
    2. 对于不同硬件显卡的适配和优化
    3. 实时性(60fps、120fps)和分辨率(1080p、4K、8K)要求
    4. CPU带宽和内存限制(游戏逻辑、网络、动画物理等都是CPU处理的)
  • 这块是一个实践性、工程性知识(与纯理论相对),因此技术更新换代非常快

四个课时概览

在这里插入图片描述


一,渲染管线流程

流程参照101和图形基础

二,了解GPU

SIMD 和 SIMT

  • 单指令多数据SIMD(Single Instruction Multiple Data)运算,对多个数据同时进行同一种运算(指令级并行),一般用于矩阵计算
  • 单指令多线程SIMT(Single Instruction Multiple Threads)运算,多线程处理运算(相当于GPU多线程版SIMD),GPU的线程数是比CPU多得多,因此处理简单计算快

GPU 架构

  • GPU上的运算是分到一个个的流式多核处理器SM(Streaming Multiprocessor)里计算的,SM用于运行CUDA(并行处理器)。计算时不仅可以并行,相互间还可以交换数据(硬件加速),这是现代GPU最重要的架构
  • 最先进的引擎一直在更新,比如逐渐能够使用compute shader、mesh shader等等;以及一些优化比如Tile-Based,这些都跟硬件架构息息相关,如果能先了解下显卡硬件的工作原理,有助于学习这些后续知识~(艺术家也一样)
    在这里插入图片描述

CPU到GPU的数据传输

  • 现代引擎中一般绘制和逻辑是不同步的,但如果某帧绘制需要逻辑运算的数据时,就可能出现不同步的延迟。并且CPU与GPU之间的数据传输非常慢,因此默认原则:尽可能用CPU->GPU的单向传输,而不从GPU读取数据。
  • 缓存(Cache)效率在GPU中非常重要,如果计算时要加载数据不在缓存里,就会出现Cache miss(读取到时Cache miss)情况,这时候如果想去内存读取,甚至会花费一百多个时间周期,处理效率大大降低

GPU性能限制

  1. 内存瓶颈Memory Bounds
  2. 算术逻辑单元ALU Bounds
  3. 纹理贴图单元TMU(Texture Mapping Unit) Bound
  4. 带宽瓶颈BW(Bandwidth) Bound

三,可见性

Renderable可渲染对象

  • Mesh:储存每个点的位置、法线、uv、权重等和三角形的点索引
  • Materials:经典模型Phong Model、PBR Model等
  • Texture:有时候比材质还要重要
  • Shaders:shader在引擎中不算是源码,而是“数据”;shader graph连连看
  • SubMesh:Mesh根据材质不同分为不同子网格,即SubMesh

提高渲染效率

  • 多个模型的多个submesh重复了怎么提高效率呢?
    1. 可以建立一个资源池(Resource Pool),将同一种资源储存到统一的资源池中,并建立缓存;
    2. Instance(实例化)相当于先定义一个物体的Renderable,然后再将该数据实例化并渲染
    3. 游戏中相同材质的submesh,也可以把场景物体按照材质排序,把相同材质的物体group到一起,然后只需设置一次材质(减少GPU等待数据);再进一步GPU Barch Rendering可以在一次drawcall里一次性设置并渲染大量同材质物体

Visibility Culling 可见性裁剪

  • 基础原理是通过包围盒判断,优化用BVH Culling之类的算法(尤其是动态东西很多的时候)或者PVS思想。
  • PVS(Potential Visibility Set):先用BSP-tree将空间进行划分,每个小格子之间用Portal(传送门)连接,绘制时只绘制当前各自及其能看到的其他格子的内容即可(用于动态载入场景),并且每个格子的可见性是预设好的
  • 随着硬件升级,更多使用的是GPU Culling,用GPU快速计算出每个物体的包围盒是否可见,搭配preZ等技术

在这里插入图片描述

四,纹理压缩(Texture Compression)

常见的图片格式如JPG、PNG等都是一种压缩格式,它们压缩率高,但是无法实现随机访问,且算法复杂。而在引擎中的纹理需要有高效压缩和解压、随机访问、压缩率高质量好的特性,因此一般采用块压缩(Block Compression)的技术,比如bxt格式是把图片分为4X4的小格子,并且只记录像素最大最小值和各个像素在这两个值之间的插值。「相当于用64位表示原本需要384位(24*16)的16个像素:32位用565格式记录2个颜色,32位记录每个像素的索引,除两个像素颜色外只支持2种插值,共4种,用10的组合作为索引记录,其他颜色丢失」

  • 在PC上常用BC7(最新)和DXTC格式,手机上常用ASTC(最新)和ETC/PVRTC格式

在这里插入图片描述

五,Cluster-Based Mesh Pipeline

随着发展玩家在一个场景里对模型精度、细节要求越来越高,带来的GPU渲染负荷也增大,因此引擎侧逐渐向Cluster-Based Mesh Pipeline方向发展。

  • 管线核心思想:将非常精细的模型分为一个个的小Cluster,比如64个三角形分一个,然后以Cluster为单位进行渲染,剔除和深度排序也是基于Cluster bound而不是整个物体。(natine就是该思想拓展细分到像素级别)(想想曲面细分不就是一个三角形分成更多个然后统一渲染吗)这也对程序员提出了更高的要求。

总结

  • 游戏引擎的设计与硬件架构密不可分,要做好一个图形程序,就得了解显卡架构
  • 游戏引擎的一个核心问题是Mesh、Materials等数据之间的关系,submesh就是一个很好的解决方法
  • 大师:do nothing—用Culling算法使得引擎绘制尽可能少的东西,CPU、GPU做的事越少越好
  • GPU代替CPU计算–GPU Driven

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/865253.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

电路模型和电路定律

电路---为了某种需要由某些电工设备或元件按一定方式组合起来的电流的通路 实际电路的两个作用 1.电能的传输,分配和转换 2.传递和处理信号 电路中的几个基本概念 激励---电源或信号源的电压或电流,也称为输入 响应---由激励在电路各部分产生的电流…

怎么参与场外期权?

今天期权懂带你了解怎么参与场外期权? 目前个人投资者暂时还不能直接参与场外个股期权,因为场外个股期权现在只能机构来进行交易。 所以个人投资者目前只能通过机构通道来进行操作,类似期权懂,找到期权懂经理,然后通…

手机删除的照片怎么找回?3个急救指南,让你重新拥有

一不小心手滑,手机里的几百张珍贵照片就消失了!是不是心如刀割,感觉错过了几个亿?手机删除的照片怎么找回?别担心,小菜一碟,恢复照片就像打游戏一样,只要掌握正确的“攻略”&#xf…

【linux】linux和windows的互传

linux和windows的互传: 把数据从linux上放回到win上来 scp justin192.168.112.5:/home/justin/Desktop/code/python_project/Jersey-Number/datasets.tar.gz ./datasets.tar.gz 复制 Windows 文件到 Linux scp D:\data\1.txt root192.168.88.161:/root/data 复制…

初学vue3, 全是黑盒子,vue3知识点汇总

学习 Vue.js 应该像学习一门编程语言一样,首先要熟练掌握常用的知识,而对于不常用的内容可以简单了解一下。先对整个框架和语言有一个大致的轮廓,然后再逐步补充细节。千万不要像学习算法那样,一开始就钻牛角尖。 前序: vueAPI的…

Arrays.stream使用方法总结

Arrays.stream使用方法总结 本文介绍Arrays的stream流用法 Arrays.stream使用方法总结对数组简单操作最大值max最小值min平均值average数组长度count数组去重后长度distinct数组排序sorted 对数组复杂操作获得intStream对象匹配allMatch匹配anyMatch过滤filter限制数量limit遍…

AI大模型时代来临:企业如何抢占先机?

AI大模型时代来临:企业如何抢占先机? 2023年,被誉为大模型元年,AI大模型的发展如同一股不可阻挡的潮流,正迅速改变着我们的工作和生活方式。从金融到医疗,从教育到制造业,AI大模型正以其强大的生成能力和智能分析,重塑着行业的未来。 智能化:企业核心能力的转变 企…

世界智能产业博览会开幕 - 天空卫士汽车行业方案入选优秀案例

6月20日,以“智行天下、能动未来”为主题的2024世界智能产业博览会在国家会展中心(天津)开幕。主席向博览会致贺信并指出:中国高度重视人工智能发展,积极推动互联网、大数据、人工智能和实体经济深度融合,培…

netty系列(三)client启动

client启动: server是在bootstrap.bind的时候启动,而同样,client是在bootstrap.connect时启动,流程都是一样的:创建NioSocketChannel,和workgroup中的一个eventloop绑定起来,然后再执行connect…

[Python学习篇] Python函数

定义函数 语法:使用关键字 def def 函数名(参数): 代码1 代码2 ...... 调用函数 语法: 函数名(参数) 注意:不同的需求,参数可有可无。在Python中,函数必须先定义后使用 示例: # 定义函数 d…

Linux 程序打包

参考文献: Linux(ubuntu)下打包C代码并运行于其他ubuntu上linux C打包程序总结Linux shell 中获取当前目录的方法Linux shell路径变量出现空格时的处理方法 假设编译了一个 cmd 可执行文件,想要把它交给其他人运行。 找到动态库 首先新建一个文件夹 …

csdn如何建立专栏,并且把已发布的文章,放到专栏里

不会在csdn上建立专栏,管理自己的博客? 建立了专栏,不知道该怎么放入文章? 本文将一步步带你解决这些问题。 我是蚊子码农,欢迎各位的点赞、关注和收藏,有了你们的激励,我会带来更好的作品。…

聚焦 Navicat 17 新特性 | 让用户界面交互更丝滑

随着 Navicat 17 的发布,引起业界热烈反响和深入讨论。早前,我们介绍了 Navicat 17 《模型设计创新与优化​​​​​​​》与《查询与配置》的新特性。此外,Navicat 在用户界面交互方面进行了显著优化,新增了一系列实用的功能&…

(javascript)为什么await在forEach中不生效?

转载:为啥await在forEach中不生效?-腾讯云开发者社区-腾讯云 (tencent.com) 两天要写循环遍历请求接口,于是就在forEach中用到了await,但是根本不是我想要的啊! 于是各种查,各种搜,终于有点明…

《后端程序猿 · 基于 Lettuce 实现缓存容错策略》

📢 大家好,我是 【战神刘玉栋】,有10多年的研发经验,致力于前后端技术栈的知识沉淀和传播。 💗 🌻 近期刚转战 CSDN,会严格把控文章质量,绝不滥竽充数,如需交流&#xff…

机器学习辅助的乙醇浓度检测

目录 1.为什么要机器学习 2. 神经网络一般组成 3.BP神经网络工作过程 4.评价指标 5.实操代码 1.为什么要用机器学习 人工分析大量的谐振模式,建立各种WGM的响应与未知目标之间的关系,是一个很大的挑战。机器学习(ML)能够自行识别全谱的全部特征。作为…

如何在Lazada平台快速出单?测评助力商家突破销量瓶颈

Lazada在短短的几年里已经发展成了东南亚地区最大的在线购物网站之一 ,很多商家也想要在这样一个大的跨境平台上发展。那么,对于希望在Lazada平台上大展拳脚的商家而言,出单是否容易呢? ​一、Lazada出单容易吗? Lazada出单的难易程度并非…

漫步5G-A City,一份独属于上海的浪漫

作家亨利詹姆斯曾写道,“城市漫步,让我接触到了这个世界上最好的东西”。 用漫无目的地行走,来体验和观察一座城市,上海凭借丰富多元的文化特质,成为citywalk这种浪漫生活方式的流行地。 无论你是漫步在美术馆、画廊林…

数据抓取技术在视频内容监控与快速读取中的应用

引言 在数字化时代,视频内容的快速读取和监控对于内容提供商来说至关重要。思通数科的OPEN-SPIDER抓取技术为这一需求提供了高效的解决方案。 OPEN-SPIDER技术概述 OPEN-SPIDER是思通数科开发的一种先进的数据抓取技术,它能够: - 高效地从各…

ananconda 和 pip傻傻分不清???

Anaconda 和 pip 都是 Python 编程语言中用于管理包(libraries)和环境的工具,但它们在功能和设计理念上有所不同。 Anaconda Anaconda 是一个面向科学计算的发行版,包括了 Python 语言和许多常用的科学计算及数据分析库。Anacon…