游戏引擎技术——前向渲染与延迟渲染

作者:yangkuKO

一、前言

2015年5月,3A巨作《巫师3:狂猎(The Witcher 3:Wild Hunt)》横空出世,该游戏作为一款开放世界的角色扮演游戏,其巨大的开放世界、绵长的剧情故事、画面精美的表现力深深吸引着大量玩家,并在当年一举拿下年度最佳游戏、最佳RPG、金操纵杆奖、最佳故事讲述、最佳视觉设计等,直到现在,共计获得超过800个奖项。用如今2024年的眼光回看巫师3的画面,也仍是相当不错的水平,你要知道这可是一款快10年的老游戏了。《巫师3:狂猎》的画面在当年可是游戏圈顶尖的存在,帧帧美如画的美誉可不是凭空吹出来的,正是靠着过于“硬核”的质量在2018年仍能拿下steam的最佳环境奖,直到现在仍有着97%的好评率。

来源:巫师3:狂猎游戏原图

同年8月,被誉为计算机图形学顶会的SIGGRAPH 2015召开,报告的其中一个,就是巫师三图形引擎的详细解说。值得注意的是,游戏精美的画面主要来自于以延迟渲染(Deferred Rendering)为主,部分前向渲染(Forward Rendering)的渲染方式。熟悉图形渲染的小伙伴应该了解,在过去,前向渲染一直是主流技术,随着计算机图形学和处理能力的不断进步,渲染引擎也在不断演化和改进,渲染方式慢慢从前向渲染过度到延迟渲染为主,部分前向渲染的方式。在本篇中,小编将探讨渲染引擎的演化历程,剖析前向渲染和延迟渲染的原理与特点,深入分析它们的优缺点以及适用场景,旨在为读者呈现一个全面的视角,更好地理解渲染技术的发展趋势和未来方向。

SIGGRAPH 2015 Killing Monsters: Behind the Scenes of the Witcher 3: Wild Hunt 图形引擎解说现场 ,来源:日本媒体4gamer

二、前向渲染(Forward Rendering)

前向渲染是早期游戏中常用的一种渲染技术。其基本原理是在渲染管线的几何处理阶段将场景中的物体转换为屏幕空间的顶点,并进行光照计算。在光照阶段,每个像素都需要遍历场景中的所有光源,并计算其对该像素的影响,然后将所有光照计算结果合并以得到最终的像素颜色。

前向渲染管线流程,来源:毛星云,【《Real-Time Rendering 3rd》 提炼总结】(七) 第七章续 · 延迟渲染(Deferred Rendering)的前生今世

前向渲染的核心伪代码可以表示为:

For each light:For each object affected by the light: framebuffer += object * light

从流程图可以看到,运用前向渲染方法渲染N个物体,在M个光源下,需要执行N*M次的渲染次数,复杂度为O(N*M)。所以前向渲染中场景光源数量对计算复杂度影像巨大,比较适合单一光源,或者光源较少且固定的场景。在当时硬件条件还没有那么强的时候,前向渲染还是各大游戏产品的主流渲染方式,因为这些游戏场景复杂度并不高,可能只有一个定向光或者几个局部光源。例如,在2001年的合金装备2(Metal Gear Solid 2)中,由于环境场景光源有限,因此采用了正向渲染,游戏内灯光是动态的,玩家和npc都可以利用阴影区域进行掩护和隐藏。

正向渲染的固定光源场景,来源:合金装备2游戏截图

而在2015年,随着计算机硬件能力的提升,考虑到世界场景的复杂度,Konami(科乐美)工作室采用了基于延迟渲染的Fox引擎,推出了合金装备5:幻痛(Metal Gear Solid V: The Phantom Pain)。

延迟渲染适合复杂场景,来源:合金装备5:幻痛游戏截图

由此,我们可以总结出前向渲染的优缺点:

前向渲染优势:
  1. 由于场景固定,物体渲染时需要逐个考虑光源,此时,物体材质和光源属性耦合,即光源信息和光照计算都放在了物体渲染的片元着色器中,此时模型的各种材质都能使用不同的光照模型和渲染技术,如卡通渲染、各向异性材质等。
  2. 透明材质的物体也能很好的进行光照计算。
前向渲染劣势:
  1. 每个物体都需要进行光照计算,无论这个物体是否可见,由此会带来过多overDraw(无意义的渲染)问题。
  2. 显而易见,对多光源的支持不好
  3. 在每个物体材质着色器中都需要增加光源计算。

三、延迟渲染(Deferred Rendering)

“评价一个画面好坏的标准,一个简单的标准是说这个画面是否够亮” ——闫令琪(2019年获顶级计算图形学机构 ACM SIGGRAPH颁发的最佳博士论文奖得主)

光带来的画面张力,来源:PlayStation 独占游戏:对马岛之魂(Ghost of Tsushima)

现代游戏画质的飞速提升,最重要的一点就是光源的数目增加,如今看起来非常真实的3A游戏场景中往往部署着环境光、局部光等上百个光源,如此前向渲染的性能难以支撑,无法达到实时渲染的要求。怎么样减少绘制次数,将物体材质与光照计算解耦开来呢?那就得请出我们的延迟渲染。

延迟渲染( Deferred Rendering),即延迟着色(Deferred Shading),顾名思义,是将着色计算延后进行处理的一种渲染方法。延迟着色给我们优化拥有大量光源的场景提供了很多可能性,因为它能够在渲染拥有成百上千光源的场景的同时还能够保持能让人接受的帧率。下面这张图展示了一个基于延迟着色渲染出的场景,这个场景中包含了1000个点光源,对于目前的硬件设备而言,用传统的正向渲染来实现几乎是不可能的。

基于Deferred Rendering 渲染的含1000个点光源的场景,来源:J. Andersson, SIGGRAPH 2009 Beyond Programmable shading course talk @ Frostbite2(寒霜)引擎

延迟渲染管线流程:

延迟渲染管线流程,来源:毛星云,【《Real-Time Rendering 3rd》 提炼总结】(七) 第七章续 · 延迟渲染(Deferred Rendering)的前生今世

延迟渲染的核心伪代码可以表示为:

For each object:Render to multiple targets 
For each light:Apply light as a 2D postProcess

从上面的伪代码以及流程图中我们可以看出延迟渲染主要是分为了两个阶段,几何处理阶段(Geometry Pass):渲染所有的几何/Color数据到G-Buffer(Geometry Buffer,几何缓冲区),光照处理阶段(Lighting Pass):使用G-Buffer计算场景的光照。得益于硬件对于MRT(Multiple Render Target,多重渲染目标)的支持。让延迟渲染成为了可能。延迟渲染的核心在于G-Buffer,也就是若干张贴图,存的是计算光照需要的所有参数,通常包含了Depth(深度图),Normal(法线贴图),Albedo(反射率贴图),Roughness(粗糙度),Specular(高光)和Metallic(金属度)。

还是以合金装备5:幻痛为例,该游戏中的一帧画面的G-Buffer如下:

合金装备5:幻痛中的一帧G-Buffer,来源:Adrian Courrèges,Metal Gear Solid V - Graphics Study

Deferred Render在G-Buffer生成之后,会根据场景中的光源,逐个计算场景的Diffuse(漫反射)和Specular(高光):

合金装备5:幻痛的Diffuse和Specular,来源:Adrian Courrèges,Metal Gear Solid V - Graphics Study

最后,将上述几张贴图进行相关计算混合,最后生成了游戏中的一帧:

最终场景,来源:合金装备5:幻痛游戏截图

由此,我们可以总结出延迟渲染的优缺点:

延迟渲染优势:
  1. 多光源支持良好,保证物体和光源只绘制一次,避免重复渲染,渲染n个物体在m个光源下的着色,复杂度从O(n*m)减少到了O(n+m)次
  2. 运用G-Buffer,先执行物体的深度检测,再执行着色计算,避免了overDraw的现象。
  3. 解耦了材质和光源,使得每个着色器都专注于几何参数提取或者照明。这种分离使着色器的功能进行拆分,简化了着色器系统管理。
延迟渲染劣势:
  1. G-Buffer的存在导致了内存开销较大,需要存储如深度、法线等贴图。贴图数量增多会额外消耗带宽
  2. 需要MRT支持
  3. 由于透明材质的物体无需记录深度,故延迟渲染很难处理透明材质物体。

后记

可以看到,延迟渲染虽然弥补了前向渲染的一些弊端,成为越来越多的现代游戏引擎的首选方法。但延迟渲染这把“双刃剑”用的好的同时也在不断把压力给到游戏研发人员,怎样以极低的代价压缩G-Buffer空间?怎样单独处理透明模型?等等这些问题是如今研发人员需要不断思考的。

游戏行业的老大哥顽皮狗(Naughty Dog)在《神秘海域4:盗贼末路(Uncharted 4: A Thief’s End)》给出了良好的示范,其在2016年的SIGGRAPH上以《Deferred Lighting in Uncharted 4》为题做了技术汇报,针对延迟渲染管线中材质多样性导致G-Buffer开销大的问题,顽皮狗极力压榨G-buffer中每个通道,最后G-buffer压缩到了只有三张。

顽皮狗经典IP:神秘海域,来源:《神秘海域4:盗贼末路》游戏截图

神秘海域4中的G-Buffer设计,来源:顽皮狗在SIGGRAPH 2016主题演讲

除了压缩G-buffer,如开头所说,巫师三采用了延迟渲染为主,部分前向渲染的方式,最终目的是解决透明材质物体无法写入深度到G-Buffer中的问题。除此以外,分块延迟渲染,又称之为forward+(Tile-Based Deferred Rendering,TBDR)作为传统延迟渲染的另一种改进,也受到了越来越多实时渲染引擎的青睐。

在Mapmost SDK for WebGL中,主要渲染管线还是以前向渲染为主,但是部分特性,如三维地形、描边都是参考延迟渲染的逻辑实现的,欢迎大家来体验Mapmost产品哦。

参考文献

http://www.adriancourreges.com/blog/2017/12/15/mgs-v-graphics-study/

https://www.357.com/article/10453

https://www.4gamer.net/games/202/G020288/20150811091/

https://zhuanlan.zhihu.com/p/77542272

https://www.glowybits.com/blog/2022/12/18/ghost_talks/

https://gamingbolt.com/metal-gear-solid-2-a-technical-retrospective-of-hideo-kojimas-masterpiece

Tech Analysis: Metal Gear Solid 5's FOX Engine | Eurogamer.net

https://zhuanlan.zhihu.com/p/553907076

https://zhuanlan.zhihu.com/p/28489928


 关注Mapmost,持续更新GIS、三维美术、计算机技术干货

Mapmost是一套以三维地图和时空计算为特色的数字孪生底座平台,包含了空间数据管理工具(Studio)、应用开发工具(SDK)、应用创作工具(Alpha)。平台能力已覆盖城市时空数据的集成、多源数据资源的发布管理,以及数字孪生应用开发工具链,满足企业开发者用户快速搭建数字孪生场景的切实需求,助力实现行业领先。

欢迎进入官网体验使用:Mapmost——让人与机器联合创作成为新常态

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/443.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LevelDB源码阅读笔记(1、整体架构)

LevelDB源码阅读笔记(1、整体架构) LeveDB源码笔记系列: LevelDB源码阅读笔记(0、下载编译leveldb) LevelDB源码阅读笔记(1、整体架构) 前言 对LevelDB源码的博客,我准备采用总…

Hadoop大数据处理技术-Linux相关命令

​7.Linux常用命令 1)Windows中的dir:列出当前目录下所有的文件和目录 2)cd:改变当前目录 cd命令并不能直接实现这种跳跃转换目录的功能 它只能让你在当前目录和其子目录之间来回切换 就像在一张平面地图上移动一样 如果想跨目录…

Qt菜单栏

文章目录 创建菜单栏创建菜单并在菜单栏中添加创建子菜单并添加到菜单创建菜单项并在菜单中添加分割线实现简易的记事本 Qt 窗口是通过 QMainWindow类 来实现的 创建菜单栏 Qt 中的菜单栏是通过 QMenuBar 这个类来实现的,一个窗口最多只有一个菜单栏。 菜单栏包含…

MyBatis 源码分析 - 缓存原理

MyBatis 源码分析 - 缓存原理 1.简介 在 Web 应用中,缓存是必不可少的组件。通常我们都会用 Redis 或 memcached 等缓存中间件,拦截大量奔向数据库的请求,减轻数据库压力。作为一个重要的组件,MyBatis 自然也在内部提供了相应的…

绘制音频时长核密度分布图

import pandas as pd import seaborn as sns import matplotlib.pyplot as plt# 读取文件到DataFrame # 可以读百万行文件 df pd.read_csv(wav_dur_million.info, sep , header0, names[音频名, 音频时长])# 绘制核密度图 sns.kdeplot(df[音频时长], fillTrue) plt.xlabel(dur…

安装Miniconda@FreeBSD13

近几年在学习和使用AI框架的时候,时时刻刻在想着如何在FreeBSD下进行训练和推理部署,可惜一直没有如愿。 近几天在调试大模型的一些项目时,尝试将飞桨、torch和tensorflow装了个遍,可惜都没有成功。机缘巧合下,看到fre…

【智能算法】饥饿游戏搜索算法(HGS)原理及实现

目录 1.背景2.算法原理2.1算法思想2.2算法过程 3.结果展示4.参考文献 1.背景 2021年,Yang等人受到自然界饥饿驱动的活动和动物的行为选择启发,提出了饥饿游戏搜索算法(Hunger Games Search, HGS)。 2.算法原理 2.1算法思想 HGS…

酒店管理系统

文章目录 酒店管理系统一、项目演示二、项目介绍三、15000字论文参考四、部分功能截图五、部分代码展示六、底部获取项目源码和万字论文参考(9.9¥带走) 酒店管理系统 一、项目演示 酒店管理系统 二、项目介绍 基于springbootvue前后端分离的…

通过实例学C#之FileStream类

简介 可以通过此类进行文件读取。 首先在项目所在文件夹的Bin文件中新建一个test.txt文件,里面输入内容“hello world!”。 构造函数 FileStream (string path, FileMode mode,FileAccess access) 通过路径文件path,打开文件模式mode以及读写…

买婴儿洗衣机怎么选择?四大绝佳好用婴儿洗衣机分享

幼龄时期的宝宝的衣物,是比较需要注意的时候。可能一不注意宝宝穿在身上就会有不适宜症状发生。所以宝妈们真的要随时观察,然后在宝宝洗衣服的这上面多下点功夫,不要让宝宝受到这种无谓的伤害。小婴儿的抵抗力比我们差很多。有些细菌、病毒可…

今天给大家推荐36套404页面模板

404页面是网站必备的一个页面,它承载着用户体验与SEO优化的重任。当用户访问不存在的页面时,服务器会返回404错误代码,并显示404页面。一个好的404页面可以帮助用户快速找到所需信息,并提升网站的用户体验。 以下是一些演示下载资…

速卖通爆款商品打造全攻略:从选品到补单,步步为赢

跨境电商行业的竞争也越来越大,速卖通卖家自然也要为店内的爆款而努力,同时也要清楚地意识到爆款也是有时限的,那么一款爆款商品该如何打造呢? 1.选品。 开店时,面对世界各地的消费者群体,远比国内复杂得…

JavaWeb--前端工程化

目录 1. 前端工程化 1.1. 概述 1.2. 前端工程化实现技术栈 2. ECMA6Script 2.1. es6的介绍 2.2. es6 变量 / 模版字符串 2.2.1. let 与 var 的差别 2.2.2. const 与 var 的差异 2.2.3. 模板字符串 2.3. 解构表达式 / 赋值 2.3.1. 数组解构赋值 2.3.2. 对象解构赋值 …

xhs图片获取并且转换成PDF,实现了我考研期间一直想实现的想法

对于一些xhs图文,很多人其实想把它的图片保存到本地,尤其是下图所示的考研英语从文章中背单词,不说别人,我就是这样的。 我在考研期间就想实现把图片批量爬取下来,转成PDF,方便一篇一片阅读进行观看&#…

《Linux运维总结:Kylin V10+ARM架构CPU基于docker-compose一键离线部署redis6.2.8之容器版哨兵集群》

总结:整理不易,如果对你有帮助,可否点赞关注一下? 更多详细内容请参考:《Linux运维篇:Linux系统运维指南》 一、部署背景 由于业务系统的特殊性,我们需要面向不通的客户安装我们的业务系统&…

idea 设置启动项指定使用的nacos namespace

文章目录 场景如图 场景 各个研发的nacos配置要做隔离,这时候通常有两种方式, 第一种修改bootstarp.yaml文件 指定研发自己的配置,第二种更优雅,只需要修改idea启动项, 对代码没有侵入 如图 –spring.cloud.nacos.discovery.names…

揭秘英伟达Blackwell平台网络拓扑架构,解锁超算新境界

英伟达Blackwell平台网络配置详解 AI算力研究:英伟达B200再创算力奇迹,液冷、光模块持续革新 突破性的GB200 NVL72全互联架构,带来高性能GPU解决方案。铜缆方案有望成为未来趋势,提供低成本、高带宽连接。 1. Blackwell 平台网络…

时序预测 | Transformer时间序列预测 Matlab代码

文章目录 效果一览文章概述源码设计参考资料 效果一览 文章概述 1.时序预测 | Transformer时间序列预测 Matlab代码 2.单变量时间序列预测; 3.多指标评价,评价指标包括:R2、MAE、MBE等,代码质量极高; 4.excel数据&…

程序使用哪个寄存器是由谁决定的?

在程序中使用哪些寄存器的决定通常是由多种因素决定的,包括: 1. 编译器或汇编器 编译器:对于高级编程语言,编译器在寄存器分配中起着重要作用。编译器分析程序的代码,识别常用的变量和表达式,并将它们映射…

政企即时通讯APP:快速构建专属、安全的智慧办公解决方案

在数字化时代,政企单位对信息系统的依赖日益加深,但随之而来的信息安全隐患也不容忽视。组织内部信息系统的安全问题,尤其是在人员调整或离职时,管理员账号管理的混乱,以及敏感资料泄露和业务系统破坏的风险&#xff0…