Forward框架的逆袭:解析Forward+渲染

转载请注明出处为KlayGE游戏引擎,本文地址为http://www.klayge.org/2012/04/21/forward%e6%a1%86%e6%9e%b6%e7%9a%84%e9%80%86%e8%a2%ad%ef%bc%9a%e8%a7%a3%e6%9e%90forward%e6%b8%b2%e6%9f%93/

AMD在7900系列显卡发布的时候同时推出了Leo demo, 并说明它不是用近年流行的Deferred框架渲染完成,而是用到了一种叫Forward+的框架。这个框架不需要Deferred的大带宽要求,却仍能 实时渲染上千光源。EG2012上有篇新paper叫做Forward+: Bringing Deferred Lighting to the Next Level,讲述的就是这个方法。但目前作者还没有放出该论文的全文,这里我只能通过只言片语和AMD的文档来解析这个神奇的Forward+。

Tiled-based Deferred Shading

在进入正题之前,我们先回顾一下Intel在SIGGRAPH Courses 2010里提到的Tiled-based Deferred Shading。它的算法框架是:

  1. 生成G-Buffer,这一步和传统deferred shading一样。
  2. 把G-Buffer划分成许多16×16的tile,每个tile根据depth得到bounding box。
  3. 对于每个tile,把它的bounding box和light求交,得到对这个tile有贡献的light序列。
  4. 对于G-Buffer的每个pixel,用它所在tile的light序列累加计算shading。

在原先的deferred框架下,每个light需要画一个light volume,以决定它会影响到哪些pixel(也就是light culling)。而用tiled based的方法,只需要一个pass就可以对所有的光源进行求交。如果用了AMD在Mecha demo中用到的OIT方法,还可以做一个per-tile linked list,直接把light序列存在链表里。

Forward+ Rendering

有了Tiled-based Deferred Shading的基础,理解Forward+就变得简单多了。Forward+ Rendering和Tiled-based Deferred Shading的关系就好比原先的Forward Shading和Deferred Shading,所以我们可以照猫画虎一次:

  1. Z-prepass,很多forward shading都会用这个作为优化,而在forward+中,这个变成了必然步骤。
  2. 把Z-Buffer划分成许多16×16的tile,每个tile根据depth得到bounding box。
  3. 对于每个tile,把它的bounding box和light求交,得到对这个tile有贡献的light序列。
  4. 对于每个物体,在PS中用该pixel所在tile的light序列累加计算shading。

从这里可以看出,前两步与Tiled-based deferred shading大同小异,但只需要Z-Buffer,而不需要很消耗带宽的G-Buffer(G-Buffer最小也要32bit color + 32bit depth)。第三步是完全一样的。第四部由于用了forward,可以有forward的各种好处:

  • 复杂材质
  • 支持硬件AA(虽然我一直认为硬件AA多算了很多东西,是一种巨大的浪费)
  • 带宽利用率高
  • 支持透明物体

由于light已经在步骤3中cache了,所以也可以不像传统的forward那样,把材质和光源搅在一起。加上shader中动态分支的能力, 不难实现类似deferred那样的巨量光源支持。由于带宽省了很多,Forward+的速度能比Deferred快。在原paper里的性能比较足以说 明这个问题。

Forward+  VS Deferred

另一个有趣的地方是透明物体的渲染。虽然我在KlayGE中用Deep G-Buffer的方法解决了纯Deferred下透明物体的渲染。 正如很多读者指出的,这么做所带来的带宽翻倍在很大程度上拖慢了整个系统。在Forward+中,第一步生成Z-prepass的时候,可以采用双Z- Buffer的办法,一个放不透明物体的Z,另一个放透明物体的Z。在第二步计算tile bounding box的时候,不管透不透明都放在一起计算一个总的bounding box。后面步骤不变,就能原生支持透明物体。

由于有了Z-Buffer,其他原先对Deferred有利的效果,比如GI、SSR,都可以直接应用。SSAO、SSVO之类的方法,如果需要考虑pixel normal,就需要适当的修改才能应用上。

在AMD的demo中,步骤2和3是用compute shader实现的。而在Tiled-based Forward Rendering这篇blog中,他完全用PS实现了per-tile linked list,但仍然需要D3D11的UAV特性。所以Forward+还没法再D3D11之前的硬件上实现。

总结

所谓三十年河东三十年河西,作为Forward框架的新发展,Forward+给我们提供了一个新思路。这样的竞争性发展总比所有资源都投到一方、忽视另一方要好。

从贡献程度来看,最有突破性的其实不是Forward部分,其实是Tiled-based。Forward+只能算作Tiled-based Deferred Shading的“Forward化”。顺便说一下,很多移动平台的GPU在硬件上支持Tiled-based Rendering(TBR),也是利用它来最大化计算相关性和带宽利用率。不支持TBR的Tegra就吃亏许多了。

转载于:https://www.cnblogs.com/gongminmin/archive/2012/04/22/2464982.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/462060.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java NIO学习系列三:Selector

前面的两篇文章中总结了Java NIO中的两大基础组件Buffer和Channel的相关知识点,在NIO中都是通过Channel和Buffer的协作来读写数据的,在这个基础上通过selector来协调多个channel以同时读写数据,本文我们就来学习一下selector。 Java NIO中引入…

Java JTable3

预览: 代码 : /*** */ package com.han;import java.awt.Color; import java.awt.GridLayout; import java.awt.event.ActionEvent; import java.awt.event.ActionListener; import java.awt.event.MouseAdapter; import java.awt.event.MouseEvent; imp…

关于ASCII字符的那些事儿

1、单字符一般用单引号加一个字符表示,比如字符1表示为‘1’,而数字1直接表示为1; char ch 1 ;int num 1;2、计算机用数字来存储字符,比如字符1,在计算机里面为49(十进制);而数字…

JqueryMobile学习之二---对话框

对话框 通过在链接中添加data-rel”dialog”的属性&#xff0c;可以使链接页面的显示方式变为对话框。给显示的对话框加入切换的效果也是一个不错的选择 例如我们将about的链接变成一个对话框并加入相应的切换效果。代码如下 <p><a href"#about" data-rel&q…

“leave the world behind”十一快乐出行

这个十一你打算怎么过&#xff1f;每天睡到自然醒&#xff0c;然后闷在家里埋头上网&#xff1f;选择晴朗好天气出去逛街&#xff0c;四处淘宝贝&#xff0c;淘美食&#xff1f;还是选择一个好的路线出去玩一周&#xff1f;其实行无论宅着还是选择出行&#xff0c;一定要让自己…

分享一个文件上传工具类

文件上传状态枚举类&#xff1a; View Code 1 package com.hoo.enums;2 3 4 5 /**6 7 * <b>function:</b> 文件上传状态8 9 * package com.hoo.enums 10 11 * fileName UploadState.java 12 13 * createDate 2010-10-11 下午1…

静态库和动态库的区别

库是写好的&#xff0c;现有的&#xff0c;成熟的&#xff0c;可以复用的代码。现实中每个程序都要依赖很多基础的底层库&#xff0c;不可能每个人的代码都从零开始&#xff0c;因此库的存在意义非同寻常。 本质上来说&#xff0c;库是一种可执行代码的二进制形式&#xff0c;可…

257. Binary Tree Paths

1、问题描述 2、代码&#xff08;非本人所写&#xff0c;十分精彩的C代码&#xff09; int pathsNum(struct TreeNode* root); void Traverse(struct TreeNode* root, char** array, char* spre, int* pindex); char* stringAdd(char* s, int val);char** binaryTreePaths(stru…

HDOJ树形DP专题之Centroid

题目链接 这题跟Balance Act那题差不多&#xff0c;求图的质点。我直接将那题改了一下提交&#xff0c;结果PE了一次&#xff0c;又WA了一次&#xff0c;最后发现是单case&#xff0c;多case的提交为什么WA呢&#xff1f; View Code 1 #include <stdio.h>2 #include <…

LAMP平台--部署Discuz论坛

环境&#xff1a;为了推广公司的产品并为客户服务提供一个交流平台&#xff0c;公司购买了一套Discuz论坛系统&#xff0c;要求安装到现有的LAMP服务器中&#xff0c;并简单划分论坛版块。需求&#xff1a;部署论坛服务器&#xff0c;安装Discuz论坛系统添加新区和版块产品发布…

ACM中java快速入门

2019独角兽企业重金招聘Python工程师标准>>> ACM中java快速入门 附&#xff1a; Chapter I. Java的优缺点各种书上都有&#xff0c;这里只说说用Java做ACM-ICPC的特点&#xff1a; (1) 最明显的好处是&#xff0c;学会Java&#xff0c;可以参加Java Challenge …

OV7725的帧率和PCLK寄存器设置

一、OV7725的PCLK的改变和以下几个寄存器有关&#xff1a; 1&#xff1a;OX0D&#xff08;COM4&#xff09;&#xff1b; ------------------------------------------------------------------------------------------------------------------ 0X0D COM4 41 …

演示:两台交换机成环后的STP计算原则

演示&#xff1a;两台交换机成环后的STP计算原则演示目标&#xff1a;理解两台交换机成环后&#xff0c;STP的计算原则&#xff0c;重点理解PID的作用。演示环境&#xff1a;如下图7.49所示。演示背景&#xff1a;上图所示的环境为两台交换机的生成树环境&#xff0c;其中S1有较…

引水入城

最近在搞提高组的题,这是某天早上给的T1 T1最难还行 原题目 最近考试考多了就是见题打暴力,打搜索, 然而这题真是搜索, 但是并不能只搜索,会T,没亲测,但一定有效 这并不是考试题,所以看看标签(理直气壮的理由) 是BFS啊... 那就用DFS吧 这里的DP一开始看没有什么感觉,但是做着做…

程序员必知8大排序3大查找(一)

每天都在叫嚣自己会什么技术&#xff0c;什么框架&#xff0c;可否意识到你每天都在被这些新名词、新技术所迷惑&#xff0c;.NET、XML等等技术固然诱人&#xff0c;可是如果自己的基础不扎实&#xff0c;就像是在云里雾里行走一样&#xff0c;只能看到眼前&#xff0c;不能看到…

最详细的U-BOOT源码分析及移植

本文从以下几个方面粗浅地分析u-boot并移植到FS2410板上&#xff1a; 1、u-boot工程的总体结构 2、u-boot的流程、主要的数据结构、内存分配。 3、u-boot的重要细节&#xff0c;主要分析流程中各函数的功能。 4、基于FS2410板子的u-boot移植。实现了NOR Flash和NAND Flash启动,…

织梦教程

/************************************************************************************************************************************************** 织梦 文件说明 很详细 http://bbs.admin5.com/thread-1952932-1-1.html /****************************************…

TinyXML:一个优秀的C++ XML解析器

2019独角兽企业重金招聘Python工程师标准>>> 读取和设置xml配置文件是最常用的操作&#xff0c;试用了几个C的XML解析器&#xff0c;个人感觉TinyXML是使用起来最舒服的&#xff0c;因为它的API接口和Java的十分类似&#xff0c;面向对象性很好。 TinyXML是一个开源…

《C++标准程序库》学习笔记5 — 第七章

1.(P252) 迭代器的分类及其能力&#xff1a;input迭代器只能读取元素一次。如果复制input迭代器&#xff0c;并使原迭代器和新产生副本都向前读取&#xff0c;可能会遍历到不同的值。output迭代器类似。 2.(P258) C不允许修改任何基本类型&#xff08;包括指针&#xff09;的暂…

Android无线调试——抛开USB数据线

开发Android的朋友都知道&#xff0c;真机调试需要把手机与PC相连&#xff0c;然后把应用部署到真机上进行安装和调试。长长的USB线显得很麻烦&#xff0c;而且如果需要USB接口与其他设备连接的话显得很不方便。今天介绍一种不通过USB线就可以进行真机调试的方法。首先让手机与…