Reversed-Z详解

  在3D渲染管线中,Z这个家伙几乎无处不在,如Z-Buffer,Early-Z,Z-Cull,Z-Test,Z-Write等等,稍有接触图形学的人都会对这些术语有所耳闻。

  那么Z到底是什么呢?首先Z当然可以是任意坐标系下的z坐标值,但我们这里要说的Z值,就是深度值,上面几个包含Z的术语里面的Z也都是深度值的意思,深度值是物体变换到屏幕空间后的z坐标的值,因为NDC空间转屏幕空间时并不会改变z值,所以也可以说是NDC空间中z坐标的值,有些读者可能认为在屏幕空间中Z值已经不存在了,这也是有道理的,因为屏幕是一个2d空间,没有z轴,但我们在这里不做2d,3d区别,认为都有z轴。在DirectX中,Z值得取值范围是[0,1],在OpenGL中,其取值范围为[-1,1],这篇拟在DirectX环境下讨论Z。

  Z值的推导请参见:

http://www.codeguru.com/cpp/misc/misc/graphics/article.php/c10123/Deriving-Projection-Matrices.htm

  这里我们直接用上文中的一个结果(建议没推导过的读者按照这一篇的思路推导一遍,必定会受益匪浅), 即Z值在透视投影后的结果:

$$ZZ_{c}={\frac{f}{f-n}Z_{c}}-{\frac{fn}{f-n}}$$

  上面的方程中,$Z$即我们要求的深度值,$Z_{c}$是物体在Eye Space中的z坐标,f是视锥体远裁剪平面在Eye Space中的z坐标,n是视锥体近裁剪平面在Eye Space中的z坐标。由上式可求得($ZZ_{c}$其实是Clip Space中的z值,除以$Z_{c}$就是透视除法,得到NDC空间的z值,也即是深度值Z):

 $$Z={\frac{f}{f-n}}-{\frac{fn}{(f-n)*Z_{c}}}\quad ①$$

  对于$Z_{c}$,我们可以证明其关于物体在World Space中的z值$Z_{w}$为线性关系,那么根据上式可知$Z$与$Z_{c}$、$Z_{w}$皆不为线性关系。简单起见,我们取f=1000,n=0.01,有:

 $$Z≈-{\frac{0.01}{Z_{c}}}+1\quad②$$

其函数图像如下($Z_{c}>0$):

图1

 

  图中A点表明了$Z_{c}$∈[0.01,0.1]的物体占用了十分之九(0~0.9)的深度值,这说明在z轴方向上与相机距离为0.1到1000的物体只用到了十分之一(0.9~1.0)的深度值。这个结果是令人印象深刻的,因为Z值的分布太不均匀了,就好像世界上的绝大部分钱都被一个人占有了一样。那Z值的分布情况对于3d渲染来说重要吗?它意味着什么呢?

  深度值的不均分分配会导致非常严重的后果,那就是Z-Fighting。深度值的取值范围是[0,1],但这并不代表它存到Z-Buffer里面后也一定是[0,1]的浮点数,事实上在过去很长一段时间乃至现在很多时候,深度值被保存在16位或者24位的无符号整数中。这里我们用范围更小的16位来存储深度值,因为这能更好的凸显出问题。当深度值存储为16位无符号整型格式时,其取值范围是[0,65535],现在我们来算一算当深度值为65534时,$Z_{c}$是多少?65534映射到[0,1]中,值为65534/65535。连同f=1000,n=0.01代入①式(①比②可获得更精确的结果)可解得:$Z_{c}$≈395.9005401718437≈395.9,这说明在Eye Space中在z轴方向上距离相机395.9到1000的物体的深度值都是65535!当两个物体拥有同样的深度值时,就会产生非常丑陋的Z-Fighting(详见:https://en.wikipedia.org/wiki/Z-fighting):

(相同的深度值导致GPU不能正确分辨哪个在前,哪个在后)。

    在3d渲染中,应该尽可能的避免产生Z-Fighting,即应该尽可能的改善深度值分布的均匀程度。提高用来保存深度值类型的精度可以起到改善z值冲突的情况,比如用24位甚至32位的数据类型来存储深度会比16位好很多,但由于硬件条件的限制和Z值的非线性增长,目前来说不可能用太多位的硬件出现。有的人也许会想到用浮点数来保存深度值,但其实这毫无作用的,甚至可以说更为浪费,因为对于32位浮点数,其尾数(Mantissa)只有23位二进制数,规格化浮点数加上一位保留位也只有24位,这与24位无符号整数表示的精度是一样的,而浮点数还多使用了8位来存储其他信息。另外,虽然浮点数本身表示的范围更广,但我们知道深度值的范围不过为[0,1],当我们用浮点数来存储深度值时,当然不会再去做映射,这样,深度值其实只占到了范围在[0,1]的浮点数所占的精度,这势必就更少了,不过好在浮点数的精度分布也主要分布在0值附近,0值附近的符点数拥有更好的精度,但不管怎样,目前来说想依靠浮点数来改善状况是不可取的。

  除了提高Z-Buffer的精度以外,还有一些方法也可以改善Z值冲突的情况,如增大近裁面与相机位置z值距离(即n值)就是一种方法。对①式 我们取n=0.1,f=1000(不变),有:

$$Z≈-\frac{0.1}{Z_{c}}+1$$

其图像如下:

图2

  对比图1,图2的情况好了很多,对比两个图中的点A,前0.9的深度值表示的范围从0.1扩大到了1,说明有更多的深度值用来表示$Z_{c}$比较大的情况,如果还以16位无符号整数来存储深度值,计算后可得$Z_{c}$在区间[868,1000]时共享65535这个深度值,这比[396,1000]的冲突少了非常多,降低了出现Z-Fighting的概率。而我们仅仅是将n从0.01提高到0.1而已,这对一般的应用场景几乎不会产生影响。

  既然如此,我们将n值继续增大,比如取n=100,会怎样呢?我们将n=100,f=1000(不变)代入1式得:

 $$Z=-\frac{1000}{9Z_{c}}+\frac{10}{9}$$

图像如下(我必须把x轴压缩400倍才能截个图):

图3

  可以看到0到0.9的深度值已经可以表示到大约=600的时候了,要知道n=0.01的时候, 0.9的深度值$Z_{c}$只能表示到0.1;n=0.1的时候$Z_{c}$只能表示到1。依然将深度值存入到无符号整型中,我们可以计算出当物体的$Z_{c}$∈[999.863,1000]时,它们才共用65535这个深度值,通过取n=100我们很好地改善了Z值的分布情况。至少看起来已经是个很好——甚至可以说近乎完美的办法了。但是,事实并非如此,由于取得n=100,我们舍弃了整个$Z_{c}$∈[0,100]的物体,我们将永远看不到那些离相机z轴距离少于100的物体!增大近裁剪面的值以换取深度值的分布均匀程度,难言利弊得失。

    难道就没有更好的改善深度值分布的办法了吗?当然有了,办法就是神奇的Reversed-Z,Reversed-Z的做法其实是很简单的,即将原本近裁剪平面映射到深度值0,远裁剪平面映射到深度值1的映射关系反过来,让近裁剪平面映射到深度值1,远裁剪平面映射到深度值0。即将[n,f]映射到[1,0],按照上文给出的投影矩阵推导链接中的方法,我们可以推导出Reversed-Z的情况下Z与$Z_{c}$的关系(其实就是①式中n与f互换):

  $$Z={\frac{n}{n-f}}-{\frac{fn}{(n-f)*Z_{c}}}$$

  我们取n=0.1,f=1000,有:

$$Z≈\frac{0.1}{Z_{c}}$$

函数图像如下:

图4

    看到上面的图,细心的读者可能会发现,这不跟图2一样嘛,都是$Z_{c}$=1的时候,深度值Z就用了十分之九(0.9)了,不过是前者是[0, 0.9],这里是[0.1, 1]而已,有区别吗?如果我们还是以无符号整型来存储深度值,的确对我们达成目的没有帮助,依然是靠近近裁剪平面的少数物体占据了大多数深度值。但是我说过Reversed-Z是神奇的,它的神奇之处是当它搭配上我前面否定过的浮点数时,Reversed-Z在"提高深度值均分分布程度" 这件事上就变得非常有效了。

    让我们回到浮点数,前面有提到过 "0值附近的符点数拥有更好的精度",这是有依据的,浮点数具体介绍请参考维基百科:https://en.wikipedia.org/wiki/IEEE_floating_point,这里以单精度符点类型做简单说明。规约化单精度浮点数的有效位数只有7位(实际是7点多位,这里简单起见取7),当一个浮点数小于1的时候,它可以确保有6位小数位是精确的,也就是说,在(0,1)这个开区间内至少可以包含999999(6位)个误差允许的单精度浮点数,1~9同理,但由于非规约化浮点数(主要是在0值左右)的存在,使得(0,1)这个区间内的浮点数个数要比(1,2),(2,3)…(9,10)这些区间内的符点数要多。在(10, 11)这个区间内,由于整数位占去了两位,所以这个区间内至少只可以包含99999(5位)个有效单精度浮点数,以此类推,(100,101)开区间内包含9999个有效单精度浮点数,(1000,1001)开区间内包含999个有效单精度浮点数等等,当数量级来到[1000000,1000001]时(注意这里是闭区间),这个区间内能保证有效的单精度浮点数不过就两个:1000000与1000001本身。这说明浮点数的分布与深度值的分布一样是不均与的,越靠近0的浮点数分布越密集,越远离0的浮点数分布越稀疏:

浮点数分布情况图

  当我们用正常的Z值系统([n,f]映射到[0,1])与浮点数配合时,符点数没有任何帮助(原谅这个不一样的画风,由于我还不太会使用GeogeBra作图,我把本文的主要参考文章Depth Precision Visualized的图拿过来用了):

图5

  图5中z1到z2这么远的距离依然只共享一个深度值0.99。

    

但当我们将Reversed-Z([n,f]映射到[1,0])与浮点数结合起来,情况就变成了:

图6

随着$Z_{c}$的增大,深度值Z的降幅越来越小,看似又要陷入精度不够的死胡同,但浮点数的分布规律恰好弥补了这一不足,使得较大的也有足够的精度表示,图6中z1到z2比之图5中多获得了5个深度值。这样,距离相机近和远的物体分得的深度值就比较平均了,变相的实现了"改善深度值分布状况"这一目的,从而也达到了降低Z-Fighting出现的概率(是的,虽然Reversed-Z这么神奇,但Z-Fighting还是不能完全避免的,虽然概率已经降到很低)。

作为依赖Unity引擎的开发者,很高兴看到Unity在其5.5以及以后的版本中引入了Reversed-Z的做法,在这里也提醒一下大家以后为Unity写shader的时候,如果用到深度值Z,一定要记得 [n,f] 是映射到[1,0],否则就会写出错误的效果J

 

参考与说明:

本文参考:Depth Precision Visualized,对Reversed-Z进行思考与分析,希望能对读者有所帮助。

文中的函数图像使用GeoGeBra软件绘制,公式用LaTex 语法写成。

转载于:https://www.cnblogs.com/jackmaxwell/p/6851728.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/370707.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

pyqt开发的程序模板_小程序定制开发和模板开发要多少钱?有什么区别?

到现在,小程序开发已经有了1年多的历史,已经达到百万数量级。无论是小程序商城还是小程序游戏,其开发方式不外乎两种,一种是定制开发,另一种是模板开发。对于很多初次接触小程序的客户来说,还不知道小程序的…

html 三列布局(两列自适应,一列固定宽度)

不做过多解释:主要是记录一个完整的布局样式,实现页面大致三列其中左右两列是自适应宽度,中间固定宽度效果。 不多少代码奉上: CSS样式代码: /*********************公共标签样式********************//************…

单曲循环 翻译_歌单 | 单曲循环amp;热评

December2020/12/ 写在前面的话 /本来打算在跨年的时候才更文,但是吧又觉得空出这最后一个月有点苍白,然后最近一直夜半网抑云(敏感ing)就想到可以做一期分享歌单的推文,分享一些最近听得频繁的歌曲(还不是刷抖音刷出来的)。《暧昧》// 王菲徘…

休息使用Jersey –包含JAXB,异常处理和客户端程序的完整教程

最近,我开始使用Jersey API开发一个Restful Web服务项目。 在线提供了一些教程,但是我遇到了异常处理方面的一些问题,而且在使用JaxB和提供异常处理方法的完整项目中找不到任何地方。 因此,一旦我能够使用带有异常处理和客户端程序…

【转】Java方向如何准备BAT技术面试答案(汇总版)

原文地址:http://www.jianshu.com/p/1f1d3193d9e3 这个主题的内容之前分三个篇幅分享过,导致网络上传播的比较分散,所以本篇做了一个汇总,同时对部分内容及答案做了修改,欢迎朋友们吐槽、转发。因为篇幅长度和时间的原…

numpy维度交换_“lazy”的transpose()函数——从numpy 数组的内存布局讲起

1 数组的两种内存布局方式行优先与列优先首先我们回顾一下,矩阵数据在内存中的两种布局方式:行优先(row-major):以行为优先单位,在内存中逐行存储/读取;对于多维,意味着当线性扫描内…

云耀服务器切换系统,【计算】云耀服务器-常见操作汇总指南

通过上期的介绍,相信大家对于云耀云服务器的基本知识有了一个了解。云耀云服务器是一个具备独立、完整的操作系统和网络功能,可快速搭建简单应用的新一代云服务器。接下来,本期为大家带来关于云耀云服务器使用中的一些简单方法和小技巧。1.云…

机器学习应该准备哪些数学预备知识?

转 https://www.zhihu.com/question/36324957 https://www.zhihu.com/question/36324957/answer/139408269 机器学习应该准备哪些数学预备知识? 数据分析师,工作中经常使用机器学习模型,但是以调库为主。 自己一直也在研究算法,也…

react usecontext_Vue3原理实战运用,我用40行代码把他装进了React做状态管理

前言vue-next是Vue3的源码仓库,Vue3采用lerna做package的划分,而响应式能力vue/reactivity被划分到了单独的一个package中。如果我们想把它集成到React中,可行吗?来试一试吧。使用示例话不多说,先看看怎么用的解解馋吧…

css的三个特性 背景透明设置

关于行内元素(补充一点) 行内元素只能容纳文本或其他行内元素。(a特殊a里面可以放块级元素) 例子: 关于行高tip: 选择器的嵌套层级不应大于3级,位置靠后的限定条件应尽可能的精确。 属性定义必须另起一行…

ccs安装多版本编译器离线_大数据分析:学习工具JDK,在线安装指南

hadoop是使用Java语言开发的并且Hadoop运行需要有Java环境的支持,因此在安装hadoop之前需要安装Java开发环境即JDK(Java Development Kit)。安装前首先向大家介绍以一下本文会用到的几个词:JAVA_HOME:一是为了方便引用,比如,JDK安…

asp.net尚未在web服务器上注册_最新版Web服务器项目详解 00 项目概述

点 击 关 注 上 方"两猿社"设 为"置 顶 或 星 标",干 货 第 一 时 间 送 达。互 联 网 猿 | 两 猿 社TineyWebServerLinux下C轻量级Web服务器,助力初学者快速实践网络编程,搭建属于自己的服务器…

DBMS-基本概念

文件处理系统(file-processing system)的主要弊端: 数据冗余和不一致(data redundancy and inconsistency)、数据访问困难(difficulty in accessing data)、数据孤立(data isolation…

python多大孩子可以学_孩子学编程最佳年龄是多大

儿童编程教育已经悄悄地掀起了编程低龄化的热浪。但是很多人会疑惑,到底孩子学编程最佳年龄是多少呢?下面小编就为大家解答一下。孩子学编程最佳年龄 首先,孩子的学习黄金时期是非常重要的。从6岁开始,大多数孩子都可以掌握对基本…

上传文件到华为云云服务器,上传文件到云服务器

上传文件到云服务器 内容精选换一换登录Windows操作系统的弹性云服务器时,需使用密码方式登录。因此,用户需先根据创建弹性云服务器时使用的密钥文件,获取该弹性云服务器初始安装时系统生成的管理员密码(Administrator帐户或Cloudbase-init设…

关于图片预加载的思考

引子&#xff1a; 很多时候&#xff0c;我们在写html页面的时候&#xff0c;当需要在页面中加入图片时&#xff0c;我们很自然地把图片直接用<img>标签放在了<body>里面&#xff0c;这本来是没有多大问题的。 但是当图片数量很多的时候&#xff0c;问题就来了。H…

SpringBoot03 项目热部署

1 问题 在编写springBoot项目时&#xff0c;经常需要修改代码&#xff1b;但是每次修改代码后都需重新启动&#xff0c;修改的代码才会生效 2 这么实现IDEA能够像Eclipse那样保存过后就可以自动进行刷新呢 将springBoot项目进行热部署即可 3 如何实现SpringBoot项目的热部署01 …

STM32实现流水灯

led.c #include"led.h"void Led_Init(void) {GPIO_InitTypeDef GPIO_VALUE; //???RCC_APB2PeriphClockCmd(RCC_APB2Periph_GPIOC,ENABLE);//???GPIO_VALUE.GPIO_ModeGPIO_Mode_Out_PP;//???? ????GPIO_VALUE.GPIO_PinGPIO_Pin_1|GPIO_Pin_2|GPIO_Pin_…

jacob 报错 Can't co-create object

问题&#xff1a;开始时一切正常&#xff0c;后来什么都没该&#xff0c;出现Cant co-create object报错&#xff0c;即是创建不了ActiveXComponent wdnew ActiveXComponent("Word.Application"); 偶尔发现任务管理器中word进程居然达到10个&#xff0c;而我没有打开…

wxpython可视化_使用wxPython的绘图模块wxPyPlot进行数据可视化

[Python进阶(四十)-数据可视化の使用matplotlib进行绘图前言  matplotlib是基于Python语言的开源项目&#xff0c;旨在为Python提供一个数据绘图包。我将在这篇文章中介绍matplotlib A #-*- coding: utf-8 -*- ############################################################…