实施vertex compression所遇到的各种问题和解决办法

关于顶点压缩,好处是可以减少带宽,一定程度提高加载速度,可以提高约5-10%的fps,特别是mobile上,简单描述就是:

压缩之前(32字节)

position float3 12
normal float3 12
texcoord0 float2 8

压缩之后(16字节)

position short4 8
normal ubyte4 4
texcoord0 short2 4

 

压缩的方法,其实就是在bounding box内分65536份,用"-32767.5"到"32767.5"描述。

参考文章:“Vertex Decompression using Vertex Shaders Part 2” by Dean Calve @ShaderX Programming

示例代码如下:

    // 计算position的范围oiram::vec3 posCenter(    (mMesh.boundingBox.pmax.x + mMesh.boundingBox.pmin.x) * 0.5f, (mMesh.boundingBox.pmax.y + mMesh.boundingBox.pmin.y) * 0.5f, (mMesh.boundingBox.pmax.z + mMesh.boundingBox.pmin.z) * 0.5f),posExtent(    (mMesh.boundingBox.pmax.x - mMesh.boundingBox.pmin.x) * 0.5f,(mMesh.boundingBox.pmax.y - mMesh.boundingBox.pmin.y) * 0.5f,(mMesh.boundingBox.pmax.z - mMesh.boundingBox.pmin.z) * 0.5f);
                if (vertexDeclaration & oiram::Ves_Position){oiram::vec4 norm((vertex.vec3Position.x - posCenter.x) / posExtent.x,(vertex.vec3Position.y - posCenter.y) / posExtent.y,(vertex.vec3Position.z - posCenter.z) / posExtent.z,1.0f);vertex.short4Position = oiram::short4(norm);}
    inline short packF32ToS16(float f){return static_cast<short>(f * 32767.5f);;}struct short4{short s[4];short4() {}short4(const oiram::vec4& v){s[0] = packF32ToS16(v.x);s[1] = packF32ToS16(v.y);s[2] = packF32ToS16(v.z);s[3] = packF32ToS16(v.w);}};

这样,position的xyz就从float压缩到short中了。接下来,要在vs中进行解压,那么同样需要传入center和extent:

float4 position = float4(iPosition.xyz / 32767.5 * positionExtent + positionCenter, 1);

当然,这里可以直接将positionExtent除以32767.5之后再传入,减少一次不必要的除法操作,这属于自行研发优化的范畴之内,不累述。

接下来,同理可以将uv也进行压缩,因为uv是2个值的缘故,所以center和extent可以合并在一起,只占用一个float4即可,同上理不累述。

float4 texcoord0 = float4(iTexCoord0.xyzw * uvExtentCenter.xyxy + uvExtentCenter.zwzw);

 

需要注意的是,因为必须依赖vs进行解压,而且center和extent的值必须正确。有意思的是,如果美术曾经将一个展分过uv的大模型,摘取其中某一块,然后merge到一个新的模型中,那么就容易出现混乱的uv值,比如u = 1.234567e+28, v = 1.234567e-44#DEN之类的。如果打开3dsmax里的UV map观察,整个face的3个vertex都在uv上的同一个"点"上。无奈的是,获取这些数据的函数都正确返回了,而且uv数值也是正常的float,无法通过isNAN神码的来判断是否有效。唯一能想到的办法就是,检查uv的绝对值,如果小于0.00001,或者大于10000,就将其重置为0。

还有一个在顶点压缩之前不容易察觉的情况,因为某种原因,部分faces的material为空,即没有附上材质。这一些顶点之前可能安全地藏在模型的体内,肉眼无法察觉。但现在经过压缩之后,如果vs没有照顾到它们,将其正确得解压的话,因为是以short形式记录的,于是你会发现场景中出现一些奇异的巨形的模型,附着奇怪的贴图。

既然选择了programmable pipeline代替Fixed Function,那么意味着,你的shader在解压数据之余,渲染效果必须保持与之前FF的一致。可以想象的是,这并不是一件简单的事情,比如一个模型中,一部分submesh是用diffuse map渲染,另一部分submesh只用到了diffuse color。那么好吧,你的shader可要准备好了才行。

 

结论:一篇paper,一个算法,一种优化,往往看上去很简单很美好。当你往具体项目中加入时,通常不会像demo中执行得那么顺利,尤其是遇上大量的数据,甚至是各种奇葩数据,从而出现各种诡异现象的时候,那时候估计你就会跟我一样,很难笑得出来了。

 

 

转载于:https://www.cnblogs.com/oiramario/p/3508097.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/473696.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python基础(十)--文件相关

目录 Python基础&#xff08;十&#xff09;--文件相关 1 读写文件 1.1 获取文件对象 1.2 文件读取 1.3 文件写入 1.4 文件定位 2 文件与路径的操作 2.1 os模块 2.2 os.path模块 2.3 shutil模块 2.4 glob模块 3 序列化 3.1 csv 3.2 json 3.3 pickle 4 上下文管理…

memcache 原理 监测 查看状态 stats 结构

Mencache内存存储方式&#xff1a;slab/LRU&#xff0c;采用预先申请固定大小的内存页&#xff08;slab/page&#xff09;&#xff0c;然后再把内存分成多个块&#xff08;chunk) 先放一张从网上找到的memcache内存结构图&#xff0c;觉得非常的赞&#xff1a; 再来一张memcach…

爬虫——多线程糗事百科案例

Queue&#xff08;队列对象&#xff09; Queue是python中的标准库&#xff0c;可以直接import Queue引用;队列是线程间最常用的交换数据的形式 python下多线程的思考 对于资源&#xff0c;加锁是个重要的环节。因为python原生的list,dict等&#xff0c;都是not thread safe的…

LeetCode 1625. 执行操作后字典序最小的字符串(BFS)

文章目录1. 题目2. 解题1. 题目 给你一个字符串 s 以及两个整数 a 和 b 。其中&#xff0c;字符串 s 的长度为偶数&#xff0c;且仅由数字 0 到 9 组成。 你可以在 s 上按任意顺序多次执行下面两个操作之一&#xff1a; 累加&#xff1a;将 a 加到 s 中所有下标为奇数的元素…

Python基础(十一)--正则表达式

Python基础&#xff08;十一&#xff09;--正则表达式 1 简述 正则表达式可以对指定的字符串与模式之间执行模式匹配。模式可以是普通的字符串&#xff0c;也可以是含有特殊意义字符的字符串。通过正则表达式&#xff0c;我们可以进行查找&#xff0c;校验等。 2 特殊字符 …

C++ 0x 使用可变参数模板类 实现 C# 的委托机制

1 #ifndef _ZTC_DELEGATE_H_2 #define _ZTC_DELEGATE_H_3 4 #include <vector>5 #include <functional>6 7 ///8 // C 使用 可变参数模板类, 来实现9 // C#中的 委托 10 // Anchor: ztc 11 // Date : 2014-01-10 12 /// 13 14 template<typename R, typename …

爬虫技巧:在pycharm 下 调试 scrapy项目

&#xff08;1&#xff09; 用pycharm导入scrapy项目 &#xff08;2&#xff09;选择自己编写的scrapy&#xff0c;run一下 &#xff08;3&#xff09;点击菜单栏的run &#xff0c;选择Edit Configurations。 &#xff08;4&#xff09;选择运行的spider文件 &#xff08;5&am…

LeetCode 1626. 无矛盾的最佳球队(最大上升子序DP)

文章目录1. 题目2. 解题1. 题目 假设你是球队的经理。对于即将到来的锦标赛&#xff0c;你想组合一支总体得分最高的球队。球队的得分是球队中所有球员的分数 总和 。 然而&#xff0c;球队中的矛盾会限制球员的发挥&#xff0c;所以必须选出一支 没有矛盾 的球队。 如果一名…

Spark内核架构

1、初识Spark Spark是分布式的&#xff0c;主要基于内存的&#xff0c;适合迭代计算的大数据计算框架。注意基于内存&#xff1a;是优先考虑将数据放到内存中&#xff0c;因为在内存中具有更好的数据本地性&#xff0c;但是如果内存放不下也会放在磁盘上&#xff0c;或者部分数…

ubuntu 安装 LAMP

1、apt更新源 apt-get install apache2 php5 mysql-server mysql-client php5-mysql libapache2-mod-php5 转载于:https://www.cnblogs.com/ccdc/p/3448650.html

爬虫最基本的工作流程:内涵社区网站为例

网络爬虫&#xff08;又被称为网页蜘蛛&#xff0c;网络机器人&#xff09;就是模拟客户端发送网络请求&#xff0c;接收请求响应&#xff0c;一种按照一定的规则&#xff0c;自动地抓取互联网信息的程序。 只要是浏览器能做的事情&#xff0c;原则上&#xff0c;爬虫都能够做…

LeetCode 网易-2. 古老的游戏机

文章目录1. 题目2. 解题1. 题目 小易有一个古老的游戏机&#xff0c;上面有着经典的游戏俄罗斯方块。因为它比较古老&#xff0c;所以规则和一般的俄罗斯方块不同。 首先&#xff0c;荧幕上一共有 n 列&#xff0c;每次都会有一个 1 x 1 的方块随机落下&#xff0c;在同一列中…

sudo: unable to resolve host ubuntu提示的解决

http://blog.sina.com.cn/s/blog_6c9d65a1010180mg.html转载于:https://www.cnblogs.com/wangkongming/p/3516449.html

RDD(弹性分布式数据集)

1、什么是RDD RDD&#xff08;分布式弹性数据集&#xff09;是对分布式计算的抽象&#xff0c;代表要处理的数据&#xff0c;一个数据集,RDD是只读分区的集合。数据被分片&#xff0c;分成若干个数据分片&#xff0c;存储到不同的节点中&#xff0c;可以被并行的操作&#xff…

爬虫Scrapy框架基本流程图入门:以东莞阳光网为例

一、Scrapy简单介绍 Scrapy是一个为了爬取网站数据&#xff0c;提取结构性数据而编写的应用框架。 可以应用在包括数据挖掘&#xff0c;信息处理或存储历史数据等一系列的程序中。 所谓网络爬虫&#xff0c;就是一个在网上到处或定向抓取数据的程序&#xff0c;当然&#xff0…

Eclipse自动补全功能轻松设置 || 不需要修改编辑任何文件

本文介绍如何设置Eclipse代码自动补全功能。轻松实现输入任意字母均可出现代码补全提示框。Eclipse代码自动补全功能默认只包括 点"." &#xff0c;即只有输入”."后才出现自动补全的提示框。想要自动补全总是去按 “Alt / ”也很麻烦。 其实只需简单在Eclips…

RDD持久化、广播、累加器

1、持久化 RDD的持久化包括两个方面&#xff1a;①操作RDD的时候怎么保存结果&#xff0c;这个部分属于action算子的部分②在实现算法的时候要进行cache、persist&#xff0c;还有checkpoint进行持久化。 1.1 persist和cache Spark稍微复杂一点的算法里面都会有persit的身影…

微信定时向好友发信息(循环发信息)

确保自己电脑系统时间准确&#xff1a;1.打开 浏览器&#xff1b;2.访问微信网页版&#xff1a;https://wx.qq.com/&#xff0c;并扫描登录&#xff1b;3.在左侧找到该联系人&#xff0c;选中后对话&#xff0c;右侧会显示进入聊天窗口&#xff1b;4.把你要发的内容写在输入框内…

LeetCode 网易-1. 分割环(前缀和 + 哈希)

文章目录1. 题目2. 解题1. 题目 小易有 n 个数字排成一个环&#xff0c;你能否将它们分成连续的两个部分(即在环上必须连续)&#xff0c;使得两部分的和相等&#xff1f; 输入描述&#xff1a; 第一行数据组数 T &#xff0c;对于每组数据 第一行数字 n &#xff0c;表示数字…

[jstl] forEach标签使用

在JSP的开发中&#xff0c;迭代是经常要使用到的操作。例如&#xff0c;逐行的显示查询的结果等。在早期的JSP中&#xff0c;通常使用Scriptlets来实现Iterator或者Enumeration对象的迭代输出。现在&#xff0c;通过JSTL的迭代标签可以在很大的程度上简化迭代操作。 JSTL所支持…