CLAY是一种大规模可控生成模型,用于创建高质量的3D资产,它结合了多分辨率变分自编码器和简化的潜在扩散变压器,通过多种输入形式生成详细的3D几何结构和物理渲染材质。
CLAY或许是今年最值得期待的3D生成模型,号称质量最好+布线最好+支持的输入模态最多+支持材质生成。
相关链接
论文地址:https://arxiv.org/abs/2406.13897
项目主页:https://sites.google.com/view/clay-3dlm
代码:https://github.com/CLAY-3D/OpenCLAY(暂未开源)
论文阅读
CLAY:一种可控的大规模生成模型高质量的3D资产
摘要
在数字创意领域,我们凭借想象力创造复杂 3D 世界的潜力常常受到现有数字工具的限制,这些工具需要大量的专业知识和努力。为了缩小这种差距,我们引入了 CLAY,这是一种 3D 几何和材料生成器,旨在毫不费力地将人类的想象力转化为复杂的 3D 数字结构。
CLAY 支持经典的文本或图像输入以及来自各种基元(