Objaverse:大规模3D模型开放数据集

研究人员推出了 Objaverse,这是一个“包含文本描述的3D 对象的海量开放数据集”。 它包含大约 800 000 个 3D 模型以及文本描述。

Objaverse数据集可以从huggingface下载,并且是通过 Sketchfab(Epic Games 旗下的在线平台)上共享的 3D 模型创建的。 该团队仅使用根据知识共享许可共享的 3D 模型。 换句话说,如果你使用 CC 许可证在 Sketchfab 上共享 3D 模型,它们可能会包含在 Objaverse 中,即使你使用了 NoAI 标签,情况也可能如此,该标签本意是阻止 AI 的任何使用。

NSDT工具推荐: Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 可编程3D场景编辑器 - REVIT导出3D模型插件 - 3D模型语义搜索引擎 

1、为什么要创建这个数据集?

Matt Deitke 等人在论文Objaverse: A Universe of Annotated 3D Objects中,解释了他们为什么创建这个数据集。 他们强调,在文本或图片方面,海量数据集已经可用,这也是人工智能在最近几年/几个月取得如此巨大进步的原因。 换句话说,如果没有数据集来训练,ChatGPT、StableDiffusion 等工具将无法创建文本或图片,无论这些数据集是否开放、是否可用于商业用途。

到目前为止,只有中等规模的 3D 数据集可用,并且对象类别的多样性有限。 当然,这限制了它们的使用。

有了大规模数据集,就可以创建新的人工智能工具。 例如,你可以训练 AI 根据文本描述创建 3D 模型,或者创建 LOD/重新拓扑资产,识别 3D 对象应该是什么,或者为 3D 角色创建动画。 这样的数据集也可以用于计算机视觉领域,不仅可以作为训练数据,还可以作为基准。

Objaverse 与现有 3D 对象数据集之间的比较

2、Objaverse:来自 Sketchfab 的对象

在此阶段,你可能意识到 Objaverse 等数据集在人工智能方面具有巨大潜力。 它既可以用作训练数据,也可以用作基准。 研究人员解释说,为了创建 Objaverse,他们从 Sketchfab 获取了 3D 模型、描述和标签。 Objaverse 包含由超过 10 万艺术家设计的超过 80 万个资产。 包括 3D 扫描、从头开始创建的 3D 模型,甚至动画资产。

应该强调的是,该数据集仅源自使用知识共享许可共享的资产(其中大多数都遵循 CC-By 许可)。

3、Objaverse 可以用来做什么?

Objaverse 刚刚发布,但已经被多个研究项目使用。 例如,Text2Tex 是使用 Objaverse 训练的文本到纹理工具:

Text2Tex 根据给定的文本提示生成 3D 网格的高质量纹理,这种方法将修复结合到预先训练的深度感知图像扩散模型中,以从多个视点逐步合成高分辨率部分纹理。 为了避免伪影,Text2Tex提出了一种自动视图序列生成方案来确定更新部分纹理的下一个最佳视图。 大量实验表明,Text2Tex方法明显优于现有的文本驱动方法和基于 GAN 的方法。

Objaverse 论文的主要作者 Matt Deitke 给出了其他示例,例如 Zero-1-to-3,这是一个可以从单个图像创建 3D 模型的系统:

4、Objaverse 引发问题的第一反应

CC许可证本身允许抓取资源,但这种做法引发了一些问题。

许多艺术家和创作者长期以来一直在 Sketchfab 上上传 3D 模型,因此他们的一些资产在AI兴起之前就被共享了。 此外,Objaverse 似乎没有考虑到“NoAI”标签,该标签现在可以在 Sketchfab 上使用,公开声明你不希望您的资产被用来训练 AI。 当然,在这种情况下,Objaverse 背后的团队不会是侵犯许可的人,而且这种滥用在 Sketchfab 上共享的资产已经可能发生。

我们还应该强调的是,许多使用 Creative Commons 许可证共享的 3D 资源......实际上并未获得 CC 许可证。 例如,快速搜索,你会发现从任天堂游戏中提取的资产,并且上传它的用户只对其进行了轻微调整。 该资产与原始受版权保护的资产太接近,无法在 CC 许可下共享。

当他们了解到 Objaverse 时,一些艺术家选择删除他们的 Sketchfab 帐户,而其他艺术家则建议(可能是开玩笑)处理这个问题的一种方法是将“具有非流形几何体的资产上传到 Sketchfab 并用常见的标签” 标签”,以创建不良数据。 换句话说,从 Sketchfab 抓取的数据集将无法用于训练AI。 当然,这可能会被 Sketchfab 和该平台的其他用户视为垃圾资产。

5、如何检查我的 3D 模型是否包含在此数据集中?

Objaverse 的创建者已经搭建了一个探索工具,可在此处使用。 查找你的 Sketchfab 句柄或输入其中一个 3D 模型的名称应该可以帮助检查你的3D模型是否包含在Objaverse数据集内。

6、Sketchfab 对此有何看法?

Sketchfab 首席执行官兼 Sketchfab 联合创始人 Alban Denoyel(提醒一下,Sketchfab 归 Epic Games 所有,很快将并入 Fab)在 Twitter 上做出了回应。

他的回答突出了四个要点:

  • 他强调说,“这些模型是在他们不知情的情况下由 objaverse 大规模聚合的”,并且“在发生这样的事情时,它们的优势绝对为零”。
  • 他还解释说,该数据集是在 Sketchfab 实现 NoAI 标签之前创建的,这也许可以解释为什么没有考虑到它。
  • 他还强调该数据集依赖于“用户可下载的 CC 内容集”。 换句话说,即使他们没有预料到,他们在技术上也确实允许这种方式使用他们的资产。
  • 最后但并非最不重要的一点是,他解释说 Sketchfab/Epic Games“正在研究他们有什么可以采取的措施”。

Sketchfab 官方账户也发布了几条关于这个话题的推文,解释说他们“理解艺术家的担忧并正在调查”。

目前尚不清楚 Sketchfab 对此事能做些什么。 一个值得探索的有趣主题与文本描述有关。 Sketchfab 使用条款规定许可证适用于“3D 资产”,但描述是否是资产的一部分? 如果没有,那么仍然可以抓取 Sketchfab 上在 CC 许可下共享的 3D 模型,并将它们作为数据集共享,但没有描述。 这会让这个数据集对于训练AI来说变得不那么有趣。

我们询问 Sketchfab 他们是否可以帮助我们阐明这个问题,我们将相应地更新文章。 我们还询问了 Objaverse 的创建者他们的计划是什么(特别是,他们是否会排除 Sketchfab 上现在带有 NoAI 标签的 3D 模型,以及他们将如何处理 Sketchfab 上在 CC 许可下共享的 3D 模型,但这显然是 受版权保护)。

7、不确定的时代

这种情况突显了一些数字艺术平台使用的“NoAI”标签并不是应对人工智能崛起的完美解决方案,因为当它们实施时,数据可能已经被专区。 Objaverse 还提醒我们,在 CC 许可下上传资产可能会导致艺术家无法预见的情况。

最后但并非最不重要的一点是,该公告强调了这样一个事实:如果数据未经彻底检查,则声称工具经过非版权数据的训练是不够的。 事实上,Objaverse 确实包含受版权保护的材料以及艺术家的创作,这些艺术家确实在 CC 许可下分享了他们的作品,但不希望他们的作品被用来训练人工智能。 这引发了道德和法律问题。 希望 Objaverse 背后的团队能够考虑到这些问题。

同时,如果你有 Sketchfab 帐户,可以使用“设置/帐户”页面在所有上传的内容上添加“NoAI”标签(如果你愿意)。 这将为你过去和未来的所有上传内容分配“NoAI”元标签,并禁止生成式AI使用它们。 当然,这不会对可能已经下载的数据产生任何影响。


原文链接:Objaverse大型3D数据集 - BimAnt

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/201739.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LightDB - 支持 last_day 函数[mysql兼容]

从 23.4 开始 LightDB 支持 mysql 的 last_day 函数。 目前LightDB 实现last_day的与mysql 并不完成相同,会在示例中列举出不同点, 主要是以下几点: 对于错误日期mysql返回null,lightdb 是直接报错对于一些特殊日期,lightdb 不支…

Backend - Python 序列化

目录 一、作用1:代码块存入数据库 二、作用2:前后端传递数据 (一)前端 1. JSON.stringify() 2. JSON.parse() (二)后端 1. json.dumps() (1)作用 (2&#xff09…

algo-多数排序

多数排序在leetcode只是一个简单题,但是衍生出来的多种解法却非常有意思 首先是最容易想到的hash和排序算法,接着是 随机化 从概率来讲一个随机挑选一个元素并验证都很大概率是众数 func majorityElementRandom(nums []int) int {n : len(nums)mc : …

RAM、ROM、flash、eMMC

RAM:Random-Access Memory的缩写,意思为“随机存取存储器” ROM:Read-Only Memory的缩写,意思为“只读存储器” 总体来看:都是存储器 最大区别:ROM可以在停止供电的时候仍然保存着数据;RAM在…

又有狗咬娃!江西8岁男童买早餐被狗扑咬,满脸血缝了90多针!

位于江西省吉安市吉安县实验小学门口,一名年仅8岁的男童在去买早餐的路上遭遇了一场恐怖的袭击。据报道,孩子是在清晨的买早餐路上被一只恶狗扑倒咬伤的,伤口深可见骨。 孩子的母亲悲痛欲绝地描述了当时的情景,孩子被咬伤后躺在地…

ky10 x86 一键安装wvp gb28181 pro平台

下载代码 git clone https://gitcode.net/zengliguang/ky10_x86_wvp_record_offline_install.gitfinalshell mobaxterm 修改服务器ip 查看服务器ip ip a 在脚本文件中修改服务器ip 执行安装脚本 切换到root用户 sudo su cd ky10_x86_wvp_record_offline_install/ sourc…

智能优化算法应用:基于黑寡妇算法无线传感器网络(WSN)覆盖优化 - 附代码

智能优化算法应用:基于黑寡妇算法无线传感器网络(WSN)覆盖优化 - 附代码 文章目录 智能优化算法应用:基于黑寡妇算法无线传感器网络(WSN)覆盖优化 - 附代码1.无线传感网络节点模型2.覆盖数学模型及分析3.黑寡妇算法4.实验参数设定5.算法结果6.参考文献7.…

Git 应用 -- 多人协作开发场景1

目录 1. 既查看本地仓库的分支,又查看远程仓库的分支: git branch -a (但是远程的分支只能查看,不能直接切换到远程的分支上) 2. 本地的分支和远程的分支建立连接:git checkout -b [分支名] [要连接远程的…

B027-MySQL增强

目录 多表查询为什么要用多表查询?笛卡尔积和内连接消除笛卡尔积外键数据库内连接练习左连接查询和右连接查询等值连接out join自连接子查询 数据操作(DML)数据的插入数据的删除数据的修改 数据库的备份与恢复Dos命令行窗口导出Dos命令行窗口导入Navicat导出Navicat…

if与switch语句的运用—输出成绩

1.给出一个百分制成绩&#xff0c;要求输出成绩等级A、B、C、D、E。90分以上为A&#xff0c;81-89分为B&#xff0c;70-79分为C&#xff0c;60&#xff0d;69分为D&#xff0c;60分以下为E。 if语句实现 #include <stdio.h> int main() { int score; printf(&qu…

146. LRU 缓存 --力扣 --JAVA

题目 请你设计并实现一个满足 LRU (最近最少使用) 缓存 约束的数据结构。 实现 LRUCache 类&#xff1a; LRUCache(int capacity) 以 正整数 作为容量 capacity 初始化 LRU 缓存int get(int key) 如果关键字 key 存在于缓存中&#xff0c;则返回关键字的值&#xff0c;否则返回…

基于SSM的图书馆管理系统运行部署教程

基于SSM的图书馆管理系统运行部署教程 1、下载2、数据准备-导入sql文件3、项目导入idea4、项目运行5、测试6、日志乱码问题 1、下载 源码下载地址&#xff1a; https://download.csdn.net/download/weixin_44796239/85072348下载之后&#xff0c;会得到一个压缩包&#xff1a; …

LeetCode-470. 用 Rand7() 实现 Rand10()【数学 拒绝采样 概率与统计 随机化】

LeetCode-470. 用 Rand7 实现 Rand10【数学 拒绝采样 概率与统计 随机化】 题目描述&#xff1a;解题思路一&#xff1a;首先说一个结论就是(rand_X() - 1) Y rand_Y() > [1,X*Y]&#xff0c;即可以等概率的生成[1, X * Y]范围的随机数&#xff0c;其实就像军训的时候报数…

抖店怎么对接达人带货?达人渠道整理,实操详解!

我是电商珠珠 很多人在抖店开通后&#xff0c;按照流程去正常的跑自然流量&#xff0c;再去找达人带货让自己店铺的流量增多&#xff0c;得到相应的曝光。 但是一些新手小白并不知道从哪去找达人&#xff0c;或者说不知道怎么去筛选达人。 一开始所有人都想着去找头部主播&a…

MyBatis-Plus动态更改查询的表名或字段名

部分业务可能会需要根据参数不同而查询不同的表&#xff0c;或者查询不同的字段。使用MyBatis-Plus可以很方便地实现这种需求&#xff0c;甚至不需要使用.xml文件。 三张数据表user、user1、user2内容都如下&#xff1a; idnameagesex1张三1812李四<null><null>3&…

ubuntu启动kafka报错Could not create the Java Virtual Machine.

网上有两种方式&#xff0c;但是需要具体看自己的错误信息&#xff0c;我的错误信息如下: 这里大概是说要写入日志无权限&#xff0c;所以执行的时候&#xff0c;前面加一下sudo 执行成功。

反射(理论详细到不能详细,需要不断实践)

反射机制&#xff1a; 需求&#xff1a;从【外部】配置文件中获取 类名和方法名 将其运行-》只有反射可以实现 在不修改源码的情况下控制程序-》设计模式的ocp开闭原则 &#xff08;开&#xff1a;功能开放给你使用&#xff0c;闭&#xff1a;不让修改源码&…

阿里云语雀频繁崩溃,有什么文档管理工具是比较稳定的?

10月23 日14:00左右&#xff0c;蚂蚁集团旗下的在线文档编辑与协同工具语雀发生服务器故障&#xff0c;在线文档和官网都无法打开。直到当天晚上22:24&#xff0c;语雀服务才全部恢复正常。从故障发生到完全恢复正常&#xff0c;语雀整个宕机时间将近 8 小时&#xff0c;如此长…

【SpringCloud篇】Eureka服务的基本配置和操作

文章目录 &#x1f339;简述Eureka&#x1f6f8;搭建Eureka服务⭐操作步骤⭐服务注册⭐服务发现 &#x1f339;简述Eureka Eureka是Netflix开源的一个基于REST的服务治理框架&#xff0c;主要用于实现微服务架构中的服务注册与发现。它由Eureka服务器和Eureka客户端组成&#…

机器学习与 S3 相集成 :释放数据的力量

文章作者&#xff1a;Libai 引言 在当今数据驱动的世界中&#xff0c;企业不断寻求如何高效利用企业自身所产生的数据的解决方案。机器学习已经成为一种提取有价值的见解和做出数据驱动决策的强大工具。然而&#xff0c;机器学习模型的成功在很大程度上依赖于高质量数据的可用…