Objaverse:大规模3D模型开放数据集

研究人员推出了 Objaverse,这是一个“包含文本描述的3D 对象的海量开放数据集”。 它包含大约 800 000 个 3D 模型以及文本描述。

Objaverse数据集可以从huggingface下载,并且是通过 Sketchfab(Epic Games 旗下的在线平台)上共享的 3D 模型创建的。 该团队仅使用根据知识共享许可共享的 3D 模型。 换句话说,如果你使用 CC 许可证在 Sketchfab 上共享 3D 模型,它们可能会包含在 Objaverse 中,即使你使用了 NoAI 标签,情况也可能如此,该标签本意是阻止 AI 的任何使用。

NSDT工具推荐: Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 可编程3D场景编辑器 - REVIT导出3D模型插件 - 3D模型语义搜索引擎 

1、为什么要创建这个数据集?

Matt Deitke 等人在论文Objaverse: A Universe of Annotated 3D Objects中,解释了他们为什么创建这个数据集。 他们强调,在文本或图片方面,海量数据集已经可用,这也是人工智能在最近几年/几个月取得如此巨大进步的原因。 换句话说,如果没有数据集来训练,ChatGPT、StableDiffusion 等工具将无法创建文本或图片,无论这些数据集是否开放、是否可用于商业用途。

到目前为止,只有中等规模的 3D 数据集可用,并且对象类别的多样性有限。 当然,这限制了它们的使用。

有了大规模数据集,就可以创建新的人工智能工具。 例如,你可以训练 AI 根据文本描述创建 3D 模型,或者创建 LOD/重新拓扑资产,识别 3D 对象应该是什么,或者为 3D 角色创建动画。 这样的数据集也可以用于计算机视觉领域,不仅可以作为训练数据,还可以作为基准。

Objaverse 与现有 3D 对象数据集之间的比较

2、Objaverse:来自 Sketchfab 的对象

在此阶段,你可能意识到 Objaverse 等数据集在人工智能方面具有巨大潜力。 它既可以用作训练数据,也可以用作基准。 研究人员解释说,为了创建 Objaverse,他们从 Sketchfab 获取了 3D 模型、描述和标签。 Objaverse 包含由超过 10 万艺术家设计的超过 80 万个资产。 包括 3D 扫描、从头开始创建的 3D 模型,甚至动画资产。

应该强调的是,该数据集仅源自使用知识共享许可共享的资产(其中大多数都遵循 CC-By 许可)。

3、Objaverse 可以用来做什么?

Objaverse 刚刚发布,但已经被多个研究项目使用。 例如,Text2Tex 是使用 Objaverse 训练的文本到纹理工具:

Text2Tex 根据给定的文本提示生成 3D 网格的高质量纹理,这种方法将修复结合到预先训练的深度感知图像扩散模型中,以从多个视点逐步合成高分辨率部分纹理。 为了避免伪影,Text2Tex提出了一种自动视图序列生成方案来确定更新部分纹理的下一个最佳视图。 大量实验表明,Text2Tex方法明显优于现有的文本驱动方法和基于 GAN 的方法。

Objaverse 论文的主要作者 Matt Deitke 给出了其他示例,例如 Zero-1-to-3,这是一个可以从单个图像创建 3D 模型的系统:

4、Objaverse 引发问题的第一反应

CC许可证本身允许抓取资源,但这种做法引发了一些问题。

许多艺术家和创作者长期以来一直在 Sketchfab 上上传 3D 模型,因此他们的一些资产在AI兴起之前就被共享了。 此外,Objaverse 似乎没有考虑到“NoAI”标签,该标签现在可以在 Sketchfab 上使用,公开声明你不希望您的资产被用来训练 AI。 当然,在这种情况下,Objaverse 背后的团队不会是侵犯许可的人,而且这种滥用在 Sketchfab 上共享的资产已经可能发生。

我们还应该强调的是,许多使用 Creative Commons 许可证共享的 3D 资源......实际上并未获得 CC 许可证。 例如,快速搜索,你会发现从任天堂游戏中提取的资产,并且上传它的用户只对其进行了轻微调整。 该资产与原始受版权保护的资产太接近,无法在 CC 许可下共享。

当他们了解到 Objaverse 时,一些艺术家选择删除他们的 Sketchfab 帐户,而其他艺术家则建议(可能是开玩笑)处理这个问题的一种方法是将“具有非流形几何体的资产上传到 Sketchfab 并用常见的标签” 标签”,以创建不良数据。 换句话说,从 Sketchfab 抓取的数据集将无法用于训练AI。 当然,这可能会被 Sketchfab 和该平台的其他用户视为垃圾资产。

5、如何检查我的 3D 模型是否包含在此数据集中?

Objaverse 的创建者已经搭建了一个探索工具,可在此处使用。 查找你的 Sketchfab 句柄或输入其中一个 3D 模型的名称应该可以帮助检查你的3D模型是否包含在Objaverse数据集内。

6、Sketchfab 对此有何看法?

Sketchfab 首席执行官兼 Sketchfab 联合创始人 Alban Denoyel(提醒一下,Sketchfab 归 Epic Games 所有,很快将并入 Fab)在 Twitter 上做出了回应。

他的回答突出了四个要点:

  • 他强调说,“这些模型是在他们不知情的情况下由 objaverse 大规模聚合的”,并且“在发生这样的事情时,它们的优势绝对为零”。
  • 他还解释说,该数据集是在 Sketchfab 实现 NoAI 标签之前创建的,这也许可以解释为什么没有考虑到它。
  • 他还强调该数据集依赖于“用户可下载的 CC 内容集”。 换句话说,即使他们没有预料到,他们在技术上也确实允许这种方式使用他们的资产。
  • 最后但并非最不重要的一点是,他解释说 Sketchfab/Epic Games“正在研究他们有什么可以采取的措施”。

Sketchfab 官方账户也发布了几条关于这个话题的推文,解释说他们“理解艺术家的担忧并正在调查”。

目前尚不清楚 Sketchfab 对此事能做些什么。 一个值得探索的有趣主题与文本描述有关。 Sketchfab 使用条款规定许可证适用于“3D 资产”,但描述是否是资产的一部分? 如果没有,那么仍然可以抓取 Sketchfab 上在 CC 许可下共享的 3D 模型,并将它们作为数据集共享,但没有描述。 这会让这个数据集对于训练AI来说变得不那么有趣。

我们询问 Sketchfab 他们是否可以帮助我们阐明这个问题,我们将相应地更新文章。 我们还询问了 Objaverse 的创建者他们的计划是什么(特别是,他们是否会排除 Sketchfab 上现在带有 NoAI 标签的 3D 模型,以及他们将如何处理 Sketchfab 上在 CC 许可下共享的 3D 模型,但这显然是 受版权保护)。

7、不确定的时代

这种情况突显了一些数字艺术平台使用的“NoAI”标签并不是应对人工智能崛起的完美解决方案,因为当它们实施时,数据可能已经被专区。 Objaverse 还提醒我们,在 CC 许可下上传资产可能会导致艺术家无法预见的情况。

最后但并非最不重要的一点是,该公告强调了这样一个事实:如果数据未经彻底检查,则声称工具经过非版权数据的训练是不够的。 事实上,Objaverse 确实包含受版权保护的材料以及艺术家的创作,这些艺术家确实在 CC 许可下分享了他们的作品,但不希望他们的作品被用来训练人工智能。 这引发了道德和法律问题。 希望 Objaverse 背后的团队能够考虑到这些问题。

同时,如果你有 Sketchfab 帐户,可以使用“设置/帐户”页面在所有上传的内容上添加“NoAI”标签(如果你愿意)。 这将为你过去和未来的所有上传内容分配“NoAI”元标签,并禁止生成式AI使用它们。 当然,这不会对可能已经下载的数据产生任何影响。


原文链接:Objaverse大型3D数据集 - BimAnt

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/201739.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

又有狗咬娃!江西8岁男童买早餐被狗扑咬,满脸血缝了90多针!

位于江西省吉安市吉安县实验小学门口,一名年仅8岁的男童在去买早餐的路上遭遇了一场恐怖的袭击。据报道,孩子是在清晨的买早餐路上被一只恶狗扑倒咬伤的,伤口深可见骨。 孩子的母亲悲痛欲绝地描述了当时的情景,孩子被咬伤后躺在地…

ky10 x86 一键安装wvp gb28181 pro平台

下载代码 git clone https://gitcode.net/zengliguang/ky10_x86_wvp_record_offline_install.gitfinalshell mobaxterm 修改服务器ip 查看服务器ip ip a 在脚本文件中修改服务器ip 执行安装脚本 切换到root用户 sudo su cd ky10_x86_wvp_record_offline_install/ sourc…

智能优化算法应用:基于黑寡妇算法无线传感器网络(WSN)覆盖优化 - 附代码

智能优化算法应用:基于黑寡妇算法无线传感器网络(WSN)覆盖优化 - 附代码 文章目录 智能优化算法应用:基于黑寡妇算法无线传感器网络(WSN)覆盖优化 - 附代码1.无线传感网络节点模型2.覆盖数学模型及分析3.黑寡妇算法4.实验参数设定5.算法结果6.参考文献7.…

Git 应用 -- 多人协作开发场景1

目录 1. 既查看本地仓库的分支,又查看远程仓库的分支: git branch -a (但是远程的分支只能查看,不能直接切换到远程的分支上) 2. 本地的分支和远程的分支建立连接:git checkout -b [分支名] [要连接远程的…

B027-MySQL增强

目录 多表查询为什么要用多表查询?笛卡尔积和内连接消除笛卡尔积外键数据库内连接练习左连接查询和右连接查询等值连接out join自连接子查询 数据操作(DML)数据的插入数据的删除数据的修改 数据库的备份与恢复Dos命令行窗口导出Dos命令行窗口导入Navicat导出Navicat…

if与switch语句的运用—输出成绩

1.给出一个百分制成绩&#xff0c;要求输出成绩等级A、B、C、D、E。90分以上为A&#xff0c;81-89分为B&#xff0c;70-79分为C&#xff0c;60&#xff0d;69分为D&#xff0c;60分以下为E。 if语句实现 #include <stdio.h> int main() { int score; printf(&qu…

基于SSM的图书馆管理系统运行部署教程

基于SSM的图书馆管理系统运行部署教程 1、下载2、数据准备-导入sql文件3、项目导入idea4、项目运行5、测试6、日志乱码问题 1、下载 源码下载地址&#xff1a; https://download.csdn.net/download/weixin_44796239/85072348下载之后&#xff0c;会得到一个压缩包&#xff1a; …

LeetCode-470. 用 Rand7() 实现 Rand10()【数学 拒绝采样 概率与统计 随机化】

LeetCode-470. 用 Rand7 实现 Rand10【数学 拒绝采样 概率与统计 随机化】 题目描述&#xff1a;解题思路一&#xff1a;首先说一个结论就是(rand_X() - 1) Y rand_Y() > [1,X*Y]&#xff0c;即可以等概率的生成[1, X * Y]范围的随机数&#xff0c;其实就像军训的时候报数…

抖店怎么对接达人带货?达人渠道整理,实操详解!

我是电商珠珠 很多人在抖店开通后&#xff0c;按照流程去正常的跑自然流量&#xff0c;再去找达人带货让自己店铺的流量增多&#xff0c;得到相应的曝光。 但是一些新手小白并不知道从哪去找达人&#xff0c;或者说不知道怎么去筛选达人。 一开始所有人都想着去找头部主播&a…

ubuntu启动kafka报错Could not create the Java Virtual Machine.

网上有两种方式&#xff0c;但是需要具体看自己的错误信息&#xff0c;我的错误信息如下: 这里大概是说要写入日志无权限&#xff0c;所以执行的时候&#xff0c;前面加一下sudo 执行成功。

阿里云语雀频繁崩溃,有什么文档管理工具是比较稳定的?

10月23 日14:00左右&#xff0c;蚂蚁集团旗下的在线文档编辑与协同工具语雀发生服务器故障&#xff0c;在线文档和官网都无法打开。直到当天晚上22:24&#xff0c;语雀服务才全部恢复正常。从故障发生到完全恢复正常&#xff0c;语雀整个宕机时间将近 8 小时&#xff0c;如此长…

【SpringCloud篇】Eureka服务的基本配置和操作

文章目录 &#x1f339;简述Eureka&#x1f6f8;搭建Eureka服务⭐操作步骤⭐服务注册⭐服务发现 &#x1f339;简述Eureka Eureka是Netflix开源的一个基于REST的服务治理框架&#xff0c;主要用于实现微服务架构中的服务注册与发现。它由Eureka服务器和Eureka客户端组成&#…

机器学习与 S3 相集成 :释放数据的力量

文章作者&#xff1a;Libai 引言 在当今数据驱动的世界中&#xff0c;企业不断寻求如何高效利用企业自身所产生的数据的解决方案。机器学习已经成为一种提取有价值的见解和做出数据驱动决策的强大工具。然而&#xff0c;机器学习模型的成功在很大程度上依赖于高质量数据的可用…

算能技术资料地址、Demo github地址

技术资料地址&#xff1a; https://developer.sophgo.com/site/index/material/38/all.html Demo github地址&#xff1a;https://github.com/sophgo/sophon-demo

人工智能在警务工作中的运用

AI 能否帮助警察打击犯罪&#xff1f; 执法部门负责维护公共安全&#xff0c;他们必须处理随之而来的所有挑战。幸运的是&#xff0c;警察可以依靠技术来处理很多工作。近几年来&#xff0c;尤其是人工智能技术在全球变成了警务工作中的一个重要部分。 随着基于 AI 的警务技术…

c++搭建http服务器

HTTP请求协议格式如下&#xff1a; HTTP响应协议格式如下&#xff1a; #include <iostream> #include <winsock2.h> #include <ws2tcpip.h> #include <string>#pragma comment(lib, "ws2_32.lib")//std::string generateResponse(const st…

企业级SQL开发:如何审核发布到生产环境的SQL性能

自从上世纪 70 年代数据库开始普及以来&#xff0c;DBA 们就不停地遭遇各种各样的数据库管理难题&#xff0c;其中最为显著的&#xff0c;可能就是日常的开发任务中&#xff0c;研发人员们对于核心库进行变更带来的一系列风险。由于针对数据库的数据变更是一项非常常见的任务&a…

Linux修改时区失败,手动修改localtime无效

有时候改了这个也不行&#xff0c;用命令行修改也不行 解决办法 &#xff1a;cp /usr/share/zoneinfo/Asia/Shanghai /etc/localtime 或者想改其他时区的直接 ll /usr/share/zoneinfo/ 查看

DTCC2023大会-基于eBPF观测数据库-附所有PPT下载链接

DTCC2023大会-基于eBPF观测数据库-附所有PPT下载链接 8月16日—18日,第14届中国数据库技术大会(DTCC-2023)在北京国际会议中心举行。聚好看在大会上首次发布基于eBPF观测数据库性能的产品DBdoctor&#xff0c;受到了业界广泛的关注。近期几位业内同仁过来要大会的PPT&#xff…

python爬虫-某公开数据网站实例小记

注意&#xff01;&#xff01;&#xff01;&#xff01;某XX网站逆向实例仅作为学习案例&#xff0c;禁止其他个人以及团体做谋利用途&#xff01;&#xff01;&#xff01; 第一步&#xff1a;分析页面和请求方式 此网站没有技巧的加密&#xff0c;仅是需要携带cookie和请求…