Talk | UCSD博士生刘明华:在开放的世界中理解和生成3D物体

本期为TechBeat人工智能社区539线上Talk。

北京时间10月19日(周四)20:00,加州大学圣地亚哥分校博士生刘明华的Talk已准时在TechBeat人工智能社区开播!

他与大家分享的主题是: 在开放的世界中理解和生成3D物体,探讨分享了开放世界中的3D物体生成及物体理解。

Talk·信息

主题:在开放的世界中理解和生成3D物体

嘉宾:加州大学圣地亚哥分校博士生 刘明华

时间:北京时间 10月19日(周四) 20:00

地点:TechBeat人工智能社区

点击下方链接,即可观看视频!

TechBeatTechBeat是荟聚全球华人AI精英的成长社区,每周上新来自顶尖大厂、明星创业公司、国际顶级高校相关专业在读博士的最新研究工作。我们希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。icon-default.png?t=N7T8https://www.techbeat.net/talk-info?id=817

Talk·介绍

在开放的世界中理解和生成3D物体是三维视觉和具身智能中的重要任务。随着大规模3D数据集的出现和VLM、LLM的发展,3D深度学习不再受限于数据的稀缺,迎来了新的机遇。曾经局限于少数类别的“椅子研究”开始探索面向开放世界的能力。

Talk大纲

1、开放世界中的3D物体生成

(1)回顾过去一年3D AIGC的发展,总结各个流派的特点和问题。

(2)介绍一种较新的3D AIGC思路:有机结合多视角图像预测和三维重建。

(3)具体介绍我们NeurIPS2023的工作:One-2-3-45。

(4)列举与这一新思路相关的最新工作,并展望未来的探索空间。

2、开放世界中的3D物体理解

(1)简要介绍我们NeurIPS2023的工作:OpenShape。通过在大规模3D数据上进行多模态表征对齐,我们首次实现3D物体的开放世界理解,并支持丰富的三维点云应用。

(2)简要介绍我们CVPR2023的工作:PartSLIP。通过利用2D VLM,我们提出了一个对三维点云进行low-shot部件分割的新方法。其中zero-shot版本表现惊艳,few-shot版本能实现与全监督方法相近的性能。

Talk·预习资料

图片

https://one-2-3-45.github.io

图片

https://colin97.github.io/OpenShape/

图片

https://colin97.github.io/PartSLIP_page

Talk·提问交流

在Talk界面下的【交流区】参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

图片

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

Talk·嘉宾介绍

图片

刘明华

加州大学圣地亚哥分校博士生

刘明华是加州大学圣地亚哥分校五年级博士生,导师为苏昊副教授。在此之前,他在清华大学计算机系取得本科学位。他的研究兴趣主要围绕于三维视觉和具身智能。他曾在CVPR、ECCV、SIGGRAPH、NeurIPS、CoRL等国际顶级会议和期刊发表17篇论文,其中一作、共一论文10篇。他曾在Adobe、Waymo、高通、商汤实习,曾荣获Powell奖学金和高通QIF奖学金。他曾多次担任CVPR、ECCV、ICCV、SIGGRAPH、NeurIPS、ICLR、ICML、T-RO、TPAMI等国际会议、期刊的审稿人。

个人主页:

https://www.techbeat.net/grzytrkj?id=34870


关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/111654.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

用护眼灯到底好不好?好用热门的护眼台灯推荐

现在市面上做护眼灯的品牌非常多,有的是脚踏实地,真正做保护消费者眼睛的产品,有的则是夸大宣传,以次充好来收割很多不明真相的群众。其实护眼灯的防蓝光是做不到完全无蓝光的,那些宣传完全无蓝光的商家,完…

会议剪影 | 思腾合力携AI服务器亮相PRCV 2023,并作主题演讲

第六届中国模式识别与计算机视觉大会(PRCV 2023)于2023年10月13日至15日在厦门国际会议中心酒店举办。本届会议主题为“相约鹭岛,启智未来”。 会议旨在汇聚国内国外模式识别和计算机视觉理论与应用研究的广大科研工作者及工业界同行&#xf…

2023年中国工业气体行业研究报告

第一章 行业概况 1.1 定义 工业气体行业是一个不可或缺的产业领域,它为多种行业提供关键的产品和服务。工业气体,包括氧气、氮气、氩气、二氧化碳、氦气、氢气及特种气体等,是现代工业生产和科学研究的基础。这些气体在不同的领域具有广泛的…

mysql体系结构及引擎

目录 一、mysql体系结构 二、存储引擎简介 2.1查看当前数据库支持的存储引擎 三、存储引擎的特点 3.1innodb 3.2myisam 3.3memory 四、存储引擎的选择 一、mysql体系结构 连接层 最上层是一些客户端和连接服务,主要完成一些类似于连接处理,授权认…

C- 使用原子变量实现自旋锁

自旋锁 自旋锁(Spinlock)是一种常用于多线程编程中的低开销锁,其特点是当线程尝试获取锁而锁已被其他线程占用时,该线程会处于一个持续的忙等待(busy-wait)状态,直到它可以获取到锁为止。这种方…

哈夫曼树的建立(C++,最优树)

介绍: 哈夫曼树(Huffman Tree)是一种用于数据压缩的树形数据结构。它是由刚特哈夫曼于1952年发明的。 哈夫曼树的特点是:对于一个长度为n的字符集,它可以将每个字符在树上表示为一个唯一的二进制编码。在哈夫曼树中&am…

NSSCTF做题(10)

叫10好听一点,就是补9的 第7页的内容 [SWPUCTF 2022 新生赛]ez_sql get传参说是不安全,那就只能用post了 有回显了,两个假的flag 发现万能密码 1 or 11#变成了 11# 11# 1 11#1# 11# 11# 发现or和空格都无了,union也过滤 …

golang的json转pb验证

基于这篇文章的最后一个代码进行验证。 https://blog.csdn.net/mijichui2153/article/details/133894403?csdn_share_tail%7B%22type%22%3A%22blog%22%2C%22rType%22%3A%22article%22%2C%22rId%22%3A%22133894403%22%2C%22source%22%3A%22mijichui2153%22%7D 1、准备 &…

Python新手常犯的8个错误,你中招了吗?

我们都知道Python是一门非常流行和强大的编程语言,而作为一个刚入门Python编程的新手,你可能会犯一些常见的错误,这些错误可能会阻碍你的学习和项目进展。 如何避免这些常见的错误呢?在本文中,小编将为你介绍8个新手P…

OJ第四篇

文章目录 链表分割环形链表有效的括号 链表分割 链接: 链表分割 虽然这个题牛客网中只有C,但是无所谓,我们只要知道C是兼容C的就可以了 至于说这个题的思路,我们就弄两个链表,把小于x的结点放到一个链表中,剩下的放到另一个链表…

群狼调研(长沙社情民意调查) | 残疾人服务满意度调查流程

以下是一个基本的残疾人服务满意度调查流程,可以根据实际情况进行调整和修改: 1. 制定调查目标和范围:明确调查的目标、范围和重点,确定需要评估的服务类型和方面。 2. 制定调查计划:确定调查的时间表、预算、人员分…

【c#】Quartz开源任务调度框架学习及练习Demo

Quartz开源任务调度框架学习及练习Demo 1、定义、作用 2、原理 3、使用步骤 4、使用场景 5、Demo代码参考示例 6、注意事项 7、一些Trigger属性说明 1、定义、作用 Quartz是一个开源的任务调度框架,作用是支持开发人员可以定时处理业务,比如定时…

Python常用视频编辑操作——读取与保存视频、更改帧数、拼接视频、视频语音合并、视频与图像互转等

1.更改视频帧数 降低视频帧数,简单的操作只能降低视频帧数,如果要增加视频帧数,那就要使用深度学习进行插帧处理: import cv2 from moviepy.editor import * def change_fps(inpt_path,output_path,fps):# 加载视频video Video…

python实现TCPclient

python实现TCPclient是一件简单的事情,只要通过socket这个模块就可以实现。 一、实现步骤 1、导入模块: 首先,你需要导入Python的socket模块。 import socket2、创建Socket对象: 使用socket.socket()函数创建一个新的socket对…

Flink学习---15、FlinkCDC(CDC介绍、案例实操)

星光下的赶路人star的个人主页 未来总是藏在迷雾中让人胆怯,但当你踏入其中,便会云开雾散 文章目录 1、CDC简介1.1 什么是CDC1.2 CDC的种类1.3 Flink-CDC 2、FlinkCDC案例实操2.1 开启MySQL Binlog并重启MySQL2.2 FlinkSQL方式的应用2.2.1 导入依赖2.2.2…

Elasticsearch2.x Doc values

文档地址: https://www.elastic.co/guide/en/elasticsearch/reference/2.4/doc-values.html https://www.elastic.co/guide/en/elasticsearch/guide/2.x/docvalues-intro.html https://www.elastic.co/guide/en/elasticsearch/guide/2.x/docvalues.html https://ww…

【Java 进阶篇】HTML DOM 事件详解

当用户在网页上点击按钮、输入文本、鼠标移动到某个区域或执行其他互动操作时,这些动作都可以触发事件。HTML DOM(文档对象模型)允许我们使用JavaScript来捕获、处理和响应这些事件,以实现网页的交互和动态性。本篇博客将围绕HTML…

iOS原生、Android 原生, flutter 三种方式给照片流添加文字(水印)

效果图:三中代码实现的效果差不多 Swift:代码 import UIKitclass ImageWatermarking: NSObject {static func textToImage(drawText text: String, inImage initImage: UIImage, atPoint point: CGPoint) -> UIImage {let textColor = UIColor.whitelet textFont = UIFon…

ccpc2023秦皇岛F. Mystery of Prime(dp)

题目要求改变数组中的数字使相邻数字之和是质数,同时改变数字的次数最少 因为改变的数字可以无穷大 我假设当一个数改变为一个某一个偶数时,他周围的任意的奇数肯定能和他相加变成质数 当一个数变为某一个大于1的奇数时,他周围任意偶数肯定…

港联证券:资金融通构成强支撑 “一带一路”金融合作开新局

本年是共建“一带一路”主张提出十周年。经过十年打开,共建“一带一路”从夯基垒台、立柱架梁到落地生根、持久打开,已成为打开包容、互利互惠、协作共赢的国际协作途径。“资金融通”作为首份“一带一路”白皮书提出的“五通”之一,定位为“…