Talk|香港中文大学高瑞元:MagicDrive - 基于3D几何控制的自动驾驶街景数据生成

本期为TechBeat人工智能社区565线上Talk。

北京时间1月18(周四)20:00,香港中文大学博士生高瑞元的Talk已准时在TechBeat人工智能社区开播!

他与大家分享的主题是: MagicDrive - 基于3D几何控制的自动驾驶街景数据生成”,介绍了他的团队在新型街景生成框架等相关工作所做的研究。

Talk·信息

主题:MagicDrive - 基于3D几何控制的自动驾驶街景数据生成

嘉宾:香港中文大学博士生 高瑞元

时间:北京时间 1月18日(周四)20:00

地点:TechBeat人工智能社区

点击下方链接,即可观看视频!

TechBeatTechBeat是荟聚全球华人AI精英的成长社区,每周上新来自顶尖大厂、明星创业公司、国际顶级高校相关专业在读博士的最新研究工作。我们希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。icon-default.png?t=N7T8https://www.techbeat.net/talk-info?id=843

Talk·介绍

虽然最近在扩散模型方面的进步显著提高了具有2D控制的数据合成能力,并让我们看到了在3D感知任务成功应用合成数据希望,但在街景生成中实现精确的3D控制却依旧十分困难。具体来说,将鸟瞰视角(BEV)作为主要条件会丢失高度信息,无法控制道路表面高度;使用2D控制会影响到物体大小、遮挡模式和,进而与标注不匹配。对于3D物体检测任务,这些都是感知数据合成的重要因素。

MagicDrive作为一个新型街景生成框架,提供了包括相机姿态、道路地图和3D边界框在内的多样化3D几何控制。通过定制编码策略实现了与文本描述的结合,可以实现多种条件的戏力度控制。此外,我们的设计还融入了一个跨视图关注模块,确保了多个相机视图间的一致性。通过MagicDrive,我们捕捉到了细粒度的3D几何变化和各种场景描述差异,实现了高保真度的街景合成。在下游任务的实验中,MagicDrive 还证明了生成数据可以用来提升BEV分割和3D物体检测等任务的表现。

Talk大纲

1、背景:3D 可控的街景生成与自动驾驶感知模型数据增强;

2、方法:MagicDrive - 多重可控 + 跨视角/多帧一致的街景数据生成;

3、实验结果:MagicDrive 生成高质量图像/视频数据,可以有效驱动下有感知任务训练,并且具有多重可控性;

4、总结:MagicDrive 的优势与不足,以及未来工作展望

Talk·预习资料

Image

论文链接:

https://arxiv.org/abs/2310.02601

Image

论文链接:

https://arxiv.org/abs/2308.07687

Image

论文链接: 

https://arxiv.org/abs/2306.04607

Talk·提问交流

在Talk界面下的【交流区】参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

Talk·嘉宾介绍

Image

高瑞元

香港中文大学博士生

高瑞元目前是CUHK计算机系博四的学生,导师是徐强教授。博士期间主要的研究方向是生成模型与感知模型的协同,对AI安全也有所涉猎。此前,高瑞元于北京航空航天大学获得本科学位,曾与北京航空航天大学的杨海龙老师、刘祥龙老师一同合作,主要研究方向为AI隐私。 

以第一作者身份在多个会议、期刊发表过多篇论文, 包括ICCV,CCGrid和TCYB,并以协作作者身份发表多篇论文。曾在中国科学院自动化研究所,商汤研究院等实习。

个人主页:  TechBeat 


关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/633419.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

湛江涡轮壳工件实物扫描三维测绘广州抄数公司造型stl转面3d打印

湛江涡轮壳上门实物三维扫描及抄数打印案例(CASAIM中科广电): 涡轮壳三维扫描及逆向设计技术是一种基于计算机辅助设计(CAD)和逆向工程(RE)的方法,用于对涡轮壳进行精确的三维测量和…

基于小波多普勒变换的回波信号检测matlab仿真

目录 1.算法运行效果图预览 2.算法运行软件版本 3.部分核心程序 4.算法理论概述 4.1小波变换基础 4.2 多普勒效应与多普勒变换 4.3 小波多普勒变换 4.4 回波信号检测 5.算法完整程序工程 1.算法运行效果图预览 2.算法运行软件版本 matlab2022a 3.部分核心程序 %回波…

解决打开 json 文件中文乱码的问题

如下图,pycharm 打开是下面的样子 右下角的编码尝试了好久,依然打不开 用代码打开就成功了 import jsonwith open(./Mydata/garbage_classification.json,encodingutf8,moder) as f:data json.load(f) print(data)控制台结果:

时序分解 | Matlab实现SMA-CEEMDAN利用黏菌优化算法优化CEEMDAN时间序列信号分解

时序分解 | Matlab实现SMA-CEEMDAN利用黏菌优化算法优化CEEMDAN时间序列信号分解 目录 时序分解 | Matlab实现SMA-CEEMDAN利用黏菌优化算法优化CEEMDAN时间序列信号分解效果一览基本介绍程序设计参考资料 效果一览 基本介绍 SMA-CEEMDAN利用黏菌优化算法优化CEEMDAN Matlab语言…

JVM性能调优-垃圾收集器G1详解

目录 G1收集器(-XX:UseG1GC) G1垃圾收集分类 YoungGC MixedGC Full GC G1收集器参数设置 G1垃圾收集器优化建议 什么场景适合使用G1 G1收集器(-XX:UseG1GC) G1 (Garbage-First)是一款面向服务器的垃圾收集器,主要针对配备多颗处理器及大容量内存的机器. 以极高概率满足…

VSCode 插件推荐

前言 关于开发用的插件就不做赘述了,网上面有很多文章都做了推荐,本文推荐几个好看的插件。 文件图标主题 Vscode icons Material Icon Theme 字体主题 推荐 One Dark Pro 其他 推荐一个生成好看代码的网址 https://carbon.now.sh/

智能小程序真机调试教程

概述 Tuya MiniApp Tools 真机调试通过网络连接实现 kit 插件调试功能,帮助开发者更好地排查定位问题。区别于模拟调试,真机调试将使用用户的真实环境。 功能 发起调试 在 Tuya MiniApp Tools 中登录并打开项目,单击上述图片红框内按钮后&…

【前沿技术杂谈:智能对话的未来】深入比较ChatGPT与文心一言

【前沿技术杂谈:智能对话的未来】深入比较ChatGPT与文心一言 引言主体智能回复语言准确性知识库丰富度 深入分析:ChatGPT与文心一言的技术对比技术架构和算法数据处理和隐私用户界面和体验 应用场景分析未来展望技术进步的趋势潜在的挑战对社会的影响 结…

【mars3d】 graphic.bindPopup(inthtml).openPopup()无需单击小车,即可在地图上自动激活弹窗的效果。

实现效果:new mars3d.graphic.FixedRoute({无需单击小车,即可在地图上实现默认打开弹窗的激活效果。↓↓↓↓↓↓↓↓ 相关链接说明: 1.popup的示例完全开源,可参考:功能示例(Vue版) | Mars3D三维可视化平台 | 火星科…

Python使用HTTP代理实现网络请求的调试和日志记录

在Python中,使用HTTP代理可以实现网络请求的调试和日志记录。通过HTTP代理,我们可以拦截、修改或记录网络请求和响应的数据,以便更好地了解和调试网络请求。 下面是一个使用Python和httplib2库实现HTTP代理的示例,同时对请求和响…

水经微图Web版1.5.0发布

让每一个人都有自己的地图! 水经微图(简称“微图”)新版已上线,在该版本中主要新增了撤销、重做、截图、视频气泡、绘制时捕捉节点和属性导出选择等功能。 现在,为你分享一下本轮迭代上新主要功能,以及部…

安卓Android studio读写EM4305卡源码

本示例使用的发卡器&#xff1a; https://item.taobao.com/item.htm?id718720660087&spma1z10.5-c.w4002-21818769070.15.57dc6f89txUhXE <?xml version"1.0" encoding"utf-8"?> <androidx.constraintlayout.widget.ConstraintLayout xml…

代码随想录算法训练营第九天|理论基础,232.用栈实现队列,225. 用队列实现栈

系列文章目录 代码随想录算法训练营第一天|数组理论基础&#xff0c;704. 二分查找&#xff0c;27. 移除元素 代码随想录算法训练营第二天|977.有序数组的平方 &#xff0c;209.长度最小的子数组 &#xff0c;59.螺旋矩阵II 代码随想录算法训练营第三天|链表理论基础&#xff…

React配置src根目录@

文章目录 1.打开webpack配置文件2.配置webpack 1.打开webpack配置文件 yarn eject or npm run eject 如果报错了记得提前 git commit一下 2.配置webpack 找到 webpack.config.js 文件在 webpack.config.js 文件中找到 alias 配置在alias里添加: path.resolve(src) , 或者 : pa…

提升开发效率的google插件

在如今的软件开发领域&#xff0c;Google Chrome浏览器的开发者插件扮演着至关重要的角色&#xff0c;为开发人员提供了丰富的工具和功能&#xff0c;从而提高了开发效率。下面介绍几款强大的 Google 插件&#xff0c;它们在不同方面为开发者提供了便利&#xff0c;并能显著提升…

MSVS C# Matlab的混合编程系列1 - 看似简单的问题引出

前言&#xff1a; 问题提出&#xff0c;如何把Matlab(本文简称MT)的算法集成到Visual Studio(本文简称VS)里面运行&#xff1f; 本文&#xff0c;通过编制一个MT中最简单的加法函数&#xff0c;我们把他做成 MSVS C#能够使用的动态库&#xff0c;说明了MSVS C# 和 MT集成的最…

下拉框联动控制,明细数据重复检查

1、明细数据重复检查针对下拉框的字段&#xff0c;在重新赋空值时没成功&#xff0c;被注释了。 2、下拉联动控制如图 价格类型&#xff1a;优惠价&#xff0c;门店价 与员工关系&#xff1a;本人&#xff0c;父母&#xff0c;儿女&#xff0c;兄弟姐妹 优惠类型&#xff1a…

精华推荐 |【深入浅出Sentinel源码】「源码探索专题」完整剖析Alibaba微服务架构体系之分布式系统的流量防卫兵的基本介绍(入门源码介绍)

整剖析Alibaba微服务架构体系之分布式系统的流量防卫兵的基本介绍 推荐资料Sentinel 是什么&#xff1f;Sentinel 具有以下特征: Maven的pom中配置main函数介绍总结说明自定义的rule加载规则 Sentinel的限流原理滑动时间窗口算法固定时间窗口算法普通的滑动窗口做法Sentinel的滑…

ReactNative中样式与布局的书写

样式 const styles StyleSheet.create({container: {flex: 1,justifyContent: center,alignItems: center,backgroundColor: #F5FCFF,}, welcome: {fontSize: 20, textAlign: center,margin: 10, }, instructions: {textAlign: center,color: #333333,marginBottom: 5,}, …

七省数据局密集挂牌,期待规范引领数据行业蓬勃发展

今年开年以来&#xff0c;新一轮机构改革逐步在省级层面落地&#xff1a;多个省级数据局纷纷挂牌&#xff0c;全国各省市数据要素化市场加速推动。 1月10日&#xff0c;江苏省数据局率先正式挂牌&#xff0c;这是2023年国家数据局正式揭牌后&#xff0c;第一个成立的省级数据局…