本期为TechBeat人工智能社区第521期线上Talk!
北京时间8月10日(周四)20:00,清华大学博士生—刘世隆的Talk已准时在TechBeat人工智能社区开播!
他与大家分享的主题是: “From Detection to Grounding-迈向更强的开集目标检测”,他分享了其在开集目标检测的探索并展示Grounding DINO的优异结果。
Talk·信息
▼
主题:From Detection to Grounding-迈向更强的开集目标检测
嘉宾:清华大学博士生 刘世隆
时间:北京时间 8月10日(周四)20:00
地点:TechBeat人工智能社区
http://www.techbeat.net/
点击下方链接,一键预约TALK!
Talk·介绍
▼
目标检测是计算机视觉的基础任务,但是传统的目标检测器只能处理固定类别,实现“检测一切”这一目标仍是一个有挑战性的内容。我们会分享我们在开集目标检测的探索,展示Grounding DINO的优异结果,这也许是当前最强的开集目标检测模型。
Talk大纲
1. 介绍和对比开放词表检测中的两个范式:Referring (CLIP-based)和Grounding。
2. 在Grounding方向的探索:Grounding DINO的模型设计思路和方案及其优异结果。
3. Grounding DINO和SAM结合带来的Grounded-SAM、组合开集模型的优异性能。
Talk·预习资料
▼
代码链接:
https://github.com/IDEA-Research/GroundingDINO
https://github.com/IDEA-Research/Grounded-Segment-Anything
Talk·提问交流
▼
在Talk界面下的【交流区】参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!
你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!
Talk·嘉宾介绍
▼
刘世隆
清华大学博士生
刘世隆,清华大学计算机系三年级博士生,导师为朱军教授,也长期在粤港澳大湾区数字经济研究院 (IDEA Research)接受张磊教授指导。他长期关注计算机视觉中的物体理解问题,主要研究方向包括检测分割以及开放场景下的理解问题。他的代表作包括DAB-DETR, DINO, Grounding DINO等。Google Scholar引用超过900,GitHub累计超过1.4万stars。
个人主页:
https://www.techbeat.net/grzytrkj?id=26396
关于TechBeat人工智能社区
▼
TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。
我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。
期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!
更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区