Talk | 南洋理工大学博士后研究员李祥泰:基于Transformer的视觉分割模型总结、回顾与展望

图片

本期为TechBeat人工智能社区517线上Talk!

北京时间7月27(周四)20:00南洋理工大学博士后研究员—李祥泰的Talk已经准时在TechBeat人工智能社区开播了!

他与大家分享的主题是: 基于Transformer的视觉分割模型总结、回顾与展望,系统性地回顾与总结了Transformer模型。

Talk·信息

主题:基于Transformer的视觉分割模型总结、回顾与展望

嘉宾:南洋理工大学博士后研究员 李祥泰

时间:北京时间 7月27日(周四)20:00

地点:TechBeat人工智能社区

http://www.techbeat.net/

 点击下方链接,一键预约TALK!

TechBeatTechBeat是荟聚全球华人AI精英的成长社区,每周上新来自顶尖大厂、明星创业公司、国际顶级高校相关专业在读博士的最新研究工作。我们希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。https://www.techbeat.net/talk-info?id=794

Talk·介绍

分割是一个基础性质的视觉任务,其目标是把输入的图像,视频,点云等划分成为带有语义性质的区域块。作为一个重要的场景理解任务,分割任务有着广泛的应用价值,包括自动驾驶,机器人导航,短视频分析。

在深度学习时代,分割领域采用以卷积神经网络为基础的全卷积网络,在各个子方向上取得了突破性的进展。近期,以Transformer为基础的一些方法在NLP以及CV领域各个方向上也取得了突破性的进展。相比于CNN模型,Transformer模型结构上更灵活,更适用于多模态,多任务的输入。

在分割与检测领域,基于Transformer的模型在各个基准上也取得了领先的效果。自从ViT和DETR出现后,在各个子方向上,最新的研究方法均建立在Transformer为骨干网络和解码器的基础框架上。鉴于目前这个领域近期快速进展,我们课题组对整个领域做了系统性地回顾与总结。整个Survey的内容包括基础知识与任务设置介绍,Transformer的基础内容介绍,CNN分割模型的系统性回顾,基于Transformer的分割模型回顾,相关基准数据集的评估与测试,以及未来可行的研究方向探索。

Talk大纲

1、近期3-4年内常见的分割方法系统回顾与探索。

2、基于Transformer 的分割与检测方法的系统性回顾,包含图像,视频,点云三个不同的领域。

3、本研究组以及近期相关研究组的Transformer-based Segmentation/Detection 方法的研究。

4、近期与分割大模型相关的研究回顾。

Talk·预习资料

图片

论文链接:

https://arxiv.org/abs/2304.09854

repo:

https://github.com/lxtGH/Awesome-Segmentation-With-Transformer

Talk·提问交流

在Talk界面下的【交流区】参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

图片

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

Talk·嘉宾介绍

图片

李祥泰

南洋理工大学博士后研究员

南洋理工大学S-lab博士后研究员,博士毕业于北京大学,研究方向包括计算机视觉和机器学习,图像视频分割与检测,多模态场景理解等。曾以第一作者身份在CVPR,ECCV,ICCV,PAMI顶级会议以及期刊上发表一些相关研究。

个人主页: 

https://www.techbeat.net/grzytrkj?id=6355


关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/10998.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C#多线程

C#多线程 C#多线程是C#学习中必不可少的知识,在实际开发中也能有效的提升用户体验,和程序性能。 文章目录 C#多线程前言一、什么是线程、什么是进程、什么是协程?协程优点缺点 线程优点缺点: 进程优点缺点: 二、C# 中…

使用Spring Boot实现Redis键过期回调功能

使用Spring Boot实现Redis键过期回调功能 当使用Redis作为缓存或数据存储的时候,有时候需要在键过期时执行一些特定的操作,比如清除相关数据或发送通知。在Spring Boot中,可以通过实现RedisMessageListener接口来实现Redis键过期回调功能。下…

基于“RWEQ+”集成技术在土壤风蚀模拟与风蚀模数估算、变化归因分析中的实践应用及SCI论文撰写

查看原文>>>基于“RWEQ”集成技术在土壤风蚀模拟与风蚀模数估算、变化归因分析中的实践应用及SCI论文撰写 土壤风蚀是一个全球性的环境问题。中国是世界上受土壤风蚀危害最严重的国家之一,土壤风蚀是中国干旱、半干旱及部分湿润地区土地荒漠化的首要过程。…

B2B企业如何选择CRM系统?

CRM软件的优势在于简化业务流程,实现企业的降本增效。越来越多的B2B企业通过CRM为业务赋能,B2B企业如何快速找到适合公司业务的CRM系统?总的来说就是根据企业自身业务而量身打造的一套系统。 1.整理业务需求 B2B企业首先要考虑是业务痛点&a…

MySQL绿色安装和配置

1、 从地址http://dev.mysql.com/downloads/mysql/中选择windows的版本下载。 2、 mysql各个版本的简介 (1) MySQL Community Server 社区版本,开源免费,但不提供官方技术支持。 (2) MySQL Enterprise Ed…

Spring MVC

一、什么是MVC MVC就是一种思想,而Spring MVC是对MVC思想的具体实现 MVC是Model View Controller的所缩写,是一种软件架构模式,它将软件系统Fenwick墨香,视图和控制器三个基本部分。 Model:是应用程序中用于处理应用…

对各种项目梳理Maven、SpringBoot等介绍

对于maven 项目 首先结束pom.xm依赖库 https://www.cnblogs.com/zhangweizhong/p/13582903.html plugin插件 maven项目中pom.xml的build中的plugin你真的了解过吗?都是干货_pom 中plugin_is me monday的博客-CSDN博客

7.27 Qt

制作简易小闹钟 Timer.pro QT core gui texttospeechgreaterThan(QT_MAJOR_VERSION, 4): QT widgetsCONFIG c11# The following define makes your compiler emit warnings if you use # any Qt feature that has been marked deprecated (the exact warnings # dep…

网站SEO优化:提升搜索排名与流量引爆

导言: 在互联网时代,网站SEO(搜索引擎优化)是提高网站搜索排名、吸引流量、增加曝光的重要策略。通过优化网站结构、内容和链接等方面,让搜索引擎更好地理解和收录网站内容,从而为网站带来更多有价值的有机…

Cisco 路由器配置管理

大多数网络中断的最常见原因是错误的配置更改。对网络设备配置的每一次更改都伴随着造成网络中断、安全问题甚至性能下降的风险。计划外更改使网络容易受到意外中断的影响。 Network Configuration Manager 网络更改和配置管理 (NCCM)解决方案&#xff…

「JVM」性能调优工具

「JVM」性能调优工具 一、jcmd1、jcmd 能干嘛?2、与JVM相关的命令3、示例 二、jmap1、jmap有什么用?2、jmap的命令大全3、示例 三、jps1、jps有什么用?2、jps命令以及示例 四、jstat1、jstat有什么用?2、jstat命令以及示例 五、js…

Python(四十五)二层循环中的break和continue

❤️ 专栏简介:本专栏记录了我个人从零开始学习Python编程的过程。在这个专栏中,我将分享我在学习Python的过程中的学习笔记、学习路线以及各个知识点。 ☀️ 专栏适用人群 :本专栏适用于希望学习Python编程的初学者和有一定编程基础的人。无…

剑指Offer-学习计划(四)双指针(下)

剑指 Offer 57. 和为s的两个数字 剑指 Offer 58 - I. 翻转单词顺序 剑指 Offer 21. 调整数组顺序使奇数位于偶数前面 题目一:调整数组顺序使奇数位于偶数前面 输入一个整数数组,实现一个函数来调整该数组中数字的顺序,使得所有奇数在数组的…

WPF实战学习笔记08-创建数据库

创建数据库 创建文件夹 ./Context 创建文件 ./Context/BaseEnity.cs ./Context/Memo.cs ./Context/MyTodoContext.cs ./Context/Todo.cs ./Context/User.cs 创建数据对象 ./Context/BaseEnity.cs namespace MyToDo.Api.Context {public class BaseEnity{public int Id…

C#之泛型

目录 一、概述 二、C#中的泛型 继续栈的示例 三、泛型类 (一)声明泛型类 (二)创建构造类型 (三)创建变量和实例 (四)比较泛型和非泛型栈 四、类型参数的约束 (一…

elementUI --- el-select 下拉框 日历 级联选择

element UI 组件库中的 select 选择器 中下拉列表的样式,在页面渲染的时候,总是渲染为仅次于body级别的div ,这样子覆盖样子会影响全局其他的select选择器下拉框样式,试图通过给el-select加父标签来覆盖,然而并没有卵用…

【FAQ】关于无法判断和区分用户与地图交互手势类型的解决办法

一. 问题描述 当用户通过缩放手势、平移手势、倾斜手势和旋转手势与地图交互,控制地图移动改变其可见区域时,华为地图SDK没有提供直接获取用户手势类型的API。 二. 解决方案 华为地图SDK的地图相机有提供CameraPosition类&…

Linux 之 Vi 编辑器

文章目录 1. vi/vim介绍2. vi/vim使用详解2.1 vi/vim的特点2.2 vi/vim三种编辑模式2.3 文本编辑方式 1. vi/vim介绍 vi编辑器是linux和unix上最基本的文本编辑器,工作在字符模式下。由于不需要图形界面,vi是效率很高的文本编辑器。尽管在linux上也有很多…

手机视频聊天分享

在人际互动的手机APP中,增加语音视频聊天功能是一个常见的需求。而现在,更进一步,在某些场景下,我们需要能将自己的手机屏幕分享给他人,或者是观看他人的手机屏幕。那么,这些常见的功能是如何实现的了&…

哈希表及其模拟实现

文章目录 一、解决哈希冲突1.1闭散列1.1.1线性探测1.1.2二次探测 1.2开散列 二、模拟实现哈希表三、HashMap源码的一些相关内容 哈希(散列)方法:构造一种存储结构,通过某种函数使元素的存储位置与它的关键码之间能够建立 一 一 映…