CVPR 2022 | 天大本科生论文入选!深度学习长尾分类新SOTA

58f5cf781017da136db2867a5f252364.png

文 | 丰色 发自 凹非寺
源 | 量子位(QbitAI)

本科生搞科研到底能做出什么成绩?

最新被CVPR 2022收录的一篇论文中,提供了一种新思路来解决深度学习中长尾分布数据的分类问题,最终实现了新SOTA。

fed2f8bc35e10258a03fd7b677bd92b7.png

论文:https://arxiv.org/abs/2111.09030

文章一共5位作者,有博士生,也有来自新加坡A*STAR的高级研究员……

而排在一作位置的,是一位来自天津大学的科生——李同学

厉害的是,这还不是这位“初生牛犊”的第一篇顶会论文,在此之前,他还中了一篇数据挖掘领域的顶会(WWW 2022),同样是一作。

7c5f117a8849e5509eb2d27bbd91b9b6.png

本科生搞科研,势头已经这么强了吗?

大三进实验室,大四就有2篇顶会在手

李同学来自天津大学智能与计算学部,今年大四

这篇CVPR文章,主要就是以新型集成(ensembling)学习策略来解决长尾分类的问题。

152d2ed2c05373c06cf06016f493b60c.png

长尾分布大家都知道,对于这些数据的分类则是深度学习中十分常见的一个应用。

它的难点主要是样本量极端不平衡尤其尾部样本量过少,难以获得有效的训练结果。

目前,基于集成学习的方法显示出巨大潜力,实现了SOTA性能。

但这种方法有两个局限性:

一是在failure-sensitive应用中的预测通常不可信,这对极容易出错的尾部数据的影响非常大;

二是它会为所有样本分配统一数量的资源(experts),这对于简单样本来说,造成了多余、过高的计算成本。

因此,李同学等人提出,通过引入不确定性集成,来实现对尾部类别样本的自动感知。

在此基础上,提出为尾部类别样本动态分配比头部样本更多的模型资源(experts),以兼顾性能与效率。

becaa3a71499a956744a1a4e6ac8eb8e.png
▲ 测试阶段使用哈佛提出的DS理论形成joint uncertainty

最终,所得模型实现了对尾部类别样本的自动化检测与训练调节,成为一个解决长尾分类问题的通用模型。

一系列分类、尾部检测、离群点检测和故障预测等任务的综合实验证明,该模型的性能成功打败现有的SOTA方法

a3acfa9ef149157632862b21997ce3d5.png

今年6月,李同学即将本科毕业,然后将直接以博士生的身份进入普渡大学学习,师从张教授。

张教授刚刚从康奈尔大学统计学博士毕业,在普渡大学担任助理教授,她的研究方向为机器学习和数据科学中概率模型的构建。

0a02e893ee9b83f1fb638b969c512182.png

他是在大三的时候,凭着优秀的学习成绩进入了学部的机器学习与数据挖掘实验室

4ebe94ca8cdd471458f0a1bda6f1124f.png

在导师张长青(天津大学博导)的带领下,李同学经过短短一年半的学习,就中标了两篇顶会论文。可以说后生可畏。

越来越多的本科生开始发顶会

不过要说起本科生搞科研,其实大家应该有所注意,很多学校对于这件事越来越开放和重视:

在大三或者更低年级时,就会开放一些名额让有潜力的学生进入实验室,和研究生、博士生一起搞科研。

比如清华“星火班”就招募大二学生,北大也鼓励学生从大二就开始开展科研项目,而像中科大等学校,对做出相应成绩的本科生还会给予专门的奖学金

在这样的情况下,已经有不少像李同学这样的学生,在本科期间就发表上顶会了,可谓光环满身。

比如我们熟悉的清华特奖得主、2016级本科生高天宇,大学四年期间就有四篇顶会在手:两篇AAAI、两篇EMNLP,还开过一个直播,专门传授起自己的科研经验。

771bd03bdf037e987fcae64f87de1aea.png

比如MIT本科生毛啸,大四中标计算机理论顶会FOCS 2021,并摘得最佳学生论文奖。

再比如清华电子系本科生刘泓,3篇一作顶会;北大本科生吴克文不仅发顶会(ACM计算理论年会STOC),还拿下最佳论文奖;以及电子科大本科生王谭也有1篇一作CVPR 2020、浙大本科生任意同样1篇一作ICML 2019……

类似的例子非常多。

可以说,本科生搞科研是越来越厉害了,大家觉得呢?

45696bcbb91cccce8011e99467780098.png

12979f3049bc2f95924858ee4e2aa853.png后台回复关键词【入群

加入卖萌屋NLP、CV与搜推广与求职讨论群

后台回复关键词【顶会

获取ACL、CIKM等各大顶会论文集!

01f494f0c9b706e7014a3ec001a1d870.gif 80f692a22a8cfc618015690233bcc726.png

[1]http://cic.tju.edu.cn/info/1040/3704.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/477515.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Spring Cloud构建微服务架构:Hystrix监控面板【Dalston版】

在上一篇《服务容错保护(hystrix断路器)》的介绍中,我们提到断路器是根据一段时间窗内的请求情况来判断并操作断路器的打开和关闭状态的。而这些请求情况的指标信息都是HystrixCommand和HystrixObservableCommand实例在执行过程中记录的重要度…

学术会议 | 欢迎注册参加第11届国际知识图谱联合会议

11th International Joint Conference On Knowledge Graphs(IJCKG 2022)IJCKG(International Joint Conference On Knowledge Graphs)会议之前是国际语义技术联合会议(the Joint International Semantic Technology Conference (JIST)),JIST …

LeetCode 396. 旋转函数(数学)

1. 题目 给定一个长度为 n 的整数数组 A 。 假设 Bk 是数组 A 顺时针旋转 k 个位置后的数组,我们定义 A 的“旋转函数” F 为: F(k) 0 * Bk[0] 1 * Bk[1] ... (n-1) * Bk[n-1]。计算F(0), F(1), …, F(n-1)中的最大值。 注意: 可以认为 n 的值小…

敬你一杯调参人生

文 | 不会的选C源 | LA PAUSE乐泊一杯上好的手冲咖啡也是作品,就像算法工程师调参已久的模型,建筑师终于定稿的一份设计,一首制作人编排已久的歌曲。从第一次喝到风味开始喝咖啡的人很多,有的喝速溶,有的追星巴克新品&…

Spring Cloud构建微服务架构:服务容错保护(Hystrix断路器)【Dalston版】

前言 在前两篇《Spring Cloud构建微服务架构:服务容错保护(Hystrix服务降级)》和《Spring Cloud构建微服务架构:服务容错保护(Hystrix依赖隔离)》中,我们对Hystrix提供的服务降级和依赖隔离有了…

LeetCode 934. 最短的桥(2次BFS)

1. 题目 在给定的二维二进制数组 A 中,存在两座岛。(岛是由四面相连的 1 形成的一个最大组。) 现在,我们可以将 0 变为 1,以使两座岛连接起来,变成一座岛。 返回必须翻转的 0 的最小数目。(可…

讲习班 | ISWC 2022 知识感知的零样本学习

前言近年来,深度学习技术依托强大的计算资源、复杂的神经网络和大规模的标注数据集在视觉、语言、医学、金融等广泛的研究领域取得了显著的成就。然而,在现实应用场景中,尤其是在开放世界的背景假设下,随时会有一些新的概念/对象出…

谷歌提出 RNN 版 Transformer,或为长文本建模的当前最优解

文 | 小轶今天给大家介绍一篇谷歌的最新工作,解决的是 Transformer 的长文本处理问题。在原生 Transformer 中,attention 的复杂度是输入序列长度的平方级别,因此限制了它处理长文本的能力。简单来说,本文提出的解决方案就是把 Tr…

Spring Cloud构建微服务架构:服务容错保护(Hystrix依赖隔离)【Dalston版】

前言 在上一篇《Spring Cloud构建微服务架构:服务容错保护(Hystrix服务降级)》中,我们已经体验了如何使用HystrixCommand来为一个依赖资源定义服务降级逻辑。实现方式非常简单,同时对于降级逻辑还能实现一些更加复杂的…

重点领域知识工程课程群虚拟教研室建设启动会暨第一次教学研讨会在线召开...

重点领域知识工程课程群虚拟教研室启动会暨第一次教学研讨会于2022年10月11日晚在线召开。重点领域教学资源建设项目管理办公室相关负责人、中国中文信息学会语言与知识计算专委会主任李涓子、天津大学智能与计算学部主任李克秋出席会议并致辞。天津大学人工智能学院院长胡清华…

LeetCode 556. 下一个更大元素 III

1. 题目 给定一个32位正整数 n,你需要找到最小的32位整数,其与 n 中存在的位数完全相同,并且其值大于n。如果不存在这样的32位整数,则返回-1。 示例 1: 输入: 12 输出: 21示例 2: 输入: 21 输出: -1来源:力扣&#x…

这可能是你与 AI 大神们近距离接触的唯一机会……

明人不说暗话:作为粤海街头放飞梦想的有志青年,他们可能是国内最大胆的「狗仔队」。从2016年成立至今,他们报道过:国内外数十场 AI 学术会议动态,写下老中青研究者们在会场前线的精神风采AI 领域的每一个最新研究突破&…

Spring Cloud构建微服务架构:服务容错保护(Hystrix服务降级)【Dalston版】

前言 在微服务架构中,我们将系统拆分成了一个个的服务单元,各单元应用间通过服务注册与订阅的方式互相依赖。由于每个单元都在不同的进程中运行,依赖通过远程调用的方式执行,这样就有可能因为网络原因或是依赖服务自身问题出现调…

论文浅尝 | 基于注意力图卷积神经网络的依存驱动关系抽取

笔记整理:王大壮论文链接:https://aclanthology.org/2021.acl-long.344.pdf动机句法信息,特别是依存树,已经被广泛应用于关系提取,以更好地分析与给定实体相关联的上下文信息。然而大多数现有的研究都饱受依赖树噪声的影响,特别是当它们自动生…

别再龟速炼丹了!聊聊怎样科学提升训练效率

文 | Horace He等编 | Juniper源 | 机器之心深度学习是门玄学?也不完全是。每个人都想让模型训练得更快,但是你真的找对方法了吗?在康奈尔大学本科生、曾在 PyTorch 团队实习的 Horace He 看来,这个问题应该分几步解决&#xff1a…

LeetCode 第 17 场双周赛(469/897,前52.3%)

文章目录1. 比赛结果2. 题目LeetCode 5143. 解压缩编码列表 easyLeetCode 5144. 矩阵区域和 mediumLeetCode 5145. 祖父节点值为偶数的节点和 mediumLeetCode 5146. 不同的循环子字符串 hard1. 比赛结果 做出来了1, 3两题,第2题在比赛结束后10分钟提交通过。 2.…

Spring Cloud构建微服务架构:分布式配置中心【Dalston版】

Spring Cloud Config是Spring Cloud团队创建的一个全新项目,用来为分布式系统中的基础设施和微服务应用提供集中化的外部配置支持,它分为服务端与客户端两个部分。其中服务端也称为分布式配置中心,它是一个独立的微服务应用,用来连…

图谱实战 | 知识图谱在美团搜索酒旅场景认知中的应用

分享嘉宾:陈骐 美团 高级算法专家编辑整理:毛佳豪 中国平安浙江分公司(实习)出品平台:DataFunTalk导读:知识图谱凭借能够以图模型描述知识和世界万物关联关系的特性,在各行业领域大放异彩。与此同时,知识图…

AI技术在空气净化机器人中的高能应用

本文转载自公众号“夕小瑶的卖萌屋”,专业带逛互联网算法圈的神操作 -----》我是传送门 关注后,回复以下口令: 回复【789】 :领取深度学习全栈手册(含NLP、CV海量综述、必刷论文解读) 回复【入群】&#xf…

Spring Cloud构建微服务架构:服务消费(Feign)【Dalston版】

通过前两篇《Spring Cloud构建微服务架构:服务消费(基础)》和《Spring Cloud构建微服务架构:服务消费(Ribbon)》,我们已经学会了在Spring Cloud中基本的服务调用方式。本文我们将继续介绍Spring…