Attention最新进展

来自 | 知乎   作者|sisiyou

链接 | https://zhuanlan.zhihu.com/p/130388873

编辑 | 深度学习这件小事公众号

本文主要总结了最新的关于attention的应用文章。

Attention-based Dropout Layer for Weakly Supervised Object Localization(CVPR19)

任务:弱监督的物体定位:只给定图像类别的标签,要求定位出目标所在的区域。

动机:只给定物体类别的话,网络往往只关注最具有判别性的信息,无法挖掘到整个物体信息。能否设计一种drop操作,每次迭代时drop最具判别性的信息,强迫网络关注其他的区域?

做法:代替之前采用CAM得到特征的热力图**,模型使用(channel-wise pooling)直接生成热力图。**采用一个设定的阈值,得到一个drop mask。

Visual Attention Consistency under Image Transforms for Multi-Label Image Classification (CVPR19)

任务:多标签图像分类问题

动机:数据增广被广泛用于图像分类任务,但是数据增广存在缺陷。图像的一些变换(如旋转)应该是比较渐层能学习到的,但是在一般使用数据增广的策略中,都只是使用最后loss来对这种变换进行学习。能否对数据增广学到的特征图进行约束。

方法:采用两分支结构。输入原始图像I和转换后的图像T(I),利用CAM得到两个特征图的热力图,约束I的热力图经过T的转换后与T(I)的热力图相同。即图像数据增广后仍然关注同样部件的区域。

AttPool: Towards Hierarchical Feature Representation in Graph Convolutional Networks via Attention Mechanism (ICCV19)

任务:定义了一个graph pooling操作。

方法:对于一个有N个节点的图(N,D),首先预测每个节点的得分(N),然后选择前K个节点(K,D),对这K个节点利用全部的N个节点进行更新(GCN)。

问题:和之前的文章Self-Attention Graph Pooling思想和做法很像,加了一步更新操作。

Group-wise Deep Object Co-Segmentation with Co-Attention Recurrent Neural Network (ICCV19)

任务:图像组间的共有物体的定位。

做法:设计了类似GRU的单元,设定了更新门和重置门,不断的更新隐单元g,使其融入了所有图像的信息,然后返回来指导每个图像的预测生成。

End-to-End Multi-Task Learning with Attention

任务:多任务学习

动机:对于多任务学习,应该有任务共享的特征和任务特定的特征。对于任务共享的特征可以通过在所有任务上学习得到。那么如何得到任务特定的特征呢?

方法:对于每个任务学习一个attention,作为特征选择器,选择与该任务相关的特征。

See More, Know More: Unsupervised Video Object Segmentation with Co-Attention Siamese Networks (CVPR19)

任务:无监督的视频物体分割

做法:提出了一个co-attention模块,将相邻帧对齐,并将F1(F2)帧的信息整合到F2(F1)上。

问题:用在视频reID上,相邻帧进行对齐后,再进行特征整合。

Improving Referring Expression Grounding with Cross-modal Attention-guided Erasing (CVPR19)

任务:跨模态的检索。给定一个语句描述,检索出图像的那个框是与之对应的。

动机:图像与语句之中可能存在多个对应关系,但是现有方法往往会过多的关注最具有判别性的对应关系。能否有一种机制,迫使网络可以关注更多的对应关系。

做法:擦除最具有判别性的语句或者图像区域。

Cross-Modal Self-Attention Network for Referring Image Segmentation

任务:跨模态分割,给定一个语句描述,分割出图像对应的物体区域。

做法:设计了一个扩模态的self attention机制,即对于query,key, value融入了图像特征和语句特征。

Mask-Guided Attention Network for Occluded Pedestrian Detection (ICCV19)

任务:遮挡的行人检测

做法:遮挡会对行人检测的性能产生较大的影响。对于特征,生成一个空间mask,mask掉遮挡区域的特征。利用可见的bounding box监督mask的生成。

Looking for the Devil in the Details: Learning Trilinear Attention Sampling Network for Fine-grained Image Recognition (CVPR)

动机:如何自适应地并且无监督的定位出物体各个部件的区域。每个channel可以响应一个特定的物体,但是单个channel的噪声大。能否整合channel使其可以定位出目标物体

做法:利用self-attention的思想,加强每个channel的特征。X为(C,N) .此时每个channel可以看做一个空间注意力图,对应一个指定的部件。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/487674.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SQL Server 2012从零开始学pdf

下载地址:网盘下载内容介绍编辑《SQL Server 2012从零开始学》面向sql server 2012初学者,以及广大数据库设计爱好者。全书内容注重实用,涉及面广,通俗易懂地介绍了sql server 2012数据库应用与开发的相关基础知识,提供…

苹果html抓包,苹果被开发者“抓包”违反了自己定的规则

原标题:苹果被开发者“抓包”违反了自己定的规则【PConline资讯】消息:苹果在本周的发布会上推出了AppleNews订阅服务,虽然咱们是用不到,但这项服务最近b被开发者抓到了“小辫子”,因为它违反了苹果自己定的规则。根据…

前沿科技 | 中科院科学家在视觉学习行为的神经机制研究中取得进展

来源:中国科学院6月3日,《自然-通讯》(Nature Communications)期刊在线发表了题为《眶额叶皮层通过调节初级视皮层的反应增益促进视觉偶联学习》的研究论文,该研究由中国科学院科学家团队——脑科学与智能技术卓越创新…

Selenium-几种操作

元素定位之后就要对它进行操作了,常见的集中操作如下: click()  点击元素  eg.输入内容后,点击操作 send_keys("内容")  模拟按键输入  eg:百度输入框,输入内容 clear()  清除元素的内容  eg:清除百度输入框的内容 submit()  提交表单  eg:driver.fi…

桌面图标设计里的计算机是灰色的,小技巧教您如何将Windows 10上的桌面图标设置中的回收站为灰色!...

如果Windows10的桌面图标设置窗口中的回收站选项显示为灰色,则可以查看本逐步指南以解决问题。这将帮助您取回“桌面图标设置”面板中的“回收站”选项,以便您可以在桌面上显示或隐藏回收站。如果错误或任何恶意软件,广告软件等将其禁用&…

人工智能算法的可解释性方法研究

来源:数学与人工智能摘要以深度学习为代表的人工智能技术在信息领域的应用,极大地提高了信息的利用效率和挖掘价值,深刻的影响了各领域的业务形态,同时也引发了监管部门和用户对这一新技术运用中出现的 “算法黑箱”问题关切和疑虑…

asp:dropdownlist如何去掉三角箭头_一棵悬崖三角枫的培养过程

更多精彩,请点击上方思齐盆景关注!▲2010年4月上图是2010年春天购买的三角枫素材。这棵三角枫过渡流畅,曲度自然。入手后开始培养枝条。▲2012年3月转眼间两年过去了,枝条的培养略见成效。翻盆时打算按照上图的角度种植&#xff0…

征服用计算机弹法,征服WIN7

与Windows XP以及Vista系统相比,WIN7自上市以来便备受好评。速度更快的内核、更加时尚的外观、更强大的功能……一切都标志着微软视窗系统的又一次全新升级。如今,新购置电脑的朋友基本都已经用上了预装的WIN7,但面对功能如此强大的操作系统&…

表单项介绍

1 <!DOCTYPE html>2 <html>3 <head>4 <meta charset"UTF-8">5 <title></title>6 </head>7 <body>8 <!-- 9 表单的作用就是用来将用户信息提交给服务器的10 …

云联惠身份认证需要多长时间_欧盟REACH认证需要多长时间【周期、费用、有效期】...

一、欧盟reach认证REACH是欧盟关于化学品注册&#xff0c;评估&#xff0c;授权和限制的法规&#xff0c;它于2007年6月1日生效&#xff0c;并用一个系统取代了许多欧洲指令和法规。二、申请REACH认证需要多长时间一般情况下&#xff0c;申请REACH认证需要5个工作日&#xff0c…

Nature Neuroscience|群际冲突的脑间同步机制

本文来源&#xff1a;”认知神经科学与学习国家重点实验室”官网编辑&#xff1a;Yezi审阅&#xff1a;mingzlee7马燚娜课题组在《Nature Neuroscience》发表论文揭示群际冲突的脑间同步机制图片来源&#xff1a;《乌合之众——大众心理研究》插图个人一旦成为群体的一员&#…

计算机叫醒服务英语,关于酒店叫醒服务的英文口语

关于酒店叫醒服务的英文口语发布时间&#xff1a;2020-03-08春困秋乏夏打盹&#xff0c;睡不醒的冬三月……起床困难户小学妹今天要和大家聊聊使用酒店叫醒服务时会用到的实用口语。叫醒服务通常会用Morning call Service或是Wake-up call来表示&#xff0c;如果第二天有重要的…

一些常用的meta标签及其作用

声明文档使用的字符编码 <meta charsetutf-8>优先使用 IE 最新版本和 Chrome <meta http-equiv"X-UA-Compatible" content"IEedge,chrome1"/><meta name"wap-font-scale" content"no"> 页面描述 <meta name&q…

scala语言的底层是java实现的_2020了,每个程序员都该学习的 5 种开发语言

我曾在某处读到过&#xff08;可能在《代码大全》&#xff0c;但我不敢确定&#xff09;&#xff0c;程序员应该每年学习一门新的编程语言。但如果做不到&#xff0c;我建议&#xff0c;你至少学习以下 5 种开发语言&#xff0c;以便你在职业生涯有很好的表现。每个公司都喜爱精…

热议:大脑功能磁共振数据不可靠?杜克大学教授对自己15年的工作提出质疑...

来源&#xff1a;brainnews作者&#xff1a;brainnew创作团队杜克大学的研究人员对功能磁共振数据进行了重新测评&#xff0c;对自己15年的工作提出了质疑。脑部图像显示了不同的两天完成3个任务所对应的功能磁共振成像。图中&#xff0c;暖色显示一组人激活级别的一致性&#…

使用BUCK进行iOS项目打包

关于BUCK BUCK是Facebook开源的快速打包工具&#xff0c;可以用于多种语言及平台的项目打包&#xff0c;例如&#xff1a;C、C、Java、iOS、Android等等。用于大型的iOS、Android项目&#xff0c;可以显著提升打包效率。 关于BUCK介绍的一些链接如下&#xff1a; BUCK官网 What…

计算机excel表格相关考试视频,1189.5天通过职称计算机考试:Excel 2003中文电子表格(考点视频串讲+全真模拟).pdf...

<<5天通过职称计算机考试&#xff1a;Excel 2003中文电子表格(考点视频串讲&#xff0b;全真模拟)>>猛点这里下载全部内容目录&#xff1a;第1章 Excel应用基础考点1 Excel的启动与退出1&#xff0e;考点分析2&#xff0e;经典试题考点2 熟悉Excel窗口的操作1&…

cvc降噪和主动降噪_1MORE 主动降噪圈铁耳机图集

1MORE在今年推出了一款主动降噪耳机&#xff0c;这款耳机定价虽然稍高达到1299元&#xff0c;不过它还是相比其他主流价位的主动降噪耳机有很多的不同点。1MORE主动降噪耳机使用的似乎是高通蓝牙SoC的方案&#xff0c;使用了动铁动圈的扬声器组合。支持前馈反馈的双Mic主动降噪…

北师大计算机试题五答案,北京师范大学计算机软件及理论2022考研招生分析、参考书、真题等复习指导解析...

原标题&#xff1a;北京师范大学计算机软件及理论2022考研招生分析、参考书、真题等复习指导解析一、院系及专业介绍北京师范大学信息学科植根于学校百年沃土&#xff0c;经过半个多世纪的发展壮大&#xff0c;现已拥有计算机科学与技术一级学科博士后科研流动站和博士学位授权…

C++primer 13.6.2节练习

练习13.49 13.50 1 #include <iostream>2 #include <string>3 #include <utility>4 #include <memory>5 #include <algorithm>6 #include <vector>7 8 using namespace std;9 10 class String {11 friend ostream &print(ostream …