论文阅读——Painter

Images Speak in Images: A Generalist Painter for In-Context Visual Learning

GitHub - baaivision/Painter: Painter & SegGPT Series: Vision Foundation Models from BAAI

可以做什么:

输入和输出都是图片,并且不同人物输出的图片格式相同,输入输出图片格式都是H×W ×3,具体大概是原始label像素值重新定义在了三个通道上。语义分割部分如下:

原文:

训练时,输入是同一任务的两对图片concatenation,每对图片是原始图片和相应的任务输出图片,即GT。对于第二张图片即输出图片GT做了随机掩码,比例75%,重建遮挡的这部分,这部分训练时用一个可学习的向量代替被遮挡的patch。然后送入Vit-L,24blosks。从这些blocks中随机选4个特征图concatenation,送入一个三层的head(1x1卷积,3x3卷积,1个线性层)把每个patch还原为原来大小,16x16x3。

由于输入两对图片concatenation,所以计算量大,所以作者降低计算量的办法是输入图片和输出图片分别平行的送入模型,然后三个blocks后相对应的patch相加。节省一半计算开销。

损失函数smooth-l1

任务提示,作者给了两种基线办法:从训练集里面选好的,和生成一个可学习的。

其他实验结果:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/232623.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

券商期权手续费现在最低多少钱一张?怎么调低最方便

券商期权手续费是指您在证券公司开设期权账户并进行期权交易时,需要向券商支付的费用。券商期权手续费主要包括以下三个部分: 中国结算费用:这是中国证券登记结算有限责任公司向期权交易者收取的费用,固定为每张合约0.3元&#x…

智能优化算法应用:基于算术优化算法3D无线传感器网络(WSN)覆盖优化 - 附代码

智能优化算法应用:基于算术优化算法3D无线传感器网络(WSN)覆盖优化 - 附代码 文章目录 智能优化算法应用:基于算术优化算法3D无线传感器网络(WSN)覆盖优化 - 附代码1.无线传感网络节点模型2.覆盖数学模型及分析3.算术优化算法4.实验参数设定5.算法结果6.…

关于iframes的嵌套问题

1.检测iframes的嵌套方式一 if (self.frameElement && self.frameElement.tagName "IFRAME") {alert(‘在iframe中’); }2.检测iframes的嵌套方式二 if (window.frames.length ! parent.frames.length) {alert(‘在iframe中’); }3.检测iframes的嵌套方式…

Macbook 系统时间异常问题

现象 忘记充电,电量耗尽关机,开机后时间不对,开启自动对时,时间会变成上个月的一天,系统更新后问题依旧,每次出现问题都需要手动调整。 解决方法验证 删除 /var/db/timed/com.apple.timed.plist删除 /et…

【STM32入门】4.3旋转编码器计次

1.旋转编码器原理 旋转编码器旋转的时候A、B两个引脚会产生相位差90度的方波,这个地方要尤其注意: 1.方波的相位差决定了中断触发方式,是上升沿还是下降沿。 2.方波的相位差决定了判断逻辑。 逻辑: 1.A引脚的上升沿对应B引脚…

【转载】【Unity】WebSocket通信

1 前言 Unity客户端常用的与服务器通信的方式有socket、http、webSocket。本文主要实现一个简单的WebSocket通信案例,包含客户端、服务器,实现了两端的通信以及客户端向服务器发送关闭连接请求的功能。实现上没有使用Unity相关插件,使用的就是…

【QT】解决QTableView鼠标点击合并单元格高亮显示问题

问题 正常显示 鼠标单击时只会选中当前行 异常显示 解决方案 在操作之前清除单元格合并,然后再合并单元格; 合并单元格是好的,说明合并没有问题,所以最简单的办法就是将单元格的状态恢复到初始的时候,在进行操作&…

maven构建单个模块,遇到错误:Could not find the selected project in the reactor

mvn install -pl modulename -am -pl 参数用于指定要构建的子模块,可以通过指定子模块的 artifactId 或者模块路径来指定。在命令中使用 -pl my-submodule 表示只构建名为 my-submodule 的子模块。 -am 参数用于自动构建依赖的模块。如果当前构建的模块依赖于其他…

bottom-up-attention-vqa-master 成功复现!!!

代码地址 1、create_dictionary.py 建立词典和使用预训练的glove向量 (1)create_dictionary() 遍历每个question文件取出所关注的question部分,qs 遍历qs,对每个问题的文本内容进行分词,并将分词结果添加到字典中&…

LabVIEW开发自动驾驶的双目测距系统

LabVIEW开发自动驾驶的双目测距系统 随着车辆驾驶技术的不断发展,自动驾驶技术正日益成为现实。从L2级别的辅助驾驶技术到L3级别的受条件约束的自动驾驶技术,车辆安全性和智能化水平正在不断提升。在这个过程中,车辆主动安全预警系统发挥着关…

Ubuntu基础操作和使用指南

Ubuntu基础操作和使用指南 Ubuntu是一款流行的开源操作系统,广泛应用于个人电脑、服务器和云计算环境。本文将介绍Ubuntu的基础操作和使用,帮助读者更好地使用这个操作系统。 1. 安装和设置 首先,你需要安装Ubuntu。你可以从Ubuntu官方网站…

LDAP的介绍以及JAVA使用LdapTemplate来进行AD域的操作

一、概念介绍 1.1 LDAP LDAP(轻型目录访问协议)是一种用于访问和维护分布式目录服务的开放标准协议。LDAP最初是从X.500标准中派生出来的,但相比于X.500,LDAP更加简化和灵活。LDAP协议定义了客户端和服务器之间进行通信的规范&a…

WebMvcConfigurer接口详解及使用方式(Spring-WebMvc)

简介 如下图所示WebMvcConfigurer是spring-webmvc jar包下的一个接口,spring-webmvc jar包又来源于spring-boot-starter-web,所以要使用WebMvcConfigurer要引入spring-boot-starter-web依赖。WebMvcConfigurer接口提供了常用的web应用拦截方法。通过实现…

Lazada物流禁运规则是什么?Lazada物流禁运商品有哪些?——站斧浏览器

Lazada物流禁运规则 Lazada平台对物流禁运商品的规则主要有以下几个方面: 1.卖家在上传商品时需要填写正确的商品信息,包括商品名称、描述、图片等。如果卖家填写不准确或者存在虚假信息,将会导致物流禁运商品的误判。 2.卖家需要遵守平台…

HQX System Performance Troubleshooting Overview

Ensure your gvm config contain below ftrace configs: #导出config配置 adb root adb shell proc/config.gz#确认下列ftrace config是否开启,如果没有开启在代码中进行配置 CONFIG_TASKS_TRACE_RCUy CONFIG_TRACEPOINTSy CONFIG_STACKTRACE_SUPPORTy CONFIG_TRAC…

H5网页流媒体播放器EasyPlayer播放H.265录像时,无法倍速回放是什么原因?

流媒体播放器EasyPlayer是我们流媒体组件系列中关注度较高的产品,经过多年的发展和迭代,目前已经有多个应用版本,包括RTSP版、RTMP版、Pro版,以及js版,其中js版本作为网页播放器,受到了用户的广泛使用。在功…

Python自适应调整Excel的列宽度

使用python调整列宽度的逻辑需要自己写,这里是参考参考文章中的内容,使用openpyxl打开文件后,将列宽度根据列的内容进行指定,使用max(列的内容宽度 2) * 1.2来指定列宽 示例程序 假设有一个测试.xlsx的文件,使用如下…

Mac M系列安装配置VSCode

一、终端输入 安装command line tools xcode-select --install 这里是已经下载了 如果没有下载点击安装,等待安装完成即可 检验是否安装成功,终端输入 clang 如图所示是代表之前的command line tools安装 是安装成功的(Clang会不断更新…

spring boot版本升级遇到的一些问题

背景:由于项目需求,需要将nacos 1.4.6版本升级到2.x版本,由此引发的springboot、springcloud、springcloud Alibaba一系列版本变更。 旧版本分别为: Spring Boot 2.3.5.RELEASE Spring Cloud Hoxton.SR9 Spring Cloud Alibaba 2.2…