Vision Transformer

Vision Transformer详解-CSDN博客

 视频:11.1 Vision Transformer(vit)网络详解_哔哩哔哩_bilibili

Vision Transformer学习笔记_linear projection of flattened patches-CSDN博客

一、embedding 层 

 对于标准的Transformer模块,要求输入的是token (向量)序列,即二维矩阵[num_token,token_dim];

在代码实现中,直接通过一个卷积层来实现以ViT一 B/16为例,使用卷积核大小为16x16,stride为16, 卷积核个数为768;

  • [224, 224, 3] -> [14, 14, 768] -> [196, 768]

在输入Transformer Encoder之前需要加上[class]token 以及Position Embedding,都是可训练参数

  • 拼接[class]token: Cat([1,768],[196,768])->[197,768]
  • 叠加Position Embedding: [197,768]->[197,768]

在这里我画了一个图来解释一下整体过程: 

二、Encoder层

主要完成机制就是多头注意力机制

三、 MLP Head层

 把class token从最终结果[197,768]中切片拿出来,对其进行linear全连接(简单理解),如果需要类别概率的话,可以再接一个softmax

借用我导的图片来总结一下 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/195671.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

win10使用copilot(尝试中)

一、 Microsoft account | Sign In or Create Your Account Today – Microsoft 一路next全部点好【1】 二、 查看当前win10的版本,cmd输入命令winver 三、 修改区域为美国 四、更新和安全 Reference 【1】完美|在 Win10 强行开启 Win11 的独有功能…

蓝桥杯每日一题2023.12.4

题目描述 竞赛中心 - 蓝桥云课 (lanqiao.cn) 题目分析 本题使用树型DP,蓝桥杯官网出现了一个点的错误,但实际答案是正确的 状态表示:f[u]:在以u为根的子树中包含u的所有联通块的权值的最大值 假设s1,s2,…sk 是u的…

用javascript点击展开和关闭

首先,我们需要创建一个HTML页面。在这个页面中,我们将添加一个包含内容的DIV元素,以及一个可以展开和关闭内容的按钮。代码如下: JavaScript点击展开和关闭 点击展开/关闭 我是一个可以展开和关闭的内容。 接下来,我们…

腾讯云双十二优惠活动有哪些?详细攻略来了!

腾讯云作为全球领先的云计算服务提供商,一直在为各行各业的用户提供优质、高效、稳定的云计算服务。双十二即将来临,腾讯云也为大家准备了一系列丰富多彩的优惠活动。那么,这些优惠活动究竟有哪些?详细攻略在此,一起来…

【Spring之事务底层源码解析,持续更新中~~~】

文章目录 一、EnableTransactionManagement工作原理二、Spring事务基本执行原理三、Spring事务传播机制与分类四、Spring事务强制回滚五、TransactionSynchronization六、Spring事务详细执行流程 一、EnableTransactionManagement工作原理 开启Spring事务本质上就是增加了一个…

jsp高校教师调课管理系统Myeclipse开发mysql数据库web结构java编程计算机网页项目

一、源码特点 JSP 高校教师调课管理系统是一套完善的java web信息管理系统,对理解JSP java编程开发语言有帮助,系统具有完整的源代码和数据库,系统主要采用B/S模式开发。开发环境为 TOMCAT7.0,Myeclipse8.5开发,数据库为Mysq…

洗浴按摩店服务预约管理系统会员小程序效果如何

洗浴按摩是线下服务需求度较高的行业,如今互联网趋势下,传统线下实体店面临多重经营痛点,需要商家转而线上管理及赋能客户消费、完善订单流程,多平台宣传让目标客户触达。 接下来让我们看看通过【雨科】平台搭建洗浴按摩店管理系…

【云原生之Docker实战】Docker环境下部署WPS Office网页版

【云原生之Docker实战】Docker环境下部署WPS Office网页版 一、WPS Office网页版介绍1.1 WPS Office网页版简介1.2 WPS Office网页版特点二、本地环境介绍2.1 本地环境规划2.2 本次实践介绍三、本地环境检查3.1 检查Docker服务状态3.2 检查Docker版本3.3 检查docker compose 版…

22款奔驰GLE450升级香氛负离子 车载香薰功能

相信大家都知道,奔驰自从研发出香氛负离子系统后,一直都受广大奔驰车主的追捧,香氛负离子不仅可以散发出清香淡雅的香气外,还可以对车内的空气进行过滤,使车内的有害气味通过负离子进行过滤,达到车内保持清…

【C#】读取ini配置文件的内容

一、编写ini配置文件 ini文件时初始化文件,通常是系统配置文件所采用的存储格式。ini文件有自己的固定格式,是由若干个“节”(section)组成,每个节由若干个“键”(key)组成,每个key…

独孤思维:赚钱是马拉松长跑,中途放弃的都是穷b

赚钱就是一场永不停歇的马拉松长跑,中途放弃的都是穷b。 百分之百。 如果把你的一生设定为万里长跑。 开始100米是出身,家庭。 中间100米是上学,上班。 后9万9千800米是你自己。 什么意思? 出身和家庭,不是由你…

HttpSession的创建及使用

1.HttpSession对象的特点 HttpSession保存在服务器 HttpSession使用Key与Value结构存储数据 HttpSession的Key是字符串类型,Value则是Object类型 HttpSession存储数据大小无限制 2.HttpSession对象的创建 HttpSession对象的创建是通过request.getSession()方法来创建…

$‘\r‘: command not found的解决方法

在Linux系统中,运行Shell脚本,出现了如下错误: one-more.sh: line 1: $\r: command not found出现这样的错误,是因为Shell脚本在Windows系统编写时,每行结尾是\r\n,而在Linux系统中行每行结尾是\n&#xf…

37、红外遥控红外遥控电机调速

红外遥控 main.c #include <REGX52.H> #include "Delay.h" #include "LCD1602.h" #include "IR.h"unsigned char Num; unsigned char Address; unsigned char Command;void main() {LCD_Init();LCD_ShowString(1,1,"ADDR CMD NUM…

【cmake】获取到某个目录下的所有子目录名

整体工程目录结构如下。现打算获取到vac目录下的所有子目录名。 cmake 实现如下: # 设定要遍历的目录&#xff0c;保存到 VAC_INCLUDE_DIR 变量 set(VAC_INCLUDE_DIR ${CMAKE_SOURCE_DIR}/vac)# 获取到当前目录下的所有文件和目录&#xff08;以相对路径的方式&#xff09;&a…

【源码篇】基于SpringBoot+thymeleaf实现的蓝天幼儿园管理系统

基于SpringBootthymeleaf实现的蓝天幼儿园管理系统 文章目录 系统说明技术选型成果展示账号地址及其他说明 系统说明 基于SpringBootthymeleaf实现的蓝天幼儿园管理系统是为幼儿园提供的一套管理平台&#xff0c;可以提高幼儿园信息管理的准确性&#xff0c;系统将信息准确无误…

Linux C语言 38-进程间通信IPC之信号

Linux C语言 38-进程间通信IPC之信号 本节关键字&#xff1a;C语言 进程间通信 信号量 semaphore 相关库函数&#xff1a;sem_init、sem_post、sem_wait、sem_destroy 提示&#xff1a;先做内容框架梳理&#xff0c;后期进行完善补充&#xff01; 什么是信号量&#xff1f; …

idea保存时自动删除不用的import

1、File->setting 2、Editor->General->Auto Import 按照操作&#xff0c;即可实现&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;&#xff01;

中国证券交易所有哪些

中国一共有五个证券交易所&#xff0c;分别是&#xff1a; 1、上海证券交易所。 上海证券交易所&#xff0c;简称为上交所。 ①成立时间&#xff1a;上交所成立于1990年11月26日&#xff0c;同年12月19日开业。 ②规模&#xff1a;截至2020年末&#xff0c;沪市上市公司家数…

2023年年末Java面试题

1、JDK 和 JRE 有什么区别&#xff1f; JDK&#xff08;Java Development Kit&#xff09;&#xff0c;Java开发工具包 JRE&#xff08;Java Runtime Environment&#xff09;&#xff0c;Java运行环境 JDK中包含JRE&#xff0c;JDK中有一个名为jre的目录&#xff0c;里面包含两…