Vision Transformer

Vision Transformer

news/2025/7/12 5:19:01/文章来源:https://blog.csdn.net/weixin_45662399/article/details/134776247

Vision Transformer详解-CSDN博客

视频：11.1 Vision Transformer(vit)网络详解_哔哩哔哩_bilibili

Vision Transformer学习笔记_linear projection of flattened patches-CSDN博客

一、embedding 层

对于标准的Transformer模块，要求输入的是token (向量）序列，即二维矩阵[num_token,token_dim]；

在代码实现中，直接通过一个卷积层来实现以ViT一 B/16为例，使用卷积核大小为16x16,stride为16, 卷积核个数为768；

[224, 224, 3] -> [14, 14, 768] -> [196, 768]

在输入Transformer Encoder之前需要加上[class]token 以及Position Embedding,都是可训练参数

拼接[class]token: Cat([1,768],[196,768])->[197,768]
叠加Position Embedding: [197,768]->[197,768]

在这里我画了一个图来解释一下整体过程：

二、Encoder层

主要完成机制就是多头注意力机制。

三、 MLP Head层

把class token从最终结果[197,768]中切片拿出来，对其进行linear全连接（简单理解），如果需要类别概率的话，可以再接一个softmax

借用我导的图片来总结一下

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/195671.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

win10使用copilot（尝试中）

win10使用copilot（尝试中）

一、 Microsoft account | Sign In or Create Your Account Today – Microsoft 一路next全部点好【1】二、查看当前win10的版本，cmd输入命令winver 三、修改区域为美国四、更新和安全 Reference 【1】完美｜在 Win10 强行开启 Win11 的独有功能…

阅读更多...

蓝桥杯每日一题2023.12.4

蓝桥杯每日一题2023.12.4

题目描述竞赛中心 - 蓝桥云课 (lanqiao.cn) 题目分析本题使用树型DP，蓝桥杯官网出现了一个点的错误，但实际答案是正确的状态表示：f[u]：在以u为根的子树中包含u的所有联通块的权值的最大值假设s1，s2,…sk 是u的…

阅读更多...

用javascript点击展开和关闭

用javascript点击展开和关闭

首先，我们需要创建一个HTML页面。在这个页面中，我们将添加一个包含内容的DIV元素，以及一个可以展开和关闭内容的按钮。代码如下： JavaScript点击展开和关闭点击展开/关闭我是一个可以展开和关闭的内容。接下来，我们…

阅读更多...

腾讯云双十二优惠活动有哪些?详细攻略来了!

腾讯云双十二优惠活动有哪些?详细攻略来了!

腾讯云作为全球领先的云计算服务提供商，一直在为各行各业的用户提供优质、高效、稳定的云计算服务。双十二即将来临，腾讯云也为大家准备了一系列丰富多彩的优惠活动。那么，这些优惠活动究竟有哪些？详细攻略在此，一起来…

阅读更多...

【Spring之事务底层源码解析，持续更新中~~~】

【Spring之事务底层源码解析，持续更新中~~~】

文章目录一、EnableTransactionManagement工作原理二、Spring事务基本执行原理三、Spring事务传播机制与分类四、Spring事务强制回滚五、TransactionSynchronization六、Spring事务详细执行流程一、EnableTransactionManagement工作原理开启Spring事务本质上就是增加了一个…

阅读更多...

jsp高校教师调课管理系统Myeclipse开发mysql数据库web结构java编程计算机网页项目

jsp高校教师调课管理系统Myeclipse开发mysql数据库web结构java编程计算机网页项目

一、源码特点 JSP 高校教师调课管理系统是一套完善的java web信息管理系统，对理解JSP java编程开发语言有帮助，系统具有完整的源代码和数据库，系统主要采用B/S模式开发。开发环境为 TOMCAT7.0,Myeclipse8.5开发，数据库为Mysq…

阅读更多...

洗浴按摩店服务预约管理系统会员小程序效果如何

洗浴按摩店服务预约管理系统会员小程序效果如何

洗浴按摩是线下服务需求度较高的行业，如今互联网趋势下，传统线下实体店面临多重经营痛点，需要商家转而线上管理及赋能客户消费、完善订单流程，多平台宣传让目标客户触达。接下来让我们看看通过【雨科】平台搭建洗浴按摩店管理系…

阅读更多...

【云原生之Docker实战】Docker环境下部署WPS Office网页版

【云原生之Docker实战】Docker环境下部署WPS Office网页版

【云原生之Docker实战】Docker环境下部署WPS Office网页版一、WPS Office网页版介绍1.1 WPS Office网页版简介1.2 WPS Office网页版特点二、本地环境介绍2.1 本地环境规划2.2 本次实践介绍三、本地环境检查3.1 检查Docker服务状态3.2 检查Docker版本3.3 检查docker compose 版…

阅读更多...

22款奔驰GLE450升级香氛负离子车载香薰功能

22款奔驰GLE450升级香氛负离子车载香薰功能

相信大家都知道，奔驰自从研发出香氛负离子系统后，一直都受广大奔驰车主的追捧，香氛负离子不仅可以散发出清香淡雅的香气外，还可以对车内的空气进行过滤，使车内的有害气味通过负离子进行过滤，达到车内保持清…

阅读更多...

【C#】读取ini配置文件的内容

【C#】读取ini配置文件的内容

一、编写ini配置文件 ini文件时初始化文件，通常是系统配置文件所采用的存储格式。ini文件有自己的固定格式，是由若干个“节”（section）组成，每个节由若干个“键”（key）组成，每个key…

阅读更多...

独孤思维：赚钱是马拉松长跑，中途放弃的都是穷b

独孤思维：赚钱是马拉松长跑，中途放弃的都是穷b

赚钱就是一场永不停歇的马拉松长跑，中途放弃的都是穷b。百分之百。如果把你的一生设定为万里长跑。开始100米是出身，家庭。中间100米是上学，上班。后9万9千800米是你自己。什么意思？ 出身和家庭，不是由你…

阅读更多...

HttpSession的创建及使用

HttpSession的创建及使用

1.HttpSession对象的特点 HttpSession保存在服务器 HttpSession使用Key与Value结构存储数据 HttpSession的Key是字符串类型，Value则是Object类型 HttpSession存储数据大小无限制 2.HttpSession对象的创建 HttpSession对象的创建是通过request.getSession()方法来创建…

阅读更多...

$$‘\r‘: command not found的解决方法$

$‘\r‘: command not found的解决方法

在Linux系统中，运行Shell脚本，出现了如下错误： one-more.sh: line 1: $\r: command not found出现这样的错误，是因为Shell脚本在Windows系统编写时，每行结尾是\r\n，而在Linux系统中行每行结尾是\n&#xf…

阅读更多...

37、红外遥控红外遥控电机调速

37、红外遥控红外遥控电机调速

红外遥控 main.c #include <REGX52.H> #include "Delay.h" #include "LCD1602.h" #include "IR.h"unsigned char Num; unsigned char Address; unsigned char Command;void main() {LCD_Init();LCD_ShowString(1,1,"ADDR CMD NUM…

阅读更多...

【cmake】获取到某个目录下的所有子目录名

【cmake】获取到某个目录下的所有子目录名

整体工程目录结构如下。现打算获取到vac目录下的所有子目录名。 cmake 实现如下: # 设定要遍历的目录，保存到 VAC_INCLUDE_DIR 变量 set(VAC_INCLUDE_DIR ${CMAKE_SOURCE_DIR}/vac)# 获取到当前目录下的所有文件和目录（以相对路径的方式）&a…

阅读更多...

【源码篇】基于SpringBoot+thymeleaf实现的蓝天幼儿园管理系统

【源码篇】基于SpringBoot+thymeleaf实现的蓝天幼儿园管理系统

基于SpringBootthymeleaf实现的蓝天幼儿园管理系统文章目录系统说明技术选型成果展示账号地址及其他说明系统说明基于SpringBootthymeleaf实现的蓝天幼儿园管理系统是为幼儿园提供的一套管理平台，可以提高幼儿园信息管理的准确性，系统将信息准确无误…

阅读更多...

Linux C语言 38-进程间通信IPC之信号

Linux C语言 38-进程间通信IPC之信号

Linux C语言 38-进程间通信IPC之信号本节关键字：C语言进程间通信信号量 semaphore 相关库函数：sem_init、sem_post、sem_wait、sem_destroy 提示：先做内容框架梳理，后期进行完善补充！ 什么是信号量？ …

阅读更多...

idea保存时自动删除不用的import

idea保存时自动删除不用的import

1、File->setting 2、Editor->General->Auto Import 按照操作，即可实现！！！！！！！

阅读更多...

中国证券交易所有哪些

中国证券交易所有哪些

中国一共有五个证券交易所，分别是： 1、上海证券交易所。上海证券交易所，简称为上交所。 ①成立时间：上交所成立于1990年11月26日，同年12月19日开业。 ②规模：截至2020年末，沪市上市公司家数…

阅读更多...

2023年年末Java面试题

2023年年末Java面试题

1、JDK 和 JRE 有什么区别？ JDK（Java Development Kit），Java开发工具包 JRE（Java Runtime Environment），Java运行环境 JDK中包含JRE，JDK中有一个名为jre的目录，里面包含两…

阅读更多...

最新文章