Transformer - Self-Attention层的复杂度的计算

Transformer - Self-Attention层的复杂度的计算

flyfish

矩阵的维度

下面矩阵的维度是3×2即 3行,2列
6,10等都是矩阵里的元素
在这里插入图片描述
如果矩阵A的列数与矩阵B的行数相同,那么这两个矩阵可以相乘。即,若A是一个m×n矩阵,B是一个n×p矩阵,则它们的乘积C会是一个m×p矩阵。
中间相等,留两边。

在这里插入图片描述

两个矩阵相乘的复杂度是 O(m×p×n)

在这里插入图片描述

  1. 乘法操作的数量:
    对于C中的每个元素c[i][j],需要计算A的第i行与B的第j列对应元素的乘积之和,即求和m次乘法。因为C是一个m×p的矩阵,所以总共有m×p个这样的元素,因此总共需要做m×p×n次乘法操作。

  2. 加法操作的数量:在计算每个c[i][j]时,除了乘法外,还需要进行n-1次加法操作(首次乘积直接赋值,之后每次乘积与累加和相加)。因此,总的加法操作次数也是m×p×(n-1)。

基本矩阵乘法的总操作数是乘法和加法操作次数之和,即大约2mpn次操作。因此,其时间复杂度为O(mpn)。

乘法通常是计算密集型操作中更耗时的部分,所以在大O表示法中通常关注乘法的次数。不过,确实也进行了相似数量级的加法操作,但这不影响大O表示法的阶数。

C是一个m×p的矩阵,它包含mp个元素。因此,总的乘法操作次数是mp乘以n,即m×p×n次

Self-Attention层的复杂度的计算

在这里插入图片描述
n 是序列的长度,d 是向量的长度
Query = n ×d
Key = d × n

复杂度的计算之前的字母是 O(m×p×n) ,现在是(n × n × d),所以就是n的平方乘以d

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/12856.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

字符串第5/7题--右旋转字符串

题目描述: 字符串的右旋转操作是把字符串尾部的若干个字符转移到字符串的前面。给定一个字符串 s 和一个正整数 k,请编写一个函数,将字符串中的后面 k 个字符移到字符串的前面,实现字符串的右旋转操作。 例如,对于输…

(论文笔记)TABDDPM:使用扩散模型对表格数据进行建模

了解diffusion model:什么是diffusion model? 它为什么好用? - 知乎 摘要 去噪扩散概率模型目前正成为许多重要数据模式生成建模的主要范式。扩散模型在计算机视觉社区中最为流行,最近也在其他领域引起了一些关注,包括语音、NLP…

nginx文件夹内文件解释<三>

koi-utf 文件解释 [rootrelease nginx]# more koi-utf # This map is not a full koi8-r <> utf8 map: it does not contain # box-drawing and some other characters. Besides this map contains # several koi8-u and Byelorussian letters which are not in koi8-r…

什么是Docker容器的基础镜像

2024年5月15日&#xff0c;周三下午 Docker 容器的基础镜像&#xff08;Base Image&#xff09;是创建新容器时使用的起始点。基础镜像是一个层叠的文件系统&#xff0c;包含了一系列操作系统的基础层&#xff0c;这些层可以包含操作系统、运行时环境、工具和库等。当使用 Dock…

k8s证书续期

证书即将到期了如何进行证书续签 k8s版本V1.23.6 1.查看证书期限 kubeadm certs check-expiration如果证书即将到期&#xff0c;此处的天数应该是几天&#xff0c;在过期之前进行续期&#xff0c;保证集群的可用 2. 备份证书 避免出现问题可以回退 cp -r /etc/kubernetes …

使用websocket和服务建立链接慢的原因分析

1、java 项目使用websocketHandler创建websocket服务&#xff0c;在拦截器HttpSessionHandshakeInterceptor中&#xff0c;beforeHandshake日志到的很快&#xff0c;afterHandshake很慢 建立链接一直在连接中 2、原因分析&#xff1a; 找到服务器上的进程名 jps -l 3、使用…

电脑数据丢失如何恢复?简单数据恢复的办法分享!

在使用电脑的过程中&#xff0c;数据丢失问题几乎是每位用户都可能遭遇的困境。那么&#xff0c;当电脑数据丢失时&#xff0c;我们该如何恢复呢&#xff1f;下面小编就分享几种电脑数据丢失后的恢复方法&#xff0c;轻松找回丢失的数据。 一、回收站找回 电脑上数据丢失的常…

error in ./src/assets/css/element-variables.scss

报错解释&#xff1a; 这个错误表明你的项目中使用的sass-loader需要node-sass的版本至少为4&#xff0c;但是当前项目依赖中的node-sass版本低于4。sass-loader是一个Webpack的loader&#xff0c;它允许你在编译Sass/SCSS文件时使用Node.js。 解决方法&#xff1a; 你需要将项…

java医院信息系统HIS源码SaaS模式Java版云HIS系统 接口技术RESTful API + WebSocket + WebService

java医院信息系统HIS源码SaaS模式Java版云HIS系统 接口技术RESTful API WebSocket WebService 云HIS是基于云计算的医疗卫生信息系统&#xff08;Cloud-Based Healthcare Information System&#xff09;&#xff0c;它运用云计算、大数据、物联网等新兴信息技术&#xff0c;…

java作用域

在面对对象中&#xff0c;变量作用是非常重要知识点 1 重要的变量是属性&#xff08;成员变量&#xff09;和局部变量 2局部变量在成员方法中定义的变量 cat类&#xff1a;cry 全局变量&#xff1a;属性。局部变量&#xff0c;方法中的变量 我们先来看看吧 主函数区 public cl…

如何基于可靠事件模式实现最终一致性?

今天我们一起来探讨一个分布式环境下的常见问题,这个问题与数据的一致性有关。那么,什么是数据一致性呢?要回答这个问题,需要我们回顾一下单块系统和分布式系统中对于数据处理的不同需求。 我们知道,传统的单块系统通常都只与一个数据库进行交互,所有的数据处理过程都位于…

【找到所有数组中消失的数字】leetcode,python

很菜的写法&#xff1a; class Solution:def findDisappearedNumbers(self, nums: List[int]) -> List[int]:nlen(nums)#存1-Nnum_1[i for i in range(1,n1)]#预存数num_2[]nums.sort()for i in nums:num_1[i-1]0for i in num_1:if i!0:num_2.append(i)return num_2能过但是…

实现腾讯地图的接口调用以及微信小程序的地图标注

目录 微信小程序端1. 引入腾讯地图SDK2. 使用地图组件3. 地图页面编写4. 地图标注 Java后端业务逻辑1. 引入腾讯地图Java SDK2. 配置API密钥3. 调用腾讯地图API4. 提供小程序调用的接口 总结 要实现腾讯地图的接口调用以及微信小程序的地图标注&#xff0c;需要分为两个部分&am…

(内地家长)为什么不建议做香港优才计划?香港身份的孩子不是全都能低分上名校!

&#xff08;内地家长&#xff09;为什么不建议做香港优才计划&#xff1f;香港身份的孩子不能都低分上名校&#xff01; 大部分申请香港优才的朋友&#xff0c;应该是冲着孩子教育、高考升学来的。 确实&#xff0c;香港优才申请后拿到的香港身份&#xff0c;对于孩子读书教…

YOLOv8改进教程|加入可改变核卷积AKConv模块,效果远超DSConv!

⭐⭐ YOLOv8改进专栏|包含主干、模块、注意力机制、检测头等前沿创新 ​ ⭐⭐ 一、 论文介绍 论文链接&#xff1a;https://arxiv.org/abs/2311.11587 代码链接&#xff1a;GitHub - CV-ZhangXin/AKConv 论文速览&#xff1a;&#xff1a;AKConv是2023年11月发表的一种可变卷积…

AI 写 SQL 真的靠谱吗?腾讯游戏在 AI+ 湖仓一体的实践

作者&#xff1a;腾讯游戏数据技术负责人 刘岩 导读 腾讯游戏是全球领先的游戏开发和运营商&#xff0c;其数据团队拥有十余年、700 款大型游戏的数据工作沉淀。复杂的业务环境下&#xff0c;腾讯游戏数据团队每年需要处理超过 3 万个数据提取需求&#xff0c;SQL 编写需要耗费…

Mysql面试夺命18问

文章目录 1.简要说明一下数据库范式 第一范式: 属性不可再分.第二范式: 在一范式的基础上, 要求数据库表中的每个实例或行必须可以被惟一地区分. 通常需要为表加上一个列, 以存储各个实例的惟一标识. 这个惟一属性列被称为主关键字或主键.第三范式: 在二范式的基础上, 要求一个…

mysql----武侠剑客之-----MEMORY 存储引擎

文章目录 mysql--------MEMORY 存储引擎1、1 特点&#xff1a;1、2 代码演示&#xff1a; mysql--------MEMORY 存储引擎 1、1 特点&#xff1a; 1.frm文件存储表的结构信息 2 数据存放在内存中&#xff0c;没有表数据文件&#xff0c;重启后&#xff0c;数据丢失 3 使用表…

Go微服务: 接入Prometheus性能监控平台与Grafana平台

接入Prometheus 在 go-micro 生成的模板中, 我们一如既往的完成基础工作之后 进入main.go工作的代码编写&#xff0c;main.go package mainimport ("fmt""log""strconv""github.com/go-micro/plugins/v4/registry/consul"opentracing…

RT-Thread中使用Mqtt

环境&#xff1a; 开发板&#xff1a;Panduola&#xff08;stm32L475&#xff09; KEIL5 开发环境 rtthread 4.0.3内核 使用ENV 配置Rtt MQTT 1.MQTT介绍 ​ 客户端 Client 使用MQTT的程序或设备。客户端总是通过网络连接到服务端。它可以发布应用消息给其它相关的客户端。订…