图片速览 FlashAttention+Softmax的安全计算形式（暂记）

news/2025/4/13 0:13:16/文章来源:https://blog.csdn.net/ResumeProject/article/details/132175231

FlashAttention最基础的方案来自使用高速的share memory来加速Softmax操作，实现Softmax的tiling方案。（Q,K,V之间的乘法可由gemm实现。）

左侧为GPU各部分的访问速度比较

FlashAttention使用平铺来防止大型实体化𝑁 ×𝑁 注意力矩阵（虚线框）在（相对）慢的GPU HBM上。

中间为实现过程

softmax的计算公式

注:我也比较好奇，softmax公式怎么好像变得复杂了？我在参考文献60中找到了答案：
不幸的是，在所表示的数字范围有限的实际硬件上，算法1的第3行(求分母的时候)可能由于指数而上溢或下溢。得到这这种安全形式的改写。
作者提出的分解方法

右侧为融合核函数和pytorch实现的速度比较

加快PyTorch对GPT-2的关注。FlashAttention不读写大号𝑁 ×𝑁 注意力矩阵到HBM，导致注意力计算的7.6倍加速。
作者在附录B中给出了反向传播的推导

CG

https://github.com/Dao-AILab/flash-attention
Jax上继承了Numpy计算加速，XLA加速，JIT编译，自动微分等，以下代码不用自己实现cuda函数Implementation of Flash Attention in Jax
cuda实现 https://github.com/lucidrains/flash-cosine-sim-attention/tree/main
https://github.com/jundaf2/INT8-Flash-Attention-FMHA-Quantization
https://github.com/kyegomez/FlashAttention20Triton
https://github.com/Lightning-AI/lit-llama
Add Flash-Attention to Huggingface Models https://github.com/conceptofmind/flash-gpt
https://www.zhihu.com/question/611236756/answer/3136806315

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/45884.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

docker搭建es+kibana

docker搭建es+kibana

docker搭建eskibana 0 安装docker 如果是mac或者windows，可以直接安装Docker Desktop更加便捷。前提条件： Docker可以运行在Windows、Mac、CentOS、Ubuntu等操作系统上 Docker支持以下的CentOS版本： CentOS 7 (64-bit)CentOS 6.5 (64-bit…

阅读更多...

最长子序列问题

最长子序列问题

[NOIP1999] 导弹拦截 SOL1： 记 f i f_i fi 表示第 i i i 项结尾的 LDS 长度。 f i max ⁡ j < i , a j ≥ a i f j 1 f_i \max_{j < i,a_j \ge a_i} f_j 1 fij<i,aj≥aimaxfj1 朴素做是 O ( n 2 ) O(n^2) O(n2) 的。代码。显然可以…

阅读更多...

k8s集群监控方案--node-exporter+prometheus+grafana

k8s集群监控方案--node-exporter+prometheus+grafana

目录前置条件一、下载yaml文件二、部署yaml各个组件 2.1 node-exporter.yaml 2.2 Prometheus 2.3 grafana 2.4访问测试三、grafana初始化 3.1加载数据源 3.2导入模板四、helm方式部署前置条件安装好k8s集群（几个节点都可以，本人为了方便实验k8s集…

阅读更多...

【自动化测试】接口自动化01

【自动化测试】接口自动化01

文章目录一、熟悉若requests库以及底层方法的调用逻辑二、接口自动化以及正则和Jsonpath提取器的应用6. 高频面试题：9. 示例：接口关联13. 文件上传示例14. cookie关联的接口努力经营当下直至未来明朗一、熟悉若requests库以及底层方法的调用逻辑接…

阅读更多...

系统架构师---软件重用、基于架构的软件设计、软件模型

系统架构师---软件重用、基于架构的软件设计、软件模型

目录软件重用构件技术基于架构的软件设计 ABSD方法与生命周期抽象功能需求用例抽象的质量和业务需求架构选项质量场景约束基于架构的软件开发模型架构需求需求获取标识构件需求评审架构设计架构文档架构复审架构实现架构演化前言&…

阅读更多...

Linux:iptables SNAT与DNAT

Linux:iptables SNAT与DNAT

目录一、SNAT 1.1 SNAT原理与应用 1.2 SNAT转换前提条件 1.3 SNAT工作原理 1.4 SNAT实例二、DNAT 2.1DNAT原理与应用 2.2 DNAT转换前提条件 2.2实例一、SNAT 1.1 SNAT原理与应用 SNAT 应用环境:局域网主机共享单个公网IP地址接入Internet (私有IP不能在Internet中正…

阅读更多...

Day 55

Day 55

Day 55 392.判断子序列 dp[i][j] 表示以下标i-1为结尾的字符串s，和以下标j-1为结尾的字符串t，相同子序列的长度为dp[i][j]。 if (s[i - 1] t[j - 1]) t中找到了一个字符在s中也出现了 if (s[i - 1] ! t[j - 1]) 相当于t要删除元素，继续匹…

阅读更多...

性能比较 - Spring Boot 应用程序中的线程池与虚拟线程 (Project Loom)

性能比较 - Spring Boot 应用程序中的线程池与虚拟线程 (Project Loom)

本文比较了 Spring Boot 应用程序中的不同请求处理方法：ThreadPool、WebFlux、协程和虚拟线程 (Project Loom)。在本文中，我们将简要描述并粗略比较可在 Spring Boot 应用程序中使用的各种请求处理方法的性能。高效的请求处理在开发高性能后端…

阅读更多...

k8s 用户角色权限的划分

k8s 用户角色权限的划分

在Kubernetes中，角色（Role）和角色绑定（RoleBinding）用于划分用户的权限。 Kubernetes中的角色定义了一组特定操作的权限，例如创建、删除或修改特定资源。而角色绑定则将角色与用户、组或服务账号进行关联…

阅读更多...

嵌入式不如CS？信了你就上当了！

嵌入式不如CS？信了你就上当了！

在现在的互联网上，有人疯狂劝退新人进入嵌入式行业。他们认为嵌入式的工资低于计算机科学，学习难度较大，前景也不好。首先是工资方面，你要知道，计算机科学专业也有月薪四五千的人，也有月薪六位数的人。相…

阅读更多...

Jmeter 连接 MySQL 数据库脚本

Jmeter 连接 MySQL 数据库脚本

1、创建线程组 2、创建 JDBC Connection Configuration 3、创建 JDBC Request 4、最终创建的目录 5、重点来了 5.1 在百度中下载个 MySQL-connector-Java-8.0.28.jar，放在 jmeter 的 bin 目录下 5.2 在测试计划中，将 jar 包添加到脚本中 5.3 输入参…

阅读更多...

面试之ReentrantLock

面试之ReentrantLock

一，ReentrantLock 1.ReentrantLock是什么？ ReentrantLock实现了Lock接口，是一个可重入且独占式的锁，和Synchronized关键字类似，不过ReentrantLock更灵活，更强大，增加了轮询、超时、中断、公平锁…

阅读更多...

不同企业如何选择合适的CRM系统？

不同企业如何选择合适的CRM系统？

市场上的CRM系统千差万别，如何选到适合的CRM系统？很多企业凭借感觉盲目选型，结果上线后发现CRM系统功能不符合需求。这就好比买衣服，不试穿就买回家，结果发现尺码不合适，还不能退换。下面说说企业如何进行C…

阅读更多...

series的数据对齐功能

series的数据对齐功能

Series 是一种类似于 Numpy 中一维数组的对象，它由一组任意类型的数据以及一组与之相关的数据标签（即索引）组成。举个最简单的例子： 上面的代码将打印出如下内容： 左边的是数据的标签，默认从 0 开始依次递增…

阅读更多...

Git 目录详解

Git 目录详解

一、Git目录详解在使用Git时，有几个目录和文件在Git项目中扮演着重要的角色，下面详细介绍一下这些目录和文件的作用 1、.git目录 .git目录是Git项目的核心，包含了Git的版本库和元数据等重要信息。在该目录中，有一些重要的子目录和…

阅读更多...

【SA8295P 源码分析】52 - 答疑之 QNX 创建镜像、Android修改CMDLINE

【SA8295P 源码分析】52 - 答疑之 QNX 创建镜像、Android修改CMDLINE

【SA8295P 源码分析】52 - 答疑之 QNX 创建镜像、Android修改CMDLINE 一、QNX 侧创建 img 镜像二、QNX 侧指定只编译某一个版本三、Android定制修改selinux权限，user版本采用enforcing，userdebug版本permissive系列文章汇总见：《【SA8295P 源码分析】00 - 系列文章链接汇总》…

阅读更多...

【数据管理】什么是数据管理？

【数据管理】什么是数据管理？

文章目录前言常见内容主题领域数据类型元数据引用数据主数据交易数据数据类型的特点数据类型之间的关系GIGO数据质量评估数据质量管理数据治理数据安全前言数据管理，即对数据资源的管理。按照 DAMA （国际数据管理协会）的定义&#xff1…

阅读更多...

嵌入式：ARM Day6

嵌入式：ARM Day6

作业:完成cortex-A7核UART总线实验目的：1.输入a,显示b，将输入的字符的ASCII码下一位字符输出 2.原样输出输入的字符串源码： uart4.h #ifndef __UART4_H__ #define __UART4_H__#include "stm32mp1xx_rcc.h" #incl…

阅读更多...

excel条件格式：不同组对应位置对比标记

excel条件格式：不同组对应位置对比标记

问题描述下图中有两组数据，想要对比两个对应位置的数据并标记条件格式选中其中一个单元格，条件格式->新建规则使用公式确定要设置格式的单元格，自定义需求格式化剩余同样标准的单元格

阅读更多...

QT中资源文件resourcefile的使用

QT中资源文件resourcefile的使用

QT中资源文件resourcefile的使用之前添加图标的方法使用资源文件的方法创建资源文件资源文件添加前缀资源文件添加资源使用资源文件中的资源在Qt中引入资源文件好处在于他能提高应用程序的部署效率并且减少一些错误的发生。在程序编译过程中， 添加到资源文件中的…

阅读更多...

最新文章