transformer从开始到结束

transformer从开始到结束

news/2025/4/7 23:34:27/文章来源:https://blog.csdn.net/m0_46312382/article/details/131992949

首先输入是64 * 10的矩阵，代表64个句子，每个句子10个词。

 X = self.positionalEncoding(self.embedding(X)*math.sqrt(self.num_hiddens))

在经过embeddeding之后，变为64 * 10 *32 矩阵，每个词使用32维向量表示。然后将数据放入 X = encoder_block(X,valid_lens)，这里我们将block设为1，就是encoderBlock只有一层。valid_lens是一个64 * 1的向量，表示每句话的有用的向量。

随后就进入Y = self.addnorm1(X,self.multihead_attention(X,X,X,valid_lens))，先进入多头注意力机制。

queries = transpose_qkv(self.W_q(queries),self.num_heads)
keys = transpose_qkv(self.W_k(keys),self.num_heads)
values = transpose_qkv(self.W_v(values),self.num_heads)

self.W_q、self.W_k、self.W_v均为全连接层，将输入的X，进行不同的变换。这里的num_heads为4，transpose_qkv函数会将query进行切分。

def transpose_qkv(X,num_heads):# 输入为64*10*32  X = X.reshape(

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/14235.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Elasticsearch笔记

Elasticsearch笔记

迈向光明之路，必定荆棘丛生。文章目录一、Elasticsearch概述二、初识ES倒排索引1. 正向索引2. 倒排索引三、ES环境搭建1. 安装单机版ES2. 安装Kibana3. 安装ik分词器3.1 在线安装ik插件3.2.离线安装ik插件（推荐方式）3.3 自定义词典四、ES…

阅读更多...

Unity XML2——C#读写XML

Unity XML2——C#读写XML

一、XML 文件的存放位置 （一）只读不写的 XML 放在 Resouces 或者 StreamingAssets 文件夹下，详见 Unity基础3——Resources资源动态加载_weixin_53163894的博客-CSDN博客。 （二）动态存储的 XML 放在 Applica…

阅读更多...

Linux上定位线上CPU飙高

Linux上定位线上CPU飙高

【模拟场景】写一个java main函数，死循环打印 System.out.println(“111111”) ， 将其打成jar包放在linux中执行 1、通过TOP命令找到CPU耗用最厉害的那个进程的PID 2、top -H -p 进程PID 找到进程下的所有线程可以看到 pid 为 94384的线程耗用cpu …

阅读更多...

redis相关异常之RedisConnectionExceptionRedisCommandTimeoutException

redis相关异常之RedisConnectionExceptionRedisCommandTimeoutException

本文只是分析Letture类型的Redis 池化连接出现的连接超时异常、读超时异常问题。 1.RedisConnectionException 默认是10秒。通过如下可以配置： public class MyLettuceClientConfigurationBuilderCustomizer implements LettuceClientConfigurationBuilderCusto…

阅读更多...

VUE3-04

VUE3-04

1. 编写代码过程中的问题与解决 1.1 错误：cant read property of undefined(name) （1）首先定位错误的位置 （2）逐一排查问题：注释代码；debugger；console.log （3&#xff0…

阅读更多...

ComPDFKit PDF SDK库（支持Windows、Web、Android、iOS、Mac等平台）

ComPDFKit PDF SDK库（支持Windows、Web、Android、iOS、Mac等平台）

ComPDFKit提供专业、全平台支持的PDF开发库，包括Windows、Mac、Linux、Android、iOS、Web平台。开发者可以快速、灵活整合PDF功能到各开发平台的软件、程序、系统中。丰富的功能，多种开发语言，灵活的部署方案可供选择，满足您对PDF…

阅读更多...

数组传参，指针传参

数组传参，指针传参

文章目录一维数组传参二维数组传参一级指针传参二级指针传参一维数组传参二维数组传参一级指针传参二级指针传参

阅读更多...

基于stm32单片机的直流电机速度控制——LZW

基于stm32单片机的直流电机速度控制——LZW

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档目录一、实验目的二、实验方法三、实验设计1.实验器材2.电路连接3.软件设计（1）实验变量（2）功能模块a）电机接收信号…

阅读更多...

AtCoder Beginner Contest 312（A~D）

AtCoder Beginner Contest 312（A~D）

A //语法题也要更仔细嘞，要不然也会wa #include <bits/stdc.h> // #pragma GCC optimize(3,"Ofast","inline") // #pragma GCC optimize(2) using namespace std; typedef long long LL; #define int LL typedef pair<int, int> …

阅读更多...

代码随想录-回溯算法（分割问题）|ACM模式

代码随想录-回溯算法（分割问题）|ACM模式

目录前言： 131. 分割回文串题目描述： 输入输出描述： 思路和想法： 93. 复原 IP 地址题目描述： 输入输出描述： 思路和想法： 前言： 回溯算法中的分割问题，是可以…

阅读更多...

Java【Spring】项目创建、存储和获取 Bean 的基本方式

Java【Spring】项目创建、存储和获取 Bean 的基本方式

文章目录前言一、创建 Spring 项目1, 创建 Maven 项目2, 添加 Spring 依赖3, 创建启动类二、存储 Bean 的基本方式1, 创建 Bean2, 存储 Bean 三、获取 Bean 的基本方式1, 获取上下文对象2, 获取 Bean3, 使用 Bean 总结前言各位读者好, 我是小陈, 这是我的个人主页, 希望我的…

阅读更多...

Python基础入门教程（上）

Python基础入门教程（上）

目录一、你好Python 1.1、Python安装 win版 Linux版 1.2、第一个Python程序二、Python基本语法 2.1、字面量 2.2、注释 2.3、变量 2.4、数据类型 type()函数字符串类型的不同定义方式 2.5、数据类型转换编辑 2.6、标识符 2.7、运算符 2.8、字符串扩展 …

阅读更多...

基于aarch64分析kernel源码三：启动代码分析

基于aarch64分析kernel源码三：启动代码分析

一、内核启动入口点 /** Kernel startup entry point.* ---------------------------** The requirements are:* MMU off, D-cache off, I-cache on or off,* x0 physical address to the FDT blob.* 这部分注释说明了内核启动入口点的要求和约束条件。* 要求包括&…

阅读更多...

Vue2基础五、工程化开发

Vue2基础五、工程化开发

零、文章目录 Vue2基础五、工程化开发 1、工程化开发和脚手架 （1）开发 Vue 的两种方式核心包传统开发模式：基于 html / css / js 文件，直接引入核心包，开发 Vue。工程化开发模式：基于构建工具&#xf…

阅读更多...

【Python】数据分析+数据挖掘——探索Pandas中的索引与数据组织

【Python】数据分析+数据挖掘——探索Pandas中的索引与数据组织

前言在数据科学和数据分析领域，Pandas是一个备受喜爱的Python库。它提供了丰富的数据结构和灵活的工具，帮助我们高效地处理和分析数据。其中，索引在Pandas中扮演着关键角色，它是一种强大的数据组织和访问机制，使我们…

阅读更多...

【Unity2D】角色动画的切换

【Unity2D】角色动画的切换

动画状态转换第一种方法是设置一个中间状态，从中间状态向其余各种状态切换，且各状态向其他状态需要设置参数实现动作转移时右键点击Make Transition即可实现动画转移需要设置条件点击一种动画到另一种动画的线 ，然后点击加号添加Condi…

阅读更多...

$玩转LaTeX（三）【数学公式（基础）、矩阵、多行公式】$

玩转LaTeX（三）【数学公式（基础）、矩阵、多行公式】

数学公式基础导言区（引包） \usepackage{amsmath} %带星号的eqution 正文区 \begin{document}%数学公式初步 \section{简介} \LaTeX{}将排版内容分为文本模式和数学模式。文本模式用于普通文本排版，数学模式用于数学公式排版。 …

阅读更多...

【字节三面】41. 缺失的第一个正数

【字节三面】41. 缺失的第一个正数

41. 缺失的第一个正数解题思路在原数组上进行操作如果数字是2 将其放在索引为1的位置上数字x 放在索引为x - 1的位置上对于长度为n的数组其中没有出现的最小正整数只能在[1,n 1]引入如果1 - n 这些数都出现了那么答案就是n 1如果都没有出现完全那么答案就在[1,n]中没…

阅读更多...

【LeetCode】206.反转链表

【LeetCode】206.反转链表

题目给你单链表的头节点 head ，请你反转链表，并返回反转后的链表。示例 1： 输入：head [1,2,3,4,5] 输出：[5,4,3,2,1]示例 2： 输入：head [1,2] 输出：[2,1]示例 3： …

阅读更多...

【LeetCode 热题 100】矩阵专题（大多原地算法，需要一定思维）

【LeetCode 热题 100】矩阵专题（大多原地算法，需要一定思维）

解题思路在代码注释中！ 文章目录 73. 矩阵置零54. 螺旋矩阵48. 旋转图像240. 搜索二维矩阵 II 73. 矩阵置零 class Solution { public:void setZeroes(vector<vector<int>>& matrix) {// 难点：原地算法// 直接复用 matrix 第一行和 …

阅读更多...

最新文章