Attention步骤

        一个典型的Attention思想包括三部分:Qquery、Kkey、Vvalue

  • Q是query,是输入的信息;key和value成组出现,通常是原始文本等已有的信息;
  • 通过计算Q与K之间的相关性a,得出不同的K对输出的重要程度;
  • 再与对应的v进行相乘求和,就得到了Q的输出;
  • step1,计算Q对每个K的相关性相似性,即函数F ( Q , K ) F(Q,K)F(Q,K);
    这里计算相关性的方式有很多种,常见方法比如有:

  • a.求两者的【向量点击】

  • b.求两者的向量【余弦相似度】

  • c.引入一个额外的神经网络来求值

  • step2,对step1的注意力的分进行归一化;
    softmax的好处首先可以将原始计算分值整理成所有元素权重之和为1的概率分布;
    其次是可以通过softmax的内在机制更加突出重要元素的权重;

    ai​ 即为value_i对应的权重系数;

  • step3,根据权重系数对V进行加权求和,即可求出针对Query的Attention数值。

参考:关于Attention的超详细讲解_attention详解-CSDN博客

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/36535.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Spring Boot中的开发工具与插件推荐

Spring Boot中的开发工具与插件推荐 大家好,我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编,也是冬天不穿秋裤,天冷也要风度的程序猿!今天我们来聊聊Spring Boot中的开发工具与插件推荐。Spring Boot作为一种简…

【Linux系统】Ubuntu20.04 界面卡死的解决办法

方法一:不需要重启 [注意]:方法一有黑屏风险,新手使用方法二即可,恢复方法:ubuntu 处于黑屏状态(无法进入图形化界面)解决办法-CSDN博客 1. 按CtrlAltF1可以进入tty终端 2. 输入账号和密码进…

2021年12月电子学会青少年软件编程 中小学生Python编程等级考试三级真题解析(选择题)

2021年12月Python编程等级考试三级真题解析 选择题(共25题,每题2分,共50分) 1、小明在学习计算机时,学习到了一个十六进制数101,这个十六进制数对应的十进制数的数值是 A、65 B、66 C、256 D、257 答案&#xff…

为什么javaer认为后台系统一定要用java开发?

在开始前刚好我有一些资料,是我根据网友给的问题精心整理了一份「java的资料从专业入门到高级教程」, 点个关注在评论区回复“666”之后私信回复“666”,全部无偿共享给大家!!!公司有两个开发团队&#xf…

jupyter快捷键

一、jupyter快捷键 模式切换 Jupyter Notebook 有两种模式:命令模式(esc) 和 编辑模式(enter)。 命令模式快捷键 隐藏/显示:esco 删除单元格:escdd Enter:进入编辑模式 L&…

Unity3D 游戏数据本地化存储与管理详解

一、引言 在Unity3D游戏开发中,数据的本地化存储与管理是一个重要的环节。这不仅涉及到游戏状态、玩家信息、游戏设置等关键数据的保存,还关系到游戏的稳定性和用户体验。本文将详细介绍Unity3D中游戏数据的本地化存储与管理的技术方法,并给…

Apollo9.0 PNC源码学习之Planning模块(三)—— public_road_planner

前面文章: (1)Apollo9.0 PNC源码学习之Planning模块(一)—— 规划概览 (2)Apollo9.0 PNC源码学习之Planning模块(二)—— planning_component 1 planning_interface_base 规划接口基类: planning\planning_interface_base\planner_base\planner.h #pragma once#in…

深度分析Kafka与RocketMQ:定义、优缺点、使用场景及选型指南

在大数据处理和分布式系统中,消息中间件扮演着至关重要的角色。Apache Kafka和Apache RocketMQ是两种广泛使用的分布式消息系统,本文将深入分析它们的定义、优缺点、使用场景,并提供选型指南和使用注意事项。 一、Kafka与RocketMQ的定义 Ka…

4年突破20亿,今麦郎如何持续策划凉白开极致产品力?

范总在方便面市场拥有30年的丰富经验,并曾创造过奇迹。1994年,他从冰糖生意进入方便面行业,创立今麦郎的前身华龙集团。当时,方便面市场已经进入红海阶段,市场上有上千家企业,康师傅和统一占据了80%的市场份…

latex工具要点

使用latex整理论文格式是比较好的范式,这里记录一些重要的点,方便以后复用。latex格式各种期刊会议一般都会给出模板,直接套用就行,这里只是记录一些通用的技巧。 1、文献引用:zotero 参考: http://t.csd…

【Linux】PATH和LD_LIBRARY_PATH的区别

PATH与LD_LIBRARY_PATH的区别 PATH 和 LD_LIBRARY_PATH 是Linux和类Unix操作系统中的两个环境变量,它们在系统中扮演着不同但重要的角色。尽管它们的名称和用途在某种程度上相似,但它们用于指定的路径类型和目的有明显的区别。 PATH 用途:…

计算机视觉-期末复习-简答/名词解释/综合设计

目录 第一讲--计算机/机器视觉概述 名词解释 简答 第二讲--图像处理概述 名词解释 简答 第三讲没划重点习题 第四讲--特征提取与选择 名词解释 简答 综合题 第五讲--不变特征 名词解释 简答 第六讲--物体分类与检测 简答 综合题 第七讲--视觉注意机制 简答 …

三角洲行动卡顿严重?这样快速解决三角洲行动国服卡顿问题

三角洲行动官方精心设计的游戏地图和敌人布局,加上“曼德尔砖”等目标导向性道具的引入,更是为玩家之间的竞技和争夺增添了无数的变数。每一次的争夺都如同是一场智慧与勇气的较量,让人热血沸腾,无法自拔。在这个战场上&#xff0…

第六篇:精通Docker Compose:打造高效的多容器应用环境

精通Docker Compose:打造高效的多容器应用环境 1. 引言 1.1 目的与重要性 在现代软件开发中,随着应用程序的复杂性不断增加,传统的单一容器部署方式已无法满足需求。Docker Compose作为一种强大的工具,专门用于定义和运行多容器…

5、广告-广告投放

本章详细讨论了广告投放的各个环节,包括投放计划、广告策划与提案、广告投放执行、数据分析与优化调整、项目总结与结案报告以及执行部门与岗位职责。这一章为广告投放提供了系统化的方法和步骤,确保广告投放的效果和效率。 一、投放计划(Ca…

用户中心项目全流程

企业做项目流程 需求分析 > 设计(概要设计 、 详细设计) > 技术选型 >初始化项目 / 引入需要的技术 > 写个小demo > 写代码 (实现业务逻辑) > 测试(单元测试)> 代码提交 / 代码评审 …

ClickHouse-Keeper安装使用

1.rpm 安装 clickhouse-keeper rpm -ivh clickhouse-keeper-23.8.11.28.x86_64.rpm 2.修改keeper的配置文件 vi /etc/clickhouse-keeper/keeper_config.xml修改部分参数 1.可修改日志等存储路径 2.增加监听配置 <listen_host>0.0.0.0</listen_host> 3.server_id…

HarmonyOS Next开发学习手册——层叠布局 (Stack)

概述 层叠布局&#xff08;StackLayout&#xff09;用于在屏幕上预留一块区域来显示组件中的元素&#xff0c;提供元素可以重叠的布局。层叠布局通过 Stack 容器组件实现位置的固定定位与层叠&#xff0c;容器中的子元素依次入栈&#xff0c;后一个子元素覆盖前一个子元素&…

【Spring】SpringCloudAlibaba学习笔记

Nacos Nacos是一个更易于构建云原生应用的动态服务发现/服务配置和服务管理平台核心功能: 服务注册: Nacos Client会通过发送REST请求向Nacos Server注册自己的服务, 提供自己的元数据, 如ip地址/端口等信息; Nacos Server收到注册请求后, 就会把这些信息存储在Map中服务心跳:…

oracle with as是临时表还是变量

在 Oracle 数据库中&#xff0c;WITH 子句&#xff08;也称为 Common Table Expressions&#xff0c;简称 CTE&#xff09;不是用来创建临时表或变量的。但它在查询中提供了一种临时命名结果集的方式&#xff0c;这些结果集可以在主查询或该 WITH 子句内的其他 CTE 中被引用。 …