self_attention python代码

self_attention面试code

from math import sqrt
import torch
import torch.nn as nnclass SA(nn.Module):def __init__(self, dimQ, dimK, dimV):super(SA, self).__init__()self.dimQ = dimQself.dimK = dimKself.dimV = dimV# self.mid = 10self.linerQ = nn.Linear(self.dimQ, self.dimV, bias = False)self.linerK = nn.Linear(self.dimK, self.dimV, bias = False)self.linerV = nn.Linear(self.dimV, self.dimV, bias = False)self.sqrtD = 1 / sqrt(dimQ)def forward(self, x):batch, n, dim = x.shapeassert(dim == self.dimQ)Q = self.linerQ(x)K = self.linerK(x)V = self.linerV(x)dist = torch.bmm(Q, K.transpose(1, 2)) * self.sqrtDW = torch.softmax(dist, dim = -1)Output = torch.bmm(W, V)return Outputif __name__ == "__main__":x = torch.tensor([[[1,2,3],[2,3,4],[3,4,5],[4,5,6]],[[1,2,3],[2,3,4],[3,4,5],[4,5,6]]], dtype = torch.float)print(x.shape)saModel = SA(3, 3, 3)Output = saModel(x)print(Output)

https://zhuanlan.zhihu.com/p/338817680
https://blog.csdn.net/weixin_44750512/article/details/124244915
https://blog.csdn.net/qq_40178291/article/details/100302375

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/43338.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

HarmonyOS Next 实况窗 在自己的应用中怎么调用?

在HarmonyOS中,实况窗(Widget)允许应用程序展示小部件视图,并与用户进行简单的交互。要在自己的应用中调用实况窗,需要按照以下步骤进行: 1. 准备环境 确保你已经安装了DevEco Studio,并配置好了开发环境。 2. 创建实况…

超市收银系统源码

今天给大家分享一套线上线下打通的收银系统,安卓/win双端线下收银台,可DIY、多模板的三端线上小程序商城,除此之外ERP进销存管理、商品管理、会员营销都很完善。 重点是系统支持OEM贴牌独立部署和全开源源码,非常适合一些正在寻找…

南航秋招指南,线上测评和线下考试

南航秋招简介 南航作为国内一流的航空公司,对人才的需求量非常旺盛,每年也有很多专业对口的工作提供给应届毕业生,对于应届毕业生而言,一定要抓住任何一个应聘机会,并且在规定的范围内进行简历的提交,以便…

深度学习中的正则化技术 - 作为约束的范数惩罚篇

序言 深度学习作为机器学习领域的前沿技术,其核心目标在于通过构建复杂的神经网络模型来学习和理解数据的内在规律。然而,随着模型复杂度的增加,过拟合问题日益凸显,即模型在训练数据上表现优异,但在未见过的数据上泛…

CSS content 计数器

CSS content 计数器 CSS 计数器通过一个变量来设置,根据规则递增变量。 使用计数器自动编号 CSS 计数器根据规则来递增变量。 CSS 计数器使用到以下几个属性: counter-reset - 创建或者重置计数器,给计算器命名。注意声明计算器不能在自身…

孕产妇(产科)管理信息系统源码 三甲医院产科电子病历系统成品源代码

孕产妇(产科)管理信息系统源码 三甲医院产科电子病历系统成品源代码 医院智慧孕产是一种通过信息化手段,实现孕产期宣教、健康服务的院外延伸,对孕产妇健康管理具有重要意义,是医院智慧服务水平和能力的体现。实行涵盖婚前检查、孕期保健、产后康复的一…

google Guava组件实现原理和Java使用场景【主要是本地缓存Cache】

Java Guava组件介绍 Guava是Google开发的一个Java核心库,旨在提供高质量、高效率的基本工具类和数据结构,以简化Java编程。它扩展了Java标准库,并提供了许多有用的功能,特别适用于处理集合、缓存、并发等方面的应用程序。以下是对Guava的详细介绍。 作用 Guava提供了丰富…

如何把harmonos项目修改为openharmony项目

一开始分不清harmonyos和openharmony,在harmonyos直接下载的开发软件,后面发现不对劲,打脑阔 首先你要安装对应版本的开发软件,鸿蒙开发是由harmonyos和openharmony官网两个的,找到对应的地方下载对应版本的开发软件&…

C#-反射

一、概念 反射(Reflection)在C#中是一种非常重要的特性,它为开发者提供了在运行时获取和操作关于类型、成员、属性、方法等的详细信息的能力。通过反射,开发者可以在程序运行期间动态地创建对象、调用方法、设置属性值以及进行其…

uniapp 请求封装

1.创建request.js文件 export default {config: {baseUrl: "http://192.168.1.1:0000", // 示例header: {Content-Type: application/json;charsetUTF-8// Content-Type: application/x-www-form-urlencoded, },data: {},method: "GET",dataType: "j…

【Java开发实训】day01

目录 1.Java开发步骤 2.目录的三个表达方法 3.Java的三种注释方法 4.文档注释的作用 🌈嗨!我是Filotimo__🌈。很高兴与大家相识,希望我的博客能对你有所帮助。 💡本文由Filotimo__✍️原创,首发于CSDN&…

不要卷模型,要卷应用:大数据领域的深度探讨

引言 在2024年世界人工智能大会上,百度创始人李彦宏提出了“不要卷模型,要卷应用”的观点,这一观点引发了业内的广泛讨论。作为一个在计算机大数据行业深耕多年的专家,我深感这一观点的深刻内涵。本文将从大数据领域的专业视角&a…

Qt QSettings 使用详解:跨平台的配置管理

文章目录 Qt QSettings 使用详解:跨平台的配置管理一、QSettings 概述1. QSettings 的基本使用二、不同平台上的实现1. Windows 平台注册表存储INI 文件存储2. Linux 平台3. macOS 平台三、QSettings 高级用法1. 使用组管理设置2. 检查和移除设置3. 枚举键四、总结Qt QSetting…

运维锅总详解数据一致性

本文首先对数据一致性进行简要说明,然后画图分析展示9种数据一致性协议的工作流程,最后给出实现这9种协议的例子。希望对您理解数据一致性有所帮助! 一、数据一致性简介 数据一致性是数据库和分布式系统中的一个关键概念,它确保…

【Mac】Folder Icons for mac(文件夹个性化图标修改软件)软件介绍

软件介绍 Folder Icons for Mac 是一款专为 macOS 设计的应用程序,主要用于个性化和定制你的文件夹图标。以下是它的主要特点和使用方法: 主要特点: 个性化文件夹图标 Folder Icons for Mac 允许用户为 macOS 上的任何文件夹定制图标。你…

怎样优化 PostgreSQL 中对布尔类型数据的查询?

文章目录 一、索引的合理使用1. 常规 B-tree 索引2. 部分索引 二、查询编写技巧1. 避免不必要的类型转换2. 逻辑表达式的优化 三、表结构设计1. 避免过度细分的布尔列2. 规范化与反规范化 四、数据分布与分区1. 数据分布的考虑2. 表分区 五、数据库参数调整1. 相关配置参数2. 定…

融云入驻首个数字生态出海基地,加速构建数字经济出海创新生态

7 月 3 日,“2024 全球数字经济大会”重要专题论坛“2024 数字生态出海发展论坛”在北京国家会议中心举行。 论坛由全球数字经济大会组委会主办,北京市经济和信息化局、北京市政务服务和数据管理局、大兴区人民政府共同承办。来自阿联酋、日本、古巴、…

Chain-of-Verification Reduces Hallucination in Lagrge Language Models阅读笔记

来来来,继续读文章了,今天这个是meta的研究员们做的一个关于如何减少LLM得出幻觉信息的工作,23年底发表。文章链接:https://arxiv.org/abs/2309.11495 首先,这个工作所面向的LLM的问答任务,是list-based q…

静态网页基础知识

1、获取输入框的输入值 var x document.getElementById(userInput).value 赋值的话:document.getElementById(userInput).value 1 2、获取td的值、span的值等一个区域的值 var x document.getElementById(result).innerText 赋值:document.getEl…

动态粒子发射特效404网站HTML源码

源码介绍 动态粒子发射404网站HTML源码,粒子内容可以进行修改,默认是4,0数字还有一个页面不存在英文,可以自行修改,喜欢的朋友可以拿去使用,源码是html,记事本打开修改即可,鼠标双击…