Attention (注意力机制)

1. 背景:

          字面的意思:给你一些东西(看见一个美女:).....),你会注意什么?

          大数据的时代下,有太多的数据,我们又该如何选择重要的数据呢?

          Attention 诞生了,但是又该如何去做呢(i.e., 实现该机制呢)?

2. 如何实现注意力

         查询的对象Q, 被查询的对象V

以下是网友的说法(初次接触这方面的只是点, 保留帮助理解):

        1) Query,Key,Value的概念取自于信息检索系统,举个简单的搜索的例子来说。当你在某电商平台搜索某件商品(年轻女士冬季穿的红色薄款羽绒服)时,你在搜索引擎上输入的内容便是Query。然后搜索引擎根据Query为你匹配Key(例如商品的种类,颜色,描述等)。然后根据Query和Key的相似度得到匹配的内容(Value)。

        2)Q,K,V是三个矩阵。 是 X 输入与 Wq,Wk,Wv 点积的结果。 最开始Wq,Wk,Wv 是随机生成的, 后面通过训练 Wq,Wk,Wv 会不断调整,通过loss 函数进行。 Wq,Wk,Wv 就是需要训练的参数。

以下图来自(attention注意力机制到底是什么?Q,K,V指的谁,如何操作?什么是多头注意力?带你深入了解注意力机制,以及transformer中的QKV。_哔哩哔哩_bilibili)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/863313.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

武汉星起航:亚马逊欧洲站潮流指南,满足年轻人选品需求

在充满活力的20-30岁年龄段,年轻人们充满朝气,追求时尚与品质,对生活充满无限期待。亚马逊欧洲站作为全球领先的电商平台,为这一年龄段的人群提供了丰富多样的商品选择。武汉星起航将为您介绍亚马逊欧洲站针对20-30岁人群的选品攻…

myCrayon个人博客项目基于springBoot+Vue全栈开发

目录 项目介绍 简介 项目架构 项目模块组成 数据库设计 项目展示 首页 用户登录与注册 个人信息模块 商城展示 博客模块 博客浏览 博客发布与编辑 博客搜索 社区模块 新闻模块 后台管理系统 部署方式 结语 项目介绍 简介 项目类似于CSDN,支持所…

2024年4家HTTP代理服务商网站最新测评

一、芝麻HTTP芝麻HTTP作为代理服务领域的佼佼者,其HTTP代理服务同样表现出色。凭借海量IP资源和高效稳定的性能,芝麻HTTP为用户提供了卓越的代理服务体验。 特点与优势 ① 海量IP资源:拥有庞大的代理IP池,确保用户能够随时获取到…

Django 自定义标签

1,简单标签 1.1 添加自定义标签函数 Test/app5/templatetags/mytags.py from django import template register template.Library() register.simple_tag() def show_title(value, n):if len(value) > n:return f{value[:n]}...else:return value 1.2 添加视…

Typora failed to export as pdf. undefined

变换版本并没有用,调整图片大小没有用 我看到一个博客后尝试出方案 我的方法 解决:从上图中的A4,变为其他,然后变回A4 然后到处成功,Amazing! 参考: Typora 导出PDF 报错 failed to export…

javaScript利用indexOf()查找字符串的某个字符出现的位置

1 创建字符串 2 利用indexof()查询字符串的字符 3 利用while循环判断indexOf是否等于-1,不等于-1就打印一次并且索引号1去查下一个字符 //创建字符串var str1234567812311231;var indexstr.indexOf(1);//查询该字符while(index !-1)//indexOf()没有查到会返回-1{…

【Linux】使用chrony同步时间

chrony介绍 chrony 是一个开源的网络时间协议 (NTP) 客户端和服务器,旨在保持计算机系统的时间精确同步。它是Linux和其他类Unix系统中广泛使用的工具,特别是在需要高精度时间同步的环境中。chrony 的设计考虑了现代网络的挑战,如不稳定的连…

负载均衡器有什么用?

负载均衡器有什么用? 负载均衡器是一种在多个服务器之间分配网络或应用程序流量的设备或软件应用程序。其主要目的是确保没有一台服务器承担过多的需求,从而提高应用程序的响应速度和可用性。 在计算机发展的早期,负载均衡是一个手动过程。…

AI Prompt 提示词编写公式

自 OpenAI 的 ChatGPT 横空出世至今,各种 AI 大模型百花齐放、百家争鸣。按照用途可以分为两类: 对话类:即通过文字、语音、图片或者视频输入来给模型下达指令,然后模型按照指令以文字的形式将回答输出给用户;生成类&…

暑假兼职赚生活费

兼职项目种类繁多,以下是一些常见的副业兼职项目,供您参考: 写作兼职: 挖掘专长领域:如科技、金融、教育等。 注册自由职业平台:如猪八戒网、酷咖写手等,完善个人资料和作品展示。 宣传与建立…

lodash.js 工具库

lodash 是什么? Lodash是一个流行的JavaScript实用工具库,提供了许多高效、高兼容性的工具函数,能够方便地处理集合、字符串、数值、函数等多种数据类型,大大提高工作效率。 lodash官网 文档参见:Lodash Documentation lodash 在Vue中怎么使用? 1、首先安装 lodash np…

视频云计算的未来发展趋势:智能化、个性化与云端协同助力智慧城市安防监控

随着信息技术的飞速发展,云计算作为一种全新的服务模式,正在改变我们处理数据和信息的方式。而视频云计算技术,作为云计算领域的一个重要分支,以其独特的优势,正在逐步渗透到我们生活的各个领域。 一、视频云计算技术…

【折腾笔记】兰空图床使用Minio作为储存策略

前言 花了几个小时研究了一下在兰空图床中使用Minio作为存储策略,官方并没有给出太多关于minio的储存策略配置文档,我是经过反复尝试,然后根据错误日志的提示以及查阅兰空图床在GitHub上面的issues悟出来的配置方法。 因为我的兰空图床和Minio都是基于群晖的NAS设备DS423+…

干货 | AI 产品经理的成长之路(ChatBot 方向)

近几年,人工智能在投资圈、创业圈甚至是全社会都成了热词,那么提起人工智能,一定会想到机器学习、深度学习、自然语言处理等等名词,同时也会想到这些技术背后的人才—算法工程师,因此这两年算法工程师成为了人才市场上…

pdf拆分,pdf拆分在线使用,pdf拆分多个pdf

在数字化的时代,pdf文件已经成为我们日常办公、学习不可或缺的文档格式。然而,有时候我们可能需要对一个大的pdf文件进行拆分,以方便管理和分享。那么,如何将一个pdf文件拆分成多个pdf呢?本文将为你推荐一种好用的拆分…

相关作业调度算法的完成时间、周转时间、平均周转时间等问题

☀️☀️☀️ 相关作业调度算法的完成时间、周转时间、平均周转时间等问题 ​ 周转时间:从作业被提交给系统开始,到作业完成为止的这段时间间隔称为作业周转时间。 带权周转时间:即作业的周转时间T与系统为它提供服务的时间Ts之比&#xff…

生成独立的zedboard+ad9361起始项目

文件分享 链接:https://pan.baidu.com/s/17wB_9xVWjO7HhxNvmmZyuA 提取码:94zz 首先下载HDL和NO-OS项目 git clone --recursive https://github.com/analogdevicesinc/hdl git clone --recursive https://github.com/analogdevicesinc/no-OS下载…

CXL:拯救NVMe SSD缓存不足设计难题-2

LMB提出了基于CXL协议的内存扩展框架和内核模块。该方案利用CXL内存扩展器作为物理DRAM源,旨在提供一个统一的内存分配接口,使PCIe和CXL设备都能方便地访问扩展的内存资源。通过这个接口,NVMe驱动和CUDA的统一内存内核驱动可以直接高效地访问…

携程二面测开—中核

4.12 35min面试经验 自我介绍 在面试的开始,我简洁明了地进行了自我介绍,突出了我的教育背景、技能特长以及实习经历,为后续的面试内容打下了良好的基础。 实习的具体工作内容 在谈及实习经历时,我详细阐述了在实习期间所承担…

架构设计之RBAC基于角色的访问控制设计

概念 RBAC(Role-Based Access Control,基于角色的访问控制)是一种常见的权限管理模型,它通过定义角色来分配权限,然后将角色分配给用户。在Java中实现RBAC权限管理,你可以遵循以下步骤: 定义权…