与传统RNN相比,AI模型当红大神Transformer有什么新魔法呢?

      在上一篇文章“AI模型大宗师Transformer的Encoder工具”里面提到“自注意力机制”,有些伙伴可能不太理解,今天我再用个例子细说一下。

      下面,我们用一个实际的文本处理例子来看看传统的循环神经网络(RNN)和引入自注意力机制的Transformer模型在处理长距离依赖关系上的差异。

      假设我们有以下句子:“去年我去了西湖,那里的风景美丽极了。我决定明年再回去。”

      传统循环神经网络(RNN)在处理这个句子时,会按顺序逐个处理单词。RNN将努力记忆“去年我去了西湖”这一信息,以便在处理后续的“我决定明年再回去”时能够关联起来。然而,由于RNN在处理序列时是一步一步进行的,它可能会遇到短距离信息的覆盖问题,即所谓的“遗忘”问题。当句子很长或者有多个嵌套的句子结构时,RNN可能难以捕捉到“西湖”和“再回去”之间的长距离依赖关系。

      引入自注意力机制的Transformer模型在处理这个句子时,会使用自注意力机制来同时考虑句中的所有单词。在处理“我决定明年再回去”这一小部分时,自注意力机制允许模型直接关联到“去年我去了西湖”中的“西湖”,从而建立了一个直接的联系。这是因为在计算注意力分数时,每个单词的表示(查询)会与所有其他单词的表示(键)进行比较,从而直接捕捉到它们之间的相关性,无论它们在文本中的距离如何。


      当Transformer处理“再回去”这个词组时:

1. 查询、键、值向量:每个词被转换为查询(Query)、键(Key)、值(Value)向量。

2. 计算注意力分数:对于“再回去”的查询向量,模型计算与句中每个词的键向量(包括“西湖”的键向量)的点积,得到分数。

3. 应用Softmax函数:这些分数经过Softmax处理,转换为概率分布,表示对“再回去”而言,句中每个词的相关重要性。

4. 加权求和:根据上述概率分布,对应的值向量进行加权求和,形成“再回去”的新表示。

5. 输出:这个新表示捕捉到了“再回去”与“西湖”之间的关联,使得后续的模型部分能够正确解释这两个词之间的关系,即使它们在文本中相隔较远。

      Transformer模型通过自注意力机制能够更有效地捕捉长距离依赖关系,因为它能够在处理每个单词时考虑到整个句子的上下文。这使得Transformer特别适合处理包含复杂结构和长距离依赖的文本数据。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/865584.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【坚果识别】果实识别+图像识别系统+Python+计算机课设+人工智能课设+卷积算法

一、介绍 坚果识别系统,使用Python语言进行开发,通过TensorFlow搭建卷积神经网络算法模型,对10种坚果果实(‘杏仁’, ‘巴西坚果’, ‘腰果’, ‘椰子’, ‘榛子’, ‘夏威夷果’, ‘山核桃’, ‘松子’, ‘开心果’, ‘核桃’&a…

CTO透露GPT-5内幕,OpenAI 以36亿美元收购数据库初创公司

目录 01 GPT-5 02 OpenAI收购Rockset 2.1 谁是Rockset? 2.2 OpenAI的目的是什么? 01 GPT-5 虽然GPT-4的视频通话功能尚未全面推广,但OpenAI的CTO已经对即将到来的GPT-5给出了新的暗示。 不久前,Mira回到母校达特茅斯工程学…

springboot 自定义的全局捕获异常失效

背景:springbootspringcloud 分布式微服务。 问题:公共模块在使用RestControllerAdvice全局捕获异常时,捕获不到子服务抛出的相应异常 首先看一下全局异常组件有么有被扫描到 如何查看,很简单只需要写一段类加载打印代码&#x…

剪映数字人口播原理终于搞清楚了

剪映版本升级了,新版本支持数字人定制,于是我赶紧申请了使用资格 目前的价格是49元单个价格/30天 支付49元之后剪映要求上传2.5至10分钟的视频 接着要阅读一段话并录制视频上传 第三步提交,提交完成之后大概两三个小时就会有一个特定数字人形象出现:

嵌入式c语言3——自定义数据类型

结构体struct,共用体union 结构体中定义变量,首尾地址相连 对于union,其包含变量对起始地址相同 由于其起始地址相同,则改变其中某一变量值时有可能使得另一个变量值发生改变 enum 枚举,可以用来定义一堆整形常量构成…

深入详解RocketMQ源码安装与调试

1.源码下载 http://rocketmq.apache.org/dowloading/releases/ 2. 环境要求 64位系统JDK1.8(64位)Maven 3.2.x

性价比蓝牙耳机怎么选?百元高性价比蓝牙耳机推荐

在现代社会中,蓝牙耳机已经成为人们日常生活中必不可少的配件之一。对于许多消费者来说,找到一款高性价比且价格在百元左右的蓝牙耳机是非常重要的。市面上有许多价格不菲的蓝牙耳机,性价比蓝牙耳机怎么选?如何在有限预算下找到性…

ODN网络弱光聚类定界与整治

01 ODN网络弱光运维现状 ODN网络是家庭宽带连接系统-无源光网络 (PON) 的重要组成部分,是连接局端 OLT 和用户 ONT 之间的光路通道,其质量直接影响整个PON系统的性能及可靠性。ODN光纤链路包括OLT PON口、ODF、主干光纤、一级分光器、分支光纤、二级分光…

Unity Shader技巧:实现带投影机效果,有效避免边缘拉伸问题

这个是原始的projector 投影组件,边缘会有拉伸 经过修改shader 后边缘就没有拉伸了 (实现代码在文章最后) 这个着色器通过检查每个像素的UV坐标是否在定义的边界内,来确定是否应用黑色边框。如果UV坐标处于边缘区域,那么像素颜色会被强制设为黑色,从而在投影图像周围形成一…

240703_昇思学习打卡-Day15-K近邻算法实现红酒聚类

KNN(K近邻)算法实现红酒聚类 K近邻算法,是有监督学习中的分类算法,可以用于分类和回归,本篇主要讲解其在分类上的用途。 文章目录 KNN(K近邻)算法实现红酒聚类算法原理数据下载数据读取与处理模型构建--计算距离模型预测 算法原理 KNN算法虽…

日产X-Trail | 压电式喷油器故障

故障现象 冷启动正常,但超车或者发动机处于负荷状态时就会出现熄火。熄火后无法重新发动,要等发动机完全冷却下来才能再次启动。 有两个故障代码:“P2146:喷油器1和2电源对地短路” 和 “P2146:喷油器3和4电源对地短…

vscode python调试,找不到控制调试工具栏,被隐藏了

问题: 如图所示,最开始蓝框中的调试台被莫名其妙的隐藏了,没法进行调试。 解决办法: 打开设置输入调试点击调试(31)找到红框选的那个选项,选择floating

Django QuerySet对象,all()方法

all()方法 在Django中,all()方法是QuerySet对象的一个方法,用于获取模型的所有实例。 当你调用ModelName.objects.all()时,Django会生成一个SQL查询,从数据库中获取该模型的所有记录,并返回一个QuerySet对象&#xf…

匠心独运:红酒与手工艺的很好结合

在岁月的长河中,红酒与手工艺都以其不同的魅力和技艺,书写着各自的故事。当这两者相遇,仿佛是一场跨越时空的对话,不仅展现了匠心独运的技艺之美,更在无声中诉说着对品质与生活的热爱。今天,就让我们一起探…

echarts-wordcloud:打造个性化词云库

前言 在当今信息爆炸的时代,如何从海量的文本数据中提取有用的信息成为了一项重要的任务。词云作为一种直观、易于理解的数据可视化方式,被广泛应用于文本分析和可视化领域。本文将介绍一种基于 echarts-wordcloud 实现的词云库,通过其丰富的…

魔行观察-AI数据分析>>勒泰中心购物中心

摘要 本报告基于 魔行观察 搜集整理的数据,对勒泰中心购物中心的营业状态、商户构成、业态分布以及消费者评价进行了详细分析。 商场概览 勒泰中心是一个正常营业的购物中心,自2013年开业以来,已成为当地居民和游客的重要购物和休闲场所。…

golang写的自动更新器

文件自动更新器,这个很多端游和软件都有用到的。 golang的rpc通信,是非常好用的一个东西,可以跟调用本地函数一样,调用远程服务端的函数,直接从远程服务端上拉取数据下来,简单便捷。 唯一的遗憾就是&#x…

Speculative decoding 投机采样原理和验证

概念 做法有很多,这里介绍最广泛被人认识的一种(朴素投机采样) 瓶颈: 大模型推理自回归采样,逐步串行解码。 生成的每个Token都需要将所有参数从存储单元传输到计算单元。 因此:内存访问带宽成为重要的瓶颈…

python gdal 压缩栅格数据

1 压缩方法LZW 使用 LZW(Lempel-Ziv-Welch),主要对图像数据压缩,可逆 2 代码 函数gdal_translate():转换栅格的不同格式 我们使用的数据是GTiff格式的数据 GTiff – GeoTIFF File Format — GDAL documentation 参…

怎样保存python文件

按下“CtrlS”键即可快速保存Python文件。 或者点击“File”,在下拉菜单中选择“Save”。 打开后我们就会看到这样的一个页面窗口了。 我们还能在这里进行路径的保存位置的查找。 然后在这里选择文件类型,并输入文件名。 接下来我们点击保存就可以完成操…