seq2seq架构略解

seq2seq架构略解

diannao/2025/7/12 20:46:18/文章来源:https://blog.csdn.net/C20180602_csq/article/details/138230580

用于序列翻译任务（下图来自d2l）

训练时输入输出格式：

若数据集为{ <(a1,a2,a3,a4,a5),(b1,b2,b3,b4,b5)> }（AB语言对应的句子组）

输入

A语言的单词序列+结束符（a1,a2,a3,a4,a5,<eos>）

开始符+B语言的单词序列（<bos>,b1,b2,b3,b4,b5）

输出

B语言的单词序列（b1,b2,b3,b4,b5,<eos>）

预测时输入格式：

A语言的单词序列+结束符（a1,a2,a3,a4,a5,<eos>）

开始符+空（<bos>，，，，，）

编码器、解码器两部分使用的暂时还是RNN

编码器RNN

隐藏层使用普通初始化

输入：

A语言序列单词的独热向量+<eos>的独热向量

输出：

特征向量序列（但后续并没有使用）+隐藏层参数H1

解码器RNN

使用编码器计算结束之后的隐藏层H1，初始化隐藏层

输入：

训练时，输入<bos>+B语言序列单词的独热向量 + H1（直接拼接）

预测时，输入<bos>，然后将当前RNN预测结果作为下一次预测的输入。

输出：

B语言单词序列的独热向量+<eos>的独热向量

训练时seq2seq的计算图：

预测时seq2seq的计算图：

代码d2l官网十分详细了，就不再赘述了。

另外一个小插曲

实际上d2l官方给出的代码实现的解码器架构有一些小问题

在预测时，在第一步预测完毕之后，使用的dec_state会继承解码器RNN的隐藏层状态，而不是保持编码器所获取的隐藏层H1的信息

在评论区里面已经有大佬给出了正确的代码实现，可以围观。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/diannao/4122.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

RabbitMQ是如何保证消息不被重复消费，或者说是如何保证消息消费时的幂等性的

RabbitMQ是如何保证消息不被重复消费，或者说是如何保证消息消费时的幂等性的

目录面试官：RabbitMQ是如何保证消息不被重复消费？或者说是如何保证消息消费时的幂等性的1. 使用唯一业务标识2. 使用RabbitMQ的消息去重插件3. 使用业务逻辑实现幂等性4. 使用消息属性和死信队列5. 使用Spring Boot的重试机制该文章专注于面试，面试只要回答关键点即可，不需…

阅读更多...

Unity类银河恶魔城学习记录14-5 p152 Lost currency save and enemy‘s currency drop

Unity类银河恶魔城学习记录14-5 p152 Lost currency save and enemy‘s currency drop

Alex教程每一P的教程原代码加上我自己的理解初步理解写的注释，可供学习Alex教程的人参考此代码仅为较上一P有所改变的代码【Unity教程】从0编程制作类银河恶魔城游戏_哔哩哔哩_bilibili LostCurrencyController.cs using System.Collections; using System.Colle…

阅读更多...

【STM32+HAL】三轴按键PS2摇杆

【STM32+HAL】三轴按键PS2摇杆

一、准备工作： 有关CUBEMX的初始化配置，参见我的另一篇blog：【STM32HAL】CUBEMX初始化配置有关定时器触发ADC模式配置，详见【STM32HAL】ADC采集波形实现二、所用工具： 1、芯片： STM32F407VET6 2、CUBE…

阅读更多...

通义灵码-IDEA的使用教程

通义灵码-IDEA的使用教程

通义灵码-IDEA的使用教程 1、通义灵码是什么？ 通义灵码，是阿里云出品的一款基于通义大模型的智能编码辅助工具，提供行级/函数级实时续写、自然语言生成代码、单元测试生成、代码注释生成、代码解释、研发智能问答、异常报错排查等能力&#…

阅读更多...

【QT进阶】Qt线程与并发之线程和并发的简单介绍

【QT进阶】Qt线程与并发之线程和并发的简单介绍

往期回顾： 【QT进阶】Qt http编程之实现websocket server服务器端-CSDN博客【QT进阶】Qt http编程之实现websocket client客户端-CSDN博客【QT进阶】Qt线程与并发之创建线程的三种方法(超详细介绍)-CSDN博客【QT进阶】Qt线程与并发之线程和并发的简单介绍一、 …

阅读更多...

MATLAB矩阵

MATLAB矩阵

MATLAB 矩阵矩阵是数字的二维数组。在MATLAB中，您可以通过在每行中以逗号或空格分隔的数字输入元素并使用分号标记每行的结尾来创建矩阵。例如，让我们创建一个45矩阵一- 示例 a [ 1 2 3 4 5; 2 3 4 5 6; 3 4 5 6 7; 4 5 6 7 8] MATLAB将执行上述语…

阅读更多...

C++可调用对象的绑定器和包装器

C++可调用对象的绑定器和包装器

包装器和绑定器乃神器也可调用对象、包装器std:function、绑定器std:bind应用场景:可变函数和参数、回调函数、取代虚函数可调用对象在C中，可以像函数一样调用的有:普通函数、类的静态成员函数、仿函数、lambda函数、类的成员函数、可被转换为函数的类的对象…

阅读更多...

uniapp微信小程序开发踩坑日记：Vue3 + uniapp项目引入Echarts图表库

uniapp微信小程序开发踩坑日记：Vue3 + uniapp项目引入Echarts图表库

一、下载插件包下载地址如下： lime-echart: 百度图表 echarts，uniapp、taro 使用 echarts 图表，全面兼容各平台小程序、H5、APP、Nvue 将以下两个文件夹放到项目的components里同样地，将静态资源文件夹下内容放到自己项目的s…

阅读更多...

什么是端口

什么是端口

啊，端口！这可是计算机网络中一个非常重要的概念呢。简单来说，端口就好比是网络通信中的门，用来区分不同的应用程序或服务。我们知道，计算机在进行网络通信时需要通过网络传输数据，而端口就是帮助计算机在…

阅读更多...

vue echarts 饼图(环形图)

vue echarts 饼图(环形图)

vue echarts 饼图(环形图) ，echarts版本为5.3.3 可以自定义颜色 <template><div><div id"pieChart1" ref"pieChartRef1" style"width: 100%; height: 250px"></div></div></template><scri…

阅读更多...

ASP.NET教务平台—学籍管理模块开发与设计

ASP.NET教务平台—学籍管理模块开发与设计

摘要教务平台之学籍管理模块是一个典型的教务信息管理系统(MIS)，其开发主要包括后台数据库的建立和前端应用程序的开发两个方面。对于后台数据库要求实现数据的完整性、一致性和安全性；对于前台应用程序开发则要求模块功能完备、界面友好、易使用等特…

阅读更多...

java中http调用组件深入详解

java中http调用组件深入详解

目录一、前言二、http调用概述 2.1 什么是http调用 2.1.1 http调用步骤 2.2 HTTP调用特点 2.3 HTTP调用应用场景三、微服务场景下http调用概述 3.1 微服务开发中http调用场景 3.2 微服务组件中http的应用四、常用的http调用组件 4.1 java中常用的http组件介绍 4…

阅读更多...

C++11新特性：lambda表达式

C++11新特性：lambda表达式

目录 1.lambda表达式 1.1 C98中的一个例子 1.2 lambda表达式 1.3 lamzbda表达式语法 1. lambda表达式各部分说明 2. 捕获列表说明 1.4 函数对象与lambda表达式 1.lambda表达式 1.1 C98中的一个例子在C98中，如果想要对一个数据集合中的元素进行排序&#xff0…

阅读更多...

Kafka 3.x.x 入门到精通（04）——对标尚硅谷Kafka教程

Kafka 3.x.x 入门到精通（04）——对标尚硅谷Kafka教程

Kafka 3.x.x 入门到精通（04）——对标尚硅谷Kafka教程 2. Kafka基础2.1 集群部署2.2 集群启动2.3 创建主题2.4 生产消息2.5 存储消息2.5.1 存储组件2.5.2 数据存储2.5.2.1 ACKS校验2.5.2.2 内部主题校验2.5.2.3 ACKS应答及副本数量关系校验2.5.2.4 日志文…

阅读更多...

BEC写作和其他英语写作有什么区别？成人学英语去哪里柯桥有专业培训吗？

BEC写作和其他英语写作有什么区别？成人学英语去哪里柯桥有专业培训吗？

BEC中级考试的写作与其他英语类考试略有不同。除考查考生的整体写作水平之外，它也考查考生处理日常商务活动及解决商务运作中出现问题的能力。测试题材与体裁均与商务信函有关，往往涉及以下内容： 商务信函：这里所涉及的信函往往是…

阅读更多...

CNAS软件测评报告收费标准

CNAS软件测评报告收费标准

随着信息技术的快速发展，软件测评在保障软件质量、提升用户体验等方面扮演着越来越重要的角色。CNAS（中国合格评定国家认可委员会）作为国内权威的认可机构，其软件测评报告收费标准受到了广泛关注。本文旨在解析CNAS软件测评报告的…

阅读更多...

（学习日记）2024.05.06：UCOSIII第六十节：User文件夹函数概览（uCOS-III-＞Source文件夹）第六部分

（学习日记）2024.05.06：UCOSIII第六十节：User文件夹函数概览（uCOS-III-＞Source文件夹）第六部分

写在前面： 由于时间的不足与学习的碎片化，写博客变得有些奢侈。但是对于记录学习（忘了以后能快速复习）的渴望一天天变得强烈。既然如此不如以天为单位，以时间为顺序，仅仅将博客当做一个知识学习的目录&a…

阅读更多...

CentOS安装CRI--containerd

CentOS安装CRI--containerd

前言 CRI，Container Runtimes，通常直译成容器进行时因为kubernetes，从1.24开始，移除了Dockershim，需要额外安装CRI，保障Pod能顺利运行。网上有很多容器进行时的工具，本文采用containerd工具。 …

阅读更多...

解决双击PDF文件出现打印的问题【Adobe DC】

解决双击PDF文件出现打印的问题【Adobe DC】

问题描述电脑安装Adobe Acrobat DC之后，双击PDF文件就会出现打印，而无法直接打开。右键PDF文件就会发现，第一栏出现的不是用Adobe打开，而是打印。重装软件多次仍然无法解决。原因右键菜单被改写了。双击其实是执行右键菜…

阅读更多...

AIGC的发展历程

AIGC的发展历程

AI生成内容（AIGC）的发展历程可以追溯到20世纪50年代，当时人工智能（AI）的概念还处于起步阶段。然而，AIGC技术的快速发展主要集中在21世纪初，特别是随着深度学习、自然语言处理和其他相关领域的突…

阅读更多...

最新文章