Pytorch 中 LSTM 和 LSTMCell 的区别

Pytorch 中 LSTM 和 LSTMCell 的区别

news/2025/7/2 20:32:10/文章来源:https://blog.csdn.net/cnhwl/article/details/126588861

LSTM 的官方文档在这里

在这里插入图片描述

在例子中：
LSTM 函数的参数为输入特征向量的长度 input_size = 10、隐藏层向量的长度 hidden_size = 20、隐藏层的数量 num_layers = 2；
输入 input 的维度是时间/序列长度（句子有多少个单词） time_steps = 5、批量 batch = 3、输入特征向量的长度 input_size = 10；
初始的隐藏层向量与状态向量的维度都是隐藏层的数量 num_layers = 2、批量 batch = 3、隐藏层向量的长度 hidden_size = 20

在这里插入图片描述

LSTM 就是中间的红色框，它将输入（蓝色框）和初始的隐藏层向量与状态向量（黄色框）作为输入，输出的是最终的隐藏层向量与状态向量（绿色框）。

LSTMCell 的官方文档在这里

在这里插入图片描述
在例子中：
LSTMCell 函数的参数为输入特征向量的长度 input_size = 10、隐藏层向量的长度 hidden_size = 20；
输入 input 的维度是时间/序列长度（句子有多少个单词） time_steps = 5、批量 batch = 3、输入特征向量的长度 input_size = 10；
初始的隐藏层向量与状态向量的维度都是批量 batch = 3、隐藏层向量的长度 hidden_size = 20

在这里插入图片描述
对比即可得知，LSTMCell 就是图中的红色框，实际上就是一个隐藏层神经元，所以它没有 LSTM 中隐藏层数量这个参数。使用 LSTMCell 的方法就是 for 循环，遍历次数为时间/序列长度；LSTM 则是优化了这个 for 循环。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/307504.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

程序员修神之路--缓存架构不够好，系统容易瘫痪

程序员修神之路--缓存架构不够好，系统容易瘫痪

“灵魂拷问缓存能大幅度提高系统性能，也能大幅度提高系统瘫痪几率怎么样防止缓存系统被穿透？缓存的雪崩是不是可以完全避免？前几篇文章我们介绍了缓存的优势以及数据一致性的问题，在一个面临高并发系统中，缓存几乎成了…

阅读更多...

Leetcode 数据结构与算法题解大全——目录（推荐收藏，持续更新）

Leetcode 数据结构与算法题解大全——目录（推荐收藏，持续更新）

为了方便查找写过的题解，我按照不同的类型将题解进行了归类，这里做个目录置顶。由于牛客网笔试时可能用的是ACM模式，所以可以看看这篇博客，做做入门练习就理解了。刷题顺序的话，可以按我的这篇博客刷。数学&#x…

阅读更多...

Magicodes.IE之花式导出

Magicodes.IE之花式导出

总体设计Magicodes.IE是一个导入导出通用库，支持Dto导入导出以及动态导出，支持Excel、Word、Pdf、Csv和Html。在本篇教程，笔者将讲述如何使用Magicodes.IE进行花式导出。在本篇教程，笔者主要讲述如何使用IE进行花式导出并满足客户…

阅读更多...

京东笔试4.2-19:00随笔

京东笔试4.2-19:00随笔

30道选择考察到了数据结构，计网，linux,数据库，java基础，就记得这些了两道编程题一道二叉树一道动态规划一道也没AC出来第一道需要会做的前提是需要创建二叉树并给其赋值然后再谈算法因为一直刷leetcode，转换…

阅读更多...

我又踩坑了！如何为HttpClient请求设置Content-Type标头？

我又踩坑了！如何为HttpClient请求设置Content-Type标头？

最近在重构认证代码，认证过程相当常规：POST /open-api/v1/user-info?client_id&timstamp&rd12345&sign***&methodhmac content-type: application/json payload: { "token":"AA2917B0-C23D-40AB-A43A-4C4B61CC7C74&qu…

阅读更多...

利用数组创建二叉树并赋值

利用数组创建二叉树并赋值

1:二叉树的创建与赋值 (1):前言知识这里的创建是利用层序序列进行创建,主要就是根节点的坐标为i 的话那么左节点的坐标为 2i1,右节点的坐标为2i2;开辟一个结构体 struct Node {int val;Node * left;Node * right;Node () : val(-1),left(NULL),right(NULL) {};Node(int x)…

阅读更多...

2020 中国开源年会（COSCon'20）再启程：开源向善（Open Source for Good）

2020 中国开源年会（COSCon'20）再启程：开源向善（Open Source for Good）

中国开源年会COSCon2020正式启动！*本图由开源社设计组叶凯设计时间：2020年10月24-25日线上直播地址：bilibili & Youtube讲师互动平台：Zoom时间弹指飞逝，转眼即过去了一年。不知道各位在这多舛的半年间又和开源这二…

阅读更多...

利用结构体数组实现重排序(详解)

利用结构体数组实现重排序(详解)

一:要求输入乱序的成绩单包括姓名和成绩，成绩按照递增顺序输出,如果遇见成绩相同的按名字的字典序输出。示例： 输入 5 w 12 a 12 v 7 c 3 e 9输出: c 3 v 7 e 9 a 12 w 12二:代码实现 #include<bits/stdc.h> using namespace std;struc…

阅读更多...

使用Azure Functions玩转Serverless

使用Azure Functions玩转Serverless

Serverless&Azure Functions通过无服务器计算，开发者无需管理基础结构，从而可以更快构建应用程序。通过无服务器应用程序，将由云服务提供商自动预配、缩放和管理运行代码所需的基础结构。要理解无服务器计算的定义，注意到服务…

阅读更多...

java并发之初识

java并发之初识

一:并发编程的难点 1:原子性问题操作系统做任务切换,可以发生在任何一条CPU指令执行完成后；CPU能保证的原子操作是指令级别的，而不是高级语言的操作符； n不是原子操作的，而是3条指令 2:可见性问题可见性是指一个线程对一个…

阅读更多...

Dotnet Core IHttpClientFactory深度研究

Dotnet Core IHttpClientFactory深度研究

今天，我们深度研究一下IHttpClientFactory。一、前言最早，我们是在Dotnet Framework中接触到HttpClient。HttpClient给我们提供了与HTTP交互的基本方式。但这个HttpClient在大量频繁使用时，也会给我们抛出两个大坑：一方面&#xf…

阅读更多...

java并发之synchronized实现原理及其优化

java并发之synchronized实现原理及其优化

1:synchronnized概述 synchronized修饰的方法或代码块相当于并发中的临界区，即在同一时刻jvm只允许一个线程进入执行。synchronized是通过锁机制实现同一时刻只允许一个线程来访问共享资源的。另外synchronized锁机制还可以保证线程并发运行的原子性，有…

阅读更多...

.NET 是信息技术应用创新产业重要参与者

.NET 是信息技术应用创新产业重要参与者

今天是国庆节，也是中秋节，月满中秋，举国欢庆，在这里祝各位开发者中秋国庆快乐。放假在家就想把这几年对于.NET发展相关生态做个梳理，写一篇文章来总结一下这两年从腾讯出来自己创业，推动.NET在国内的应用的…

阅读更多...

蓝桥杯- 包子凑数

蓝桥杯- 包子凑数

一:题目题目描述小明几乎每天早晨都会在一家包子铺吃早餐。他发现这家包子铺有 NN 种蒸笼，其中第 ii 种蒸笼恰好能放 A_iA i 个包子。每种蒸笼都有非常多笼，可以认为是无限笼。每当有顾客想买 XX 个包子，卖包子的大叔就会迅速选出若…

阅读更多...

秋天 | 等疫情过后，我们继续背起相机去旅行

秋天 | 等疫情过后，我们继续背起相机去旅行

这是头哥侃码的第218篇原创2020年，注定是不平凡的一年。八个月前，我正和家人一起沉浸在春节的喜悦中，可没成想一场疫情的到来彻底改变了欢快的气氛。别的倒没什么，只是之前所有的计划全部被打乱了。先说春节假期，和舅舅…

阅读更多...

简单理解CAP-BASE

简单理解CAP-BASE

1、CAPCAP是分布式系统的指导理论，是NoSQL数据库的理论基石。CAP其实就是对分布式系统的特性总结，即一致性（Consistency）、可用性（Availability）、分区容错性（Partition tolerance）。…

阅读更多...

面试必问系列之在浏览器中输入URL后到网页显示其间发生了什么?

面试必问系列之在浏览器中输入URL后到网页显示其间发生了什么?

文章目录[TOC](文章目录)1:解析URL网址,从而生成发送给Web服务器的Http请求信息2:真实地址查询-----(DNS域名解析)3:调用协议栈4:可靠的传输 TCP5:远程定位--IP地址6:两点传输--获取MAC地址7:网卡--出口8:送别者--交换机9:出境大门--路由器10:相互扒皮--服务端与客户端1:解析UR…

阅读更多...

C# 中的 is 真的是越来越强大，越来越语义化

C# 中的 is 真的是越来越强大，越来越语义化

一：背景 1. 讲故事最近发现 C#7 之后的 is 是越来越看不懂了，乍一看花里胡哨的，不过当我静下心来仔细研读，发现这 is 是越来越短小精悍，而且还特别语义化，那怎是一个爽字了得????，这一篇就和…

阅读更多...

leetcode209. 长度最小的子数组(滑动窗口)

leetcode209. 长度最小的子数组(滑动窗口)

一:题目二:上码 class Solution { public:/**思路:1.滑动窗口解法1>:确定窗口内是什么2>:确定窗口的起始位置3>:确定窗口的终止位置2.窗口:也就是我们的求的连续字符串的和3.窗口的起始位置: 窗口的起始位置最先是我们数组的起始位置,当窗口内连续数组的和大于targe…

阅读更多...

开源特训营 - Lesson 4 - 如何运营社区

开源特训营 - Lesson 4 - 如何运营社区

编辑：李明康责编：袁睿斌作者：课程助教 - 苏斌主讲教师：庄表伟（开源社理事长）、赵生宇（同济大学）本次课程的主题为《如何运营社区》，主讲者为开源社的理事长庄表伟老师和来…

阅读更多...

最新文章