RNN总结

RNN总结

news/2025/7/15 17:59:00/文章来源:https://blog.csdn.net/weixin_30493401/article/details/98114018

RNN既可以表述为循环神经网络（recurrent neural network），也可以表述为递归神经网络（recursive neural network），前者一般用于处理以时间序列为输入的问题（比如把一个句子看成词组成的序列），每次向循环神经网络输入一个词，知道整个句子输入结束。后者一般用于处理图结构或树结构问题（比如为了处理歧义问题，我们构造语法树为输入，而不是循环输入每一个词）。

下图是循环神经网络的展开

图1

下面是一个句子对上图的应用

图2

可以这样理解：将所有用到的英文词向量化之后，the表示为（0.4,0.3），对应图1中的x输入，经过神经元计算之后输出为（1,3.5），神经元内部的计算方式为:

函数f通常是诸如tanh或者ReLU的非线性函数,U，x，St-1都为向量且U、V、W都是待训练参数。输出O可以选择softmax函数，其表达式如下

这里的变量i对应图1中的变量t，可见

也就是说循环神经网络所有输出之和为1，输出O的计算公式为

其中V和St都是向量。也就是说神经元先计算隐状态St，然后计算输出Ot

下面以树结构为例来说明递归神经网络的输入与计算

1.将句子分词之后，给每个词一个向量，这里词的向量化可以采用one-hot或者其他一些向量化工具，比如Google的gensim

2.将词按照树形结构输入，以图3为例

图3

2.1 首先计算“两个”和“外语学院”的父节点的向量，计算方法是：假设“两个”的词向量表示为c1，“外语学院”的词向量表示为c2，那么父节点对应的向量P为

其中W和b是训练好的参数，tanh是双曲正切函数，表达式为

2.2 依次迭代计算各个父节点对应的向量，最终得到根节点对应向量。

因为是以语法树输入的，所以对于歧义问题有较好的处理能力，比如图3中的句子也可以用图4的语法树来表示：

图4

事实上，图3与图4对应的根节点向量完全不同，因为词向量的输入顺序是不一样的。

在得到根节点向量后，我们就可以去完成一些更高级的任务，比如计算语义相似度或者情感分析等。

转载于:https://www.cnblogs.com/xueyinzhe/p/7441639.html

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/251974.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Problem 2. number题解

Problem 2. number题解

number：数学二分图匹配首先，如果S<N,那么S1，S2...N这些数直接放在S1,S2...N的位置上(如果其他数x放在这些位置上面，这些数不放在对应位置，那么x一定能放在这些数放的位置，所以直接交换即可)所以可以直接…

阅读更多...

SSD列子

SSD列子

一、介绍本博文主要介绍实现通过SSD物体检测方式实现工件裂纹检测。裂纹图像如下所示： 二、关于SSD算法具体算法不再阐述，详细请参考： https://blog.csdn.net/u013989576/article/details/73439202 https://blog.csdn.net/xiaohu2022/arti…

阅读更多...

linux硬链接与软链接

linux硬链接与软链接

Linux 系统中有软链接和硬链接两种特殊的“文件”。软链接可以看作是Windows中的快捷方式，可以让你快速链接到目标档案或目录。硬链接则透过文件系统的inode来产生新档名，而不是产生新档案。创建方法都很简单： 软链接（符号链接…

阅读更多...

int转时间

int转时间

int转时间 public static string FormatDuration(int duration) { if (duration 0) return "00:00:00"; int hours duration / 3600; int minutes duration % 3600 / 60; int seconds duration % 3600 % 60; string _hours hours.ToString("00") &qu…

阅读更多...

企业级区块链现状研究报告：小企业的投资总额是大企业的28倍

企业级区块链现状研究报告：小企业的投资总额是大企业的28倍

根据企业级区块链现状研究报告表明，当前企业采用区块链技术的势头正在逐步增强。参与该报告的企业表示，区块链投资今年共增长了 62% ，预计到 2025 年区块链将成为主流技术。其中，有 28% 的企业正在积极开展区块链发展计划。现在看…

阅读更多...

特征匹配

特征匹配

Python 使用Opencv实现图像特征检测与匹配 2018-06-13 11:36:58 Xy-Huang 阅读数 19203更多分类专栏： Python 人工智能版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。本文链接…

阅读更多...

bzoj 1015 并查集

bzoj 1015 并查集

代码： //这题可以反着想，把要去掉的点倒着处理变成往图中一个一个的加点，然后用并查集处理联通快就好了。 #include<iostream> #include<cstdio> #include<cstring> #include<vector> using namespace std; const in…

阅读更多...

页面中切换echarts主题

页面中切换echarts主题

要做的效果是：点击下拉框切换echarts主题下面是效果图： 项目环境： vue ts es6 echarts(4.2.1) 步骤安装依赖， npm install echarts -S / yarn add echarts -S引入主题参考链接选择下拉框中的主题时，拿到图表主题…

阅读更多...

画极线

画极线

OpenCV学习日记5 2017-05-27 10:44:35 1000sprites 阅读数 2339更多分类专栏： 计算机视觉版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。本文链接：https://blog.cs…

阅读更多...

Win10开启Administrator超级管理员账户

Win10开启Administrator超级管理员账户

方法1 1、在系统的开始菜单上，我们单击鼠标右键，然后选择计算机管理打开进入 2、打开的计算机管理窗口，点击本地用户和组中的用户打开，然后点击右侧的Administrator账户，双击鼠标打开进入 3、打开的属性窗口中&#xf…

阅读更多...

Mysql异常问题排查与处理——mysql的DNS反向解析和客户端网卡重启

Mysql异常问题排查与处理——mysql的DNS反向解析和客户端网卡重启

中午刚想趴一会，不料锅从天降！！！Mysql连不上了。。。。。。。现象如下： 现象1：登录mysql所在服务器，连接MySQL 成功； 现象2：通过客户端远程连接MySQL，返回失…

阅读更多...

最近很火的MySQL：抛开复杂的架构设计，MySQL优化思想基本都在这

最近很火的MySQL：抛开复杂的架构设计，MySQL优化思想基本都在这

优化一览图优化笔者将优化分为了两大类：软优化和硬优化。软优化一般是操作数据库即可；而硬优化则是操作服务器硬件及参数设置。 1、软优化 1）查询语句优化首先我们可以用EXPLAIN或DESCRIBE(简写:DESC)命令分析一条查询语句的执行信息。例…

阅读更多...

【读书笔记】《深入浅出Webpack》

【读书笔记】《深入浅出Webpack》

Webpack版本分析版本为3.6.0 4.0为最近升级的版本，与之前版本变化较大，编译输出的文件与3.0版本会不一致，目前项目中使用的版本3.0版本，所以基于3.0版本进行分析学习。 Webpack构建流程初始化：启动构建，读…

阅读更多...

《JAVA与模式》之桥梁模式

《JAVA与模式》之桥梁模式

在阎宏博士的《JAVA与模式》一书中开头是这样描述桥梁（Bridge）模式的： 桥梁模式是对象的结构模式。又称为柄体(Handle and Body)模式或接口(Interface)模式。桥梁模式的用意是“将抽象化(Abstraction)与实现化(Implementation)脱耦&#xff0…

阅读更多...

LABLEME UPDATE DAMOD

LABLEME UPDATE DAMOD

Labelme的改进——海量图片的自动标注深度学习一般需要对大量的图片进行标注，但是手动标注耗时耗力，所以模仿labelme软件的功能，使用程序对大批量的图片进行自动标注，大大减少手动操作。下面介绍如何实现对大批量的图片进行标…

阅读更多...

Java基础教程：面向对象编程[2]

Java基础教程：面向对象编程[2]

Java基础教程：面向对象编程[2] 内容大纲访问修饰符四种访问修饰符 Java中，可以使用访问控制符来保护对类、变量、方法和构造方法的访问。Java 支持 4 种不同的访问权限。 default (即缺省，什么也不写）: 在同一包内可见&#xff…

阅读更多...

【javascript】异步编年史，从“纯回调”到Promise

【javascript】异步编年史，从“纯回调”到Promise

异步和分块——程序的分块执行一开始学习javascript的时候， 我对异步的概念一脸懵逼， 因为当时百度了很多文章，但很多各种文章不负责任的把笼统的描述混杂在一起，让我对这个 JS中的重要概念难以理解， “异步是非阻塞的…

阅读更多...

Shell编程之if语法练习（LNMP）全过程

Shell编程之if语法练习（LNMP）全过程

大家好，我是延凯，本人原来在CSDN写作已经快一年了都是相关Linux运维这方面的技术知识，现在搬到博客园也是我一直想的，本博客主要写Python，docker，shell等偏向开发云计算等知识点，谢谢各位&…

阅读更多...

基于UNet和camvid数据集的道路分割

基于UNet和camvid数据集的道路分割

基于UNet和camvid数据集的道路分割h(1.3.0)： 背景语义分割是深度学习中的一个非常重要的研究方向，并且UNet是语义分割中一个非常经典的模型。在本次博客中，我尝试用UNet对camvid dataset数据集进行道路分割，大致期望的效果如下&…

阅读更多...

二分法查找和普通查找

二分法查找和普通查找

一、普通查找对于数组和一个需要查找的元素来说，普通查找的原理很简单，即为从数组的第一个元素到最后一个元素进行遍历，如果第i个元素的值等于我们需要查找的值，那么返回找到的角标i，否则返回-1表示没有查找到。这里以…

阅读更多...

最新文章