深度学习:到底怎么理解embedding

深度学习:到底怎么理解embedding

注意到embedding这个词,很大可能是在进行时间序列上的处理过程中遇到的,遇到的时间序列模型中,很大部分需要用到embedding过程,同时在看相关的程序代码的时候看到模型的结构设计中设计到embedding层。那么到底什么是embedding,还有embedding完成了什么操作,这里记录一下最直观的解释。

1. 何为Embeddings–何为嵌入

Embeddings: 中文名词:嵌入
OpenAI的文本嵌入衡量文本字符串的相关性。

说的简单一点,就是一种编码,只不过这个编码的过程与one-hot这种简单的编码表示方式不同,这个embedding是有一个字典,同时通过这种嵌入方式所表示的数据可以含有数据之间的相似性信息,相似性可以通过计算相似度。如下面的余弦相似度计算方式。

通俗一点解释嵌入的过程:现在有一本字典,字典规定了每一个单词可以通过一个长度为10的向量进行表示。那么
现在有一句话,I like cats,那么用字典每一个词都可以用长度为10的向量表示,则这个最终的表示维度大小为[3,10],现在你有另一句话I love cats,这句话用这个字典可以通过维度[3,10]的数据表示。

如果采用one-hot 编码的方式表示,假设是有十个不同的单词,那么I like cats 这句话需要同样需要[3,10],但是其中只有三个数字是1,其他全是0。在NLP处理中并不是一个好的编码方式。

总的来说,嵌入具有以下优势:可以完成语义表示,完成降维,学习语义关系,提高计算效率。最重要一点,这个嵌入是从数据中学习得到的。

这是有一本字典的前提,如果要是没有,就相当于在自己的网络中Embedding层,然后通过训练得到Embedding的权重,完成嵌入过程。

  • 余弦相似度:
    s i m i l a r i t y = cos ⁡ ( θ ) = A ⋅ B ∥ A ∥ ∥ B ∥ = ∑ i = 1 n A i × B i ∑ i = 1 n ( A i ) 2 × ∑ i = 1 n ( B i ) 2 \mathrm{similarity}=\cos(\theta)=\frac{A\cdot B}{\|A\|\|B\|}=\frac{\sum_{i=1}^nA_i\times B_i}{\sqrt{\sum_{i=1}^n{(A_i)^2}}\times\sqrt{\sum_{i=1}^n{(B_i)^2}}} similarity=cos(θ)=A∥∥BAB=i=1n(Ai)2 ×i=1n(Bi)2 i=1nAi×Bi
    其中, A ⋅ B \mathbf{A}\cdot\mathbf{B} AB表示点积, ∥ A ∥ \|\mathbf{A}\| A表示范数,结果越靠近1越相近。
import numpy as np
from numpy.linalg import normdef cosine_similarity(a, b):dot_product = np.dot(a, b)norm_a = norm(a)norm_b = norm(b)similarity = dot_product / (norm_a * norm_b)return similarity# 示例向量
vector_a = np.array([1, 2, 3])
vector_b = np.array([4, 5, 6])# 计算余弦相似度
similarity = cosine_similarity(vector_a, vector_b)print(f"Cosine Similarity: {similarity}")

下面用代码说明可能更直观。

2.torch.nn.Embeddings()

在torch中提供了一个nn.Embedding()层,可以构建网络的过程中使用,这里面涉及的参数包括以下

  • num_embeddings(int) : 嵌入字典的大小
  • embedding_dim(int) :每个嵌入向量的大小

通过程序理解这两个参数,

import torch
import torch.nn as nn
embedding = nn.Embedding(20, 5)
input = torch.LongTensor([[1,2,3,4], [4,3,2,9]])
print(input.shape)
print(embedding(input).shape)
print(embedding(input))
print(embedding.weight.shape)

运行之后会得到:

torch.Size([2, 4])
torch.Size([2, 4, 5])
torch.Size([20, 5])

-第一个参数就是说你添加的这个字典的大小,对应的是训练更新权重的第一个维度,第二个参数对应的是训练更新权重的第二个维度,同时embedding_dim大的大小相当于在输入数据的后面添加了一个嵌入向量大小的维度。

通俗解释:输入数据是包含2句话,每一句话有四个数据(单词)(torch.Size([2,4])),经过embedding之后,还是有两句话,每一句话中的每一个数据,都用长度为5的向量表示,则输出的维度为torch.Size([2,4,5])。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/155174.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux下Centos7 gcc/g++、动态库/静态库(动态/静态链接)

1.gcc/g gcc是对c语言代码进行编译链接,而g是对c代码进行编译链接,接下来我们只对gcc进行讲解,g的使用方法跟gcc是一样的。 编译链接的四个步骤: 1:预处理 2:编译 3:汇编 4:链接 注:这些在后面都会着重讲解 1.1gcc -o 我们先在D…

C++之谓词

C之谓词 一元谓词 #include<iostream> using namespace std; #include<vector> #include<algorithm> //仿函数 返回值类型是boo1数据类型&#xff0c;称为谓词 //一元谓词class GreaterFive { public:bool operator()(int val){return val > 5;} };void …

傅里叶分析(2)

在《傅里叶分析&#xff08;1&#xff09;》中&#xff0c;讲述了连续信号的傅里叶分析方法&#xff0c;本文讲述离散信号的傅里叶分析方法。 虽然电、声、光、机械振动等信号在物理上是连续函数&#xff0c;但在实际工程中&#xff0c;其通常为离散信号&#xff0c;即若干离散…

2024测试工程师必学系列之Jmeter(36):jmeter对图片验证码的处理

jmeter对图片验证码的处理 在web端的登录接口经常会有图片验证码的输入&#xff0c;而且每次登录时图片验证码都是随机的&#xff1b;当通过jmeter做接口登录的时候要对图片验证码进行识别出图片中的字段&#xff0c;然后再登录接口中使用&#xff1b; 通过jmeter对图片验证码…

【CSH 入门基础 8 -- csh 中 set 与 setenv 的区别 】

文章目录 set 命令setenv 命令区别设置系统路径变量PATH添加单个路径设置多个路径 举例例子&#xff1a;编辑 .cshrc 文件 设置文件路径设置和使用局部变量永久设置变量 在 csh&#xff08;C shell&#xff09;和它的变体 tcsh&#xff08;增强型 C shell&#xff09;中&#x…

深度学习之基于yolo的体育运动项目姿态估计识别计数系统

欢迎大家点赞、收藏、关注、评论啦 &#xff0c;由于篇幅有限&#xff0c;只展示了部分核心代码。 文章目录 一项目简介 二、功能三、系统四. 总结 一项目简介 深度学习在体育运动项目姿态估计识别计数系统中的应用是一项具有挑战性和应用价值的研究领域。以下是对深度学习在体…

亚马逊运营中动态/静态住宅IP代理的应用有哪些?跨境电商必备

作为全球最大的电商平台之一&#xff0c;亚马逊已经成为许多商家的首选销售平台。而代理IP作为近几天互联网的热门工具&#xff0c;在跨境电商界也起着非常强大的作用。那么在亚马逊运营中&#xff0c;适合动态住宅代理还是静态住宅代理呢&#xff1f;下面我们一起来探索&#…

位运算技巧及leetcode相关例题Java实现

目录 一、异或运算符的运用&&leetcode136 异或运算符 a ^ b ^ b a leetcode136 二、n & (n - 1)&&leetcode133 n & (n - 1):消除n最右边的一个1 leetcode133/剑指offer15 三、m的n次方&#xff08;n是正整数&#xff09; 常规写法 二进制的快…

LeetCode热题100——贪心算法

贪心算法 1. 买卖股票最大利润2. 跳跃游戏3. 跳跃游戏Ⅱ 1. 买卖股票最大利润 给定一个数组 prices &#xff0c;它的第 i 个元素 prices[i] 表示一支给定股票第 i 天的价格。 你只能选择 某一天 买入这只股票&#xff0c;并选择在 未来的某一个不同的日子 卖出该股票。设计一…

linuxTcp状态转换

1.TCP状态转换 在TCP进行三次握手&#xff0c;或者四次挥手的过程中&#xff0c;通信的服务器和客户端内部会发送状态上的变化&#xff0c;发生的状态变化在程序中是看不到的&#xff0c;这个状态的变化也不需要程序猿去维护&#xff0c;但是在某些情况下进行程序的调试会去查…

《QT从基础到进阶·三十六》QWidget实现收缩栏的效果

功能&#xff1a; 1、可以在收缩栏插件中添加界面 2、可以把界面展开或收缩 3、可以用鼠标拖动界面改变界面的排放顺序 源码放在最下方 1、可以在收缩栏插件中添加界面 virtual void addWidget(QWidget* widget, const QString& label, const QIcon& icon QIcon())…

打造高效医患沟通:陪诊小程序开发技术指南

随着科技的不断发展&#xff0c;陪诊小程序作为医患沟通的新工具逐渐成为关注焦点。本文将带领你通过使用React和Node.js技术栈&#xff0c;构建一个功能强大且用户友好的陪诊小程序&#xff0c;实现医患互动的便捷和高效。 1. 准备工作 确保你的开发环境中已安装了Node.js和…

封装Vue中的axios请求库

安装axios&#xff1a;首先&#xff0c;在项目中安装axios库。可以使用npm或者yarn进行安装。 npm install axios创建封装文件&#xff1a;在src目录下创建一个api文件夹&#xff0c;并在该文件夹下创建一个request.js文件。 在request.js文件中&#xff0c;引入axios库和Vue&…

点击这里,获取数据治理加速器!

数据管理员&#xff1a;又双叒叕…盘一遍数据&#xff0c;这种工作究竟还要重复多少次&#xff1f;&#xff01; • 上上个月&#xff0c;发现数据有些问题&#xff0c;我把数据盘了一遍&#xff0c;梳理完数据的关联表才定位到问题&#xff1b; • 上个月&#xff0c;进行数据…

竞赛 题目:基于深度学习的人脸表情识别 - 卷积神经网络 竞赛项目 代码

文章目录 0 简介1 项目说明2 数据集介绍&#xff1a;3 思路分析及代码实现3.1 数据可视化3.2 数据分离3.3 数据可视化3.4 在pytorch下创建数据集3.4.1 创建data-label对照表3.4.2 重写Dataset类3.4.3 数据集的使用 4 网络模型搭建4.1 训练模型4.2 模型的保存与加载 5 相关源码6…

js判断参数是否为空方法

这边记录一下大致的判断情况&#xff0c; 写法一&#xff08;不推荐&#xff09;&#xff1a; function foo(arg){//写法一&#xff1a;不严谨arg arg ? arg : 我是默认值console.log(arg) }foo(123) //输出:123 foo() //输出&#xff1a;我是默认值 foo(0) …

去除IDEA中代码的波浪线(黄色警示线)

去除IDEA中代码的波浪线 首先是点击File—>Settings 操作如下图所示: 然后点击Editor—>Inspections—>General—>Duplicated code fragment(去掉勾选)—>Apply—>OK 即可,详情请看下图所示:

【Java】Groovy 语言应用场景以及积累

Groovy 是一种多用途的编程语言&#xff0c;它可以用于多种开发场景。以下是 Groovy 可以用于的一些开发领域和示例&#xff1a; 脚本编写&#xff1a; Groovy 的简洁语法和强大的动态特性使其成为编写脚本的理想选择。 def message "Hello, World!" println messag…

7-sqlalchemy快速使用和原生操作、增删查改、增加和基于对象的跨表查询、scoped线程安全、g对象、基本增查改和高级查询

1 sqlalchemy快速使用 2 sqlalchemy原生操作 3 sqlalchemy操作表 3.2 基本增删查改 4 一对多关系 4.1 关系建立 4.2 增加和基于对象的跨表查询 5 多对多关系 5.2 增加和基于对象跨表查 6 scoped线程安全 7 g对象 8 基本增查改 7 常用查询 1 sqlalchemy快速使用 1.1 介绍 # …

什么是数字化工厂?企业数字化转型有什么好处?

科技在发展&#xff0c;时代在进步&#xff0c;全球信息化、数字化的步伐越来越快&#xff0c;数字化转型是否成功也成为企业在未来发展中能否做大做强的关键因素。而数字化工厂就是制造业数字化发展的一个重要发展方向&#xff0c;那么究竟什么是数字化工厂呢&#xff1f;它和…