Re55：读论文 Entities as Experts: Sparse Memory Access with Entity Supervision

Re55：读论文 Entities as Experts: Sparse Memory Access with Entity Supervision

news/2025/4/27 8:16:34/文章来源:https://blog.csdn.net/PolarisRisingWar/article/details/134616337

诸神缄默不语-个人CSDN博文目录
诸神缄默不语的论文阅读笔记和分类

论文名称：Entities as Experts: Sparse Memory Access with Entity Supervision
模型名称：Entities as Experts (EaE)

ArXiv网址：https://arxiv.org/abs/2004.07202

本文是2020年EMNLP论文。作者来自谷歌。
这篇文章也贯彻了谷歌论文的风格，那就是非常难读。

EaE的核心思想从文本中学习实体表征，结合到LM中做QA任务

在这里插入图片描述

为每个实体构建独立的表征，然后EaE再将其用于QA
① MLM预测实体 ② 获取每个实体的正确memory （用了现成的实体识别工具和维基百科超链接）

在这里插入图片描述

文章目录

1. 模型公式
2. 实验

1. 模型公式

在这里插入图片描述

Entity Memory Layer：
在这里插入图片描述

伪实体表征（头尾表征）：
在这里插入图片描述

在实体嵌入表中找伪实体表征的K近邻，加权求和：
在这里插入图片描述

Task-Specific Heads：
TokenPred and EntityPred（实体嵌入中离伪实体表征最近的）

Inference-time Mention Detection：
mention detection layer
BIO预测实体

损失函数：
(1) a mention boundary detection loss, (2) an entity linking loss, and (3) a masked language modeling loss

2. 实验

下游任务：cloze knowledge probes, opendomain question answering and relation extraction

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/171426.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

人工智能基础_机器学习050_对比sigmoid函数和softmax函数的区别_两种分类器算法的区别---人工智能工作笔记0090

人工智能基础_机器学习050_对比sigmoid函数和softmax函数的区别_两种分类器算法的区别---人工智能工作笔记0090

可以看到最上面是softmax的函数对吧,但是如果当k = 2 那么这个时候softmax的函数就可以退化为sigmoid函数,也就是逻辑斯蒂回归了对吧我们来看一下推导过程,可以看到上面是softmax的函数可以看到k=2 表示,只有两个类别对吧,两个类别的分类不就是sigmoid函数嘛对吧,所以说 …

阅读更多...

Python算法——霍夫曼编码树

Python算法——霍夫曼编码树

Python中的霍夫曼编码树霍夫曼编码是一种用于数据压缩的技术，通过构建霍夫曼编码树（Huffman Tree）来实现。这篇博客将详细讲解霍夫曼编码树的原理、构建方法和使用方式，并提供相应的Python代码实现。霍夫曼编码原理霍夫曼编…

阅读更多...

ubuntu 安装 jetbrains-toolbox

ubuntu 安装 jetbrains-toolbox

ubuntu 安装 jetbrains-toolbox 官网下载 jetbrains-toolbox jetbrains 官网 jetbrains 官网：https://www.jetbrains.com/ jetbrains-toolbox 官网下载页面在下载页面点击 Download 安装 jetbrains-toolbox 解压 jetbrains-toolbox 安装包到指定目录本案例将…

阅读更多...

STM32 默认时钟更改 +debug调试

STM32 默认时钟更改 +debug调试

STM32时钟文章目录 STM32时钟前言一、修改系统时钟二、DEBUG 前言为什么我们要改STM32的时钟呢，打个比方在做SPI驱动的时候，需要16M的时钟，但是stm32默认是72的分频分不出来，这个时候我们就要改系统时钟了，那么怎么…

阅读更多...

[科普] 无刷直流电机驱动控制原理图解

[科普] 无刷直流电机驱动控制原理图解

Title: [科普] 无刷直流电机驱动控制原理图解文章目录 I. 引言II. 直流电机的原理1. 有刷直流电机和无刷直流电机的区别2. 有刷直流电机的运行原理3. 既是电动机又是发电机 III. 无刷直流电机的原理1. 无刷直流电机与永磁同步电机的区别2. 无刷直流电机的换向控制原理3. 无刷直…

阅读更多...

python 笔记根据用户轨迹+基站位置，估计基站轨迹+RSRP

python 笔记根据用户轨迹+基站位置，估计基站轨迹+RSRP

1 问题描述已知用户实际的轨迹，和基站的位置，能不能得到用户所连接的基站，以及基站的信号强度RSRP？ 1.1 几个假设这里我们做几个假设： 每个用户有80%的概率连接最近的基站，有20%的概率选择其他的基站连…

阅读更多...

4/5G互操作 EPSFB讲解

4/5G互操作 EPSFB讲解

今天我们来讲一下4/5G之间之间互操作，以及5G的EPSFB是基于什么实现的~ 目录 4/5G互操作重选切换基于覆盖的切换基于业务的切换两个面试问题想要加快4G切换5G的速度，调哪个参数怎么调高效？ 想要减慢5G切换4G的速度调哪个参数怎…

阅读更多...

2018年5月23日 Go生态洞察：更新Go行为准则

2018年5月23日 Go生态洞察：更新Go行为准则

🌷🍁 博主猫头虎（🐅🐾）带您 Go to New World✨🍁 🦄 博客首页——🐅🐾猫头虎的博客🎐 🐳 《面试题大全专栏》 🦕 文章图文…

阅读更多...

knime 中没有column expressions，怎么下载

knime 中没有column expressions，怎么下载

knime 中没有column expressions，怎么下载 1、打开view，然后找到knime hub，column expression 2、往里面拖动，就可以安装了 3、然后会出现重启，搜索就可以出现啦

阅读更多...

【SpringCloud】从单体架构到微服务架构

【SpringCloud】从单体架构到微服务架构

今天来看看架构的演变过程一、单体架构从图中可以看到，所有服务耦合在一起，数据库存在单点，一旦其中一个服务出现问题时，整个工程都需要重新发布，从而导致整个业务不能提供响应这种架构对于小项目而言是没有什么…

阅读更多...

OSG编程指南＜十二＞：OSG二三维文字创建及文字特效

OSG编程指南＜十二＞：OSG二三维文字创建及文字特效

1、字体基础知识适当的文字信息对于显示场景信息是非常重要的。在 OSG 中，osgText提供了向场景中添加文字的强大功能，由于有第三方插件 FreeType 的支持，它完全支持TrueType 字体。很多人可能对 FreeType 和 TrueType 还不太了解&#xff0c…

阅读更多...

【AUTOSAR】【通信栈】ComXf

【AUTOSAR】【通信栈】ComXf

AUTOSAR专栏——总目录_嵌入式知行合一的博客-CSDN博客文章浏览阅读292次。本文主要汇总该专栏文章，以方便各位读者阅读。https://xianfan.blog.csdn.net/article/details/132072415 目录一、概述二、限制说明

阅读更多...

深度学习第3天：CNN卷积神经网络

深度学习第3天：CNN卷积神经网络

☁️主页 Nowl 🔥专栏《机器学习实战》《机器学习》 📑君子坐而论道，少年起而行之文章目录介绍 CNN的主要结构卷积层激励层池化层 Kears搭建CNN 搭建代码直观感受卷积的作用结语介绍卷积神经网络（Convol…

阅读更多...

vs2019中出现Debug Error的原因

vs2019中出现Debug Error的原因

一般出现这种错误表示你的某个变量没有正确赋值，或者说本身在你的C程序中加了assert断言，assert的作用是先计算表达式expression,如果其值为假，那么它会打印一条错误信息 #include<assert.h> void assert(int expression); 例子&…

阅读更多...

皮尔逊相关性分析的matlab实现，简介和实例

皮尔逊相关性分析的matlab实现，简介和实例

皮尔逊相关性分析（Pearson correlation analysis）是一种常用的统计方法，用于衡量两个变量之间的线性关系强度和方向。它通过计算两个变量之间的协方差和标准差来衡量它们之间的相关性。皮尔逊相关系数的取值范围为 -1 到 1，其中 -…

阅读更多...

【nlp】4.1 fasttext工具介绍（文本分类、训练词向量、词向量迁移）

【nlp】4.1 fasttext工具介绍（文本分类、训练词向量、词向量迁移）

fasttext工具介绍与文本分类 1 fasttext介绍1.1 fasttext作用1.2 fasttext工具包的优势1.3 fasttext的安装1.4 验证安装2 fasttext文本分类2.1 文本分类概念2.2 文本分类种类2.3 文本分类的过程2.4 文本分类代码实现2.4.1 获取数据2.4.2 训练集与验证集的划分2.4.3 训练模型2.4…

阅读更多...

安全设备的监控与运维的全面解决方案

安全设备的监控与运维的全面解决方案

随着信息技术的快速发展和广泛应用，网络安全问题日益凸显。如何有效监控和管理各类安全设备，确保其稳定运行，并及时发现和解决潜在的安全风险，成为当前亟待解决的问题。在此背景下，监控易应运而生，为安全设…

阅读更多...

新手如何对一个web网页进行一次渗透测试

新手如何对一个web网页进行一次渗透测试

新手如何对一个web网页进行一次渗透测试文章目录新手如何对一个web网页进行一次渗透测试什么是渗透测试?渗透测试和红蓝对抗的区别那么拿到一个网站后如何进行一次优雅的渗透测试呢什么是渗透测试? 在获得web服务运营的公司书面授权的情况下，模拟攻击者的行为…

阅读更多...

JAVA - 阻塞队列

JAVA - 阻塞队列

一、什么是堵塞队列堵塞队列（Blocking Queue）是一种特殊类型的队列，它具有一些特定的行为和限制。在堵塞队列中，当队列为空时，尝试从队列中取出元素的操作将会被阻塞，直到队列中有可用元素；当…

阅读更多...

windows运行Pangolin应用填坑心得——如何在window应用轻量级opengl软件Pangolin库显示3D界面及窗口

windows运行Pangolin应用填坑心得——如何在window应用轻量级opengl软件Pangolin库显示3D界面及窗口

目录 0、前言1、最有效的安装打开方式准备工作安装git安装vcpkg（1）下载（2）安装（3）集成至vs 安装cmake 安装pangolin 2、应用实例c工程（1）vs创建新工程（2）新工…

阅读更多...

最新文章