18-Gm-TransH:Group-Constrained Embedding of Multi-fold Relations in Knowledge Bases,嵌入,transH,n-ary

文章目录

  • abstract
  • 1. introduction
  • 2 Related Work
    • 2.1 Binary Relation Embedding
    • 2.2 Multi-fold Relation Embedding
  • 3 Group-Constrained Embedding
    • 3.1 Framework
    • 3.2 Optimizing Method
    • 3.3 Proposed Model
    • 3.4 Complexity Analysis
  • 4.实验
    • 4.1 数据集
    • 4.2 Link Prediction
    • 4.3 Instance Classification
  • 5.总结

Huang, Y., et al. (2019). Group-Constrained Embedding of Multi-fold Relations in Knowledge Bases. Natural Language Processing and Chinese Computing: 235-248.

abstract

知识库的表示学习旨在将实体和关系都嵌入到连续的向量空间中。大多数现有模型(例如TransE,DistMult,ANALOGY和ProjE)仅考虑知识库中涉及的二进制关系,而将多重关系转换为三元组并视为二进制关系的实例,从而导致结构信息丢失。M-TransH是最近提出的用于多重关系的直接建模框架,但忽略了某些事实属于同一关系的关系级信息。本文提出了一种组约束嵌入方法,该方法将实体节点和事实节点从实体空间嵌入到关系空间中,将与同一关系相关的嵌入事实节点限制为具有零约束,半径约束或余弦约束的组。使用此方法,提供了一个新模型,即Gm-TransH。我们在链接预测和实例分类任务上评估了我们的模型,实验结果表明Gm-TransH明显优于以前的多重关系嵌入方法,并取得了出色的性能。

  • 实体/关系嵌入(到连续的向量空间中)
    • 二元关系:例如TransE,DistMult,ANALOGY和ProjE)
    • 多重关系嵌入
      • 二元关系的方法用于多重关系(多重关系转化为多个三元组,对每个三元组用二元关系的方法)
      • 问题:二元关系的方法若用于多重关系,将之转换为三元组,视为二元关系,导致信息丢失
        • 出现谓词的异质性heterogeneity,不利于嵌入
        • 解决:M-TransH
      • M-TransH的问题:忽略了某些事实属于同一关系的关系级信息
        • 解决:本文Gm-TransH
  • Gm-TransH:
    • 任务:将实体节点和事实节点从实体空间嵌入到关系空间中
    • 动机:考虑某些事实属于同一关系的关系级信息
      • 做法:以使嵌入的事实向量接近超平面上其对应的关系向量
    • 优化:组约束嵌入方法:Group-Constrained Embedding
      • 约束:
        • 目的:将同一关系的事实节点限制在组中:
        • 策略:零约束、半径约束、余弦约束
    • 对应于三种策略的三个模型变体:Gm-TransH:zero, Gm-TransH:radius, Gm-TransH:cosine

1. introduction

表示学习[7]已被提出作为一种新的知识库表示和推理方法。它嵌入了实体和实体之间的关系。实体和关系的表示是通过最小化涉及所有实体和关系的全局损失函数获得的。与传统的基于逻辑的推理方法相比,表示学习在语义搜索,问题解答,药物发现和疾病诊断等应用中显示出强大的可行性和鲁棒性。

  • 知识图谱应用的方法
    • 基于逻辑的推理方法
    • 表示学习
      • 实体和关系的表示,通过最小化相关的所有实体和关系的全局损失得到
      • 更稳定、可行

尽管取得了令人鼓舞的成就,但大多数现有的表示学习技术(例如TransE [1],DistMult [18],ANALOGY [9]和ProjE [12])仅考虑知识库中包含的二元关系,即三元组每个都涉及两个实体和一个关系。例如,“唐纳德·J·特朗普是美国总统”由两个实体组成:“唐纳德·J·特朗普。特朗普”,“美国”和二元关系“一国总统”。但是,我们现实生活中大量的知识是具有多重关系(n元, 2)的实例,在一个实例中涉及三个或更多实体(例如“哈利·波特是英美电影系列根据作者JK罗琳的哈利波特小说”)。解决此问题的通用方法是将每个多重关系转换为具有二进制关系的三元组,并使用现有的Trans(E,H,R)方法学习每个三元组的嵌入。因此,具有N元关系的实例将转换为2)三元组[17]。尽管这种转换能够捕获多重关系结构的一部分[11],但它导致谓词的异质性,不利于嵌入。Wen等。 [17]提倡多重关系的实例表示,并提出了用于知识库嵌入的直接建模框架“ m-TransH”。但是,m-TransH将事实节点与一般实体节点相同,并且忽略某些事实属于同一关系的关系级别信息。

在本文中,我们首先提出了一种组约束嵌入方法,该方法将实体节点和事实节点从实体空间嵌入到关系空间中,使用三种不同的约束策略()将与同一关系相关的嵌入事实节点限制在组中。即零约束,半径约束和余弦约束。

  • 数据集
    • FB15K [1]
    • JF17K [17].
  • 贡献:
    • Group-Constrained Embedding 框架
    • 三种约束策略:零约束,半径约束和余弦约束
    • 提出Gm-TransH和三个变体
    • 清理冗余数据,从JF17K数据集生成GfactG_{fact}Gfact

(a)提出了用于多重关系嵌入的组约束嵌入框架,该框架将实体和事实节点都嵌入到低维向量空间中,从而迫使事实嵌入接近其对应的关系向量。
(b)我们引入了三种不同的组约束类型:零约束,半径约束和余弦约束。对它们的优缺点进行了经验分析。
(c)整合了TransH模型,并提出了一种新模型Gm-TransH和三个变体Gm-TransH:Zero,Gm-TransH:Radius和GmTransH:Cosine用于多重关系嵌入。链接预测和实例分类任务的实验结果证明了这三种模型变体的有效性。
(d)清理冗余数据并为JF17K数据集生成一个新的子集GfactG_{fact}Gfact

2 Related Work

2.1 Binary Relation Embedding

在这里插入图片描述

  • 二元关系
    • TransE系列:(transilation embedding)
      • TransE:(h,r,t)成立:h+r≈t(h,r,t)成立:h+r\approx t(h,r,t)h+rt
      • TransH:在不同关系下,实体的表示不同(投影)
      • TransR:实体空间–>关系空间
      • PTransE [7],
      • TranSparse [6],
      • KG2E [3]
    • MultiKE [19],
    • RotatE [14]
    • 张量分解方法
      • LFM [4],
      • HolE [10]
    • 神经网络方法
      • ProjE [12]
      • Conv2D [2],
      • NKGE [15],
      • CrossE [20]

2.2 Multi-fold Relation Embedding

  • 多重关系嵌入
    • 通常使用S2C转换和分解框架[17]
      • 多元关系->多个三元组
      • 每个三元组用一次二元关系的方法
    • 直接的多重关系框架
      • M-TransH
        • 将TransH直接泛化到multi-fold关系上
        • cost function:fr(t)=∣∣Σrho∈M(Rr)ar(ρ)Pnr(t(ρ))+br∣∣22,t∈NM(Rr)M(Rr):涉及关系Rr的一组实体N:KB中的所有实体t::Rr的实例t(ρ):ρ角色的实体Pnr(z):向量z在超平面上的投影,nr:normal向量Pnr(z)=z−nrTznrnr和br:单位长度正交向量f_r(t)=||\Sigma_{rho\in M(R_r)}a_r(\rho)P_{n_r}(t(\rho))+b_r||_2^2,t\in N^{M(R_r)}\\ M(R_r):涉及关系R_r的一组实体\\ N:KB中的所有实体 t::R_r的实例\\ t(\rho):\rho角色的实体\\ P_{n_r}(z):向量z在超平面上的投影,\\n_r:normal向量\\ P_{n_r}(z)=z-n_r^Tzn_r\\ n_r和b_r:单位长度正交向量fr(t)=ΣrhoM(Rr)ar(ρ)Pnr(t(ρ))+br22,tNM(Rr)M(Rr):RrN:KBt::Rrtρ):ρPnr(z)z,nrnormalPnr(z)=znrTznrnrbr
        • ar∈RM(Rr),Σrho∈M(Rr)ar(ρ)=0a_r\in R^{M(R_r)},\Sigma_{rho\in M(R_r)}a_r(\rho)=0arRM(Rr),ΣrhoM(Rr)ar(ρ)=0

3 Group-Constrained Embedding

3.1 Framework

在这里插入图片描述

  • 框架
    • 原始文本->知识->知识库中多重关系的实例
    • 事实节点:特定关系的每个实例(Fact)
      • 实例的实体链接到事实节点(三角形)
      • 事实节点可以共享:实体(角色)和关系
    • 组:同一个关系的属于一个组
    • 组内fact距离近,组间距离远

我们的多重关系建模框架如图1所示。从原始文本中提取的知识构成了知识库中多重关系的实例,我们引入事实节点来表示特定关系的每个实例,并将实例的实体链接到相应的事实节点。这些事实节点可以共享某些角色(即实体)和关系。例如,在图1中,事实2和事实4具有相同的“出生”关系,即唐纳德·特朗普和伊万卡·特朗普都出生在纽约。我们将实体和事实节点都嵌入到低维向量空间中,并使具有相同关系的事实节点的嵌入接近,从而为每种关系类型生成一个组,而使不同关系的组彼此远离。

3.2 Optimizing Method

在这里插入图片描述

说明了在知识库中进行多重关系嵌入的三种不同的组约束策略。我们使用零约束,半径约束或余弦约束方法将实体,事实和多重关系从原始向量空间(即图A)嵌入到连续向量空间(即图B,C,D)。橙色正方形表示多重关系,绿色圆圈表示实例(即事实节点),蓝色三角形表示一般实体。 (在线彩色图)
将多重关系转换为二进制关系会导致谓词的异构性,这不利于知识库的嵌入。M-TransH [17]将事实节点与一般实体节点相同,忽略了某些事实属于同一关系的关系级别信息。在这里,我们提出了一种称为组约束嵌入的优化方法,该方法将实体节点和事实节点从实体空间嵌入到关系空间中,从而将与同一关系相关的嵌入事实节点限制为特定组。

  • 优化方法:组约束嵌入
    • 将同一关系相关的嵌入事实节点限定为特定组
    • cost function:fr(t)=∣∣Σrho∈M(Rr)ar(ρ)Pnr(t(ρ))+br∣∣22+β×gr(t),t∈NM(Rr)M(Rr):涉及关系Rr的一组实体N:KB中的所有实体t::Rr的实例t(ρ):ρ角色的实体Pnr(z):向量z在超平面上的投影,nr:normal向量Pnr(z)=z−nrTznrnr和br:单位长度正交向量gr(t):用于限制嵌入事实向量和关系向量的惩罚项。前loss,后penalty−−偏置向量br:来代表关系相似度:测量事实嵌入与关系向量的距离f_r(t)=||\Sigma_{rho\in M(R_r)}a_r(\rho)P_{n_r}(t(\rho))+b_r||_2^2+\beta\times g_r(t),t\in N^{M(R_r)}\\ M(R_r):涉及关系R_r的一组实体\\ N:KB中的所有实体 t::R_r的实例\\ t(\rho):\rho角色的实体\\ P_{n_r}(z):向量z在超平面上的投影,\\n_r:normal向量\\ P_{n_r}(z)=z-n_r^Tzn_r\\ n_r和b_r:单位长度正交向量\\ g_r(t):用于限制嵌入事实向量和关系向量的惩罚项。 \\前loss,后penalty-- \\偏置向量b_r:来代表关系 \\相似度:测量事实嵌入与关系向量的距离fr(t)=ΣrhoM(Rr)ar(ρ)Pnr(t(ρ))+br22+β×gr(t),tNM(Rr)M(Rr):RrN:KBt::Rrtρ):ρPnr(z)z,nrnormalPnr(z)=znrTznrnrbrgr(t):loss,penaltybr:
      • ar∈RM(Rr),Σrho∈M(Rr)ar(ρ)=0a_r\in R^{M(R_r)},\Sigma_{rho\in M(R_r)}a_r(\rho)=0arRM(Rr),ΣrhoM(Rr)ar(ρ)=0
      • 目标:减少损失和惩罚
      • 惩罚gr(t)g_r(t)gr(t):(相似度)
        • zero-constraint:强约束,令事实向量=关系向量
          • gr(t)=∣∣br−Pnr(efact)∣∣2,t∈NM(Rr)g_r(t)=||b_r-P_{n_r}(e_{fact})||_2,t\in N^{M(R_r)}gr(t)=brPnr(efact)2,tNM(Rr)
          • 优点:减少解空间,加快模型收敛
          • 缺点:降低多样性和表达能力
          • 如图B:同组内事实共享相同的实体表示,组内事实表示相同=关系
        • radius
          • gr(t)=∣∣br−Pnr(efact)∣∣2−ϵ,t∈NM(Rr)g_r(t)=||b_r-P_{n_r}(e_{fact})||_2-\epsilon,t\in N^{M(R_r)}gr(t)=brPnr(efact)2ϵ,tNM(Rr)
          • 宽松的约束,在欧几里得空间的距离<ϵ\epsilonϵ(圆)
          • 保证表达能力和多样性
          • 缺点:每个维度的贡献均等
          • 同组的事实在以关系为中心的圆内(超球体)(图C)
        • cosine
          • gr(t)=cos(br,Pnr(efact)),t∈NM(Rr)g_r(t)=cos(b_r,P_{n_r}(e_{fact})),t\in N^{M(R_r)}gr(t)=cos(br,Pnr(efact)),tNM(Rr)
          • 图D:同组在一条线上(过原点)

在图A的原始向量空间中,我们有一个三元关系“ relation1”(用橙色正方形表示)和两个实例(用绿色圆圈表示),它们的FACT-ID为“ f act1”和“ f act2”。两个实例中的每个实例都通过不同的角色(即role1,role2和role3)与其他三个通用实体(由蓝色三角形表示)链接。我们在图A中呈现4个一般实体e1,e2,e3和e4。我们可以看到,f act1和f act2在“ role1”和“ role2”上共享相同的实体,这与“ role3”不同。
在图B,C和D中,我们通过在实例和实体的名称上添加单引号来表示实例和实体的嵌入矢量。事实节点“ f act1”的嵌入向量被标记为“ f act1’”。我们指出嵌入的多重关系“ relation1”与原始向量空间中的关系相同,因为它们是相同的向量,并且没有映射操作。
图B显示了具有零约束的组约束嵌入的结果。当我们强制嵌入的事实向量“ f act1’”,“ f act2’”及其对应的关系向量“ relation1”之间的欧几里得距离为零时,这三个向量几乎落入了嵌入向量空间中的同一点。当使用半径约束时,
如图C所示,“ f act1’”和“ f act2’”落入超球体,“ relation1”充当球体的中心,半径ϵ是介于0和0之间的十进制数。 1。我们可以看到,将ϵ设置为0时,半径约束退化为零约束。
在图D中,我们使用余弦距离作为度量,因此嵌入矢量“ f act1’”,“ f act2’”和“ relation1”的角度几乎相同,投影到超平面时落在一条直线上。

3.3 Proposed Model

  • Group-constrained m-TransH (Gm-TransH)
    • 目标:以使嵌入的事实向量接近超平面上其对应的关系向量

3.4 Complexity Analysis

  • 时间复杂度:TransH>Gm-TransH>M-TransH
    • 变体:radius>zero>cosine
  • 参数数量:Gm-TransH<M-TransH
    在这里插入图片描述

4.实验

4.1 数据集

  • 数据集
    • FB15K [1]
      • 为了验证我们的模型对特定退化类型的多重(N-ary)关系(N=2)的有效性,我们还对FB15K数据集执行了实例分类任务[1]
    • JF17K [17].
      • 多重关系:
        • T(F):GT(F):GT(F):G
        • Tid(F):GidT_{id}(F):G_{id}Tid(F):Gid:缺少大量实例的事实节点
          • FACTID:不适用于本文model,去除
          • 扩充为GfactG_{fact}Gfact
      • 用三元关系表示的二元关系的数据集(S2C(G)):G_{s2c}
      • 一致的数据集
      • 一开始就去除了冗余
        在这里插入图片描述

FB15K。为了验证我们的模型对特定退化类型的多重(N-ary)关系,即N = 2的二元关系的有效性,我们还对FB15K数据集执行了实例分类任务[1]。由于FB15K数据集仅由三元组的二进制关系组成,并且不包含事实节点的信息,因此我们扩展FB15K数据集并将唯一的事实节点附加到每个三元组。因此,我们可以使用扩展的FB15K数据集训练提出的Gm-TransH模型并在仅保持二进制关系的情况下测试其性能。为了与二进制关系的基准模型进行比较,我们使用原始的FB15K数据集来训练NTN,TransE,TransH和TransR模型。为方便起见,我们使用“ Raw”表示原始FB15K数据集,并使用“ Ext”表示扩展的FB15K数据集。表3列出了原始FB15K和扩展FB15K数据集的统计信息。

4.2 Link Prediction

  • 链接预测
    • (h,r,t):三缺1,预测缺的部分
    • the extended JF17K datasets i
    • 给候选实体排序
    • Evaluation Protocol
      • 将测试集中的实例
      • 为了公平起见,我们仅替换实例中出现的真实实体,并排除事实节点。
        在这里插入图片描述
  • 参数

按照标准,随机梯度下降用于训练。我们将L2作为相异性,遍历所有训练样本1000轮。在我们的实验中,研究了实体和关系维d的几种选择:25、50、100、150、200、250。我们在0.0015、0.005、0.01、0.1中选择SGD的学习率λ,在0.001、0.01、0.05 0.1中选择Gm-TransH的平衡因子β,在0.5、1.0、2.0中选择余量γ,在Gm-TransH中选择半径ϵ :半径在0.01、0.05、0.1、0.5、1、5之间,批量B在120、480、960、1920之间。三种不同的Gm-TransH模型的最佳配置为Gm-TransH:零:λ= 0.0015,β= 0.01,γ= 0.5,d = 150,B = 960。Gm-TransH:半径:λ= 0.0015,β= 0.05,γ= 1.0,ϵ = 0.05,d = 250,B = 480。Gm-TransH:余弦:λ= 0.0015,β= 0.01,γ= 1.0,d = 200,B = 1920。

  • 结果
    • 总体而言,模型效果好
    • zero:利于判别
    • cosine:均值度量上好,具有整体优化能力

结果。表5中显示了在清洁和扩展的JF17K数据集上进行链接预测的实验结果,该结果显示了尺寸分别为25、50、100、150、200、250的不同嵌入模型的Hit @ 10结果和平均排名结果。这三个Gm-TransH模型在Hit @ 10和平均排名指标上均大大优于Trans(E,H,R)模型。与m-TransH模型相比,我们的模型提高了Hit @ 10的概率,并通过m-TransH:inst获得了近似的平均排名。结果表明,我们的方法对于通过多重关联嵌入提高链接预测的准确性是有效的。此外,相比之下,Gm-TransH:zero优于Hit @ 10度量上的Radius约束和余弦约束,表明Zero Constraint更好用于判别。Gm-TransH:cosine在均值秩度量上表现最佳,并且具有更高的整体优化能力。

在这里插入图片描述

4.3 Instance Classification

在这里插入图片描述

  • 实例分类任务:判断给定实例(h,r,t)是否正确
  • 构建否定实例
  • 我们选择与链接预测中使用的相同的超参数,并获得20次重复试验的平均准确性。
  • 有效

评估协议。对于实例分类任务,我们在NTN和TransH中遵循相同的协议。由于分类的评估需要否定标记,因此JF17K和FB15K数据集都只包含肯定实例,因此我们按照文献[13]中对FB13使用的相同步骤构造否定实例。对于每个黄金实例,都会创建一个否定实例。
通过最大化训练集的分类精度,我们为每个关系r设置阈值。对于测试集中的给定实例,如果相异性得分低于δr\delta_rδr,它将被分类为正,否则为负。

结果。表6详细列出了实例分类的评估结果。我们可以观察到,在FB15K和JF17K数据集上,Gm-TransH模型都可以达到90%的精度,明显优于包括NTN,Trans(E,H,R)和m-TransH在内的基线模型。这表明我们的模型可以有效,富有表现力地学习关系级信息。此外,从FB15K(Raw)和FB15K(Ext)数据集的结果中,我们看到,即使对于二进制关系,组约束嵌入模型也是可行且可靠的。

5.总结

我们提出了具有三种不同类型的多重关系约束策略的群约束嵌入框架,并提出了一种新的表示学习模型Gm-TransH。我们在扩展的FB15K和JF17K数据集上评估所提出模型的有效性和性能。实验结果表明,在链接预测和实例分类任务上,Gm-TransH模型优于所有基线模型。将来,我们将针对知识库中日趋复杂的数据探索更多的表示和嵌入框架,例如事件和过程,并结合了二进制关系学习中的最新进展以进行多重关系嵌入。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/481500.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

统计学权威盘点过去50年最重要的统计学思想

来源&#xff1a;量化研究方法作者&#xff1a;陈彩娴、Mr Bear编辑&#xff1a;青暮近日&#xff0c;图灵奖得主、“贝叶斯网络之父”Judea Pearl在Twitter上分享了一篇新论文“What are the most important statistical ideas of the past 50 years?”&#xff08;过去50年中…

19-A Walk-based Model on Entity Graphs for Relation Extraction(句内多对,多关系,多元,2018ACL

文章目录abstract1.introduction2 Proposed Walk-based Model2.1 嵌入层2.2 Bidirectional LSTM Layer2.3 Edge Representation Layer2.4 Walk Aggregation Layer2.5 Classification Layer3.实验3.1数据集3.2 Experimental Settings5.结果6.相关工作6.总结Christopoulou, F., e…

CCCF精选 | 李德毅:机器如何像人一样认知——机器的生命观

如果上一代人工智能可以叫做计算机智能&#xff0c;硬核是算力、算法和数据的话&#xff0c;那么新一代人工智能应该是有感知、有认知、有行为、可交互、会学习、自成长的机器智能&#xff0c;其硬核是交互、学习和记忆&#xff0c;而量子认知机的落地应用&#xff0c;则可能是…

量子混沌:相互作用如何影响量子多体系统的局域化?

导语在量子系统中&#xff0c;相干性会打破单个粒子的遍历性&#xff0c;使之进入一种动态局域化状态。对于包含相互作用的量子多体系统&#xff0c;情况会是怎样呢&#xff1f;近日发表于 Nature Physics 的两项研究通过实验证明&#xff0c;相互作用会破坏量子多体系统的动态…

可能是全网最简明的量子纠缠科普

前两天有位朋友抱怨&#xff0c;说是看了很多学者关于量子纠缠的科普&#xff0c;但还是一头雾水&#xff0c;没有一个人真的讲明白的。我就上网搜了几个看。确实&#xff0c;大多数科普要么是光顾着讲爱因斯坦和波尔打嘴炮的历史了&#xff0c;不讲物理&#xff1b;要么讲着讲…

20-Joint entity and relation extraction based on a hybrid neural network(LSTM-ED+CNN),考虑长距离的实体标签之间的关

文章目录abstract1.introduction2.相关工作2.1. Named entity recognition2.2. Relation classification2.3 联合模型2.4. LSTM and CNN models On NLP3.模型3.1. Bidirectional LSTM encoding layer3.2. Named entity recognition (NER) module:LSTM decoder3.3. Relation cla…

牛津大学团队采用先进机器人技术,推动「人造肌腱」实际应用

你知道“肩袖撕裂”吗&#xff1f;它是肩关节炎疼痛的常见原因之一。作为肩袖撕裂损伤中最为常见的肌腱损伤&#xff0c;每年世界范围内的患者高达几千万人。该病痛给患者带来巨大疼痛&#xff0c;甚至导致肢体功能丧失&#xff0c;无法正常生活和工作&#xff0c;造成极大的家…

finetune与Bert

文章目录一&#xff1a;过拟合1.1 直接finetune1.2 layer finetune1.3ULMFiT2 Bert节省内存3 Bert蒸馏4.post train一&#xff1a;过拟合 1.1 直接finetune 容易过拟合 1.2 layer finetune 拷贝部分预训练参数&#xff0c;而其他随机初始化 两部分一同训练&#xff1a;提升…

《Nature》长期寻找,终于发现直接促进神经递质“弹药库”的蛋白质

来源&#xff1a;生物通俄勒冈健康与科学大学(Oregon Health & Science University)的科学家们发现了一种长期寻找的基因编码蛋白质&#xff0c;这种蛋白质能使大脑在神经元之间的间隙(称为突触)之间传递广泛的信号。科学家们发现了一种长期寻找的基因编码蛋白质&#xff0…

机器翻译

1 模型 1.1 模型 1.2 RNNBeam searchAttention 损失函数&#xff1a;交叉熵 预测&#xff1a;不使用解码器而是beam search #paddlepaddle from __future__ import print_function import os import six import numpy as np import paddle import paddle.fluid as flui…

姚能伟:以邻盛智能为例,如何在行业大脑进行创新实践

报告内容摘要随着技术发展&#xff0c;未来一定是智慧的时代。为此我们提除了感知世界&#xff0c;透视数据&#xff0c;洞察未知为理念的新型技术探索与实践。依托多年项目经验与行业专业积累&#xff0c;形成了一些行业深度的解决方案。在实践过程中形成了客观世界的泛感知和…

Science:已“死亡”的细菌仍能感知来自环境的信息

根据信号强度对细菌孢子进行颜色编码的显微镜图像&#xff1a;颜色越亮&#xff0c;信号越强细菌依靠其顽强的生命力&#xff0c;在包括人类在内的各种生命体和地球的各个角落繁衍生息。细菌之所以难以被杀死&#xff0c;是因为它们具有独特的生存策略&#xff0c;其中一种是在…

Berttransformer

1.transformer transformer self-attention 当前编码的词和整个句子所有词做attention&#xff0c;权重加在所有句子上获得当前的表示 encoder-decoder-attention 当前解码的单元和编码器的所有输出做attention&#xff0c;权重加在所有编码输出上&#xff0c;获得当前的表示…

GPT1-3(GPT3/few-shot,无需finetune)

GPT1–finetune 12层单向transformer预训练精调被bert比下去了 GPT2-元学习 输入&#xff1a;加上任务描述 “英翻法&#xff1a;This is life” 输出&#xff1a; “C’est la vie” 参数15亿在NLU:比不上bert也比不过其他大参数模型&#xff1a;如Turing-NLG GPT3-Langua…

一种基于人工智能的化学合成机器人,用于纳米材料的探索和优化

编辑 | 萝卜皮格拉斯哥大学&#xff08;University of Glasgow&#xff09;的研究人员提出了一种自主化学合成机器人&#xff0c;用于探索、发现和优化由实时光谱反馈、理论和机器学习算法驱动的纳米结构&#xff0c;这些算法控制反应条件并允许选择性地模板化反应。这种方法允…

千脑智能理论:开启创造机器智能的路线图 | 《千脑智能》

导语当人们谈论人工智能时&#xff0c;往往热衷于算法优化、模型迭代、算力提升&#xff0c;海量参数的复杂网络仿佛就是人工智能的发展方向。然而&#xff0c;这就是真正的智能吗&#xff1f;计算机科学家与神经科学家杰夫霍金斯在《千脑智能》中提出了一种关于大脑和智能的理…

一类机械神经网络的架构材料,未来智能技术的全新畅想

编辑 | 萝卜皮除了一些活组织之外&#xff0c;很少有材料能够在长时间暴露于意料之外的环境负载情况下自主学习表现出所需的行为。在不断变化的条件下&#xff08;例如&#xff0c;内部损坏程度的上升、不同的夹具场景和波动的外部负载&#xff09;&#xff0c;仍然有更少的材料…

自然语言处理的未来之路(周明老师,CCF-GRIR,笔记)

文章目录1.什么叫自然语言处理1.1 困难1.2历史1.3 智能1.4 经典nlp任务的进展02.技术体系2.1 词2.2 句子03 未来发展3.1 资源丰富的任务---中英翻译3.2 资源少的任务3.3 多轮问题--多轮对话4 未来之路自然语言&#xff1a;规则—>统计—>神经网络现在&#xff1a;黄金时代…

从英国首位印裔首相,看印度IC产业

来源&#xff1a;芯师爷当地时间10月24日&#xff0c;英国前财政大臣苏纳克在保守党党首竞选中胜出&#xff0c;将成为英国新一任首相。这也意味着他将成为英国历史上第一位印度裔首相。图源&#xff1a;环球网一时间&#xff0c;关于“首位印度裔首相&#xff0c;苏纳克成功逆…

CASREL:A Novel Cascade Binary Tagging Framework for Relational Triple Extraction(关系抽取,ACL2020,重叠关系)

文章目录1.介绍2.相关工作3.The CASREL Framework3.1 Bert3.2 cascade decoder4.实验5.结果参考1.介绍 做重叠关系的少 重叠关系&#xff1a; Zeng et al. (2018) &#xff1a;seq2seq强化学习改善提取顺序Fu et al. (2019)&#xff1a;(GraphRel)GCNs将文本建模为关系图 以前…