图谱问答-句子向量模型部署项目总结（未完）

news/2025/4/14 4:39:40/文章来源:https://blog.csdn.net/flying_all/article/details/117458724

内容来自七月算法nlp课程。

文章目录

1 句子向量
- 1.1 bert句子向量表示相似度效果不好
- 1.2 sentence-bert

1 句子向量

句子向量是用于实体消岐的。可以使用Elmo，也可以使用bert。这里介绍用bert生成句子向量。

1.1 bert句子向量表示相似度效果不好

Bert中最常用的句向量方式是采用cls标记位或者平均所有位置的输出值，注意，在采用平均的方式的时候，我们需要先做一个mask的操作，计算均值时，除以mask的和。但bert的句子向量效果不理想。

为什么呢？
原因1：词频率影响词向量的空间分布。bert词向量表示与原点的L2距离的均值。高频的词更接近原点。

原因2：低频次分布偏向稀疏。度量词向量空间中与K近邻单词的 L2 距离的均值。我们可以看到高频词分布更集中，而低频词分布则偏向稀疏。然而稀疏性的分布会导致表示空间中存在很多“洞”，这些洞会破坏向量空间的“凸性”。考虑到BERT句子向量的产生保留了凸性，因而直接使用其句子embeddings会存在问题。
这个凸性听得云里雾里。
在这里插入图片描述

解决的模型有：sentence-bert、bert-flow和simCSE。

1.2 sentence-bert

论文：https://arxiv.org/pdf/1908.10084.pdf
代码：https://github.com/UKPLab/sentence-transformers

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/423970.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Linux du

Linux du

linux中du与df的区别和联系 1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。df，di…

阅读更多...

DataList分页技术-- PagedDataSource类实现DataList和Repeater的分页效果

DataList分页技术-- PagedDataSource类实现DataList和Repeater的分页效果

Asp.net提供了三个功能强大的列表控件：DataGrid、DataList和Repeater控件，但其中只有DataGrid控件提供分页功能。相对DataGrid，DataList和Repeater控件具有更高的样式自定义性，所以很多时候我们喜欢使用DataList或Repeater控件来显…

阅读更多...

基于知识图谱的问答系统实践

基于知识图谱的问答系统实践

文章目录1 项目目标1.1 数据情况1.2 问题分类2 技术方案2.1 数据准备2.2 数据入库2.3 查询部分3 模型3.1 问题分类3.1.1 数据准备3.1.2 分类模型TextCNN3.2 不同类型的问题处理逻辑4 总结与优化1 项目目标 1.1 数据情况基于知识图谱的问答系统，简称为KBQA&#x…

阅读更多...

java常用的语句

java常用的语句

//判断一个长的字符串中是否包含某一个短的字符串 if (str1.indexOf(str2) ! -1) {return true;//存在 }else {return false; } /*** 消息模板关键字替换* param template 消息内容* param map 替换key-value* return*/ public static String replaceTemplate(String template…

阅读更多...

spring mvc学习（48）：java判断系统是linux还是windows系统

spring mvc学习（48）：java判断系统是linux还是windows系统

java判断系统是linux还是windows系统判断一个系统是windows还是linux? import org.junit.jupiter.api.Test;/*** program: utilsdemo* description: 判断运行的系统是windows还是linux* author: zhangyu* create: 2019-08-12 10:07*/public class JudgeSystem {/*** descript…

阅读更多...

二分搜索模板

二分搜索模板

翻了一下自己的博客。记录了花花酱的二分搜索模板、王争的二分搜索模板。花花酱的文章中提到：不要试图去找一个正确答案。试图去找一个分割点m，使得x>m，g(x)>0为true。这个始终get不到。王争的二分模板思路是比较简单的，就…

阅读更多...

spring mvc学习（49）：返回json数据

spring mvc学习（49）：返回json数据

json包下载 pom.xml <project xmlns"http://maven.apache.org/POM/4.0.0" xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation"http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">…

阅读更多...

【推荐】“水果”公司的复兴（乔布斯和苹果公司）---Google黑板报

【推荐】“水果”公司的复兴（乔布斯和苹果公司）---Google黑板报

从google黑板报上发现的很好的介绍乔布斯和苹果的文章：“水果”公司的复兴发表者：Google（谷歌）研究员吴军1.传奇小子2.迷失方向3.再创辉煌大家可以看一下，感受史蒂夫乔布斯的传奇。转载于:https://www.cnblogs.com/co…

阅读更多...

log4j 日志配置

log4j 日志配置

Log4j教程 - Log4j安装 Log4j API包是根据Apache软件许可证分发的。最新的log4j版本，包括全源代码，类文件和文档可以在http://logging.apache.org/log4j/找到。我们可以从上面的链接下载apache-log4j-x.x.x.tar.gz或zip文件。支持库我们可以使用log4…

阅读更多...

理解transformer

理解transformer

文章目录1 注意力机制2 自注意力机制3 自注意力机制加强版4 Transformer的结构4.1 input4.2 encoder4.2.1 Multi-head attention4.2.2 残差链接4.2.3 层正则化layer norm4.2.4 前馈神经网络 feed forward network4.3 decoder4.3.1 输入4.3.1 Masked Multi-head attention4.3.2 …

阅读更多...

第一百三十七期:一个简单的小案例带你理解MySQL中的事务

第一百三十七期:一个简单的小案例带你理解MySQL中的事务

事务又叫做TCL，全称是transaction control language，意思是事务控制语言。作者：Java的架构师技术栈事务又叫做TCL，全称是transaction control language，意思是事务控制语言。这篇文章还是属于我的mysql基础文章&…

阅读更多...

解决ffmpeg拉流转发频繁丢包问题max delay reached. need to consume packet

解决ffmpeg拉流转发频繁丢包问题max delay reached. need to consume packet

软件： 1、流媒体服务器EasyDarwin-windows-8.1.0-1901141151 2、ffmpeg-20181001-dcbd89e-win64-static 3、直播源：rtsp://192.168.1.168/0 4、流媒体服务器EasyDarwin地址rtsp://192.168.1.28/3 问题现象 [rtsp 0000000000122bc0] max delay reached. …

阅读更多...

第一百三十八期:37 个MySQL数据库小知识，为面试做准备

第一百三十八期:37 个MySQL数据库小知识，为面试做准备

无论是运维、开发、测试，还是架构师，数据库技术是一个必备加薪神器，那么，一直说学习数据库、学MySQL，到底是要学习它的哪些东西呢? 作者：芒果教你学编程无论是运维、开发、测试，还是架构师&…

阅读更多...

NLG模块实现（未完成）

NLG模块实现（未完成）

NLG(Natural Language Generation)，计算机将结构化数据转换为文本并以人类语言编写信息。使用GPT框架完成NLG任务。GPT模型是预训练模型， 采用两阶段过程，第一个阶段是利用语言模型进行预训练（无监督形式）&#xff0c…

阅读更多...

android adb shell常用命令（四）

android adb shell常用命令（四）

一、简介 adb命令是adb这个程序自带的一些命令，而adb shell则是调用的Android系统中的命令，这些andorid特有的命令都放在来Android设备的system/bin目录下。二、常用命令介绍 pm Pacage Manager，可以获取到一些安装在Android设备上的应用信息…

阅读更多...

第一百三十九期:11月数据库排行：排名前三数据库分数暴跌

第一百三十九期:11月数据库排行：排名前三数据库分数暴跌

DB-Engines 数据库流行度排行榜 11 月更新已发布，与上期数据相比，这期排行榜最大的亮点就是排名前三数据库那引人注目的“红色”分数。作者：局长 DB-Engines 数据库流行度排行榜 11 月更新已发布，排名前二十如下： ▲…

阅读更多...

对话系统之NLU总结报告

对话系统之NLU总结报告

文章目录1 项目介绍1.1 背景知识介绍1.2 数据集介绍1.3 评价指标2 技术方案梳理2.1 模型目标2.2 模型介绍2.3 模型实现2.3.1 数据处理2.3.2 构建dataset2.3.3 模型定义2.3.4 训练相关参数2.3.5 训练结果3 项目总结1 项目介绍 1.1 背景知识介绍对话系统按领域分类&#xff0c…

阅读更多...

Windows SDK编程之一窗口示例程序

Windows SDK编程之一窗口示例程序

/*Win32应用程序框架主要由"初始化窗口类"，"窗口注册类"，"窗口的创建"以"窗口消息函数"等组成*/ #include "stdafx.h" LRESULT CALLBACK WndProc(HWND,UINT,WPARAM,LPARAM); //窗口函数说明 /* Win…

阅读更多...

Ubuntu下用apache+perl搭建最简单的聊天室

Ubuntu下用apache+perl搭建最简单的聊天室

最近学习了下perl，尝试自己搭建一个聊天室，现已搭建成功，但设计方法很简陋，误见笑，收获在于对apache、html、perl都有了些许认识，后面打算学习LAMP（LinuxApacheMySQLPHP）搭建一个在线…

阅读更多...

闲聊型对话系统之NLG总结报告

闲聊型对话系统之NLG总结报告

文章目录1 项目介绍1.1 背景知识介绍1.2 NLG的实现方式1.2.1 基于模板1.2.2 检索式1.2.3 生成式1.3 数据集介绍2 技术方案梳理2.1 模型介绍2.2 评价指标2.3 模型实现2.3.1 数据处理2.3.2 构建dataset2.3.3 模型定义2.3.4 训练相关参数2.3.5 训练结果1 项目介绍 1.1 背景知识介…

阅读更多...

最新文章