Elasticsearch(面试篇)

目录

Elasticsearch的倒排索引是什么?

详细描述一下Elasticsearch更新和删除文档的过程

描述一下Elasticsearch搜索的过程


兄弟们一起加油 ! ! !

Elasticsearch的倒排索引是什么?

传统我们索引通过文章,逐个遍历找到对应关键词的位置。而倒排索引,是通过分成策略,形成了词和文章的映射关系表,这种词典+映射表即为倒排索引。有了倒排索引,就能实现O(1) 时间复杂度的效率检索文章了,极大的提高了检索效率。

详细描述一下Elasticsearch更新和删除文档的过程

1. 删除和更新也都是写操作,但是Elasticsearch中的文档是不可变的,因此不能被删除或则改动以展示其变更;

2. 磁盘上的每个段都有一个相应的 .del文件。当删除请求发送后,文档没有真的被删除而是在 .del文件中被标记为删除,新版本的文档被索引到一个新段。旧版本的文档依然能匹配查询,但是会在结果中被过滤掉。

描述一下Elasticsearch搜索的过程

1. 搜索被执行成一个两阶段过程,我们称之为Query Then Fetch;

2. 在初始查询阶段时,查询会广播到索引中每一个分片拷贝(主分或者副本分片)。每个分片在本地执行搜索并构建一个文档匹配的大小为from + size的优先队列

3. 每个分片返回各自优先队列中所有文档的ID和排序值给协调节点,它合并这些值到自己的优先队列中来产生一个全局排序后的结果列表。

4. 接下来就是 取回阶段,协调节点辨别出哪些文档需要被取回并向相关的分片体骄傲多个GET请求。每个分片加载并丰富文档,如果有需要的话,接着返回文档给协调节点。一旦所有的文档都被取回了,协调节点返回结果给客户端。

5. 补充:Query Then Fetch 的搜索类型在文档相关性打分的时候参考的时本分片的数据,这样在文档数量较少的时候可能不够准确,DFS Query Then Fetch增加了一个预查询的处理,询问Term和Document frequency,这个评分更准确,但是性能会变差。

后续会继续增加该文章面试问题

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/51431.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

TCP/UDP的对比,粘包分包抓包,http协议

服务器端: 一、loop 127.0.0.1本地回环测试地址 二、tcp特点 面向连接、可靠传输、字节流 粘包问题:tcp流式套接字,数据与数据之间没有套接字,导致可能多次的数据粘到一起 解决方法:(1)规…

使用USB转485转接器,从机不响应

在调试485通信时,bms不响应主机,usb转485转换器接收指示灯常亮,现象如下,通过更新驱动程序解决。 更新驱动程序链接: 1. 下载并解压驱动文件 https://www.szutek.com/Uploads/file/20210917/20210917091627_42822.rar…

生信圆桌:专业生信服务器与平台服务的提供者

生信圆桌是一个专注于提供生物信息学(生信)服务器和平台服务的领先企业,致力于为全球科研机构、企业和独立研究者提供高性能的生信分析解决方案。随着生物信息学研究对计算资源的需求日益增加,生信圆桌凭借其先进的服务器技术和专…

C++ 多线程(互斥锁、条件变量)

互斥锁 最简单示例&#xff1a; #include <iostream> #include <thread> #include <mutex>std::mutex mtx; int counter 0;void increment() {for (int i 0; i < 10000; i) {// b1 是创建出来的对象. lock_guard 类似智能指针一样,为了防止忘记释放锁…

【QT学习】1-2 Liunx环境下QT5.12.9软件安装1——VMware17.0.0虚拟机安装

注意&#xff1a;如果电脑已经安装低版本的VMware&#xff0c;千万不要卸载&#xff0c;直接覆盖安装&#xff0c;更新到新的安装版本 1.点击.exe文件&#xff0c;右键以管理员身份运行&#xff0c;点击下一步&#xff0c;下一步 2.选择软件安装位置后&#xff0c;点击下一步。…

手写Spring框架(简单实现)

Spring风格的三级缓存管理&#xff1a;一个简单实现示例 在实现一个简单的Spring风格的依赖注入容器时&#xff0c;我们通常需要处理Bean的生命周期&#xff0c;包括实例化、属性注入以及完全初始化。为了处理复杂的依赖关系和循环依赖问题&#xff0c;我们可以使用三级缓存机…

虚幻5|制作一个木桩,含血量及伤害数字

一&#xff0c;基础设置 1.创建Actor蓝图类 2.编辑胶囊体和网格体的碰撞预设 3.打开敌人的角色蓝图&#xff0c;编辑飙血特效 二&#xff0c;创建敌人血量的ui&#xff0c;命名为敌人血量&#xff0c;如下 1. 2&#xff0c;打开后&#xff0c;添加一个画布画板和进度条&#…

ArkUI-布局(一)

ArkUI-布局 布局概述布局元素的组成如何选择布局布局位置对子元素的约束 线性布局部分属性与使用方式 层叠布局部分属性与使用方式 弹性布局基本概念布局方向布局换行主轴对齐方式交叉轴对齐方式容器设置交叉轴对齐方式子元素设置交叉轴对齐方式内容对齐 自适应拉伸 布局概述 …

C++基础面试题 | 什么是C++的列表初始化?

青山相待&#xff0c;白云相爱&#xff0c;梦不到紫罗袍共黄金带。 - 《山坡羊道情》(宋方壶) 2024.8.26 回答重点 C11中引入了列表初始化&#xff0c;其语法是用花括号{}来初始化变量或对象。列表初始化可以应用于&#xff1a; 基础数据类型用户自定义类型&#xff08;类、结…

云端集中管控边缘服务:利用 EMQX ECP 在 K8s 上快速部署 NeuronEX

随着物联网、边缘计算技术的发展&#xff0c;实现边缘服务的快速部署对于分布式计算环境至关重要。它不仅可以显著降低延迟、节省带宽资源、增强数据的安全性和隐私保护&#xff0c;同时还能改善用户体验&#xff0c;支持动态变化的工作负载需求&#xff0c;提供更高的灵活性和…

Linux 实时调度器:带宽限制

文章目录 1. 前言2. 概念3. 实时进程 的 带宽限制3.1 实时进程 带宽限制 初始化3.2 启动 实时进程 带宽 监测定时器3.3 累加 实时进程 消耗的带宽3.4 查看 实时进程 带宽消耗情况3.5 小结 1. 前言 限于作者能力水平&#xff0c;本文可能存在谬误&#xff0c;因此而给读者带来的…

JAVA毕业设计165—基于Java+Springboot+vue3的二手房交易管理系统(源代码+数据库+11000字论文)

毕设所有选题&#xff1a; https://blog.csdn.net/2303_76227485/article/details/131104075 基于JavaSpringbootvue3的二手房交易管理系统(源代码数据库11000字论文)165 一、系统介绍 本项目前后端分离(还有ssm版本)&#xff0c;分为用户、卖家、管理员三种角色 1、用户&a…

TOMCAT-企业级WEB应用服务器

一 WEB技术 1.1 HTTP协议和B/S 结构 HTTP&#xff08;HyperText Transfer Protocol&#xff09;协议即超文本传输协议&#xff0c;是用于在万维网&#xff08;WWW&#xff09;上传输超文本内容的基础协议。 一、HTTP 协议的特点 1、简单快速 客户向服务器请求服务时&#…

leetcode234. 回文链表(java实现)

题目描述&#xff1a; 本道题的思路可以使用集合先存储链表的值&#xff0c;然后进行判断即可。 总体思路比较简单。 代码实现&#xff1a; class Solution {public boolean isPalindrome(ListNode head) {List<Integer> res new ArrayList();ListNode cur head;whil…

Python lambda(匿名函数)

Python 使用 lambda 来创建匿名函数。 lambda 函数是一种小型、匿名的、内联函数&#xff0c;它可以具有任意数量的参数&#xff0c;但只能有一个表达式。 匿名函数不需要使用 def 关键字定义完整函数。 lambda 函数通常用于编写简单的、单行的函数&#xff0c;通常在需要函…

代谢组数据分析(十八):随机森林构建代谢组诊断模型

介绍 使用随机森林算法和LASSO特征选择构建了一种胃癌(GC)诊断预测模型。参与者(队列1,n=426)通过随机分层抽样分为发现数据集(n=284)和测试集(n=142)。接下来,在发现数据集上执行LASSO回归,以选择能够识别胃癌患者的较少数量的特征。我们将L1约束的系数设置为0.01…

OpenCV绘图函数(3)判断点一条直线是否在一个矩形范围内的函数clipLine()的使用

操作系统&#xff1a;ubuntu22.04 OpenCV版本&#xff1a;OpenCV4.9 IDE:Visual Studio Code 编程语言&#xff1a;C11 算法描述 裁剪线段与图像矩形相交的部分。 cv::clipLine 函数计算出完全位于指定矩形内的线段部分。如果线段完全位于矩形之外&#xff0c;则返回 false。…

2024年小红书图文制作超火爆风格,1单19.9!趣味性插画AI表情包项目思路

今天我想跟大家分享一个每天只需花20分钟就能轻松赚钱的AI表情包项目。 这个项目在小红书上非常受欢迎&#xff0c;因为它符合小红书的用户习惯&#xff0c;而且操作简单。下面我来详细讲讲如何利用软件快速创作有趣的插画&#xff01; 项目简介 这个项目的原理很简单&#x…

工厂模式和策略模式区别以及使用

1. 简介 1.1. 概述 1.1.1. 工厂模式 工厂模式的核心思想是将对象的创建过程封装起来,使得客户端(Caller)不需要直接与具体类(Concrete Class)交互,而是通过一个接口(Interface)来与它们交互。这样做的好处是,当需要更改对象的创建方式时,只需修改工厂方法即可,无需…

计算机网络-2-tcpip协议

1.说说 TCP/IP 四层模型&#xff1f; TCP/IP&#xff08;Transmission Control Protocol/Internet Protocol&#xff09;模型是一种用于描述互联网通信的协议层次结构。它分为四个主要层次&#xff0c;每个层次都定义了不同的协议来实现特定的功能。下面是TCP/IP模型各层的常用…