elasticSearch原理浅尝

elasticSearch原理浅尝

news/2025/4/27 4:40:17/文章来源:https://blog.csdn.net/ma15732625261/article/details/137397328

终于等到你马上就要放弃

开个玩笑，进入正题 on fire

基础的咱不说了，一搜一麻袋

读

全文检索：

协调节点广播查询请求到相关分片并将其响应整合全局排序返回结果集合

带路由：具体文档

shard = hash(document_id) % (num_of_primary_shards)

平衡负载，协调节点每个请求分发到不同分片

写

协调节点 hash算法得出主分片，路由对应节点执行请求，成功转发请求到副本节点

更新：

协调节点找到主分片修改_source.json 重新索引主分片文档并转发到node1 node2副本

如果另一个进程修改则重复直到retry_on_conflict次放弃

put:更新将json完全替换掉,需要指定id

post:自动创建id，更新相同字段的值，非幂等deng

一致性保障

consistency：自定义处理一次增删改请求

one 写操作一个主分片active可执行

all写操作，所有主分片和副本都是活跃可执行

quorum默认值，大部分分片活跃可用

近实时搜索

分词器

字符串拆分独立词或词汇单元token，输出token stream

字符过滤器：接受原始文本各种转换：去除HTML标签数字转换成文字等

分词器：切分上面处理后的文本，一系列词项

词项过滤器：处理词项小写化过滤掉停用词处理同义词 stemming提取词根

分析器：字符串转换为一串tokens/terms

索引时分析器顺序

字段映射定义的分析器 > 索引设置中的 > 标准分析器

搜索分析器顺序

全文查找定义的 > 字段映射搜索分析器 >字段映射分析器>索引配置默认>索引配置>标准的

写入时分词：

句子单词小写删过滤词单词转词干 term存储倒排索引中

映射中每个text类型字段指定自己的analyzer，写入索引时没有指定analyzer 默认分析器

IK分词器：ik_smart ik_max_word

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/793944.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

redis进阶入门主从复制与哨兵集群

redis进阶入门主从复制与哨兵集群

一、主从复制 1.1背景一般来说，要将 Redis用于工程项目中，只使用一台 Redist是万万不能的，原因如下： 从结构上，单个 Redist服务器会发生单点故障，井且一台服务器需要处理所有的请求负載，压力…

阅读更多...

HTML基础知识详解（上）（如何想知道html的全部基础知识点，那么只看这一篇就足够了！）

HTML基础知识详解（上）（如何想知道html的全部基础知识点，那么只看这一篇就足够了！）

前言：在学习前端基础时，必不可少的就是三大件（html、css、javascript ），而HTML（超文本标记语言——HyperText Markup Language）是构成 Web 世界的一砖一瓦，它定义了网页内容的含义和…

阅读更多...

P1570 KC 喝咖啡

P1570 KC 喝咖啡

P1570 KC 喝咖啡 - 洛谷 | 计算机科学教育新生态 (luogu.com.cn) 让求 ∑ v i ∑ c i \frac { \sum{ v_i}} { \sum{c_i}} ∑ci∑vi的最大值，假设值为 a n s ans ans，则 a n s ∑ v i ∑ c i ans \frac {\sum{v_i}} {\sum{c_i}} ans∑ci∑vi…

阅读更多...

物联网实战--驱动篇之(一)EEPROM存储器(AT24C64)

物联网实战--驱动篇之(一)EEPROM存储器(AT24C64)

目录一、驱动概述二、AT24C64简介三、驱动编写四、驱动应用一、驱动概述这是驱动篇的第一篇，所以先说明下驱动篇的作用和书写计划。之前的净化器项目已有提及，向ESP8266、SHT30这些都属于驱动设备，主芯片STM32是核心，相…

阅读更多...

C++从入门到精通——范围for的使用

C++从入门到精通——范围for的使用

范围for的使用前言一、（引言）python中for循环的使用二、C中的范围forC语言中的for循环C中的范围for的语法不使用范围for的正常写法范围for的写法正常范围forauto自动推导范围for 三、范围for的使用条件for循环迭代的范围必须是确定的迭代的对象要实现和…

阅读更多...

第五节 LLava模型数据处理源码解读(input_ids/labels/attention_mask/image，上篇)

第五节 LLava模型数据处理源码解读(input_ids/labels/attention_mask/image，上篇)

文章目录前言一、torch.nn.utils.rnn.pad_sequence与torch.ne函数1、torch.nn.utils.rnn.pad_sequence函数功能解读1、函数原理2、demo示列3、demo结果对比2、torch.ne函数介绍二、图像与语言加载1、语言处理tokenizer的来源2、图像处理process的来源3、数据加工方法三、数据加…

阅读更多...

redis 数据库的安装及使用方法

redis 数据库的安装及使用方法

目录一关系数据库与非关系型数据库 （一）关系型数据库 1，关系型数据库是什么 2，主流的关系型数据库有哪些 3，关系型数据库注意事项 （二）非关系型数据库 1，非关系型数据库是…

阅读更多...

$vue-element-template 设置权限管理配置文件 \ vue用户权限管理$

vue-element-template 设置权限管理配置文件 \ vue用户权限管理

最近使用vue-element-template模板做系统时，需要实现用户权限管理，通过后端传来的roles字段来判断不同用户的身份，不同用户显示不同的侧边栏，下面是配置方法： 0.需要配置的文件有： src/routersrc/store/mo…

阅读更多...

模拟---算法

模拟---算法

1、定义仅仅使用较简单的算法和数据结构的题目。模拟顾名思义，按照题目的要求，一步步写出代码。特点：模拟题目通常是具有码量大、操作多、思路繁复的特点。 2、步骤读题，读懂题目的意思，要知道题目想做什么建模，利用什么样的数据结构来实现代码实现，写出代码框架调…

阅读更多...

maven上传pom和jar文件到远程仓库

maven上传pom和jar文件到远程仓库

上传.pom文件例如只想要上传 Spring Cloud Dependencies 的 .pom 文件到 Maven 远程仓库，可以执行如下命令 mvn deploy:deploy-file -Durlrepository-url -DrepositoryIdrepository-id -Dfilepath-to-pom-file -DpomFilepath-to-pom-file其中，需要…

阅读更多...

day04-MQ

day04-MQ

1.初识MQ 1.1.同步和异步通讯微服务间通讯有同步和异步两种方式： 同步通讯：就像打电话，需要实时响应。异步通讯：就像发邮件，不需要马上回复。两种方式各有优劣，打电话可以立即得到响应，但是你…

阅读更多...

LeNet卷积神经网络

LeNet卷积神经网络

文章目录简介conv2d网络层的结构简介它是最早发布的卷积神经网络之一 conv2d 这个卷积成的参数先进行介绍一下： self.conv1 nn.Conv2d(in_channels3, out_channels10, kernel_size3, stride1, padding1)先看一下in_channels 输入的通道数，out_cha…

阅读更多...

蓝桥杯备考随手记: practise06

蓝桥杯备考随手记: practise06

问题描述: 一个字符串的非空子串是指字符串中长度至少为1 的连续的一段字符组成的串。例如，字符串aaab 有非空子串a, b, aa, ab, aaa, aab, aaab，一共7 个。注意在计算时，只算本质不同的串的个数。请问，字符串01001100010100…

阅读更多...

Redis从入门到精通(五)Redis实战(二)商户查询缓存

Redis从入门到精通(五)Redis实战(二)商户查询缓存

↑↑↑请在文章头部下载测试项目原代码↑↑↑ 文章目录前言4.2 商户查询缓存4.2.1 缓存介绍4.2.2 查询商户信息的传统做法4.2.2.1 接口文档4.2.2.2 代码实现4.2.2.3 功能测试 4.2.3 查询商户信息添加Redis缓存4.2.3.1 逻辑分析4.2.3.2 代码实现4.2.3.3 功能测试 4.2.3 数据一致…

阅读更多...

接口的总结与面试题

接口的总结与面试题

接口本身不能创建对象，只能创建接口的实现类对象，接口类型的变量可以与实现类对象构成多态引用。声明接口用interface，接口的成员声明有限制： （1）公共的静态常量 （2）公共的抽象方…

阅读更多...

【洛谷 P8656】[蓝桥杯 2017 国 B] 对局匹配题解（映射+位集合+贪心算法）

【洛谷 P8656】[蓝桥杯 2017 国 B] 对局匹配题解（映射+位集合+贪心算法）

[蓝桥杯 2017 国 B] 对局匹配题目描述小明喜欢在一个围棋网站上找别人在线对弈。这个网站上所有注册用户都有一个积分，代表他的围棋水平。小明发现网站的自动对局系统在匹配对手时，只会将积分差恰好是 K K K 的两名用户匹配在一起。如果两人分差小…

阅读更多...

Python网络爬虫（四）：b站评论

Python网络爬虫（四）：b站评论

首先来看一下采集的数据格式：本文不对数据采集的过程做探讨，直接上代码。首先要在程序入口处bvids列表内替换成自己想要采集的视频bvid号，然后将self.cookies替换成自己的（需要字典格式），代码可以同时爬取多个视频的评论，且爬取的评论较为完整，亲测有效： im…

阅读更多...

el-upload上传图片图片、el-load默认图片重新上传、el-upload初始化图片、el-upload编辑时回显图片

el-upload上传图片图片、el-load默认图片重新上传、el-upload初始化图片、el-upload编辑时回显图片

问题我用el-upload上传图片，再上一篇文章已经解决了，el-upload上传图片给SpringBoot后端,但是又发现了新的问题，果然bug是一个个的冒出来的。新的问题是el-upload编辑时回显图片的保存。问题描述：回显图片需要将默认的 file-lis…

阅读更多...

VScode使用持续更新中。。。

VScode使用持续更新中。。。

VScode 安装 Ubuntu18.04安装和使用VScode 使用 Vscode如何设置成中文

阅读更多...

基于springboot大学生兼职平台管理系统（完整源码+数据库）

基于springboot大学生兼职平台管理系统（完整源码+数据库）

一、项目简介本项目是一套基于springboot大学生兼职平台管理系统包含：项目源码、数据库脚本等，该项目附带全部源码可作为毕设使用。项目都经过严格调试，eclipse或者idea 确保可以运行！ 该系统功能完善、界面美观、操作简单、功…

阅读更多...

最新文章