Elasticsearch快速上手与深度进阶:一站式实战教程

目录

1. Elasticsearch 简介

2. 安装与启动

方式 1:Docker 快速安装(推荐)

方式 2:手动安装

3. 基础操作

3.1 创建索引

3.2 插入文档

3.3 查询文档

3.4 更新文档

3.5 删除文档

4. 高级查询

4.1 布尔查询

4.2 范围查询

4.3 通配符查询

5. 聚合分析

5.1 统计年龄分布

5.2 计算平均值

6. 自定义分析器

6.1 创建分词器

6.2 应用分析器到索引

7. 集群管理

7.1 启用集群发现

7.2 添加节点

8. 安全配置(基础)

8.1 生成证书

8.2 创建用户

8.3 启用 HTTPS

9. 性能优化

9.1 索引优化

9.2 冷热架构

10. 实战案例

案例:电商商品搜索


Elasticsearch 的分步教程,涵盖从基础到进阶的核心内容,适合快速上手和实践。


1. Elasticsearch 简介

  • 是什么:基于 Lucene 的分布式搜索和分析引擎,支持全文搜索、结构化搜索、聚合分析。
  • 核心概念
    • 索引(Index):类似数据库的表,存储文档的集合。
    • 文档(Document):JSON 格式的数据条目,类似数据库中的行。
    • 类型(Type,7.x+ 已弃用):曾用于区分文档结构,现统一为 _doc
    • 分片(Shard):索引拆分的子单元,分布式存储和并行处理。
    • 副本(Replica):分片的备份,提高可用性和容错性。

2. 安装与启动

方式 1:Docker 快速安装(推荐)
# 拉取 Elasticsearch 镜像
docker pull docker.elastic.co/elasticsearch/elasticsearch:7.16.0# 启动容器(默认端口 9200)
docker run -d --name es -p 9200:9200 docker.elastic.co/elasticsearch/elasticsearch:7.16.0
方式 2:手动安装
  1. 下载 Elasticsearch 包:Download Elasticsearch | Elastic
  2. 解压并运行:
    cd elasticsearch-7.16.0
    bin/elasticsearch
    

3. 基础操作

3.1 创建索引
# 创建名为 "users" 的索引
curl -X PUT "localhost:9200/users"
3.2 插入文档
# 插入一条用户数据
curl -X POST "localhost:9200/users/_doc" -H 'Content-Type: application/json' -d'
{"name": "张三","age": 30,"email": "zhangsan@example.com"
}'
3.3 查询文档
# 查找所有文档
curl -X GET "localhost:9200/users/_doc/_search?pretty"# 根据 ID 查询
curl -X GET "localhost:9200/users/_doc/1?pretty"
3.4 更新文档
curl -X POST "localhost:9200/users/_doc/1/_update" -H 'Content-Type: application/json' -d'
{"doc": {"age": 31}
}'
3.5 删除文档
curl -X DELETE "localhost:9200/users/_doc/1"

4. 高级查询

4.1 布尔查询
{"query": {"bool": {"must": [{"match": {"name": "张三"}}],"filter": [{"range": {"age": {"gte": 25}}}]}}
}
4.2 范围查询
{"query": {"range": {"age": {"gte": 20,"lte": 30}}}
}
4.3 通配符查询
{"query": {"wildcard": {"email": "*example.com"}}
}

5. 聚合分析

5.1 统计年龄分布
{"aggs": {"age_distribution": {"histogram": {"field": "age","interval": 10}}}
}
5.2 计算平均值
{"aggs": {"average_age": {"avg": {"field": "age"}}}
}

6. 自定义分析器

6.1 创建分词器
{"analysis": {"analyzer": {"custom_keyword": {"type": "keyword","tokenizer": "keyword"}}}
}
6.2 应用分析器到索引
curl -X PUT "localhost:9200/my_index" -H 'Content-Type: application/json' -d'
{"settings": {"analysis": {"analyzer": {"default_search": {"type": "standard"},"default_index": {"type": "custom_keyword"}}}}
}'

7. 集群管理

7.1 启用集群发现

编辑 elasticsearch.yml

cluster.name: my-es-cluster
node.name: node-1
network.host: 0.0.0.0
discovery.seed_hosts: ["127.0.0.1:9300"]
7.2 添加节点

在另一台机器启动 Elasticsearch 并配置相同 cluster.name,节点会自动加入集群。


8. 安全配置(基础)

8.1 生成证书
bin/elasticsearch-certutil ca
bin/elasticsearch-certutil cert --ca elastic-stack-ca.p12
8.2 创建用户
bin/elasticsearch-users useradd es_admin -p admin123 -r superuser
8.3 启用 HTTPS

编辑 elasticsearch.yml

xpack.security.enabled: true
http.ssl.enabled: true
http.ssl.key: path/to/es-node.jks

9. 性能优化

9.1 索引优化
# 强制合并分段
curl -X POST "localhost:9200/users/_forcemerge?max_num_segments=1"
9.2 冷热架构

使用 ILM(Index Lifecycle Management)策略将数据迁移至冷存储。


10. 实战案例

案例:电商商品搜索
  1. 创建索引并定义映射:
    {"mappings": {"dynamic": false,"properties": {"title": {"type": "text"},"price": {"type": "float"},"category": {"type": "keyword"}}}
    }
    
  2. 插入商品数据:
    curl -X POST "localhost:9200/products/_doc" -d'
    {"title": "iPhone 14 Pro","price": 9999.0,"category": "electronics"
    }'
    
  3. 全文搜索:
    {"query": {"match": {"title": "iPhone 14"}}
    }
    

建议结合实际项目场景深入练习,并关注官方更新以获取最新特性!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/72942.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

闻所闻尽:穿透声音的寂静,照见生命的本真

在《楞严经》的梵音缭绕中,"闻所闻尽"四个字如晨钟暮鼓,叩击着每个修行者的心门。这个源自观世音菩萨耳根圆通法门的核心概念,既是佛门修行的次第指引,更蕴含着东方哲学对生命本质的终极叩问。当我们穿越时空的帷幕&…

回溯法经典练习:组合总和的深度解析与实战

回溯法经典练习:组合总和的深度解析与实战 引言 在算法世界里,回溯法(Backtracking)是解决 组合、排列、子集 等问题的神器。而 “组合总和”(Combination Sum) 问题,更是回溯算法中的经典代表…

传感器研习社:Swift Navigation与意法半导体(STMicroelectronics)合作 共同推出端到端GNSS汽车自动驾驶解决方案

自动驾驶系统单纯依赖感知传感器进行定位在遇到恶劣天气或缺乏车道标线的道路场景时很容易失效。此外,由于激光雷达(LiDAR)、视觉等传感器的成本高昂以及将众多不同组件整合为统一系统的复杂性,都可能增加产品研发成本或延迟产品上…

【人工智能】Ollama 的 API 操作指南:打造个性化大模型服务

《Python OpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门! 解锁Python编程的无限可能:《奇妙的Python》带你漫游代码世界 随着人工智能技术的飞速发展,大型语言模型(LLM)在自然语言处理领域的应用日益广泛。然而,传统的云端模型服务往往面临数据隐私、成本高…

Linux关机重启二三事

、、 1概述 故障是高可用组最常接触的场景,其中包含了进程故障,网络故障、系统故障,硬件故障。掉电、关机和重启作为其中最常见的系统故障,具体的细节还是有些许差异的。本文将从操作系统与主板的行为讲解三者之间的联系与区别。…

算法1--两束求和

题目描述 解题思路 先说一种很容易想到的暴力解法 暴力解法的思路很简单,就是遍历数组,对于每一个元素,都去遍历数组中剩下的元素,判断是否有两个元素的和等于目标值,如果有,就返回这两个元素的下标。 c…

在Fedora-Workstation-Live-x86_64-41-1.4中使用最新版本firefox和腾讯翻译插件让英文网页显示中文翻译

在Fedora-Workstation-Live-x86_64-41-1.4中使用最新版本firefox和腾讯翻译插件让英文网页显示中文翻译 应用——系统工具——终端 suozhangfedora:~$ rpm -aq | grep firefox firefox-131.0.2-1.fc41.x86_64 firefox-langpacks-131.0.2-1.fc41.x86_64 fedora41系统自身安装有f…

android 接入google 登录

在 Android 应用中接入 Google 登录功能,可让用户使用他们的 Google 账号快速登录应用。以下是详细的接入步骤和示例代码: 步骤 1:创建 Google API 项目 访问 Google API 控制台,并使用你的 Google 账号登录。点击 “选择项目”,然后点击 “新建项目”,按照提示填写项目…

Redis缓存与数据库 数据一致性保障

为什么要保证数据一致性 只要使用redis做缓存,就必然存在缓存和DB数据一致性问题。若数据不一致,则业务应用从缓存读取的数据就不是最新数据,可能导致严重错误。比如将商品的库存缓存在Redis,若库存数量不对,则下单时…

19.哈希表的实现

1.哈希的概念 哈希(hash)⼜称散列,是⼀种组织数据的⽅式。从译名来看,有散乱排列的意思。本质就是通过哈希函数把关键字Key跟存储位置建⽴⼀个映射关系,查找时通过这个哈希函数计算出Key存储的位置,进⾏快速查找。 1.2.直接定址法…

IoTDB TTL不生效

问题 时序数据库 IoTDB 1.3.0 版本数据库的 TTL 设置为两天,show databases details 看到设置也是正确的,怎么还是可以查到好几天前的数据?因为有很多不活跃的测点,所以专门设置了两天过期,有什么办法可以自动清理呢&…

【C++基础】Lambda 函数 基础知识讲解学习及难点解析

一、引入 在 C 中,我们通常使用函数来完成特定的功能。但有时候,我们需要在一个函数内部定义一个小型的功能块,这时如果单独写一个函数会显得繁琐。C11 引入了 Lambda 函数,它是一种匿名函数,可以在需要的地方直接定义…

OpenCV 基础模块 Python 版

OpenCV 基础模块权威指南(Python 版) 一、模块全景图 plaintext OpenCV 架构 (v4.x) ├─ 核心层 │ ├─ core:基础数据结构与操作(Mat/Scalar/Point) │ └─ imgproc:图像处理流水线(滤…

iStoreOS软路由对硬盘格式化分区(转化ext4)

一、为什么要格式化分区? 格式化硬盘分区是软路由安装或配置过程中的重要步骤,主要用于清除旧数据、优化文件系统、确保系统稳定性和兼容性。 二、通过iStoreOS硬盘格式化步骤 使用场景:Docker迁移到外置移动硬盘为例,考虑兼容现…

打造用户认证系统,构筑信息安全防线

在当今的数字化时代,信息安全和用户隐私保护变得越来越重要。用户身份认证是确保信息安全的第一道防线。通过验证用户身份,可以防止未经授权的访问和数据泄露。它有助于保护用户的个人信息、账户资金和其他敏感数据。此外,用户身份认证还可以…

北京南文观点:品牌如何抢占AI 认知的 “黄金节点“

在算法主导的信息洪流中,品牌正在经历一场隐蔽的认知权争夺战,当用户向ChatGPT咨询"哪家新能源车企技术最可靠"时,AI调取的知识图谱数据源将直接决定品牌认知排序。南文乐园科技文化(北京)有限公司&#xff…

音视频系列——Websockets接口封装为Http接口

模型服务示例:实时语音转文本服务 本示例展示一个支持双协议(WebSocket流式接口HTTP同步接口)的语音转文本模型服务,并提供将WebSocket接口封装为HTTP接口的代码实现。 一、服务架构设计 #mermaid-svg-nw0dMZ4uKfS4vGZR {font-fa…

Axure项目实战:智慧城市APP(一)(动态面板、拖动效果)

亲爱的小伙伴,在您浏览之前,烦请关注一下,在此深表感谢! 课程主题:智慧城市APP便民服务平台 主要内容:完整智慧APP原型设计 应用场景:各类政务型、B端APP均可参考 案例展示:&…

MySQL 入门大全:数据类型

🧑 博主简介:CSDN博客专家,历代文学网(PC端可以访问:https://literature.sinhy.com/#/literature?__c1000,移动端可微信小程序搜索“历代文学”)总架构师,15年工作经验,…

Java 记忆链表,LinkedList 的升级版

文章目录 记忆链表 MemoryLinkedList实战源代码 众所周知,ArrayList 和 LinkedList 是 Java 集合中两个基本的数据结构,对应数据结构理论中的数组和链表。但在这两个数据结构,开发者们通常使用 ArrayList,而不使用 LinkedList。JD…