Elasticsearch SQL

Elasticsearch引擎

Elasticsearch是当今许多生产部署中使用最广泛的搜索引擎之一。 它基于Lucene搜索库,它提供的主要功能之一是在Lucene之上的基于JSON的查询DSL,它提供了一种易于使用的机制来与搜索引擎进行交互。 但是,查询DSL非常特定于Elasticsearch。 Elasticsearch 6.3中引入的SQL支持带来了一种针对搜索引擎运行查询的标准机制,并且朝着更容易被已熟悉SQL的开发人员采用更进一步。 尽管SQL最初是为与关系数据库管理系统一起使用而设计的,但它已经在许多其他系统(例如NoSQL数据库)中实现。 以分布式数据处理引擎(如Apache Spark)或基于分布式缓存的计算系统(如Apache Ignite)中提供的受支持的SQL为例,其中SQL是所提供的核心查询工具之一。 在本文中,我们将探讨Elasticsearch SQL的工作方式。

初步设置

为了尝试本文中的示例,您需要启动一个本地Elasticsearch(至少6.3)实例。 在本文中,我们将使用最新的Elasticsearch 7.5。 我们将创建一个帖子索引,其中包含来自论坛的帖子。 我们将使用Elasticsearch Java客户端将数据馈入索引,并且我们将不为索引的字段提供显式映射(为简单起见,我们将让Elasticsearch为我们自动创建它)。 首先,我们将创建一个依赖于Elasticsearch Java高级客户端的Maven项目(不推荐使用旧的Elasticsearch HTTP客户端,并计划在Elasticsearch 8.0中将其删除):

 <dependency> <groupId>org.elasticsearch.client< /groupId > <artifactId>elasticsearch-rest-high-level-client< /artifactId > <version>7.5.0< /version >  < /dependency > 

我们将使用以下代码在posts索引中创建10000个生成的post文档:

 RestHighLevelClient client = new RestHighLevelClient( RestClient.builder( new HttpHost( "localhost" , 9200 , "http" )));         String[] possibleUsers = new String[] { "Martin" , "Jim" , "John" }; String[] possibleDates = new String[] { "2019-12-15" , "2019-12-16" , "2019-12-17" }; String[] possibleMessages = new String[] { "Hello, Javaadvent !" , "Cool set of blog posts. We want more !" , "Elasticsearch SQL is great." };         for ( int i = 1 ; i <= 10000 ; i++) { Map<String, Object> jsonMap = new HashMap<>(); jsonMap.put( "user" , possibleUsers[ThreadLocalRandom.current().nextInt( 0 , 3 )]); jsonMap.put( "date" , possibleDates[ThreadLocalRandom.current().nextInt( 0 , 3 )]); jsonMap.put( "message" , possibleMessages[ThreadLocalRandom.current().nextInt( 0 , 3 )]); IndexRequest request = new IndexRequest( "posts" ) .id(String.valueOf(i)).source(jsonMap); client.index(request, RequestOptions.DEFAULT); }         client.close(); 

运行SQL查询

我们可以使用Kibana来查询用户名为Martin的所有文档,如下所示:

 POST /_sql ? format =txt  { "query" : "SELECT * FROM posts where user = 'Martin'"  } 

另一个示例是计算消息字段中包含Javaadvent单词的所有文档:

 POST /_sql ? format =txt  { "query" : "SELECT count(*) FROM posts where message like '%Javaadvent%'"  } 

现在,如果您想在Java应用程序中运行上述查询,则有几种选择:

  • 使用Elasticsearch JDBC驱动程序运行它。 但是,此选项仅适用于白金级和企业级订阅。
  • REST客户端调用Elasticsearch SQL端点。 如果只有基本(免费)的Elasticsearch选项,则可以选择此选项。

您可以使用几乎所有用于Java的REST客户端来使用第二个选项,但是我们将使用低级Elasticsearch REST客户端:

 <dependency> <groupId>org.elasticsearch.client< /groupId > <artifactId>elasticsearch-rest-client< /artifactId > <version>7.5.0< /version >  < /dependency > 

以下代码块仅从posts索引返回10个文档:

 RestClient restClient = RestClient.builder( new HttpHost( "localhost" , 9200 , "http" )).build();         Request request = new Request( "POST" , "/_sql" ); request.setJsonEntity( "{\"query\":\"SELECT * FROM posts limit 10\"}" ); Response response = restClient.performRequest(request); String responseBody = EntityUtils.toString(response.getEntity()); System.out.println(responseBody); restClient.close(); 

要了解如何在后台执行SQL查询,可以使用/ _sql / translate端点下提供的translation API。 如果要查看为先前的SQL查询生成的查询DSL,我们可以在Kibana中运行以下命令:

 POST /_sql/translate  { "query" : "SELECT * FROM posts limit 10" , "fetch_size" : 10  } 

我们应该得到类似于以下内容的结果:

 { "size" : 10, "_source" : { "includes" : [ "message" , "user" ], "excludes" : [ ] }, "docvalue_fields" : [ { "field" : "date" , "format" : "epoch_millis" } ], "sort" : [ { "_doc" : { "order" : "asc" } } ]  } 

Elasticsearch SQL功能

我们演示了如何执行基本的SQL查询。 Elasticsearch SQL引擎非常丰富,包括:

  • SQL查询响应的多种格式,例如csv,json,txt,yaml等;
  • 与Elasticsearch SQL一起应用其他查询DSL过滤;
  • elasticsearch-sql-cli实用程序提供的CLI,您可以在其中直接执行SQL查询。

关于SQL实现本身,可以参考支持的SQL命令以及SQL函数和运算符参考文档。

结论

在本文中,我们演示了如何使用Elasticsearch SQL与Elasticsearch引擎进行交互。 与基于JSON的查询DSL相比,使用此机制的可能性更高。 但是,Elasticsearch SQL不能替代它,而是在它之上构建的,并且可以满足搜索引擎提供的众多功能。

翻译自: https://www.javacodegeeks.com/2020/01/elasticsearch-sql.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/340901.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

电脑无internet访问_电脑中的代理服务器怎么设置 代理服务器设置方法 - 操作系统...

如何设置电脑中的代理服务器?对于代理服务器&#xff0c;可能大家对其并不是非常了解&#xff0c;其实代理服务器作为一种特殊的网络服务&#xff0c;可以代理网络用户去获取网络信息&#xff0c;提高浏览速度与效率&#xff0c;而且还可以突破自身IP的访问限制&#xff0c;访…

mysql先进后出_栈、队列中“先进先出”,“后进先出”的含义

展开全部先进先出(62616964757a686964616fe58685e5aeb931333433653339FIFO&#xff0c;first-in&#xff0c;first-out)为处理从队列或堆栈发出的程序工作要求的一种方法&#xff0c;它使最早的要求被最先处理。后进先出&#xff0c;从栈中取出数据项的顺序与将它们插入栈的顺序…

平台框架_从框架到平台

平台框架当我在十年前以Java开发人员的身份开始职业生涯时&#xff0c;该行业正经历着革命性的变化。 2003年发布的Spring框架Swift流行&#xff0c;并成为庞大的J2EE平台的严重挑战者。 经过过渡时间后&#xff0c;我很快发现自己赞成使用Spring框架而不是J2EE平台&#xff0c…

敲代码时如何快速移动光标_如何用 Linux 技巧大大提高工作效率?

前言Linux中的一些小技巧可以大大提高你的工作效率&#xff0c;本文就细数那些提高效率或者简单却有效的Linux技巧。命令编辑及光标移动这里有很多快捷键可以帮我们修正自己的命令。接下来使用光标二字代替光标的位置。删除从开头到光标处的命令文本ctrl u&#xff0c;例如&am…

Java 13:文本块

Java 13已交付了期待已久的多行字符串或Text Blocks 。 您不再需要连接跨越多行的字符串或转义特殊字符&#xff0c;这确实提高了代码的可读性。 文本块是一种预览语言功能 &#xff0c;这意味着必须使用--enable-preview标志在Java编译器和运行时中明确启用它们。 这是一个文…

java 异常练习题_java入门异常处理练习题问题

tppe大概方式&#xff1a;1、判断用户输入的类型是否正确&#xff0c;不正确捕获异常&#xff0c;把他包装成我自己定义的异常2、判断用户输入的数是多少2.1、如果是1&#xff0c;则打印“输入图书名称”&#xff0c;用户输入&#xff0c;定义一个Book类型的数组&#xff0c;然…

windows副本不是正版怎么办_盗版系统总是崩溃?别着急,让我来告诉你正版系统怎么下载...

电脑系统崩溃了怎么办&#xff1f;相信很多小伙伴都会选择重装系统&#xff0c;奈何自己又不会&#xff0c;只能搬到修电脑的地方&#xff0c;最后发现安装的还是盗版系统&#xff0c;不能登录微软账号不说&#xff0c;还会被捆绑安装一堆流氓软件&#xff0c;那么&#xff0c;…

java线程有几种状态_java线程的几种状态

java线程的几种状态导语&#xff1a;线程&#xff0c;有时被称为轻量级进程(Lightweight Process&#xff0c;LWP)&#xff0c;是程序执行流的最小单元。下面是Java线程的介绍&#xff0c;欢迎参考!新建&#xff1a;new一个Thread对象或者其子类对象就是创建一个线程&#xff0…

sudo spctl --master-disable_量大从优批发--阳离子聚丙烯酰胺--用于生活污水、

量大从优批发--阳离子聚丙烯酰胺--用于生活污水、wkkk量大从优批发--阳离子聚丙烯酰胺--用于生活污水、怎么来辨别聚丙烯酰胺到底是什么型号的呢&#xff1f;下面来介绍型号辨别的消防法。聚丙烯酰胺我们都知道聚丙烯酰基是昂贵的阳离子&#xff0c;其次是非离子聚丙烯酰胺&…

java 框架 例子_如何设计Java框架? –一个简单的例子

通过优锐课核心java学习笔记中&#xff0c;我们可以看到&#xff0c;码了很多专业的相关知识&#xff0c; 分享给大家参考学习。你可能对框架如何工作感到好奇&#xff1f; 这里将通过一个简单的框架示例来说明框架的思想。框架目标首先&#xff0c;为什么我们需要一个除普通库…

jboss eap_HawtIO在JBoss EAP上(第二部分)

jboss eap我刚刚发布了一篇关于在JBoss Wildfly 8.1上运行HawtIO的条目 。 从那篇文章中&#xff0c;您将了解HawtIO的出色表现 &#xff0c;以及它必须具备的所有 出色 插件&#xff0c;才能从单个仪表板管理基于JVM的技术……好吧…… hawt ……。 但是&#xff0c;出于上一…

alter id order by_声卡id查找表

强烈建议收藏这个表格真的很方便&#xff0c;强烈建议大家收藏&#xff0c;尤其是那些喜欢折腾的人&#xff01;因为有时候会特别需要它声卡ID表芯片型号仿冒ID创作的CA01320x100918仿冒ID值 0,1,2,3,4,5,6,9,10,11,12Cirrus Logic公司CS42100x100101仿冒ID值 13Cirrus Logic公…

java bean id_在 JSP中使用JavaBean的标签是 ,其中 id的用途是 __________________学小易找答案...

【多选题】Flash渐变动画分为()。P22【单选题】关于 JavaBean,下列的叙述哪一项是不正确的?( )【填空题】用户在实际 Web应用开发中,编写Bean除了要使用 ___________________ 引入 Java的标准类。【单选题】Its very foolish _____ it.【填空题】在 Web服务器端使用JavaBean,将…

JDK 14:CMS GC是OBE

JDK 14 Early Access Build&#xff03;23 &#xff08; 2019/11/13 &#xff09; 现已上市 。 此版本最值得注意的更改之一是删除了并发标记扫描垃圾收集器 。 JEP 291 [“弃用并发标记扫描&#xff08;CMS&#xff09;垃圾收集器”]早在2017年就使用JDK 9和JEP 363 [“删除并…

python 转成摩尔斯电码_一篇文章教会你摩尔斯码

正规的摩尔斯码对照表是这样的其实记住主要的26个字母就够日常用了&#xff0c;而记26个字母有一张更简单的图&#xff1a; 把点和横线以字母的形态呈示出来&#xff0c;基本上看一遍就能记住大半了。不过要注意每个字母下方的一行小字&#xff0c;那是正确的顺序&#xff0c;别…

java addfirst_java – ArrayDeque类的addFirst方法

以下行的功能基本上是(head-1)MODULO(elements.length),因此当head 0时,从head减去1将导致最大可能值而不是-1.head (head - 1) & (elements.length - 1)10是元素的有效长度,根据实现,elements.length总是2的幂.如果不是这种情况,则操作无效.了解其工作原理需要了解位操作…

kali使用笔记本自带无线网卡_无线网卡?那是什么?

用过无线网卡的童鞋都知道无线网卡的方便&#xff0c;而没有用过无线网卡的往往觉得它很陌生&#xff0c;今天就来跟大家讲讲无线网卡的三大用途。NO.1摆脱网线束缚&#xff0c;台式电脑也能连WiFi如今&#xff0c;WiFi上网越来越方便&#xff0c;如果房间里没有预装网口&#…

无效的Java

也许我可以被机器人代替进行代码审查。 有一些反馈我发现自己一遍又一遍。 这是我最不喜欢的一些&#xff1a; 通用代码结构 放弃其他 if return的else就是多余的&#xff0c;并造成不必要的缩进。 if (foo) { return bar; } else { return baz; } // should be replaced b…

java 指定打印机打印_java 指定打印机 进行打印

代码如下&#xff1a;package com.printer;import java.io.*;import java.util.Locale;import javax.print.*;import javax.print.attribute.*;import javax.print.attribute.standard.*;public class PrintTest {public static void main(String args[]) {FileInputStream psS…

everything安装版和便携版有什么区别_国行版爱他美卓萃和普通版有什么区别,一定要选卓萃吗?...

粉丝私信&#xff1a;想给孩子喝国行版爱他美&#xff0c;有普通版和卓萃版&#xff0c;这两个版本有什么区别&#xff0c;卓萃的价格这么高&#xff0c;就一定好吗&#xff1f;奶粉速递&#xff1a;爱他美奶粉在国内算是家喻户晓的品牌了&#xff0c;吃的宝宝也比较多&#xf…