Elastic Support Hub 转向语义搜索

作者:Chris Blaisure

我们很高兴与大家分享 Elastic Support Hub 最近的增强功能:它现在由语义搜索提供支持!

但在我们更详细地了解对 Elastic® Support Hub 所做的更改及其对客户的影响之前,我们需要花点时间解释语义搜索的概念,这一点很重要。 从本质上讲,语义搜索是一种使用人工智能返回更相关的搜索结果的搜索方法。 观看这个解释这个概念的图片:

如上所示,语义搜索将用户搜索内容的意图与可用内容而不是单词相匹配。 你可以在我们的博客 Elastic Learned Sparse Encoder 简介:Elastic 用于语义搜索的 AI 模型中了解有关其背后 AI 的更多信息。 本博客的其余部分讲述了有关将 Elastic Support Hub 迁移到语义搜索的故事。

我们为什么要做出这样的改变?

如今所有科技新闻似乎都与大型语言模型和生成式人工智能有关。 Elastic 凭借其向量数据库功能和内置自然语言模型处于领先地位。 我们应该在与我们的产品相同的前沿上构建我们的支持应用程序,这是有道理的。 通过现在进行这一更改,我们可以向我们的产品开发团队提供反馈,并使产品对每个人来说都更好。

配置语义搜索的最大收获

与大多数新技术创新一样,它需要拆除、替换旧代码,并可能更新底层架构。 我们的内部应用程序开发团队直面这些挑战,现在我们可以更好地迭代 Elasticsearch® 的任何新功能。 从我们团队的角度来看,设置过程中有两个突出的重要特征:

1. 考虑到 ELSER(Elastic 用于语义搜索的专有转换器模型)是 Elasticsearch (8.8) 中相对较新的功能,我们的开发团队很高兴看到引导式 UI 体验,使 Elasticsearch 能够通过 ELSER 摄取管道。

这使我们的开发人员能够快速将必要的文本扩展配置添加到摄取管道中,从而使语义搜索成为可能。 这使得配置体验变得更容易上手并更快地看到结果。

2. 像ELSER这样的机器学习模型需要专用的机器资源来运行(至少 4GB)。 由于我们已经在 Elastic Cloud 上运行,因此我们能够启用具有自动扩展功能的专用机器学习 (ML) 节点,以满足我们的资源需求并获得更一致的性能。

搜索结果的早期评估

我们正在启用各种系统来帮助我们大规模地理解用户查询、搜索结果和相关性。 然而,在我们的用户测试中,我们已经可以看到各种查询的显着改进。 例如,我们在标准全文搜索和新的语义搜索实现上测试了短语 “How to index data into Elasticsearch (如何将数据索引到 Elasticsearch)”。

这是两种搜索方法的并排比较。

虽然没有一篇文章解释了索引数据的所有方法(有很多),但你可以看到这些结果有多么根本的不同。 对于全文搜索,我们提供了指南、故障排除文章和带有匹配关键字的博客的组合,但没有一个回答 “如何” 的问题。 或者换句话说,文本搜索没有捕获查询的含义(语义上),而是尽力匹配关键字。

对于语义搜索结果,你可以查看通常与数据索引相关的博客。 更有趣的是 “How to ingest data into Elasticsearch Service (如何将数据引入Elasticsearch Service)” 的第四个返回结果,因为术语 “ingest” 实际上与将数据添加到索引的过程更相关。 Elastic 的开箱即用转换器模型了解向索引添加数据的语义,并返回更相关的结果,无论确切的关键字如何。

下一步是什么?

虽然我们认为这是我们为客户提供相关搜索结果的能力的巨大飞跃,但我们知道我们的工作尚未完成。 随着时间的推移,我们将评估我们所拥有的有关搜索术语、结果和阅读文章的数据。 这些数据将使我们能够添加同义词 (synonyms) 并配置适当的权重和提升,以便为你(我们的客户)在 support.elastic.co 上搜索 Elastic 内容时提供最佳体验。

>> 了解有关支持中心提供的所有服务的更多信息。

本文中描述的任何特性或功能的发布和时间安排均由 Elastic 自行决定。 当前不可用的任何特性或功能可能无法按时交付或根本无法交付。

在这篇博文中,我们可能使用或引用了第三方生成人工智能工具,这些工具由其各自所有者拥有和运营。 Elastic 对第三方工具没有任何控制权,我们对其内容、操作或使用不承担任何责任,也不对你使用此类工具可能产生的任何损失或损害负责。 使用人工智能工具处理个人、敏感或机密信息时请务必谨慎。 你提交的任何数据都可能用于人工智能培训或其他目的。 无法保证你提供的信息将得到安全或保密。 在使用之前,你应该熟悉任何生成式人工智能工具的隐私惯例和使用条款。

Elastic、Elasticsearch、ESRE、Elasticsearch Relevance Engine 和相关标记是 Elasticsearch N.V. 在美国和其他国家/地区的商标、徽标或注册商标。 所有其他公司和产品名称均为其各自所有者的商标、徽标或注册商标。

原文:Elastic Support Hub moves to semantic search | Elastic Blog

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/209484.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【安卓】安卓xTS之Media模块 学习笔记(3) VTS测试

1. 背景 接下来进行正式的VTS测试。本章节还是以Media模块相关进行介绍。 VTS主要测的是内核和HAL层,media的hal层是以openMax(即将废弃,今日2023.12) 和 Codec2 (后续主流) 接口为主。 这里我们只看Codec2的要求,CDD…

MongoDB的插入文档、更新文档语句

本文主要介绍MongoDB的插入文档、更新文档语句。 目录 MongoDB插入文档MongoDB更新文档 MongoDB插入文档 在MongoDB中,可以通过使用insertOne或insertMany方法向集合中插入文档。 insertOne方法可以插入一个文档,例如: db.collection.inse…

Android 等待view 加载布局完成 (包括动态生成View)

前言 在实际开发中,有很多组件需要 根据数据,动态生成,或者 追加 / 减少 子view,由于View布局需要时间,此时想要获取父View的最新宽高值,要么手动测量,要么等待布局完成后再获取; …

scikit-learn实现线性回归

要学习scikit-learn,我们必须要到scikit-clearn的官网中去查看公式和原理 scikit-learn 官网 scikit-learn 中文社区 进入官网一以后我们找到回归,然后再有监督学习中找到线性模型 scikit-learn实现简单的线性回归 公式: L2范数是指向量中每个元素的平…

Java+Swing: 主界面的窗体 整理8

主界面的写法跟之前登录界面的窗体写法大致相同,在主界面中主要是窗体的大小的设置 package com.student_view;import com.utils.DimensionUtil; import sun.applet.Main;import javax.swing.*; import java.awt.*; import java.net.URL;/*** Author:xie…

全面覆盖,无所不包:C++ 编程必备指南 | 开源日报 No.99

fffaraz/awesome-cpp Stars: 51.0k License: MIT 这个项目是一个精心策划的 C(或者 C) 框架、库、资源和其他有趣东西的列表。它收集了各种标准库,如 STL 容器和算法;不同领域的框架,比如人工智能、异步事件循环等;以及一系列功…

【人工智能Ⅰ】实验7:K-means聚类实验

实验7 K-means聚类实验 一、实验目的 学习K-means算法基本原理,实现Iris数据聚类。 二、实验内容 应用K-means算法对iris数据集进行聚类。 三、实验结果及分析 0:输出数据集的基本信息 参考代码在main函数中首先打印了数据、特征名字、目标值、目标…

【上海大学数字逻辑实验报告】四、组合电路(三)

一、 实验目的 掌握多路选择器74LS151的原理。掌握译码器74LS138的原理。学会在Quartus II上使用多路选择74LS151设计电路。学会在Quartus II上使用译码器74LS138设计电路。 二、 实验原理 多路选择器又称数据选择器或多路开关,它是一种多路输入单路输出的组合逻…

HHDESK右键管理简介

在HHDESK管理文件,除了基本的打开、删除、复制、粘贴、重命名外,还有多种便捷编辑方式。 可以分别以下列模式打开文档: 文本模式即是以文本编辑器打开文档。 1 二进制模式 可进行二进制编辑。 2 JSON模式 可对JSON文件进行直观的解析…

机器学习中的特征工程

1 特征工程概述 特征工程是机器学习中的一个关键步骤,在机器学习领域中占有非常重要的地位,是机器学习中不可或缺的一部分,下图展示了一个常规的机器学习流程: 特征工程涉及从原始数据中提取、选择和转换特征,以改善模…

“轻松管理文件,一键导出表格,让您的归档工作井井有条“

在忙碌的工作中,我们经常会被大量的文件和数据所困扰。如何有效地管理和整理这些资料,成为了一个让人头疼的问题。今天,我们向您介绍一款强大的文件管理工具——一键导出表格,帮助您轻松解决这个问题。 第一步,首先我们…

区块链实验室(30) - 区块链期刊:Distributed Ledger Technologies: Research and Practice

区块链涉及多学科及技术,众多期刊接收区块链文章。Distributed Ledger Technologies: Research and Practice是ACM出版集团的一本期刊。 Distributed Ledger Technologies: Research and Practice创刊历史很短,始于2022年,出版期数也不多。 载…

Leetcode 剑指 Offer II 056. 两数之和 IV - 输入二叉搜索树

题目难度: 简单 原题链接 今天继续更新 Leetcode 的剑指 Offer(专项突击版)系列, 大家在公众号 算法精选 里回复 剑指offer2 就能看到该系列当前连载的所有文章了, 记得关注哦~ 题目描述 给定一个二叉搜索树的 根节点 root 和一个整数 k , 请判断该二叉…

Java 使用oshi获取当前服务器状态cpu、内存、存储等核心信息

文章目录 简介相关资料maven依赖oshi-官方示例获取CUP信息代码获取内存信息获取磁盘信息 简介 OSHI 是基于 JNA 的(本地)操作系统和硬件信息库。它不需要安装任何其他额外的本地库,旨在提供一种跨平台的实现来检索系统信息,例如操…

[ROS2] --- action

1 action介绍 ROS通信机制也会被常常用到——那就是动作。从这个名字上就可以很好理解这个概念的含义,这种通信机制的目的就是便于对机器人某一完整行为的流程进行管理。 1.1 客户端/服务器模型 动作和服务类似,使用的也是客户端和服务器模型&#xf…

数据结构中处理散列冲突的四种方法

1 开放定址法 1.1 定义 开放定址法就是一旦发生了冲突,就去寻找下一个空的散列地址 1.2 要求 只要散列表足够大 空的散列地址总能找到,并将记录存入 1.3 线性探测法 使用该公式用于解决冲突的开放定址法称为线性探测法 对于线性探测法&#xff0c…

通过kubeadm方式安装k8s

虚拟机最少是 2 core,master内存最小3G,node内存最小2G. 要求的Docker版本是18.03,如果不是安装的docker ce,版本是过旧的,可以选择删除后重新安装; 也可以重新创建一个虚拟机执行以下命令。 简单方法&am…

线性代数基础【1】行列式

第一节 行列式的基本概念和性质 一、基本概念 ①逆序 1,2和2,1是一对逆序 ②逆序数 1,2,3,5,4的逆序数为1;1,3,2,5,4逆序数为4; ③行列式 ④余子数和代数余子数 行列式挖掉一个数(例如aij),将原行列式去掉i行j列的行列式M,则M为余子数,代数余子数记为Aij,如果(ij)为偶数…

云LIS实验室信息管理系统源码——实验室信息管理解决方案

云LIS(Cloud Laboratory Information System)是一种为区域医疗提供临床实验室信息服务的计算机应用程序,其主要功能是协助区域内所有临床实验室相互协调并完成日常检验工作,对区域内的检验数据进行集中管理和共享,通过…

高通CRM的v4l2驱动模型

概述下crm中v4l2框架的初始化创建流程: 对于CRM主设备的v4l2框架创建过程: 1、分配和初始化v4l2 device对象 2、分配和初始化media device对象,然后将v4l2 device中mdev绑定到media device上 3、分配和初始化video device对象&#xff0c…