实验场:在几分钟内使用 Bedrock Anthropic Models 和 Elasticsearch 进行 RAG 实验

作者:来自 Elastic Joe McElroy, Aditya Tripathi

我们最近发布了 Elasticsearch Playground,这是一个新的低代码界面,开发人员可以通过 A/B 测试 LLM、调整提示(prompt)和分块数据来迭代和构建生产 RAG 应用程序。今天,我们宣布 Amazon Bedrock 支持 Playground,为你带来更多来自 Amazon、Anthropic 和其他领先提供商的基础模型选择。使用 Amazon Bedrock 和 Elasticsearch 的开发人员现在可以使用私有或专有数据(索引到一个或多个 Elasticsearch 索引中)优化检索以获得答案。

使用 Amazon Bedrock 进行推理,对 LLM 和检索进行 A/B 测试

Playground 界面允许你试验和 A/B 测试来自 Amazon 和 Anthropic 等领先模型提供商的不同 LLMs。但是,选择模型只是问题的一部分。开发人员还必须考虑如何检索相关搜索结果以紧密匹配模型的上下文窗口大小(即模型可以处理的 token 数)。检索比上下文窗口长的文本段落可能会导致截断,从而导致信息丢失。小于上下文窗口的文本可能无法正确嵌入,从而导致表示不准确。下一个复杂性可能来自必须结合来自不同数据源的检索。

Playground 将许多 Elasticsearch 功能整合到一个简单但功能强大的界面中,用于调整 RAG 工作流程:

  • 使用不断增长的模型源列表(包括 Amazon Bedrock),以选择最适合你需求的 LLM
  • 使用 semantic_text,调整分块策略以适应数据和上下文窗口大小
  • 使用 retrievers 添加多阶段检索管道(包括重新排序)

将发送到模型的上下文调整为所需的生产标准后,你可以导出代码并使用 Python Elasticsearch 语言客户端或 LangChain Python 集成完成你的应用程序。

今天的公告通过 Open Inference API 集成提供对 Amazon Bedrock 上托管模型的访问,以及使用新的 semantic_text 字段类型的能力。我们真心希望你能享受这种体验!

Playground 采用了所有这些可组合元素,并为你带来了真正的开发人员工具集,可快速迭代和开发,以满足开发人员所需的速度。

使用 Playground

在 Kibana(Elasticsearch UI)中,从左侧的导航页面导航到 “Playground”。首先,你需要连接到模型提供商以提供你选择的 LLM。Playground 通过 Amazon Bedrock 支持聊天完成模型(例如 Anthropic)。

此博客提供了连接和配置 Playground 体验的详细步骤和说明。

连接 LLM 并选择 Elasticsearch 索引后,你可以开始询问有关索引中的信息的问题。LLM 将根据你的数据上下文提供答案。

将所选的 LLM 与 Elasticsearch 索引与私有专有信息相连接
立即与你的数据进行聊天并评估模型(例如本例中的 Anthropic Claude 3 Haiku)的响应

审查并定制存储向量嵌入的索引的文本和检索器查询

使用检索器和混合搜索获取最佳上下文

Elastic 的混合搜索可帮助你构建最佳上下文窗口。有效的上下文窗口由各种类型的向量化和纯文本数据构建,这些数据可以分布在多个索引中。开发人员现在可以利用新的 query retrievers 来简化查询创建。从版本 8.14 开始,Elastic Cloud Serverless 上提供了三种新的检索器,并且只需一个统一查询即可实现使用 RRF 规范化的混合搜索。你可以存储矢量化数据并使用 kNN 检索器,或者添加元数据和上下文来创建混合搜索查询。很快,你还可以添加语义重新排名以进一步改善搜索结果。

使用 Playground 快速交付对话式搜索

构建对话式搜索体验可能涉及多种方法,而选择可能会让人不知所措,尤其是考虑到新的重新排名和检索技术的创新速度,这两种技术都适用于 RAG 应用程序。

借助我们的 Playground,即使开发人员可以使用多种功能,这些选择也会变得简单直观。我们的独特方法是立即将混合搜索作为构建的主要支柱,直观地了解所选和分块数据的形状,并扩大 LLMs 的多个外部提供商的访问范围。

今年早些时候,Elastic 获得了 AWS 生成式 AI 能力奖,这一殊荣授予了极少数提供差异化​​生成式 AI 工具的 AWS 合作伙伴。Elastic 为 Playground 体验添加 Bedrock 支持的方法遵循相同的原则 —— 为 Elastic Cloud on AWS 开发人员带来新的创新功能。

使用 Playground 构建、测试、享受乐趣

立即前往 Playground 文档开始使用!探索 GitHub 上的搜索实验室,了解 Cohere、Anthropic、Azure OpenAI 等提供商的新手册和集成。

准备好自己尝试了吗?开始免费试用。
想要获得 Elastic 认证?了解下一期 Elasticsearch 工程师培训何时开始!

原文:Playground: Experiment with RAG using Bedrock Anthropic Models and Elasticsearch in minutes — Elastic Search Labs

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/45055.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Web3学习路线图,从入门到精通

前面我们聊了Web3的知识图谱,内容是相当的翔实,要从哪里入手可以快速的入门Web3,本篇就带你看看Web3的学习路线图,一步一步深入学习Web3。 这张图展示了Web3学习路线图,涵盖了区块链基础知识、开发方向、应用开发等内…

接上一回C++:补继承漏洞+多态原理(带图详解)

引子:接上一回我们讲了继承的分类与六大默认函数,其实继承中的菱形继承是有一个大坑的,我们也要进入多态的学习了。 注意:我学会了,但是讲述上可能有一些不足,希望大家多多包涵 继承复习: 1&…

windows环境下基于3DSlicer 源代码编译搭建工程开发环境详细操作过程和中间关键错误解决方法说明

说明: 该文档适用于  首次/重新 搭建3D-Slicer工程环境  Clean up(非增量) 编译生成 1. 3D-slicer 软件介绍 (1)3D Slicer为处理MRI\CT等图像数据软件,可以实行基于MRI图像数据的目标分割、标记测量、坐标变换及三维重建等功能,其源于3D slicer 4.13.0-2022-01-19开…

OS Copilot测评

1.按照第一步管理重置密码时报错了,搞不懂为啥?本来应该跳转到给的那个实例的,我的没跳过去 2.下一步重置密码的很丝滑没问题 3安全组新增入库22没问题 很方便清晰 4.AccessKey 还能进行预警提示 5.远程连接,网速还是很快,一点没卡,下载很棒 6.替换的时候我没有替换<>括…

【JavaEE】网络编程——UDP

&#x1f921;&#x1f921;&#x1f921;个人主页&#x1f921;&#x1f921;&#x1f921; &#x1f921;&#x1f921;&#x1f921;JavaEE专栏&#x1f921;&#x1f921;&#x1f921; 文章目录 1.数据报套接字(UDP)1.1特点1.2编码1.2.1DatagramSocket1.2.2DatagramPacket…

Spring Cloud Alibaba AI 介绍及使用

一、Spring Cloud Alibaba AI 介绍 Spring AI 是 Spring 官方社区项目&#xff0c;旨在简化 Java AI 应用程序开发&#xff0c;让 Java 开发者像使用 Spring 开发普通应用一样开发 AI 应用。而 Spring Cloud Alibaba AI 是阿里以 Spring AI 为基础&#xff0c;并在此基础上提供…

dive deeper into tensor:从底层开始学习tensor

inspired by karpathy/micrograd: A tiny scalar-valued autograd engine and a neural net library on top of it with PyTorch-like API (github.com)and Taking PyTorch for Granted | wh (nrehiew.github.io). 这属于karpathy的karpathy/nn-zero-to-hero: Neural Networks…

阐述 C 语言中的参数传递机制

&#x1f345;关注博主&#x1f397;️ 带你畅游技术世界&#xff0c;不错过每一次成长机会&#xff01; &#x1f4d9;C 语言百万年薪修炼课程 通俗易懂&#xff0c;深入浅出&#xff0c;匠心打磨&#xff0c;死磕细节&#xff0c;6年迭代&#xff0c;看过的人都说好。 文章目…

多表查询sql

概述&#xff1a;项目开发中,在进行数据库表结构设计时,会根据业务需求及业务模块之间的关系,分析并设计表结构,由于业务之间相互关联,所以各个表结构之间也存在着各种联系&#xff0c;分为三种&#xff1a; 一对多多对多一对一 一、多表关系 一对多 案例&#xff1a;部门与…

【PowerShell】-1-快速熟悉并使用PowerShell

目录 PowerShell是什么&#xff1f;和CMD的区别&#xff1f; PowerShell的演变 自动化IT管理任务 一些名词 详尽的PowerShell开始之路 1.打开PowerShell&#xff1a; 2.基本命令&#xff1a; &#xff08;1&#xff09;Get-Process &#xff08;2&#xff09;变量赋值…

【核心笔记】Java入门到起飞,小白都能看懂的Java教程 (五)——数组

一 数组的定义和初始化 定义数组 数据类型[] 数组名&#xff1b;例 int[] arr; 数据类型 数组名[]&#xff1b;例 int arr[]; 数组初始化 数据类型[] 数组名 new 数据类型[] {值}&#xff1b;例 int[] arr new int[] {1,2,3}; &#xff08;简化形式&#xff09;数据类型[] 数…

超赞!只需粘贴复制超赞,视频快速转换成文章

大家好&#xff01;我是闷声轻创&#xff01;是否还在为撰写高质量的文章而熬夜奋战&#xff1f;今天&#xff0c;我要给你们带来一个超级棒的消息——视频变文章的神奇工具&#xff0c;让你的创作之路从此不再艰辛&#xff01; 视频素材的宝藏——油管&#xff08;YTB&#xf…

2024年了还在学pytestday1

1、按照博主的说法&#xff0c;提出疑问&#xff1a;应该在电脑本地终端安装还是在pythoncharm终端安装&#xff1f; ------在pythoncharm终端安装就行 避免老是忘记&#xff0c;还是记下来比较好。 2、在公司安装不成功&#xff0c;换豆瓣源也不行&#xff0c;连接手机热点尝…

Linux--安装VMware步骤

安装VMware VMware Desktop Hypervisors for Windows, Linux, and Mac 复制链接打开浏览器下载即可 从官网下载软件&#xff0c;完成后为确保后续正常使用&#xff0c;需要检查虚拟网卡是否安装完成 检查虚拟网卡的安装步骤 Windows--设置--高级设置--网络适配器--看是否有显…

STM32杂交版(HAL库、音乐盒、闹钟、点阵屏、温湿度)

一、设计描述 本设计精心构建了一个以STM32MP157A高性能单片机为核心控制单元的综合性嵌入式系统。该系统巧妙融合了蜂鸣器、数码管显示器、点阵屏、温湿度传感器、LED指示灯以及按键等多种外设模块&#xff0c;形成了一个功能丰富、操作便捷的杂交版智能设备。通过串口…

vue2学习笔记-官网使用指南和搭建开发环境

官网使用指南 官网地址&#xff1a;介绍 — Vue.js 1、学习 1.1 教程和API 最重要的两个板块。API是VUE的字典&#xff0c;需要时来查阅。 1.2、风格指南 如何写出风格优雅的VUE代码。规则分为四类&#xff1a;必要的&#xff0c;强烈推荐、推荐、谨慎使用。 1.3、示例 …

初始网络知识

前言&#x1f440;~ 上一章我们介绍了使用java代码操作文件&#xff0c;今天我们来聊聊网络的一些基础知识点&#xff0c;以便后续更深入的了解网络 网络 局域网&#xff08;LAN&#xff09; 广域网&#xff08;WAN&#xff09; 路由器 交换机 网络通信基础 IP地址 端…

PCI PTS 硬件安全模块(HSM)模块化安全要求 v5.0

符合条件的 PCI SSC 利益相关者在 30 天的意见征询 (RFC) 期间审查 PCI PTS 硬件安全模块 (HSM) 模块化安全要求 v5.0 草案并提供反馈。 PCI PTS 硬件安全模块(HSM)模块化安全要求 v5.0图 从 7 月 8 日到 8 月 8 日&#xff0c;邀请符合条件的 PCI SSC 利益相关者在 30 天的意见…

C语言 结构体和共用体——结构体所占内存的字节数

目录 结构体所占内存的字节数 结构体所占内存的字节数

Unity之OpenXR+XR Interaction Toolkit实现 Gaze眼部追踪

使用 Unity OpenXR 实现Gaze眼部追踪 在虚拟现实(VR)和增强现实(AR)应用中,眼动追踪是一项强大而受欢迎的技术。它可以让开发者更好地理解用户的注意力和行为,并创造出更加沉浸和智能的体验。在本文中,我们将探讨如何使用 Unity OpenXR 实现Gaze眼部追踪功能。 Unity …