【RAG 实践】LlamaIndex 快速实现一个基于 OpenAI 的 RAG

这是 LlamaIndex 官方 Starter Tutorial 中 demo,用很少的代码来使用 OpenAI 快速实现出一个 RAG。

Ref: Starter Tutorial | LlamaIndex

代码:llamindex-rag-demo | Kaggle

1)设置 OpenAI Token

这里使用国内的 OpenAI 中转 API token,在 LlamaIndex 中需要进行如下设置:

import os
from llama_index.embeddings.openai import OpenAIEmbedding
from llama_index.llms.openai import OpenAI
from llama_index.core.settings import SettingsOPENAI_API_KEY = 'sk-xxxx'
OPENAI_API_BASE = 'https://xxxx'os.environ['OPENAI_API_KEY'] = OPENAI_API_KEY
os.environ['OPENAI_API_BASE'] = OPENAI_API_BASESettings.llm = OpenAI(model="gpt-3.5-turbo", api_key=OPENAI_API_KEY, api_base=OPENAI_API_BASE)
Settings.embed_model = OpenAIEmbedding(api_key=OPENAI_API_KEY, api_base=OPENAI_API_BASE)

其中 Settings 为设置整个代码运行所使用的默认 LLM。

2)加载数据,并构建向量索引

这里使用一个 Paul Graham 的文章 “What I Worked On” 作为本地知识语料库的数据。

语料库下载连接:download

将改 txt 文件下载到 data 目录下。

从 data 目录加载语料库:

from llama_index.core import SimpleDirectoryReaderdocuments = SimpleDirectoryReader("data").load_data()

其中 documents 是一个 Document 对象的列表,每个 Document 对象包含了文件类型、文件长度、文件内容等各种文档描述信息:

在这里插入图片描述

基于 documents 可以构建向量索引,这里使用基于内存的向量索引 VectorStoreIndex

from llama_index.core import VectorStoreIndexindex = VectorStoreIndex.from_documents(documents)

3)使用 user query 进行 QA

这里从 index 构建出 Query Engine 用于做 QA。

官方文档对 Engine 的解释如下:

  • Engines provide natural language access to your data. For example:

    • Query engines are powerful interfaces for question-answering (e.g. a RAG pipeline).
    • Chat engines are conversational interfaces for multi-message, “back and forth” interactions with your data.

代码如下:

query_engine = index.as_query_engine()
response = query_engine.query("What did the author do growing up?")
print(response)

response 就是检索增强后的生成响应:

在这里插入图片描述

以上就是一个简单的 RAG demo,具体如何打印日志、持久化 index 可以参考官方文档。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/45962.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Python】数据分析-Matplotlib绘图

数据分析 Jupyter Notebook Jupyter Notebook: 一款用于编程、文档、笔记和展示的软件。 启动命令: jupyter notebookMatplotlib 设置中文格式:plt.rcParams[font.sans-serif] [KaiTi] # 查看本地所有字体 import matplotlib.font_manager a sorted…

802.11ax RU - 传输的最小单元

子载波 无线信号是加载在某个固定频率上进行传输的,这个频率被称为载波。802.11标准中,对传输频率有更新的划分,而这些划分的频率被称为子载波。Wi-Fi 6中,以20Mhz信道为例,20Mhz信道被划分成256个子载波,…

QML 鼠标和键盘事件

学习目标:Qml 鼠标和键盘事件 学习内容 1、QML 鼠标事件处理QML 直接提供 MouseArea 来捕获鼠标事件,该操作必须配合Rectangle 获取指定区域内的鼠标事件, 2、QML 键盘事件处理,并且获取对OML直接通过键盘事件 Keys 监控键盘任意按键应的消…

基于3D感知的端到端具身操作论文导读

DexIL:面向双臂灵巧手柔性操作的端到端具身执行模型 模型架构 输入:   观测Ot: RGB点云,使用PointNet进行编码;   状态St: 双臂末端7x2Dof位姿16x2灵巧手关节位置,只进行归一化,无编码&am…

Linux Win 10 Windows上安装Ollama部署大模型qwen2 7b/15配置启动 LangChain-ChatChat 0.2.10进行对话

Win 10 Window安装Ollama部署qwen2 7b LangChain-ChatChat 环境说明 Win 10 Python 3.11.9 LangChain-ChatChat 0.20 Ollama 0.2.10 Qwen2 1.5b/7b Windows 安装Ollama 下载并安装Windows版Ollama https://ollama.com/download#/ 下载大模型qwen2:1.5b或者qwen2:7b 在命令…

prompt第三讲-PromptTemplate

文章目录 前提回顾PromptTemplateprompt 模板定义以f-string渲染格式以mustache渲染格式以jinja2渲染格式直接实例化PromptTemplatePromptTemplate核心变量 prompt value生成invokeformat_prompt(不建议使用)format(不建议使用) batchstreamainvoke PromptTemplate核心方法part…

从实时监控到风险智能预警:EasyCVR视频AI智能监控技术在工业制造中的应用

随着科技的不断进步和工业制造领域的持续发展,传统的生产管理方式正逐渐转型,迈向更加智能、高效和安全的新阶段。在这个变革过程中,视频智能监控技术凭借其独特的优势,成为工业制造领域的管理新引擎,推动着从“制造”…

访问者模式(大话设计模式)C/C++版本

访问者模式 C #include <iostream> #include <list> using namespace std;class Visitor;// 组成Computer的各组件基类 class Element { public:Element(string strName) : m_strName(strName) {}string GetName(){return m_strName;}// 组件接受访问者访问的接口…

前端大文件上传实现切片上传 + 断点续传 + 秒传 + 暂停上传 + 恢复上传

前情提要&#xff1a; 在前端无论是Vue还是React技术栈&#xff0c;都离不开上传业务代码 一般情况下&#xff0c;前端上传文件就是new FormData&#xff0c;然后把文件 append 进去&#xff0c;然后post发送给后端就完事了&#xff0c;但是大文件可不能这么搞&#xff0c;因…

【YOLOv8系列】(三)YOLOv8应用实践:从识别到分类再到分割的全方位视觉解决方案

随着深度学习技术的不断演进&#xff0c;目标检测领域的明星模型——YOLO系列&#xff0c;已经发展到了第八代&#xff0c;即YOLOv8。这一版本不仅继承了前辈们快速与准确的特点&#xff0c;还实现了功能上的巨大飞跃&#xff0c;成为了一个全能型的视觉AI工具箱&#xff0c;支…

如何实现一个二叉搜索树

实现一个二叉搜索树&#xff08;Binary Search Tree, BST&#xff09;主要涉及定义树的结构、插入新节点、搜索节点、以及可能的其他操作&#xff0c;如删除节点、遍历树等。下面是一个简单的二叉搜索树的实现示例&#xff0c;使用Python语言&#xff1a; 定义树节点 首先&am…

maven的settings.xml无法正确配置本地仓库路径

因为以前使用过新版的maven&#xff0c;现在要换个版本使用。 在配置新的本地仓库路径的时候突然发现居然idea居然识别不了我settings.xml里面配置的路径。 我很是震惊&#xff0c;明明之前一直都是这样子配置的。怎么突然间不行了。当我冥思苦想&#xff0c;在网上搜寻资料无果…

WPF学习(5) -- WPF绑定

一、双向绑定 1.代码示例 <Window x:Class"学习.MainWindow"xmlns"http://schemas.microsoft.com/winfx/2006/xaml/presentation"xmlns:x"http://schemas.microsoft.com/winfx/2006/xaml"xmlns:d"http://schemas.microsoft.com/expres…

在 MATLAB 中,如何高效地处理大规模矩阵运算以提高程序的运行速度?

在 MATLAB 中&#xff0c;可以采用以下一些方法来高效地处理大规模矩阵运算以提高程序的运行速度&#xff1a; 避免使用循环&#xff1a;MATLAB 是一种矢量化编程语言&#xff0c;通过使用矢量和矩阵操作&#xff0c;可以避免使用循环来处理矩阵运算。避免循环可以大大提高程序…

[论文阅读]MaIL: Improving Imitation Learning with Mamba

Abstract 这项工作介绍了mamba模仿学习&#xff08;mail&#xff09;&#xff0c;这是一种新颖的模仿学习&#xff08;il&#xff09;架构&#xff0c;为最先进的&#xff08;sota&#xff09;变换器策略提供了一种计算高效的替代方案。基于变压器的策略由于能够处理具有固有非…

阿里云产品流转

本文主要记述如何使用阿里云对数据进行流转&#xff0c;这里只是以topic流转&#xff08;再发布&#xff09;为例进行说明&#xff0c;可能还会有其他类型的流转&#xff0c;不同服务器的流转也可能会不一样&#xff0c;但应该大致相同。 1 创建设备 具体细节可看&#xff1a;…

LangChain —— Prompt Templates —— How to use few shot examples in chat models

文章目录 一、概述二、固定示例 Fixed Example 一、概述 本指南介绍了如何使用示例输入和输出提示 chat model。为模型提供几个这样的例子被称为 few-shotting&#xff0c;这是一种简单而强大的方法来指导生成&#xff0c;在某些情况下可以大大提高模型性能。 对于如何最好地进…

Spring源码中的模板方法模式

1. 什么是模板方法模式 模板方法模式&#xff08;Template Method Pattern&#xff09;是一种行为设计模式&#xff0c;它在操作中定义算法的框架&#xff0c;将一些步骤推迟到子类中。模板方法让子类在不改变算法结构的情况下重新定义算法的某些步骤。 模板方法模式的定义&…

驱动LSM6DS3TR-C实现高效运动检测与数据采集(8)----中断获取FIFO数据并应用MotionFX库解析空间坐标

驱动LSM6DS3TR-C实现高效运动检测与数据采集.8--中断获取FIFO数据并应用MotionFX库解析空间坐标 概述视频教学样品申请源码下载开启LED开启INT中断参考驱动程序中断读取传感器数据主程序演示 概述 本文将探讨如何使用中断机制获取FIFO数据并应用MotionFX库解析空间坐标。Motio…

React Native Android 应用开发、调试与发布深度指南

React Native 是构建跨平台移动应用的强大工具。本指南将深入探讨使用 React Native 开发、调试和发布 Android 应用的各个方面&#xff0c;为您提供全面的指导。 1. 环境准备 Node.js 和 npm/yarn: 确保您的系统中安装了 Node.js 和 npm (Node Package Manager) 或 yarn。您…