AGI(通用人工智能Artificial General Intelligence)知识点

通用人工智能AGI知识点

AGI
1. prompt提示工程是什么？
2. 怎么构建prompt？
3. Function Calling是什么？
4. RAG是什么？
- - 构建 RAG 模型的步骤：
  - RAG 的优势和应用场景：
5. 离线和在线的RAG怎么构建？
5. 构建的RAG，效果很差怎么办？
10. m3e是什么
11. 向量模型有哪些？
5. 问答系统怎么构建知识库？
6. 问答系统怎么调用知识库？
7. 怎么部署LLM、调用API接口？
8. llamaindex是什么？
9. Langchain是什么？

AGI

对深度学习模型相关的知识点进行总结。

AGI（通用人工智能 Artificial General Intelligence）是指能够执行人类可以执行的任何智力任务的机器或计算机系统。这包括理解自然语言、学习、规划、解决问题、推理、感知环境等。

实现 AGI 是一个非常复杂的问题，目前还没有一个确定的答案。目前可能的实现方法：

深度学习：深度学习是一种机器学习技术，它可以通过训练神经网络来学习自然语言处理、图像识别、语音识别等任务。深度学习已经在许多领域取得了巨大的成功，并且是实现 AGI 的一个重要方向。
强化学习：强化学习是一种机器学习技术，它可以通过训练智能体来学习如何在环境中行动以最大化奖励。强化学习已经在游戏、机器人等领域取得了巨大的成功，并且是实现 AGI 的一个重要方向。
人工神经网络：人工神经网络是一种模仿人类大脑的机器学习技术，它可以通过训练神经网络来学习自然语言处理、图像识别、语音识别等任务。人工神经网络已经在许多领域取得了巨大的成功，并且是实现 AGI 的一个重要方向。
语义理解：语义理解是指理解自然语言的含义和意图。语义理解是实现 AGI 的一个重要方向，因为它可以帮助智能体理解人类的意图和需求。
知识图谱：知识图谱是一种用于表示知识的结构化数据，它可以帮助智能体理解人类的知识和经验。知识图谱是实现 AGI 的一个重要方向，因为它可以帮助智能体更好地理解人类的知识和经验。

实现 AGI 需要结合多种技术和方法，并且需要不断地进行研究和改进。

1. prompt提示工程是什么？

提示工程（Prompt Engineering）是指通过设计和优化提示语（Prompts）来提高人工智能模型的性能和效率。提示语是指输入给人工智能模型的文本、指令或问题，它可以影响模型的输出结果。

简单来说，可以将垂直知识相关规则加入prompt，使其AGI准确回答，占位符回答槽，从而约束prompt回答模版。

提示工程的目标是设计出能够最大限度地利用模型能力的提示语，从而提高模型的性能和效率。

提示工程的方法包括设计更好的提示语、优化提示语的格式和内容、利用模型的反馈信息来改进提示语等。

这需要对模型的能力和限制有深入的了解，以及对目标任务的需求有清晰的认识。

核心思路：

把输入的自然语言对话，转成结构化的表示
从结构化的表示，生成策略
把策略转成自然语言输出

提示工程的关键技术包括：

设计合适的提示：设计合适的提示需要考虑模型的能力和限制，以及目标任务的需求。提示应该尽可能清晰地表达期望的输出，同时避免过于复杂或模糊。
优化提示：优化提示可以通过调整提示的内容、格式和结构来提高模型的性能和准确性。这可能需要使用一些技术，如词向量、语言模型等。
评估提示：评估提示的效果是提示工程的重要环节。可以通过测试模型在不同提示下的输出，来评估提示的效果。
迭代优化：提示工程是一个迭代的过程，需要不断地优化和改进提示，以提高模型的性能和准确性。

注意要点：
大模型对prompt开头和结尾的内容更敏感，先定义角色，其实就是在开头把问题域收窄，减少二义性

2. 怎么构建prompt？

具体构建 prompt 的步骤如下：

明确目标：首先，需要明确提示的目标任务是什么。是要生成文本、回答问题、翻译文本还是其他任务的文本类型（例如新闻、小说、诗歌等）。不同的目标需要不同的提示。
了解模型：需要了解模型的能力和限制，以及它能够处理的输入和输出。这可以通过阅读模型的文档和研究论文来实现。
设计提示：根据目标和模型的能力，设计一个合适的提示。提示应该尽可能清晰地表达期望的输出，同时避免过于复杂或模糊。
收集数据：接下来，你需要收集与你的任务相关的数据。这些数据可以来自互联网、书籍、报纸、杂志等。
准备 prompt：准备 prompt 需要考虑以下几个方面：
- 提示的格式：prompt 的格式可以是文本、图像、音频等。
- 提示的内容：提示的内容应该清晰明了，能够引导模型生成期望的输出。
- 提示的数量：提示的数量应该根据任务的复杂性和数据的大小来确定。
测试和优化：测试提示的效果，并根据测试结果进行优化。使用收集到的数据和准备好的 prompt 来训练模型。训练模型的方法可以是监督学习、无监督学习、强化学习等。
这可能需要调整提示的内容、格式和结构，以提高模型的性能和准确性。
评估模型：评估模型的方法可以是准确率、召回率、F1 值等。
迭代优化调整 prompt：构建提示是一个迭代的过程，需要不断地优化和改进提示，根据评估结果，调整 prompt 的内容和格式，以提高模型的性能和准确性。
重复步骤 5-9，直到模型的性能达到满意的水平。

3. Function Calling是什么？

通过预先设定好的function定义，进行调用函数、API、Stream流式输出等操作，Function Calling也是一种prompt，它也需要调优，否则会影响函数的召回、参数的准确性，甚至让 AGI产生幻觉

OpenAI GPTs

无需编程，就能定制个性对话机器人的平台
可以放入自己的知识库，实现 RAG（后面会讲）
可以通过 actions 对接专有数据和功能
内置 DALL·E 3 文生图和 Code Interpreter 能力
只有 ChatGPT Plus 会员可以使用

字节跳动 Coze

可以免科学上网，免费使用 GPT-4 等 OpenAI 的服务！大羊毛！
只有英文界面，但其实对中文更友好
Prompt 优化功能更简单直接

Dify

开源，中国公司开发
功能最丰富
可以本地部署，支持非常多的大模型
有 GUI，也有 API

百度文心大模型

ERNIE-Bot - 支持 Function Calling

ChatGLM3-6B

和 OpenAI 1106 版之前完全一样
早已使用 tools 而不是 function 来做参数

讯飞星火 3.0

和 OpenAI 1106 版之前完全一样

4. RAG是什么？

检索增强的生成模型（Retrieval-Augmented Generation，RAG）结合了信息检索和生成模型的优势，能够在生成文本时引入外部知识和信息。

以下是检索增强的生成模型（RAG）的基本流程：

检索增强的生成模型（Retrieval-Augmented Generation，RAG）结合了信息检索和生成模型的优势，能够在生成文本时引入外部知识和信息。以下是检索增强的生成模型（RAG）的基本流程：

构建检索增强的生成模型（RAG）涉及多个步骤，包括准备数据、将私有知识库内容经过 embedding 存入向量知识库、训练模型和优化过程、用户每一次提问，把问题也 embedding，并利用向量相关性算法（例如余弦算法）找到向量知识库最匹配的几个片段。

构建 RAG 模型的步骤：

准备数据：
- 知识库准备：准备一个包含丰富信息的知识库或文本数据集，用于信息检索阶段。
- 查询-文本对：构建查询和相关文本的对应数据，文档加载，并按一定条件切割成片段，用于训练检索模型和生成模型。
训练信息检索模型：
- 信息检索模型：训练一个用于从知识库中检索相关文本的模型，将切割的文本片段灌入检索引擎，例如使用 BM25 算法或神经网络模型。
- 查询表示学习：学习如何表示查询以有效检索相关文本。
训练生成模型：
- 生成模型选择：选择一个适合的生成模型，如 GPT 系列模型。
- Fine-tuning：使用查询-文本对数据对生成模型进行微调，以使其能够更好地生成与查询相关的文本。并封装检索接口。
检索阶段（Retrieval Stage）调用流程 Query -> 检索 -> ：