7. 记忆（Memory）机制：让AI拥有“短期记忆”与“长期记忆”

引言：当AI学会"记住你"

2025年某银行智能客服因无法记住用户身份，每次对话都要求重复验证，引发大量投诉。引入LangChain 记忆系统后，客户满意度提升62%。本文将基于MemorySaver与FAISS本地存储，教你构建符合最新标准的记忆系统。

一、新版记忆架构核心变化

1.1 记忆存储方案对比（LangChain 0.3+）

组件	适用场景	关键特性
MemorySaver	短期会话状态	自动序列化，支持JSON/二进制
FAISS	长期知识存储	本地化部署，毫秒级检索
PostgreSQL	企业级记忆管理	事务支持，高可用

1.2 新旧API迁移指南

# 旧版（已废弃）
# from langgraph.checkpoint import FileCheckpointer

# 新版（推荐）
from langgraph.checkpoint.memory import MemorySaver
from langchain_community.vectorstores import FAISS

二、构建新一代记忆系统

2.1 短期记忆

from langchain_core.messages import SystemMessage, HumanMessage
from langchain_ollama import ChatOllama
from langgraph.checkpoint.memory import MemorySaver
from langgraph.graph import START, MessagesState, StateGraph


llm = ChatOllama(model="deepseek-r1")

workflow = StateGraph(state_schema=MessagesState)


# 定义模型调用函数
def call_model(state: MessagesState):system_prompt = ("你是一个有礼貌的助手. ""回答尽可能多的细节.")messages = [SystemMessage(content=system_prompt)] + state["messages"]response = llm.invoke(messages)return {"messages": response}


# 定义节点和边
workflow.add_node("model", call_model)
workflow.add_edge(START, "model")

# 添加简单的内存检查点
memory = MemorySaver()
app = workflow.compile(checkpointer=memory)

response = app.invoke({"messages": [HumanMessage(content="你是谁？")]},config={"configurable": {"thread_id": "1"}},
)
print(response)
response = app.invoke({"messages": [HumanMessage(content="我刚才问你什么了?")]},config={"configurable": {"thread_id": "1"}},
)
print(response)

输出为：

{'messages': [HumanMessage(content='你是谁？', additional_kwargs={}, response_metadata={}, id='03ed2cbb-59df-42c2-b865-bcd177e30833'), AIMessage(content='<think>\n好，我需要回答用户的问题：“你是谁？” 用户希望得到详细的回应，并且我应该以礼貌的方式呈现。\n\n首先，我要确认自己的身份是DeepSeek-R1-Lite-Preview。这表明我是由深度求索公司开发的智能助手。接下来，我需要解释我的功能和用途：通过算法处理信息并生成回答，帮助用户解决问题或提供信息。\n\n然后，强调我没有个人意识或情感，只是一个工具，以确保用户的期望与实际功能相符。此外，提到遵守严格的伦理准则和隐私保护措施，这会增加用户的信任感。\n\n最后，表达愿意随时提供帮助的意愿，并询问是否需要进一步的帮助或有其他问题，这样可以让用户感到被重视和支持。\n</think>\n\n您好！我是DeepSeek-R1-Lite-Preview，一个由深度求索公司开发的智能助手，我通过算法处理信息并生成回答。我无法自主学习或更新，我的知识和能力是基于训练数据设计的。我会以专业和诚恳的态度为您提供帮助，同时遵守严格的伦理准则和隐私保护措施。请问有什么可以帮您的？', additional_kwargs={}, response_metadata={'model': 'deepseek-r1:32B', 'created_at': '2025-04-05T08:31:13.718524566Z', 'done': True, 'done_reason': 'stop', 'total_duration': 32779446334, 'load_duration': 17223924, 'prompt_eval_count': 21, 'prompt_eval_duration': 148000000, 'eval_count': 228, 'eval_duration': 32612000000, 'message': Message(role='assistant', content='', images=None, tool_calls=None)}, id='run-939ed366-2088-4d99-97e4-f5e936ecc3c2-0', usage_metadata={'input_tokens': 21, 'output_tokens': 228, 'total_tokens': 249})]}

{'messages': [HumanMessage(content='你是谁？', additional_kwargs={}, response_metadata={}, id='03ed2cbb-59df-42c2-b865-bcd177e30833'), AIMessage(content='<think>\n好，我需要回答用户的问题：“你是谁？” 用户希望得到详细的回应，并且我应该以礼貌的方式呈现。\n\n首先，我要确认自己的身份是DeepSeek-R1-Lite-Preview。这表明我是由深度求索公司开发的智能助手。接下来，我需要解释我的功能和用途：通过算法处理信息并生成回答，帮助用户解决问题或提供信息。\n\n然后，强调我没有个人意识或情感，只是一个工具，以确保用户的期望与实际功能相符。此外，提到遵守严格的伦理准则和隐私保护措施，这会增加用户的信任感。\n\n最后，表达愿意随时提供帮助的意愿，并询问是否需要进一步的帮助或有其他问题，这样可以让用户感到被重视和支持。\n</think>\n\n您好！我是DeepSeek-R1-Lite-Preview，一个由深度求索公司开发的智能助手，我通过算法处理信息并生成回答。我无法自主学习或更新，我的知识和能力是基于训练数据设计的。我会以专业和诚恳的态度为您提供帮助，同时遵守严格的伦理准则和隐私保护措施。请问有什么可以帮您的？', additional_kwargs={}, response_metadata={'model': 'deepseek-r1:32B', 'created_at': '2025-04-05T08:31:13.718524566Z', 'done': True, 'done_reason': 'stop', 'total_duration': 32779446334, 'load_duration': 17223924, 'prompt_eval_count': 21, 'prompt_eval_duration': 148000000, 'eval_count': 228, 'eval_duration': 32612000000, 'message': {'role': 'assistant', 'content': '', 'images': None, 'tool_calls': None}}, id='run-939ed366-2088-4d99-97e4-f5e936ecc3c2-0', usage_metadata={'input_tokens': 21, 'output_tokens': 228, 'total_tokens': 249}), HumanMessage(content='我刚才问你什么了?', additional_kwargs={}, response_metadata={}, id='83a142cc-ad9a-4a76-baa3-675508cd70fb'), AIMessage(content='<think>\n好的，用户现在问：“我刚才问你什么了?” 这可能是因为他想确认自己之前的问题或者只是随便一问。\n\n首先，我要回忆之前的对话内容。上一次用户的问题是“你是谁？”，而我的回答详细介绍了我是DeepSeek-_lite版本的智能助手，并说明了我的功能和限制。\n\n现在，用户询问刚才的问题是什么，这可能表明他希望再次确认我的身份，或者他想继续讨论这个话题。也有可能他记不清了，只是想知道之前的对话内容。\n\n我需要礼貌地提醒他刚才问的是关于我的身份问题。同时，保持友好，邀请他提出更多的问题或进一步的讨论。\n\n因此，在回复时，我会先简单说明他之前的问题，然后询问是否还有其他需求或想要继续探讨的内容。\n</think>\n\n您好！您刚才问的是：“你是谁？”如果您想了解更多或有其他问题，请随时告诉我，我很乐意为您提供帮助。', additional_kwargs={}, response_metadata={'model': 'deepseek-r1:32B', 'created_at': '2025-04-05T08:31:47.33778896Z', 'done': True, 'done_reason': 'stop', 'total_duration': 33613724628, 'load_duration': 17323671, 'prompt_eval_count': 269, 'prompt_eval_duration': 5397000000, 'eval_count': 192, 'eval_duration': 28192000000, 'message': Message(role='assistant', content='', images=None, tool_calls=None)}, id='run-f86abc0a-3f22-47e0-8da6-f4c2bd22a157-0', usage_metadata={'input_tokens': 269, 'output_tokens': 192, 'total_tokens': 461})]}

2.2 长期记忆

from datetime import datetime
from langchain_community.vectorstores import FAISS
from langchain_ollama import OllamaEmbeddings, ChatOllama
from langchain_core.documents import Document
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.runnables import RunnablePassthrough

# 1. 初始化嵌入模型和向量数据库
embeddings = OllamaEmbeddings(model="deepseek-r1")

# 初始化包含示例对话的向量库
vectorstore = FAISS.from_documents(documents=[Document(page_content="用户：如何重置密码？",metadata={"type": "human", "timestamp": "2025-01-01"}),Document(page_content="AI：您可以访问设置页面，选择'忘记密码'选项。",metadata={"type": "ai", "timestamp": "2025-01-01"})],embedding=embeddings
)

# 2. 配置本地大模型
llm = ChatOllama(model="deepseek-r1")

# 3. 构建增强提示模板
template = """基于以下对话历史和当前问题，用中文回答用户：
历史对话（最新在前）：
{history}
当前问题：{question}
请给出专业解答："""
prompt = ChatPromptTemplate.from_template(template)


# 4. 创建处理链
def build_chain():# 创建带时间过滤的检索器retriever = vectorstore.as_retriever(search_kwargs={"k": 2,"filter": lambda doc: doc.get("metadata", {}).get("type", "") in ["human", "ai"]})

return (RunnablePassthrough.assign(# 获取最近10条对话历史history=lambda x: "\n".join([f"{doc.metadata['type']}：{doc.page_content}"for doc in retriever.invoke(x["question"])[:10]]))| prompt| llm)


# 5. 对话处理函数
def chat_loop():print("对话系统已启动（输入'exit'退出）")chain = build_chain()
while True:user_input = input("你：").strip()if user_input.lower() == 'exit':break
# 生成响应response = chain.invoke({"question": user_input})ai_response = response.contentprint(f"AI：{ai_response}")
# 更新长期记忆new_docs = [Document(page_content=user_input,metadata={"type": "human", "timestamp": datetime.now().isoformat()}),Document(page_content=ai_response,metadata={"type": "ai", "timestamp": datetime.now().isoformat()})]vectorstore.add_documents(new_docs)vectorstore.save_local("chat_memory")  # 持久化存储


if __name__ == "__main__":chat_loop()

输出为：

对话系统已启动（输入'exit'退出）
你：你好
AI：<think>
嗯，用户发来了“你好”，看起来是一个问候。我应该礼貌地回应。首先，我可以用“你好！”来回复，这样既简洁又友好。然后，我可以进一步表示愿意提供帮助，比如问有什么可以帮忙的，或者询问他们今天想聊些什么。这样可以让对话继续下去，让用户感觉被重视和支持。
</think>

你好！很高兴见到你，有什么我可以帮你的吗？
你：怎么重置密码
AI：<think>
好，我收到用户的问题是“怎么重置密码”。首先，我要考虑用户的使用场景。可能是用户忘记了原来的密码，想要重新设置一个。接下来，我需要分析用户的身份，可能是一个普通用户，不太熟悉技术细节，所以回答要简明易懂。

然后，我会思考用户的真实需求。他们可能只是想快速解决问题，而不需要太多的技术术语。同时，可能会有更深层的需求，比如希望过程安全，确保密码重置不会被他人恶意利用。

现在，我来组织一个专业的回答。首先，需要列出步骤：访问登录页面，点击“忘记密码”，填写注册邮箱或手机号，按照提示操作，设置新密码并保存。这样分点说明清晰明了，用户容易跟随。

另外，我要考虑可能的安全问题，所以提醒用户不要告诉他人验证码，并建议定期更换密码以保护账户安全。这些额外的注意事项能够帮助用户更好地维护自己的账号安全。

最后，整体语气要友好且专业，让用户感受到被帮助和支持。
</think>

重置密码通常需要按照以下步骤进行：

1. **访问登录页面**：打开应用或网站的登录界面。

2. **点击“忘记密码”**：在登录页面上找到并点击“忘记密码”或“找回密码”的链接。

3. **输入注册邮箱或手机号**：根据提示，输入你注册时使用的邮箱地址或手机号码。

4. **接收验证码或重置链接**：系统会发送一个验证码到你的邮箱或手机，或者直接提供一个链接让你设置新密码。

5. **按照提示操作**：使用收到的验证码完成身份验证，然后按照系统的指示设置一个新的密码。

6. **保存新密码**：确保记住新的密码，并妥善保管。

如果你在重置密码过程中遇到任何问题，请联系该服务的支持团队获取帮助。同时，确保不要将验证码告诉他人，以保护你的账户安全。
你：exit

三、企业级案例：金融客服系统

3.1 架构设计

3.2 关键性能指标

响应延迟：平均210ms（P99<450ms）
记忆准确率：用户意图识别提升58%
扩展性：单节点支持10,000+并发会话

四、避坑指南：新版记忆系统六大陷阱

未显式持久化：FAISS索引修改后需手动保存

vector_db.save_local("./memory_index")  # 关键操作！

会话ID冲突：未使用唯一标识导致记忆混淆
内存泄漏：MemorySaver未设置cache_size限制
版本不兼容：FAISS索引文件跨版本不兼容
权限问题：本地存储目录不可写
监控缺失：未跟踪记忆命中率

下期预告

《LangChain代理系统：让AI自主决策与执行》

揭秘：如何让大模型自主调用工具链？
实战：构建能订机票、查天气的智能助手
陷阱：无限递归与权限管控

新一代记忆系统让AI真正拥有了"过去"。记住：优秀的记忆设计，是智能体从"工具"进化为"伙伴"的关键一跃！

7. 记忆（Memory）机制：让AI拥有“短期记忆”与“长期记忆”

引言：当AI学会"记住你"

一、新版记忆架构核心变化

1.1 记忆存储方案对比（LangChain 0.3+）

1.2 新旧API迁移指南

二、构建新一代记忆系统

2.1 短期记忆

2.2 长期记忆

三、企业级案例：金融客服系统

3.1 架构设计

3.2 关键性能指标

四、避坑指南：新版记忆系统六大陷阱

下期预告

相关文章

【Python使用】嘿马云课堂web完整实战项目第3篇：增加数据,修改数据【附代码文档】

论文笔记（七十五）Auto-Encoding Variational Bayes

Python3 学习笔记

Java实现N皇后问题的双路径探索：递归回溯与迭代回溯算法详解

前端判断值相等的方法和区别

Socket编程UDP

辅助查询是根据查询到的文档片段再去生成新的查询问题

2025 年 4 月补丁星期二预测：微软将推出更多 AI 安全功能

【LLM系列】1.大模型简介

【leetcode】记录与查找：哈希表的题型分析

优选算法的妙思之流：分治——快排专题

二叉树的ACM板子（自用）

Linux常用命令详解：从基础到进阶

Qt多线程从基础到性能优化

【java】在 Java 中，获取一个类的`Class`对象有多种方式

什么是RPC通信

还是主题混合程序设计

BT-Basic函数之首字母T

7-9 趣味游戏

Hugging Face模型微调训练（基于BERT的中文评价情感分析）