当前位置：首页 » AI知识

深度剖析AI智能体记忆：从核心概念到LangGraph实战

2025-07-07

与一个总忘记谈话内容的朋友交流，每次都得从头说起，这种体验无疑是低效且令人疲惫的。然而，这恰恰是当前多数人工智能系统的常态。它们很强大，但普遍缺失一个关键要素：记忆。

要构建能够真正学习、演化和协作的 AI 智能体 (Agent)，记忆并非可有可无的附加品，而是其核心基础。

AI 记忆的核心概念

当前 AI 的“无状态”困境

类似 ChatGPT 或各类代码助手等工具，尽管功能强大，用户却不得不反复重申指令或偏好。这种由大语言模型的上下文窗口和提示工程（Prompt Engineering）营造的“记忆错觉”，让人们误以为 AI 已经具备记忆能力。

实际上，绝大多数 AI 智能体本质上是**无状态（Stateless）的，它们无法从过去的交互中学习，也无法随时间推移而自我调整。要从无状态工具进化为真正自主的有状态（Stateful）**智能体，就必须为其赋予真正的记忆机制，而非简单地扩大上下文窗口或优化检索能力。

AI 智能体中的记忆究竟是什么？

在 AI 智能体的语境中，记忆是一种跨时间、跨任务、跨会话保留并调用相关信息的能力。它使智能体能够记住历史交互，并利用这些信息指导未来的行为。

真正的记忆远不止是存储聊天记录。它关乎构建一个持续演化的内部状态，这个状态会影响智能体的每一次决策，即便两次交互相隔数周。

智能体的记忆由三大支柱定义：

状态（State）：感知当前交互的即时信息。
持久性（Persistence）：跨会话、长期保留知识。
选择性（Selectivity）：判断哪些信息值得被长久记住。

这三大支柱共同构成了智能体实现**连续性（Continuity）**的基础。

上下文窗口、RAG 与记忆的差异

将记忆置于智能体的主流架构中，典型的组件包括大语言模型（LLM）、规划器（如 ReAct 框架）、工具集（APIs）和检索器。问题在于，这些组件本身都无法记住昨天发生了什么。

上下文窗口 ≠ 记忆

一种普遍的误解认为，不断增大的上下文窗口能彻底取代记忆。然而，这种方法存在明显瓶颈：

成本高昂：更多的 Tokens 意味着更高的计算成本和延迟。
信息有限：无法实现跨会话的持久化存储，一旦会话结束，所有上下文信息便会丢失。
缺乏优先级：所有信息在上下文中地位平等，无法区分关键信息和暂时性信息。

上下文窗口保证了智能体在单次会话内的连贯性，而记忆则赋予其跨会话的智能。

RAG ≠ 记忆

检索增强生成（RAG）与记忆系统同样为 LLM 提供信息，但它们解决的问题截然不同。RAG 在推理时，从外部知识库（如文档、数据库）中检索事实信息并注入提示词，以增强回答的准确性。但 RAG 本身是无状态的，它不关心用户身份，也无法关联本次查询与历史对话。

记忆则带来连续性。它记录用户的偏好、历史决策、成功与失败的经验，并在未来的交互中利用这些信息。

简而言之：RAG 帮助智能体回答得更准确，记忆帮助智能体行动得更智能。 一个成熟的智能体需要两者协同工作：RAG 为其提供外部知识，记忆则塑造其内在行为。

为了更清晰地区分这三者，可参考下表：

特性	上下文窗口 (Context Window)	检索增强生成 (RAG)	记忆 (Memory)
功能	提供短期会话内的即时上下文	从外部知识库检索事实信息	存储和调用历史交互、偏好和状态
状态	无状态（Stateless）	无状态（Stateless）	有状态（Stateful）
持久性	单次会话	外部知识库是持久的，但检索过程是瞬时的	跨会话，长期持久
应用场景	保持对话连贯	回答基于特定文档的问题	个性化、持续学习、任务自动化

AI 记忆的类型

AI 智能体的记忆可分为两种基本形式：短期记忆和长期记忆，它们分别服务于不同的认知功能。

短期记忆 (Short-Term Memory)：在单次交互中保存即时上下文，如同人类的工作记忆。
长期记忆 (Long-Term Memory)：跨会话、任务和时间保留知识，用于学习和适应。

短期记忆

短期记忆，也称为工作记忆，是 AI 系统最基础的记忆形式，用于保存即时上下文，包括：

对话历史：最近的消息及其顺序。
临时状态：执行任务过程中的临时变量。
注意力焦点：对话的当前核心。

长期记忆

更复杂的 AI 应用则需要实现长期记忆，以实现跨会话的知识保留和个性化。长期记忆主要包含以下三种类型：

1. 程序性记忆 (Procedural Memory)

这是智能体的“肌肉记忆”，即智能体知道如何做某件事。它定义了智能体可以执行的操作，直接编码在逻辑中。例如，“在回复技术问题时，应采用更详尽的解释风格”或“总是优先处理来自特定主管的邮件”。

2. 情景记忆 (Episodic Memory)

这是智能体的“交互相册”，记录了与特定用户相关的历史交互和具体事件。它是实现个性化、连续性和长期学习的关键。例如，智能体可以记住“上次客户咨询账单问题时，由于回复过慢导致了不满”，从而在未来优化响应策略。

3. 语义记忆 (Semantic Memory)

这是智能体的“事实百科”，存储了关于世界和用户的客观事实。这些知识通常通过向量搜索或 RAG 进行检索，独立于具体交互而存在。例如，“Alice 是项目A的技术负责人”或“John 的工作时区是 PST”。

AI 记忆的实现机制

记忆的写入时机

智能体何时以及如何创建新记忆？主流方法有两种：

实时同步写入：在与用户交互的过程中实时创建和更新记忆。这种方式能让新记忆立刻生效，但也可能增加主应用逻辑的延迟和复杂性。例如，ChatGPT 的记忆功能就采用了类似机制，它通过一个 save_memories 工具在对话中实时决策是否保存信息。
异步后台处理：将记忆的创建和整理作为独立的后台任务处理。这种方式将记忆管理与主应用逻辑解耦，降低了延迟，并允许更复杂的离线处理，如信息摘要和去重。

记忆的管理策略

当对话过长，短期记忆可能会超出 LLM 的上下文窗口限制。常见的管理策略包括：

修剪：移除对话历史中最开始或最后 N 条消息。
总结：将早期的对话内容进行总结，用摘要替换原文。
选择性遗忘：根据预设规则（如过滤掉不重要的系统消息）或模型的判断，永久删除部分记忆。

实现 AI 记忆的挑战

尽管记忆对智能体至关重要，但在实践中也面临诸多挑战：

记忆过载与遗忘机制：无限积累的记忆会使系统变得臃肿且低效。如何设计有效的遗忘机制，让智能体忘记过时或无关紧要的信息，是一个难题。
信息污染：错误的或恶意的输入可能被存入长期记忆，从而“污染”智能体的决策系统，导致未来行为出现偏差。
隐私与安全：长期记忆中存储了大量用户敏感信息，如偏好、历史和个人数据。如何确保这些数据的加密、访问控制和合规性，是应用落地的关键。
成本与性能：维护大规模的记忆存储、执行复杂的检索和写入操作，都会带来额外的计算和存储成本，并可能影响系统的响应速度。

使用 LangGraph 构建具备记忆的智能体

LangGraph 是一个用于构建有状态、多智能体应用的强大框架，它天然支持循环和状态管理，非常适合实现复杂的记忆系统。下面将通过代码示例，展示如何使用 LangGraph 为智能体添加短期和长期记忆。

添加短期记忆

短期记忆（线程级持久性）使智能体能够跟踪单次多轮对话。通过为 LangGraph 图配置一个检查点（Checkpointer），可以轻松实现状态的自动保存和加载。

以下示例使用内存检查点 InMemorySaver 来保存会话状态。

from langchain_community.chat_models import ChatAnthropic # 假设使用Anthropic模型
from langgraph.graph import StateGraph, MessagesState, START
from langgraph.checkpoint.memory import InMemorySaver
# 为简化，假设模型已初始化
# model = ChatAnthropic(model="claude-3-5-sonnet-20240620")
# 实际使用时请替换为真实模型
class FakeModel:
def invoke(self, messages):
from langchain_core.messages import AIMessage
last_message = messages[-1].content
if "bob" in last_message:
return AIMessage(content="Hi Bob! How can I help you today?")
elif "my name" in last_message:
return AIMessage(content="Your name is Bob.")
else:
return AIMessage(content="Hello there!")
model = FakeModel()
def call_model(state: MessagesState):
response = model.invoke(state["messages"])
return {"messages": [response]}
builder = StateGraph(MessagesState)
builder.add_node("call_model", call_model)
builder.add_edge(START, "call_model")
checkpointer = InMemorySaver()
graph = builder.compile(checkpointer=checkpointer)
# 使用唯一的 thread_id 来标识一个独立的对话线程
config = {
"configurable": {
"thread_id": "user_1_thread_1"
}
}
# 第一次交互
for chunk in graph.stream(
{"messages": [{"role": "user", "content": "Hi! I'm Bob."}]},
config,
stream_mode="values",
):
chunk["messages"][-1].pretty_print()
# 第二次交互，在同一线程中
for chunk in graph.stream(
{"messages": [{"role": "user", "content": "What's my name?"}]},
config,
stream_mode="values",
):
chunk["messages"][-1].pretty_print()

================================== Ai Message ==================================
Hi Bob! How can I help you today?
================================== Ai Message ==================================
Your name is Bob.

在生产环境中，应将 InMemorySaver 替换为持久化的数据库后端，如 PostgresSaver 或 MongoDBSaver，以确保服务重启后对话状态不丢失。

管理检查点

LangGraph 提供了管理检查点（即会话状态）的接口。

查看线程的当前状态：

# graph.get_state(config)

查看线程的所有历史状态：

# list(graph.get_state_history(config))

添加长期记忆

长期记忆（跨线程持久性）用于存储用户偏好等需要长期保留的数据。LangGraph 允许在编译图时传入一个 store 对象，用于实现这一功能。

以下示例展示了如何使用 InMemoryStore 存储用户信息，并在不同对话线程中共享。

import uuid
from typing_extensions import TypedDict
from langchain_core.runnables import RunnableConfig
from langgraph.store.base import BaseStore
from langgraph.store.memory import InMemoryStore
# ... (复用之前的模型和 State 定义) ...
def call_model_with_long_term_memory(
state: MessagesState,
config: RunnableConfig,
*,
store: BaseStore,
):
from langchain_core.messages import AIMessage, SystemMessage
user_id = config["configurable"]["user_id"]
namespace = ("memories", user_id)
# 检索长期记忆
memories = store.search(query="", namespace=namespace)
info = "\n".join([d.value["data"] for d in memories])
system_msg_content = f"You are a helpful assistant. User info: {info}"
# 写入长期记忆
last_message = state["messages"][-1]
if "remember" in last_message.content.lower():
memory_to_save = "User's name is Bob"
# 使用唯一ID存储记忆
store.put([(str(uuid.uuid4()), {"data": memory_to_save})], namespace=namespace)
# 调用模型
response = model.invoke([SystemMessage(content=system_msg_content)] + state["messages"])
return {"messages": [response]}
builder_ltm = StateGraph(MessagesState)
builder_ltm.add_node("call_model", call_model_with_long_term_memory)
builder_ltm.add_edge(START, "call_model")
checkpointer_ltm = InMemorySaver()
store = InMemoryStore()
graph_ltm = builder_ltm.compile(
checkpointer=checkpointer_ltm,
store=store,
)
# 在线程1中，用户要求记住名字
config1 = {
"configurable": {
"thread_id": "thread_1",
"user_id": "user_123",
}
}
for chunk in graph_ltm.stream(
{"messages": [{"role": "user", "content": "Hi! Please remember my name is Bob"}]},
config1,
stream_mode="values",
):
chunk["messages"][-1].pretty_print()
# 在新的线程2中，查询名字
config2 = {
"configurable": {
"thread_id": "thread_2",
"user_id": "user_123", # 相同的 user_id
}
}
for chunk in graph_ltm.stream(
{"messages": [{"role": "user", "content": "What is my name?"}]},
config2,
stream_mode="values",
):
chunk["messages"][-1].pretty_print()

================================== Ai Message ==================================
Hi Bob! How can I help you today?
================================== Ai Message ==================================
Your name is Bob.

启用语义搜索

通过为 store 配置向量嵌入模型，可以实现基于语义相似度的记忆检索，让智能体更智能地调用相关信息。

from langchain_openai import OpenAIEmbeddings
# 假设已初始化 OpenAIEmbeddings
# embeddings = OpenAIEmbeddings(model="text-embedding-3-small")
# store = InMemoryStore(
#     index={
#         "embed": embeddings,
#         "dims": 1536, # 嵌入维度
#     }
# )
# 
# store.put([
#     ("1", {"text": "I love pizza"}),
#     ("2", {"text": "I am a plumber"})
# ], namespace=("user_123", "memories"))
# 在调用时，通过 query 参数进行语义搜索
# items = store.search(
#     query="I'm hungry",
#     namespace=("user_123", "memories"),
#     limit=1
# )
# 搜索结果将是与 "I'm hungry" 最相关的 "I love pizza"。

这个功能使得智能体能够根据对话的上下文，动态地从记忆库中检索最相关的信息，而不是简单地进行关键词匹配。

案例研究：构建一个记忆增强的邮件智能体

下面将理论付诸实践，构建一个具备多类型记忆的邮件处理智能体。

7.1 定义智能体状态

首先，定义智能体需要跟踪的状态，包含短期和长期记忆。

from typing import TypedDict, Dict, Any
from langgraph.graph import MessagesState
class EmailAgentState(TypedDict, total=False):
"""邮件智能体的状态定义"""
messages: MessagesState  # 短期记忆：对话历史
user_preferences: Dict[str, Any]  # 长期语义记忆：用户偏好
email_threads: Dict[str, Any]  # 长期情景记忆：历史邮件线程
action: str # 决策动作
reply: str # 生成的回复

7.2 实现决策分类器（使用情景记忆）

创建一个分类器节点，根据邮件内容和历史交互（情景记忆）来决定下一步操作。

def classify_email(state: EmailAgentState):
# 此处应调用 LLM 进行分类
# 为简化，直接返回一个硬编码的决策
email_content = state["messages"][-1].content
if "urgent" in email_content.lower():
return {"action": "escalate"}
return {"action": "reply"}

7.3 定义工具（使用语义记忆）

定义智能体可用的工具，例如从语义记忆中获取联系人信息。

from langgraph.prebuilt import ToolNode
def get_contacts_from_memory(user_id: str):
# 模拟从用户数据库或语义记忆中获取联系人
contacts_db = {
"user_123": {
"developers": ["alice@company.com"],
"managers": ["charlie@company.com"]
}
}
return contacts_db.get(user_id, {})
def send_email(to: str, subject: str, body: str):
# 模拟发送邮件API
print(f"Email sent to {to} with subject '{subject}'")
return "Email sent successfully."
tools = [get_contacts_from_memory, send_email]
tool_node = ToolNode(tools)

7.4 构建图并连接节点

使用 LangGraph 将所有组件连接成一个可执行的工作流。

from langgraph.graph import StateGraph, START, END
builder = StateGraph(EmailAgentState)
# 1. 定义节点
builder.add_node("classify", classify_email)
builder.add_node("generate_reply", lambda state: {"reply": "Generated reply based on user tone."}) # 简化版
builder.add_node("escalate_task", lambda state: print("Task Escalated!"))
# 2. 定义边
builder.add_edge(START, "classify")
builder.add_conditional_edges(
"classify",
lambda state: state["action"],
{
"reply": "generate_reply",
"escalate": "escalate_task",
}
)
builder.add_edge("generate_reply", END)
builder.add_edge("escalate_task", END)
# 3. 编译图
email_graph = builder.compile()

这个简化的例子展示了如何结合不同类型的记忆（通过状态和工具）来驱动一个智能体的工作流程。通过扩展这个框架，可以构建出能够处理复杂任务、高度个性化且能持续学习的强大 AI 助手。

在设计自己的记忆增强型智能体时，以下问题可作为有效的思考指南：

学习内容：智能体应该学习什么类型的信息？是客观事实、历史事件摘要，还是行为规则？
记忆时机：应该在何时、由谁来触发记忆的形成？是实时交互中，还是后台批处理？
存储方案：记忆应存储在哪里？是本地数据库、向量存储，还是云服务？
安全与隐私：如何确保记忆数据的安全，防止泄露和滥用？
更新与维护：如何防止过时或错误的记忆污染智能体的决策？

未经允许不得转载：AI生产力工具 » 深度剖析AI智能体记忆：从核心概念到LangGraph实战

深度剖析AI智能体记忆：从核心概念到LangGraph实战

AI 记忆的核心概念

当前 AI 的“无状态”困境

AI 智能体中的记忆究竟是什么？

上下文窗口、RAG 与记忆的差异

上下文窗口 ≠ 记忆

RAG ≠ 记忆

AI 记忆的类型

短期记忆

长期记忆

1. 程序性记忆 (Procedural Memory)

2. 情景记忆 (Episodic Memory)

3. 语义记忆 (Semantic Memory)

AI 记忆的实现机制

记忆的写入时机

记忆的管理策略

实现 AI 记忆的挑战

使用 LangGraph 构建具备记忆的智能体

添加短期记忆

管理检查点

添加长期记忆

启用语义搜索

案例研究：构建一个记忆增强的邮件智能体

7.1 定义智能体状态

7.2 实现决策分类器（使用情景记忆）

7.3 定义工具（使用语义记忆）

7.4 构建图并连接节点

相关文章

相关推荐

找不到AI工具？在这试试！

推荐工具

最新发布

深度剖析AI智能体记忆：从核心概念到LangGraph实战

AI 记忆的核心概念

当前 AI 的“无状态”困境

AI 智能体中的记忆究竟是什么？

上下文窗口、RAG 与记忆的差异

上下文窗口 ≠ 记忆

RAG ≠ 记忆

AI 记忆的类型

短期记忆

长期记忆

1. 程序性记忆 (Procedural Memory)

2. 情景记忆 (Episodic Memory)

3. 语义记忆 (Semantic Memory)

AI 记忆的实现机制

记忆的写入时机

记忆的管理策略

实现 AI 记忆的挑战

使用 LangGraph 构建具备记忆的智能体

添加短期记忆

管理检查点

添加长期记忆

启用语义搜索

案例研究：构建一个记忆增强的邮件智能体

7.1 定义智能体状态

7.2 实现决策分类器（使用情景记忆）

7.3 定义工具（使用语义记忆）

7.4 构建图并连接节点

相关文章

相关推荐

找不到AI工具？在这试试！

推荐工具

最新发布

快速查询站内AI工具