第 0 章 项目导览与学习路线 在写任何一行代码之前,先回答三个问题:智能体为什么需要记忆?memU 帮你解决什么?这套教程怎么读? 0.1 智能体记忆与 memU 是什么 大模型本身是无状态的:每次对话从零开始,无法记住用户偏好、项目背景或上次犯过的错。工业级智能体需要一套持久、可检索、可审计的记忆层。 memU 是 NevaMind-AI 开源的 AI 智能体工作区运行时(Workspace Runtime)。
在写任何一行代码之前,先回答三个问题:智能体为什么需要记忆?memU 帮你解决什么?这套教程怎么读?
大模型本身是无状态的:每次对话从零开始,无法记住用户偏好、项目背景或上次犯过的错。工业级智能体需要一套持久、可检索、可审计的记忆层。
memU 是 NevaMind-AI 开源的 AI 智能体工作区运行时(Workspace Runtime)。它把聊天日志、文档、图片、音视频、工具轨迹等原始来源,编译成三层可浏览的结构化记忆:
| 层 | 类比 | 作用 |
|---|---|---|
| Index(索引) | 目录地图 | 告诉智能体「该去哪里找」 |
| Skill(技能) | 操作手册 | 记录什么有效、什么该避免 |
| Memory(记忆) | 活档案 | 用户画像、偏好、目标、关键事件 |
核心运行时只有两个操作:
WRITE — memorize() READ — retrieve() 原始来源 → 提取 → 结构化记忆 查询 → 分层导航 → 排序后的上下文
与传统「整段对话 embedding 进向量库」不同,memU 会:
在 Locomo 基准上,memU 报告 92.09% 平均准确率,显著优于纯 embedding 检索方案。
| 类别 | 选型 | 作用 |
|---|---|---|
| 核心库 | memu-py(Python ≥ 3.13) | 记忆摄入、提取、检索 |
| LLM | OpenAI 兼容 API(可换通义、OpenRouter 等) | 提取、摘要、排序、视觉描述 |
| Embedding | 独立 Profile 配置 | RAG 模式向量召回 |
| 存储 | inmemory / SQLite / PostgreSQL+pgvector | 元数据与向量持久化 |
| 生态 | memU-server、memU-ui、memU Cloud | 托管 API、可视化、企业部署 |
| 能力 | 对应章节 |
|---|---|
| 理解智能体记忆 vs 传统 RAG 的差异 | 第 2 章 |
| 掌握 Resource / Item / Category 数据模型 | 第 3 章 |
正确初始化 MemoryService 与作用域 |
第 4 章 |
跑通 memorize() 完整写入流水线 |
第 5 章 |
选择并调优 retrieve() 的 RAG / LLM 模式 |
第 6 章 |
| 摄入对话、文档、图片、音视频 | 第 7 章 |
| 配置 Postgres 持久化与多 LLM Provider | 第 8 章 |
| 接入 LangGraph 工具链或云端 API | 第 9 章 |
| 导出 Markdown 记忆树、性能与工程实践 | 第 10 章 |
┌─────────────────────────────────────────────────────────────┐ │ memU 能力全景 │ ├──────────────┬──────────────┬──────────────┬────────────────┤ │ 多模态摄入 │ 类型化提取 │ 自组织分类 │ 分层检索 │ │ 对话/文档/ │ profile/ │ Category + │ RAG / LLM │ │ 图/视/音 │ event/skill │ 向量+摘要 │ 早停+重写 │ ├──────────────┴──────────────┴──────────────┴────────────────┤ │ 可插拔存储(内存 / SQLite / Postgres) │ ├──────────────────────────────────────────────────────────────┤ │ 智能体集成(LangGraph / OpenAI 包装 / Cloud API) │ └─────────────────────────────────────────────────────────────┘
各模块在后续章节逐块展开;第 2 章先建立概念底座。
第 0 章 → 第 1 章(跑通)→ 第 5 章(memorize)→ 第 6 章(retrieve)→ 第 9 章(集成)
适合:已有智能体项目,只想快速加记忆层。
按 00 → 01 → … → 10 顺序阅读,每章动手实验。
适合:从零设计带记忆的 AI 产品。
在路线 B 基础上,重点读第 3、5、6、8、10 章,并对照官方架构文档理解 Workflow 流水线。
适合:需要自托管、定制 Pipeline 或二次开发的工程师。
| 维度 | 传统 RAG | mem0 等记忆框架 | memU |
|---|---|---|---|
| 记忆形态 | 向量片段 | 结构化条目 | 三层树 + 可导出 Markdown |
| 组织方式 | 人工切 chunk | 半自动 | 全自动 Category + 摘要 |
| 检索 | 纯 embedding | embedding 为主 | embedding + LLM 读文件 |
| 多模态 | 弱 | 部分支持 | 对话/文档/图/视/音 |
| 可追溯 | 弱 | 中等 | Resource 级溯源 |
| 可审计 | 难 | 中等 | 结构化记录,可 CRUD |
memU 不是要「取代 RAG」,而是在 RAG 之上增加语义更稳定的 Category 层和 LLM 直接阅读记忆文件的能力,解决长程一致性、可解释性等问题。
memorize() 与 retrieve()。memory_type?下一章:第 1 章 — 环境准备与首次跑通。