第 0 章 项目导览与学习路线


文档摘要

第 0 章 项目导览与学习路线 在写任何一行代码之前,先回答三个问题:智能体为什么需要记忆?memU 帮你解决什么?这套教程怎么读? 0.1 智能体记忆与 memU 是什么 大模型本身是无状态的:每次对话从零开始,无法记住用户偏好、项目背景或上次犯过的错。工业级智能体需要一套持久、可检索、可审计的记忆层。 memU 是 NevaMind-AI 开源的 AI 智能体工作区运行时(Workspace Runtime)。

第 0 章 项目导览与学习路线

在写任何一行代码之前,先回答三个问题:智能体为什么需要记忆?memU 帮你解决什么?这套教程怎么读?

0.1 智能体记忆与 memU 是什么

大模型本身是无状态的:每次对话从零开始,无法记住用户偏好、项目背景或上次犯过的错。工业级智能体需要一套持久、可检索、可审计的记忆层。

memU 是 NevaMind-AI 开源的 AI 智能体工作区运行时(Workspace Runtime)。它把聊天日志、文档、图片、音视频、工具轨迹等原始来源,编译成三层可浏览的结构化记忆:

类比 作用
Index(索引) 目录地图 告诉智能体「该去哪里找」
Skill(技能) 操作手册 记录什么有效、什么该避免
Memory(记忆) 活档案 用户画像、偏好、目标、关键事件

核心运行时只有两个操作:

WRITE — memorize() READ — retrieve() 原始来源 → 提取 → 结构化记忆 查询 → 分层导航 → 排序后的上下文

与传统「整段对话 embedding 进向量库」不同,memU 会:

  1. 把原始输入存为 Resource(带来源追溯)
  2. 用 LLM 提取带类型的 MemoryItem(profile / event / knowledge / behavior / skill / tool)
  3. 自动归入 MemoryCategory 主题文件夹,并维护摘要与向量索引
  4. 检索时按 Category → Item → Resource 分层召回,支持 RAG 与 LLM 两种策略

在 Locomo 基准上,memU 报告 92.09% 平均准确率,显著优于纯 embedding 检索方案。

0.2 技术栈一览

类别 选型 作用
核心库 memu-py(Python ≥ 3.13) 记忆摄入、提取、检索
LLM OpenAI 兼容 API(可换通义、OpenRouter 等) 提取、摘要、排序、视觉描述
Embedding 独立 Profile 配置 RAG 模式向量召回
存储 inmemory / SQLite / PostgreSQL+pgvector 元数据与向量持久化
生态 memU-server、memU-ui、memU Cloud 托管 API、可视化、企业部署

0.3 你能学到什么

能力 对应章节
理解智能体记忆 vs 传统 RAG 的差异 第 2 章
掌握 Resource / Item / Category 数据模型 第 3 章
正确初始化 MemoryService 与作用域 第 4 章
跑通 memorize() 完整写入流水线 第 5 章
选择并调优 retrieve() 的 RAG / LLM 模式 第 6 章
摄入对话、文档、图片、音视频 第 7 章
配置 Postgres 持久化与多 LLM Provider 第 8 章
接入 LangGraph 工具链或云端 API 第 9 章
导出 Markdown 记忆树、性能与工程实践 第 10 章

0.4 memU 能力模块划分

┌─────────────────────────────────────────────────────────────┐ │ memU 能力全景 │ ├──────────────┬──────────────┬──────────────┬────────────────┤ │ 多模态摄入 │ 类型化提取 │ 自组织分类 │ 分层检索 │ │ 对话/文档/ │ profile/ │ Category + │ RAG / LLM │ │ 图/视/音 │ event/skill │ 向量+摘要 │ 早停+重写 │ ├──────────────┴──────────────┴──────────────┴────────────────┤ │ 可插拔存储(内存 / SQLite / Postgres) │ ├──────────────────────────────────────────────────────────────┤ │ 智能体集成(LangGraph / OpenAI 包装 / Cloud API) │ └─────────────────────────────────────────────────────────────┘

各模块在后续章节逐块展开;第 2 章先建立概念底座。

0.5 推荐学习路线

路线 A:快速上手(约 2 小时)

第 0 章 → 第 1 章(跑通)→ 第 5 章(memorize)→ 第 6 章(retrieve)→ 第 9 章(集成)

适合:已有智能体项目,只想快速加记忆层。

路线 B:系统学习(约 1 天)

按 00 → 01 → … → 10 顺序阅读,每章动手实验。

适合:从零设计带记忆的 AI 产品。

路线 C:架构深入(约 2 天)

在路线 B 基础上,重点读第 3、5、6、8、10 章,并对照官方架构文档理解 Workflow 流水线。

适合:需要自托管、定制 Pipeline 或二次开发的工程师。

0.6 与同类方案对比(心智锚点)

维度 传统 RAG mem0 等记忆框架 memU
记忆形态 向量片段 结构化条目 三层树 + 可导出 Markdown
组织方式 人工切 chunk 半自动 全自动 Category + 摘要
检索 纯 embedding embedding 为主 embedding + LLM 读文件
多模态 部分支持 对话/文档/图/视/音
可追溯 中等 Resource 级溯源
可审计 中等 结构化记录,可 CRUD

memU 不是要「取代 RAG」,而是在 RAG 之上增加语义更稳定的 Category 层LLM 直接阅读记忆文件的能力,解决长程一致性、可解释性等问题。

0.7 本章小结

  • memU = 智能体工作区运行时,核心 API 是 memorize()retrieve()
  • 记忆分三层:Resource(来源)→ MemoryItem(原子事实)→ MemoryCategory(主题摘要)。
  • 先建立心智模型再调 API;第 1 章带你在 5 分钟内跑通第一条记忆。

动手实验

  1. 浏览 memU 官方 GitHub 仓库 README,对照本章架构图理解 WRITE / READ 流程。
  2. 思考:你的智能体目前「记住」了什么?缺的是用户偏好、项目上下文,还是工具使用经验?对应 memU 的哪种 memory_type

下一章:第 1 章 — 环境准备与首次跑通。


发布者: 作者: 转发
评论区 (0)
U