资料库
导入文档,与记忆一起搜索
资料库是让文件变成可用知识的地方。
它适合那些应该整体保留下来的来源材料:PDF、报告、电子表格、幻灯片、Markdown 笔记和代码。Mem 会解析、索引,并让这些内容和你的记忆一起工作,而不是变成孤立的附件。
资料库和记忆怎么分工?
资料库存放你想整体保留的来源材料,记忆保存的是长期有价值的结论。一个很自然的顺序是:先导入文档,先问问题;只有当你希望其中的知识长期进入图谱和记忆系统时,再执行精读。
把一份 40 页的架构评审拖进资料库。在 Timeline 里问:"评审文档里关于 API 限流是怎么说的?" 回答会同时引用文档第 12 页的内容,以及你三个月前保存的 Redis 限流决策。文档和记忆会一起参与搜索。
资料库可以存放 PDF、电子表格、Word 文件、演示文稿、代码和其他格式。系统会解析内容、切分片段并建立索引。文档进入可搜索状态后,就会出现在你日常思考时真正用到的地方:
- AI Now:按文件名、主题或一个具体问题提问。AI Now 会检索资料库、读取匹配段落,并和你的记忆一起给出带引用的回答。
- Timeline Feed Agent:后台把对话转化为记忆的内置 Agent,现在也可以在线程提到某份文档时反向进入资料库内容。
- Graph Intelligence Agent:在探索知识图谱时,Source 节点现在可以被直接检索和读取;你可以从一组相关记忆直接深入到对应的原始文档,而不用离开画布。
- 通过 MCP 连接的 AI 工具:Claude Code、Cursor 以及任何支持 MCP 的客户端都可以调用
query_sources、read_source_content、search_source_chunks和analyze_source_data,让它们的回答真正建立在你自己的文件之上。 nmem命令行:终端与脚本工作流可以用nmem sources search、read、search-chunks和analyze检索、阅读并分析资料库。详见 CLI 参考。
把资料库当一本 wiki 来读
v0.8 起,资料库也可以像一本 wiki 一样去读。你之前积累的记忆、资料、知识结晶,现在都以主题页、实体页、结晶页的形式呈现出来,互相之间用链接连起来,可以一路点着翻。
切到资料库里的 Wiki 标签,就能看到知识按主题分簇。每张卡片下面列了这个簇里被提到最多的概念,以及总结了它们的几条结晶。点卡片打开主题页,点实体打开它的 wiki 词条,点结晶里的 [[实体]] chip 继续往下翻。
读到真正想细看的地方,就在那张 wiki 页上点 深入研究。知识图谱会自动打开,把对应的东西预选好:实体页或结晶页选中那一个节点,主题页一次性把整个聚类高亮。然后你可以接着平移、展开邻居,也可以把这个选区交给 Graph Intelligence Agent,让它把你心里的那个问题问出来。
想理解背后的模型(系统替你做的事、仍然由你做的事),见 LLM Wiki 概念页。
Wiki 导出
Wiki 标签的分页栏右上角有一个 Download 按钮,点它会把你的 wiki 打成一份纯 markdown 的文件夹(index.md、topics/、entities/、crystals/),里面那一套 [[wikilink]] 在 Obsidian、Logseq 这类阅读器里同样能跳得通。
要刷新就再导出一次。这是切片,不是双向同步:在 Mem 之外做的修改,不会自动流回来。
第一份有用的文档
如果你是新用户,先导入一份你真的在意的文档。然后在 Timeline 里针对它问一个具体问题。
最基本的一步就是:
- 先加进来一份真实来源
- 再提一个有上下文的问题
- 看答案怎样同时使用文档内容和你已有的知识
第一次验证到这里就够了。精读可以等到这个基础闭环已经有价值时再做。
支持的格式
| 格式 | 扩展名 | 处理方式 |
|---|---|---|
| 感知版面提取原生文本;扫描页可用配置好的视觉模型读取 | ||
| Word | .docx | 解析为文本并提取图片,分段,索引 |
| 演示文稿 | .pptx | 提取幻灯片内容和图片,索引 |
| 电子表格 | .xlsx, .csv | 解析为 Markdown 表格,索引。多工作表 XLSX 按标签页展示 |
| Markdown | .md | 直接解析并索引 |
| 纯文本 | .txt, .org | 直接索引 |
| 代码 | .py, .js, .ts, .rs, .go, .java, .c, .cpp, .rb, .swift | 索引 |
| URL | .html, .pdf | 转换为 Markdown,索引 |
添加文档
将文件拖入 Timeline 输入框,或在资料库视图中导入。也可以直接拖入文件夹——其中所有支持的文件都会自动导入。
文档经过以下处理流程:
- 解析: 从文件格式中提取内容
- 分段: 切分为可搜索的段落
- 索引: 加入向量索引和关键词索引
处理状态可在资料库视图中查看。索引完成后,文档进入可搜索状态,可以立刻在对话、全局搜索和已连接的 AI 工具里使用。
对于扫描版 PDF,Mem 会先完成普通导入,避免应用卡住。如果某一页没有文本层、需要视觉模型读取,Mem 会在后台读取这部分扫描文字,并补回文档内容中。如果还没有配置视觉模型,或后台智能预算达到上限,资料库会暂停处理,并在可以继续时显示继续。
可搜索 vs 精读
资料库中的每份文档处于以下两种状态之一:
| 状态 | 含义 | 如何触发 |
|---|---|---|
| 可搜索 | 内容已解析、分段、索引。在 Timeline 中提问时,AI 可以直接读取和引用该文档。 | 自动——导入文件时即发生。 |
| 已精读 | AI 完整分析文档,生成结构化记忆、图谱关联和交叉引用。文档中的知识永久加入你的记忆图谱。 | 手动——点击来源上的精读按钮。 |
在 Timeline 中直接询问某个文件时,AI 会读取这份文档当前可搜索的内容。精读则会进一步提取可长期复用的知识,并把它连接进你的记忆图谱。
精读会产生什么
当你对一个来源执行精读时,AI 会完整分析其内容。对电子表格,它会计算和理解结构化数据;对文档,它会通读文本并抽取重点。最终会生成:
- 记忆 — 每份文档 2-5+ 条原子化洞察(决策、事实、流程),每条都可独立搜索
- 图谱关联 — 与你现有相关记忆的连接,发现你可能没注意到的关系
- 知识结晶 — 当 3+ 条记忆围绕同一主题聚类时,生成可持续更新的知识结晶
- 矛盾检测 — 标记与现有知识的冲突(例如,新策略推翻了之前的决定)
精读需要一定的 AI 处理时间。完成后,结果数量会显示在流程指示器中,例如 已精读 (5)。
搜索文档
文档和记忆一起被搜索。在 Timeline 中问 "Q4 报告对用户流失怎么说的?",搜索同时覆盖你的记忆和导入的文档。
在资料库视图中,可以按状态筛选——可搜索、已精读、已过期或错误——快速找到尚未精读或需要关注的来源。
与文档对话
在 Timeline 中直接对任何文档提问。答案同时来自文档和你的记忆,引用具体页码。
"架构评审文档里关于 API 限流是怎么说的?" 会返回一个答案,其中既引用文档第 12 页,也引用你三个月前的 Redis 决策。
批量操作
在资料库视图中选择多份文档,可以:
- 发送到 AI Now 进行跨文档分析——比较报告、综合发现,或提出跨文档的问题
- 批量精读 — 选择尚未精读的来源,点击
精读 (N)批量处理。对于已经精读过的来源,按钮会显示Re-analyze (N),用于刷新提取出的知识
文档、记忆和对话
三种内容类型,各有不同的用途:
| 类型 | 是什么 | 示例 |
|---|---|---|
| 记忆 | 原子化的洞察、决策或事实 | "新服务选择 PostgreSQL,因为 jsonb 支持" |
| 文档 | 整体导入的参考材料 | 一份 40 页的架构评审 PDF |
| 对话 | AI 会话存档 | 你在 ChatGPT 上关于异步模式的讨论 |
文档和对话是来源。记忆是提炼后的知识。当你精读文档或对话时,独立的洞察被提取为记忆并连接到知识图谱。原件保留在资料库或对话视图中作为来源。