资料库是让文件变成可用知识的地方。

它适合那些应该整体保留下来的来源材料：PDF、报告、电子表格、幻灯片、Markdown 笔记和代码。Mem 会解析、索引，并让这些内容和你的记忆一起工作，而不是变成孤立的附件。

资料库和记忆怎么分工？

资料库存放你想整体保留的来源材料，记忆保存的是长期有价值的结论。一个很自然的顺序是：先导入文档，先提问；只有当你希望其中的知识长期进入记忆图谱时，再提取记忆。

0:00

--:--

把一份 40 页的架构评审拖进资料库。在 Timeline 里问："评审文档里关于 API 限流是怎么说的？" 回答会同时引用文档第 12 页的内容，以及你三个月前保存的 Redis 限流决策。文档和记忆会一起参与搜索。

资料库可以存放 PDF、电子表格、Word 文件、演示文稿、代码和其他格式。系统会解析内容、切分片段并建立索引。文档进入可搜索状态后，就会出现在你日常思考时真正用到的地方：

AI Now：按文件名、主题或一个具体问题提问。AI Now 会检索资料库、读取匹配段落，并和你的记忆一起给出带引用的回答。
Timeline Feed Agent：后台把对话转化为记忆的内置 Agent，现在也可以在线程提到某份文档时反向进入资料库内容。
Graph Intelligence Agent：在探索知识图谱时，Source 节点现在可以被直接检索和读取；你可以从一组相关记忆直接深入到对应的原始文档，而不用离开画布。
通过 MCP 连接的 AI 工具：Claude Code、Cursor 以及任何支持 MCP 的客户端都可以调用 query_sources、read_source_content、search_source_chunks 和 analyze_source_data，让它们的回答真正建立在你自己的文件之上。
nmem 命令行：终端与脚本工作流可以用 nmem sources search、read、search-chunks 和 analyze 检索、阅读并分析资料库。详见 CLI 参考。

把资料库当一本 wiki 来读

v0.8 起，资料库也可以像一本 wiki 一样去读。你之前积累的记忆、资料、知识结晶，现在都以主题页、实体页、结晶页的形式呈现出来，互相之间用链接连起来，可以一路点着翻。

0:00

--:--

切到资料库里的 Wiki 标签，就能看到知识按主题分簇。每张卡片下面列了这个簇里被提到最多的概念，以及总结了它们的几条结晶。点卡片打开主题页，点实体打开它的 wiki 词条，点结晶里的 [[实体]] chip 继续往下翻。

读到真正想细看的地方，就在那张 wiki 页上点 深入研究。知识图谱会自动打开，把对应的东西预选好：实体页或结晶页选中那一个节点，主题页一次性把整个聚类高亮。然后你可以接着平移、展开邻居，也可以把这个选区交给 Graph Intelligence Agent，让它把你心里的那个问题问出来。

想理解背后的模型（系统替你做的事、仍然由你做的事），见 LLM Wiki 概念页。

Wiki 导出

Wiki 标签的分页栏右上角有一个 Download 按钮，点它会让你选一种格式：

两种导出的都是你的整张知识图谱：话题、实体、结晶，你按类型分好的记忆（memories/decision/、memories/procedure/ 等等）、智能体生成的报告和博客草稿、你激活的技能，还有一份标签清单。区别只在风味：

Markdown wiki 是 Obsidian 风格那一版，用你在 Mem 里看到的同一套 [[wikilink]] 连起来，丢进 Obsidian、Logseq 或随便哪个 markdown 阅读器都能读。
OKF 知识包是不绑厂商那一版，按 Open Knowledge Format 这份开放规范来组织：链接走标准 markdown 路径而不是 wikilink，前言按规范写，整个知识包能过 OKF 参考工具的校验。想留一份可互通的副本，或者把知识交给另一个会读 OKF 的工具，就选它。

两种都是纯 markdown，哪个阅读器都打得开，区别只在链接写法和前言。想刷新就再导出一次。这是某一刻的快照，不是双向同步：在 Mem 之外做的修改，不会自动流回来。

想多了解 OKF 这个格式、以及导出是怎么对应到它的，见 Open Knowledge Format（OKF）。

第一份有用的文档

如果你是新用户，先导入一份你真的在意的文档。然后在 Timeline 里针对它问一个具体问题。

最基本的一步就是：

先加进来一份真实来源
再提一个有上下文的问题
看答案怎样同时使用文档内容和你已有的知识

第一次验证到这里就够了。提取记忆可以等到这套用法对你确实有用时再做。

支持的格式

格式	扩展名	处理方式
PDF	.pdf	感知版面提取原生文本；扫描页可用配置好的视觉模型读取
Word	.docx	解析为文本并提取图片，分段，索引
演示文稿	.pptx	提取幻灯片内容和图片，索引
电子表格	.xlsx, .csv	解析为 Markdown 表格，索引。多工作表 XLSX 按标签页展示
Markdown	.md	直接解析并索引
纯文本	.txt, .org	直接索引
代码	.py, .js, .ts, .rs, .go, .java, .c, .cpp, .rb, .swift	索引
URL	.html, .pdf	转换为 Markdown，索引

添加文档

将文件拖入 Timeline 输入框，或在资料库视图中导入。也可以直接拖入文件夹，其中所有支持的文件都会自动导入。

文档经过以下处理流程：

解析: 从文件格式中提取内容
分段: 切分为可搜索的段落
索引: 加入向量索引和关键词索引

处理状态可在资料库视图中查看。索引完成后，文档进入可搜索状态，可以立刻在对话、全局搜索和已连接的 AI 工具里使用。

添加网页

把公开网页链接贴到 Timeline 或资料库里，Mem 会先在本地尝试读取。很多文章、文档页、PDF 和博客，不需要浏览器也能直接变成可搜索内容。

有些现代网页会拦截普通抓取，或者只返回一个空的前端壳。如果你打开设置 → 后台处理 → 公共网页兜底解析，Mem 可以在这种情况下使用 Firecrawl 获取干净的公开内容。这个能力默认关闭，只用于安全的公开 URL。Mem 不会把 Cookie、浏览器登录态或需要登录才能看的页面发给 Firecrawl。

如果是受支持的网页 AI 聊天，请使用浏览器扩展保存对话。如果页面需要真正的浏览器控制，比如公司后台、私有文档、付费内容、Dashboard，或者任何"只有你登录后才能看到"的页面，请在 Chrome、Edge、Arc 或其他 Chromium 浏览器中使用 Browse Now。

对于扫描版 PDF，Mem 会先完成普通导入，避免应用卡住。如果某一页没有文本层，Mem 可以用当前实际生效的视觉模型在后台读取扫描文字，并补回文档内容中。

视觉默认继承默认服务商；如果你想单独指定，请打开设置 → 服务商 → 视觉。请确认实际生效的视觉模型支持图片输入。如果不支持，或后台智能预算达到上限，资料库会暂停处理，并告诉你下一步该做什么。设置好模型后，回到这份资料并点击继续。

可搜索、和 AI 一起精读、提取记忆

资料库里有三件不同的事：

模式	含义	如何触发
可搜索	内容已解析、分段、索引。在 Timeline 中提问时，AI 可以直接读取和引用该文档。一份文档可以只保持可搜索，不是在等待提取。	自动：导入文件时即发生。
和 AI 一起精读	一次带引导的阅读。AI 读取这份来源，和已有记忆对照，提出哪些内容值得保存。除非你主动保存，否则不会写入记忆或结晶。	手动：点击来源上的和 AI 一起精读。
已提取记忆	完整提取流程会创建结构化记忆、图谱关联和交叉引用。文档里值得长期保留的内容会进入你的记忆图谱。	手动：点击来源上的提取记忆。

在 Timeline 中直接询问某个文件时，AI 会读取这份文档当前可搜索的内容。和 AI 一起精读，是帮你判断哪些内容值得留下。提取记忆，才会把这些内容写成长期记忆并接入图谱。

提取记忆会产生什么

当你对一个来源执行提取记忆时，AI 会完整分析其内容。对电子表格，它会计算和理解结构化数据；对文档，它会通读文本并抽取重点。最终会生成：

记忆：每份文档 2-5+ 条原子化洞察（决策、事实、流程），每条都可独立搜索
图谱关联：与你现有相关记忆的连接，帮你发现可能没注意到的关系
知识结晶：当 3+ 条记忆围绕同一主题聚类时，生成可持续更新的知识结晶
矛盾检测：标记与现有知识的冲突（例如，新策略推翻了之前的决定）

提取记忆需要一定的 AI 处理时间。完成后，结果数量会显示在流程指示器中，例如 记忆 (5)。

搜索文档

文档和记忆一起被搜索。在 Timeline 中问 "Q4 报告对用户流失怎么说的？"，搜索同时覆盖你的记忆和导入的文档。

在资料库视图中，可以按状态筛选：可搜索、已有记忆、已过期或错误。只有当你想把文档里的内容长期保存为记忆时，才需要提取；只保持可搜索本身就是正常状态。

如果你有很多客户、项目或不同用途的资料，可以在导入时加标签或来源 metadata。之后 API、MCP 和 CLI 搜索会先缩小资料库范围，再排序结果。例如：

nmem sources search "renewal terms" --label customer-acme --metadata purpose=contract-review
nmem sources list --metadata material_type=case-study

标签适合人能直接理解的大类。metadata 适合脚本和集成已经知道的字段，比如 customer、project、material_type 或 purpose。

与文档对话

在 Timeline 中直接对任何文档提问。答案同时来自文档和你的记忆，引用具体页码。

"架构评审文档里关于 API 限流是怎么说的？" 会返回一个答案，其中既引用文档第 12 页，也引用你三个月前的 Redis 决策。

批量操作

在资料库视图中选择多份文档，可以：

发送到 AI Now 进行跨文档分析：比较报告、综合发现，或提出跨文档的问题
提取记忆：选择还没有记忆的来源，点击 提取记忆 (N) 批量处理。对于已经提取过记忆的来源，按钮会显示 Re-analyze (N)，用于刷新提取出的知识

文档、记忆和对话

三种内容类型，各有不同的用途：

类型	是什么	示例
记忆	原子化的洞察、决策或事实	"新服务选择 PostgreSQL，因为 jsonb 支持"
文档	整体导入的参考材料	一份 40 页的架构评审 PDF
对话	AI 会话存档	你在 ChatGPT 上关于异步模式的讨论

文档和对话是来源。记忆是提炼后的知识。当你从文档或对话中提取记忆时，独立的洞察会被保存为记忆并连接到知识图谱。原件保留在资料库或对话视图中作为来源。

下一步

快速入门: Timeline 和所有添加知识的方式
后台智能: 导入的知识如何连接到你的图谱
搜索与相关性: 搜索如何在记忆和文档间排序结果

资料库是让文件变成可用知识的地方。

资料库和记忆怎么分工？

0:00

--:--

AI Now：按文件名、主题或一个具体问题提问。AI Now 会检索资料库、读取匹配段落，并和你的记忆一起给出带引用的回答。
Timeline Feed Agent：后台把对话转化为记忆的内置 Agent，现在也可以在线程提到某份文档时反向进入资料库内容。
Graph Intelligence Agent：在探索知识图谱时，Source 节点现在可以被直接检索和读取；你可以从一组相关记忆直接深入到对应的原始文档，而不用离开画布。
通过 MCP 连接的 AI 工具：Claude Code、Cursor 以及任何支持 MCP 的客户端都可以调用 query_sources、read_source_content、search_source_chunks 和 analyze_source_data，让它们的回答真正建立在你自己的文件之上。
nmem 命令行：终端与脚本工作流可以用 nmem sources search、read、search-chunks 和 analyze 检索、阅读并分析资料库。详见 CLI 参考。

把资料库当一本 wiki 来读

0:00

--:--

想理解背后的模型（系统替你做的事、仍然由你做的事），见 LLM Wiki 概念页。

Wiki 导出

Wiki 标签的分页栏右上角有一个 Download 按钮，点它会让你选一种格式：

Markdown wiki 是 Obsidian 风格那一版，用你在 Mem 里看到的同一套 [[wikilink]] 连起来，丢进 Obsidian、Logseq 或随便哪个 markdown 阅读器都能读。
OKF 知识包是不绑厂商那一版，按 Open Knowledge Format 这份开放规范来组织：链接走标准 markdown 路径而不是 wikilink，前言按规范写，整个知识包能过 OKF 参考工具的校验。想留一份可互通的副本，或者把知识交给另一个会读 OKF 的工具，就选它。

想多了解 OKF 这个格式、以及导出是怎么对应到它的，见 Open Knowledge Format（OKF）。

第一份有用的文档

如果你是新用户，先导入一份你真的在意的文档。然后在 Timeline 里针对它问一个具体问题。

最基本的一步就是：

先加进来一份真实来源
再提一个有上下文的问题
看答案怎样同时使用文档内容和你已有的知识

第一次验证到这里就够了。提取记忆可以等到这套用法对你确实有用时再做。

支持的格式

格式	扩展名	处理方式
PDF	.pdf	感知版面提取原生文本；扫描页可用配置好的视觉模型读取
Word	.docx	解析为文本并提取图片，分段，索引
演示文稿	.pptx	提取幻灯片内容和图片，索引
电子表格	.xlsx, .csv	解析为 Markdown 表格，索引。多工作表 XLSX 按标签页展示
Markdown	.md	直接解析并索引
纯文本	.txt, .org	直接索引
代码	.py, .js, .ts, .rs, .go, .java, .c, .cpp, .rb, .swift	索引
URL	.html, .pdf	转换为 Markdown，索引

添加文档

将文件拖入 Timeline 输入框，或在资料库视图中导入。也可以直接拖入文件夹，其中所有支持的文件都会自动导入。

文档经过以下处理流程：

解析: 从文件格式中提取内容
分段: 切分为可搜索的段落
索引: 加入向量索引和关键词索引

处理状态可在资料库视图中查看。索引完成后，文档进入可搜索状态，可以立刻在对话、全局搜索和已连接的 AI 工具里使用。

添加网页

把公开网页链接贴到 Timeline 或资料库里，Mem 会先在本地尝试读取。很多文章、文档页、PDF 和博客，不需要浏览器也能直接变成可搜索内容。

可搜索、和 AI 一起精读、提取记忆

资料库里有三件不同的事：

模式	含义	如何触发
可搜索	内容已解析、分段、索引。在 Timeline 中提问时，AI 可以直接读取和引用该文档。一份文档可以只保持可搜索，不是在等待提取。	自动：导入文件时即发生。
和 AI 一起精读	一次带引导的阅读。AI 读取这份来源，和已有记忆对照，提出哪些内容值得保存。除非你主动保存，否则不会写入记忆或结晶。	手动：点击来源上的和 AI 一起精读。
已提取记忆	完整提取流程会创建结构化记忆、图谱关联和交叉引用。文档里值得长期保留的内容会进入你的记忆图谱。	手动：点击来源上的提取记忆。

提取记忆会产生什么

当你对一个来源执行提取记忆时，AI 会完整分析其内容。对电子表格，它会计算和理解结构化数据；对文档，它会通读文本并抽取重点。最终会生成：

记忆：每份文档 2-5+ 条原子化洞察（决策、事实、流程），每条都可独立搜索
图谱关联：与你现有相关记忆的连接，帮你发现可能没注意到的关系
知识结晶：当 3+ 条记忆围绕同一主题聚类时，生成可持续更新的知识结晶
矛盾检测：标记与现有知识的冲突（例如，新策略推翻了之前的决定）

提取记忆需要一定的 AI 处理时间。完成后，结果数量会显示在流程指示器中，例如 记忆 (5)。

搜索文档

文档和记忆一起被搜索。在 Timeline 中问 "Q4 报告对用户流失怎么说的？"，搜索同时覆盖你的记忆和导入的文档。

如果你有很多客户、项目或不同用途的资料，可以在导入时加标签或来源 metadata。之后 API、MCP 和 CLI 搜索会先缩小资料库范围，再排序结果。例如：

nmem sources search "renewal terms" --label customer-acme --metadata purpose=contract-review
nmem sources list --metadata material_type=case-study

标签适合人能直接理解的大类。metadata 适合脚本和集成已经知道的字段，比如 customer、project、material_type 或 purpose。

与文档对话

在 Timeline 中直接对任何文档提问。答案同时来自文档和你的记忆，引用具体页码。

"架构评审文档里关于 API 限流是怎么说的？" 会返回一个答案，其中既引用文档第 12 页，也引用你三个月前的 Redis 决策。

批量操作

在资料库视图中选择多份文档，可以：

发送到 AI Now 进行跨文档分析：比较报告、综合发现，或提出跨文档的问题
提取记忆：选择还没有记忆的来源，点击 提取记忆 (N) 批量处理。对于已经提取过记忆的来源，按钮会显示 Re-analyze (N)，用于刷新提取出的知识

文档、记忆和对话

三种内容类型，各有不同的用途：

类型	是什么	示例
记忆	原子化的洞察、决策或事实	"新服务选择 PostgreSQL，因为 jsonb 支持"
文档	整体导入的参考材料	一份 40 页的架构评审 PDF
对话	AI 会话存档	你在 ChatGPT 上关于异步模式的讨论

下一步

快速入门: Timeline 和所有添加知识的方式
后台智能: 导入的知识如何连接到你的图谱
搜索与相关性: 搜索如何在记忆和文档间排序结果

资料库

把资料库当一本 wiki 来读

Wiki 导出

第一份有用的文档

支持的格式

添加文档

添加网页

可搜索、和 AI 一起精读、提取记忆

提取记忆会产生什么

搜索文档

与文档对话

批量操作

文档、记忆和对话

下一步

On this page

资料库

把资料库当一本 wiki 来读

Wiki 导出

第一份有用的文档

支持的格式

添加文档

添加网页

可搜索、和 AI 一起精读、提取记忆

提取记忆会产生什么

搜索文档

与文档对话

批量操作

文档、记忆和对话

下一步

On this page