资料库
导入文档,与记忆一起搜索
资料库是让文件变成可用知识的地方。
它适合那些应该整体保留下来的来源材料:PDF、报告、电子表格、幻灯片、Markdown 笔记和代码。Mem 会解析、索引,并让这些内容和你的记忆一起工作,而不是变成孤立的附件。
资料库和记忆怎么分工?
资料库存放你想整体保留的来源材料,记忆保存的是长期有价值的结论。一个很自然的顺序是:先导入文档,先问问题;只有当你希望其中的知识长期进入图谱和记忆系统时,再执行精读。
把一份 40 页的架构评审拖进资料库。在 Timeline 里问:"评审文档里关于 API 限流是怎么说的?" 回答会同时引用文档第 12 页的内容,以及你三个月前保存的 Redis 限流决策。文档和记忆会一起参与搜索。
资料库可以存放 PDF、电子表格、Word 文件、演示文稿、代码和其他格式。系统会解析内容、切分片段并建立索引。导入后的文档可以在 Timeline、全局搜索和已连接的 AI 工具里直接检索。
第一份有用的文档
如果你是新用户,先导入一份你真的在意的文档。然后在 Timeline 里针对它问一个具体问题。
最基本的一步就是:
- 先加进来一份真实来源
- 再提一个有上下文的问题
- 看答案怎样同时使用文档内容和你已有的知识
第一次验证到这里就够了。精读可以等到这个基础闭环已经有价值时再做。
支持的格式
| 格式 | 扩展名 | 处理方式 |
|---|---|---|
| 感知版面提取文本,分段,索引 | ||
| Word | .docx | 解析为文本并提取图片,分段,索引 |
| 演示文稿 | .pptx | 提取幻灯片内容和图片,索引 |
| 电子表格 | .xlsx, .csv | 解析为 Markdown 表格,索引。多工作表 XLSX 按标签页展示 |
| Markdown | .md | 直接解析并索引 |
| 纯文本 | .txt, .org | 直接索引 |
| 代码 | .py, .js, .ts, .rs, .go, .java, .c, .cpp, .rb, .swift | 索引 |
| URL | .html, .pdf | 转换为 Markdown,索引 |
添加文档
将文件拖入 Timeline 输入框,或在资料库视图中导入。也可以直接拖入文件夹——其中所有支持的文件都会自动导入。
文档经过以下处理流程:
- 解析: 从文件格式中提取内容
- 分段: 切分为可搜索的段落
- 索引: 加入向量索引和关键词索引
处理状态可在资料库视图中查看。索引完成后,文档进入可搜索状态,可以立刻在对话、全局搜索和已连接的 AI 工具里使用。
可搜索 vs 精读
资料库中的每份文档处于以下两种状态之一:
| 状态 | 含义 | 如何触发 |
|---|---|---|
| 可搜索 | 内容已解析、分段、索引。在 Timeline 中提问时,AI 可以直接读取和引用该文档。 | 自动——导入文件时即发生。 |
| 已精读 | AI 完整分析文档,生成结构化记忆、图谱关联和交叉引用。文档中的知识永久加入你的记忆图谱。 | 手动——点击来源上的精读按钮。 |
在 Timeline 中直接询问某个文件时,AI 会读取这份文档当前可搜索的内容。精读则会进一步提取可长期复用的知识,并把它连接进你的记忆图谱。
精读会产生什么
当你对一个来源执行精读时,AI 会完整分析其内容。对电子表格,它会计算和理解结构化数据;对文档,它会通读文本并抽取重点。最终会生成:
- 记忆 — 每份文档 2-5+ 条原子化洞察(决策、事实、流程),每条都可独立搜索
- 图谱关联 — 与你现有相关记忆的连接,发现你可能没注意到的关系
- 知识结晶 — 当 3+ 条记忆围绕同一主题聚类时,生成可持续更新的知识结晶
- 矛盾检测 — 标记与现有知识的冲突(例如,新策略推翻了之前的决定)
精读需要一定的 AI 处理时间。完成后,结果数量会显示在流程指示器中,例如 已精读 (5)。
搜索文档
文档和记忆一起被搜索。在 Timeline 中问 "Q4 报告对用户流失怎么说的?",搜索同时覆盖你的记忆和导入的文档。
在资料库视图中,可以按状态筛选——可搜索、已精读、已过期或错误——快速找到尚未精读或需要关注的来源。
与文档对话
在 Timeline 中直接对任何文档提问。答案同时来自文档和你的记忆,引用具体页码。
"架构评审文档里关于 API 限流是怎么说的?" 会返回一个答案,其中既引用文档第 12 页,也引用你三个月前的 Redis 决策。
批量操作
在资料库视图中选择多份文档,可以:
- 发送到 AI Now 进行跨文档分析——比较报告、综合发现,或提出跨文档的问题
- 批量精读 — 选择尚未精读的来源,点击
精读 (N)批量处理。对于已经精读过的来源,按钮会显示Re-analyze (N),用于刷新提取出的知识
文档、记忆和对话
三种内容类型,各有不同的用途:
| 类型 | 是什么 | 示例 |
|---|---|---|
| 记忆 | 原子化的洞察、决策或事实 | "新服务选择 PostgreSQL,因为 jsonb 支持" |
| 文档 | 整体导入的参考材料 | 一份 40 页的架构评审 PDF |
| 对话 | AI 会话存档 | 你在 ChatGPT 上关于异步模式的讨论 |
文档和对话是来源。记忆是提炼后的知识。当你精读文档或对话时,独立的洞察被提取为记忆并连接到知识图谱。原件保留在资料库或对话视图中作为来源。