后台智能
Nowledge Mem 在你不用它的时候做了什么,以及防止它浪费资源的保护机制。
Mem 里大部分有用的工作都在后台完成。实体提取、EVOLVES 检测、矛盾标记、知识结晶合成、工作记忆更新,都不需要你动手。你存一条记忆或导入一段对话,剩下的系统来。
这个页面讲跑了什么、什么时候跑、怎么防止失控。
两类触发方式
后台任务按触发方式分为两类。
定时任务
按固定时间运行,和你今天做了什么无关。
- 每日简报,每天清晨。回顾近期活动,生成洞察,标记矛盾,为每个活跃分区写一份新的 Working Memory。Default 分区保留兼容文件
~/ai-now/memory.md。 - 结晶审查,每周一次。找出可以合成为知识结晶的相关记忆集群。
- 洞察检测,每周一次。在知识库里搜索跨领域关联和模式。
- 技能建议,默认每 3 天运行一次。寻找你反复使用、值得教给 AI 的工作方式,做成一条 Skill。
- 规则建议,默认每 3 天运行一次。寻找反复出现、可能值得智能体长期遵守的偏好和规则。建议会先保持草稿状态,等你确认。
- 记忆整理,开启后每周运行。审查冗余记忆,并合并确认重复的内容。
- 标签整合,开启后每周运行。审查重复标签,包括不同语言写法,再决定是否合并。
- 社区检测,定期运行。重建实体图谱的社区结构,供搜索使用。
- 记忆新鲜度,开启后每天运行。重新计算所有记忆的新鲜度和置信分数。
- 记忆类型维护,默认每 3 天小批量运行。把记忆归到事实、决策、流程、经验或事件里,让智能体更容易找对上下文。
事件驱动任务
这些因为你做了某件事而触发,有一个短暂的延迟。
- EVOLVES 检测:保存新记忆时触发。检查新记忆是替代、丰富、印证还是质疑了已有知识。详见知识演化。
- 实体提取:同步触发。为知识图谱提取实体和关系。
- 记忆类型维护:新记忆到达后小批量触发。它会改善记忆的组织方式,但不会改写你保存的记忆正文。
- 工作记忆刷新:新记忆到达时触发。更新当前分区的 Working Memory,让连接的智能体尽快看到新上下文。
- 集群评估:EVOLVES 边创建后触发。看新集群是否达到了结晶的形成条件。
级联
这些任务不是独立的,一个动作可以触发一整条链。
你存一条记忆 → EVOLVES 检测跑起来 → 发现和一条旧记忆的"印证"关系 → 集群评估触发 → 发现三条相关记忆构成了足够强的集群 → 知识结晶被创建。
每一步都有自己的延迟窗口,系统是攒一批再处理。连续存五条记忆,系统会放在一起分析,不会跑五遍。
四层保护
后台智能消耗 LLM token。没有限制的话,一波密集操作可能耗尽 token 预算,或者赶工太多产出低质量结果。四层机制防住这个。
防抖:事件驱动任务执行前等一段时间。等待期间又来了同类事件,计时器重置。导入一个长对话时,系统不会每条消息都分析一遍,而是合并成一次。
频率限制:每小时能跑的 LLM 任务有上限。超了就延迟,不丢弃。
Token 预算:可以设每小时和每天的 token 上限。预算花完后 LLM 任务暂停到下一个周期。不用 LLM 的任务(衰减刷新、社区检测)不受影响。
质量门控:抑制低价值输出。每日简报如果产出零洞察、零结晶、零标记,就保持沉默,不会生成一张"无事可报"的卡片。洞察检测会比对过去两周的记录避免重复。结晶至少需要三个汇聚来源。
上下文注入
每个后台任务启动前会收到预算好的上下文。每日简报拿到的是过去一周的活动摘要、昨天的工作记忆、图谱统计和最近的矛盾解决记录。省掉 LLM 自己探索的步骤,直接聚焦。
上下文有大小上限,超了就先裁低优先级的部分。
工作记忆
工作记忆是每日简报最直接的产出。每天早上归档昨天的,基于近期活动写一份新的。
Default 分区保留文件 ~/ai-now/memory.md。如果你使用 spaces,其他分区也会通过同样的 Mem 接口拥有各自的 Working Memory。Claude Code、Grok Build、Cursor、Codex 这些工具之所以知道你最近在做什么、做了什么决定,靠的就是这份简报。
白天也会更新。存了新记忆后系统会刷新它,延迟比其他事件驱动任务长一些(因为跑一次成本更高)。你也可以手动编辑。
处理设置
处理设置页里,大多数任务都有两类控制:
- 运行按钮:现在立即跑一次。
- 右侧开关:控制之后是否允许 Mem 自动运行。
从设置里启动的小型维护任务会应用安全、已审查的结果。例如,记忆类型维护只会在一个有限批次里应用高置信的类型修正。
设置左下角出现绿色点,表示现在有后台任务正在跑。进入 设置 → 处理 后,可以看到当前任务名称、开始时间和可用进度。
最近运行会显示任务结果,以及已上报或估算的 token 用量。不调用 LLM 的日常整理任务会显示 0 tokens;调用 LLM 的任务会显示近似消耗,并标出服务商没有返回精确用量的步骤。
用量统计边界
设置 → 处理 里的 AI 用量,是本机安全账本,不是所有 AI 消耗的总账单。
它会统计:
- 这台设备上由 Mem 自动运行的后台任务
- AI Now、Graph Intelligence 这类内置前台 AI 会话,前提是服务商返回了用量
- 登录 Plus 后,由订阅计划提供的托管 AI 额度
它不会统计 Mem 周围所有工具发起的 AI 调用。Browser / Exchange agent、浏览器扩展、外部 IDE agent、第三方宿主工具,可能会通过它们自己的运行环境或模型账户调用模型。这些消耗可能真实存在,但应该在那个宿主工具或模型服务商的账单里确认,不属于本机 Mem 账本。
如果你使用自己的 API key,模型服务商后台仍然是账单的准确信源。Mem 的本机数字用于限制自动任务、发现异常消耗,但不能替代服务商账单。
有些服务商不会为每次响应返回 token 用量。遇到这种情况,Mem 会把对应运行标记为“部分上报”,提醒你看到的总数可能低于真实消耗。
这些任务的风险级别不一样:
- 安全的日常整理:记忆新鲜度和记忆类型维护会改善哪些记忆更容易出现、以及它们如何归类;不会改写你保存的记忆正文。
- 先审查再维护:Memory Maintenance 会在旧记忆或重叠记忆可能造成噪音时,在 Timeline 里准备一条审查建议。新鲜度刷新本身不会归档、合并、删除或改写记忆。
- 合并类任务:记忆整理和标签整合会在审查后合并图谱记录。它们默认关闭;只有你希望 Mem 自动保持图谱整洁时再打开。
- 移出日常召回:低风险事实和事件可以在你确认后移出日常召回。偏好、决定、流程、计划、经验、规则、身份和上下文记忆不会被机械归档,只会作为语义整理的候选。
普通用户保持默认设置即可。如果你在服务器或 VPS 上运行 Mem,可以用同页的 token 限额控制后台 AI 成本。
全量维护任务,比如全量记忆类型重分类,可能消耗较多 AI 额度,也会触达很多记忆。请通过 CLI 运行,先预览结果,再确认是否应用:
nmem memories reclassify-types --target-type procedure --full-scan --wait
nmem memories reclassify-types --target-type procedure --full-scan --apply --wait任务控制
每个后台任务都有独立的开关。你可以关掉 EVOLVES 检测但保留每日简报,或者禁用洞察检测但保留实体提取。总开关可以一次性关闭全部。
Token 预算和调度参数(简报时间、社区检测间隔)也可以配置。后台智能需要配置远程 LLM,因为任务在你的机器上运行,需要一个模型来推理。