记忆衰减
Nowledge Mem 如何决定优先展示什么,同时不让任何东西真正消失。
你记得昨天的会议比上个月的更清楚。你每天都用的事实比只看过一次的更容易回想起来。人类记忆之所以这样运作,是因为不得不如此。无限回忆但没有优先级,和忘掉一切一样没用。
Nowledge Mem 应用了类似的思路。每条记忆都有两个独立的分数,影响它在搜索结果中的位置。一个随时间衰减,另一个只增不减。
两个分数,两个职责
衰减分数反映新鲜度。今天存的记忆比半年前存的分数更高(其他条件相同)。分数按指数曲线随时间下降,但你经常访问的记忆因为频率加成会保持较高分数。
置信分数反映支撑程度。从一个基线开始,随证据积累而增长,永远不会下降。被多次访问、通过 EVOLVES 链关联、或者被用作知识结晶来源的记忆,置信度比孤立的、没碰过的记忆高。
两个分数互相独立。一条记忆可以很旧(低衰减)但有充分支撑(高置信),或者很新(高衰减)但未经验证(低置信)。两个信号都会和语义相关性一起,参与最终的搜索排序。
各个信号的来源
衰减分数
两个分量混合而成:
- 时近性:从上次交互到现在的指数衰减。越近分数越高。半衰期按周算,不是按小时,所以记忆不会一夜消失。
- 频率:访问次数的对数函数。经常用的记忆保持新鲜,哪怕最近几天没碰。
时近性的权重高于频率。一条去年大量使用但此后没碰过的记忆仍然会衰减,只是比从未访问过的慢一些。
置信分数
六种信号,每种都有上限以防单一信号主导:
- 访问频率:被检索了多少次
- 搜索出现次数:在搜索结果里露面的频率
- 主动点击:你打开它读了多少回
- 阅读时长:每次打开停留了多久
- EVOLVES 边:有多少其他记忆印证或丰富了它
- 结晶归属:有没有被用作知识结晶的来源
这些信号都是自动追踪的。你不需要手动评分或标记,系统就能学会哪些记忆重要。
重要性地板
衰减有个问题:一条真正重要的事实,几个月没访问,分数就会很低。它依然正确、有价值,但排不上来了。间隔重复系统靠安排复习解决这个,不过 Mem 不是闪卡应用。
所以每条记忆有一个重要性地板。衰减分数可以降,但不会低于一个和重要性等级挂钩的最低值。基础性的决定、关键操作流程,哪怕你很久没看,也始终能搜到。
地板是温和的。不会压过语义相关性,只是防止"幽灵记忆":知识明明在系统里,但搜不到。
衰减如何影响搜索排序
语义相关性是搜索结果中的主导因素。衰减和置信是次要信号,在语义分数接近时调整排序。
实际效果:
- 两条与查询同样相关的记忆 → 更新的那条排得更高
- 语义匹配度强的结果总是胜过最近但弱相关的
- 支撑充分的记忆(高置信)获得小幅额外提升
- 知识结晶和 EVOLVES 链中的最新版本在此基础上还有各自的排序调整
自动刷新
系统每天作为后台任务重新计算衰减和置信分数。刷新同时更新搜索中使用的缓存分数,所以结果能反映当前的使用模式,无需手动干预。
你还可以选择开启自动归档。跌破很低衰减阈值、从未被访问、且足够老的记忆可以被移入归档状态。自动归档默认关闭,需要明确开启。归档的记忆不会被删除,随时可以恢复。