微软发布Memora:解决AI智能体的"健忘症"
作者: CBISMB
责任编辑: 邹大斌
来源: CBISMB
时间: 2026-07-01 10:54
浏览: 0
点赞: 0
收藏: 0
AI智能体正被寄望于记住多轮对话、用户偏好和历史决策,但现有记忆方案的碎片化问题让这一切难以落地。微软研究院近日推出Memora,一套旨在为AI智能体提供可扩展、可靠长期记忆的新架构。
Memora的核心思路是将"记住什么"与"如何检索"解耦。每个记忆条目由两部分构成:一个6-8词的主抽象(primary abstraction)概括记忆的核心主题,以及一个承载完整内容的记忆值(memory value)。当同一主题出现新信息时,系统会将其合并到已有条目下,而非生成一串部分重复的碎片。
伴随主抽象,Memora还引入了"线索锚点"(cue anchors)——从记忆值中提取的上下文感知标签,提供通往同一记忆的替代访问路径。这些标签作为灵活、有机生成的元数据,让检索不再局限于语义相似度匹配。
在检索层,Memora采用策略引导型检索器,它不是一次性返回最相似的top-k结果,而是迭代细化查询、通过线索锚点扩展相关记忆、并自主判断何时停止。
"当前智能体记忆最深的缺陷在于把检索当成了记忆。"Greyhound Research首席分析师Sanchit Vir Gogia指出,"矢量存储擅长找到看起来相关的文本,但企业级智能体需要的不仅仅是相似度。它需要知道什么变了、什么仍然有效、什么在当前任务中永远不该被调取。"
基准测试显示,Memora在LoCoMo(平均600轮对话)上取得86.3%的准确率,在LongMemEval(11.5万token上下文)上取得87.4%,超越了RAG、Mem0、Nemori、Zep、LangMem甚至全上下文推理。同时,每个对话的记忆条目数仅为Mem0的一半(344条对651条),token消耗较全上下文推理降低最多98%。
但Gogia提醒企业不要直接将这一数字等同于成本:这是基准测试中的上下文缩减,不是企业账单会降98%的承诺。实际成本还包括记忆构建、索引、存储和审计日志的开销。Memora最强的检索模式也是最慢的——策略检索器每次查询约需5至6秒,而简单语义模式不到1秒。
"提示token的节省被检索延迟和额外推理部分对冲。记忆瓶颈并没有消失,只是转移了——企业不能只关心提示变长,还得管理什么被写入、什么被更新、什么被遗忘,以及治理它们的索引和测试体系。"Gogia说。
Memora目前仍是微软研究院的活跃项目,研究代码已在GitHub公开。但纸面上的可移植性不等于生产就绪。Gogia建议IT领导者将其作为架构思路来研究,而非直接当作软件部署。企业还需建立治理和合规策略,明确谁可以写入记忆、谁可以读取、记忆保留多久,以及审计人员如何追溯某项记忆对决策的影响——"智能体记住了"这样的解释,在欧盟AI法案的可追溯性要求和印度数字个人数据保护法面前是站不住的。