微软发布Memora：解决AI智能体的"健忘症"

作者： CBISMB

责任编辑：邹大斌

来源： CBISMB

时间： 2026-07-01 10:54

关键字：微软，AI智能体，Memora ，长期记忆，RAG

点赞： 0

收藏： 0

AI智能体正被寄望于记住多轮对话、用户偏好和历史决策，但现有记忆方案的碎片化问题让这一切难以落地。微软研究院近日推出Memora，一套旨在为AI智能体提供可扩展、可靠长期记忆的新架构。

Memora的核心思路是将"记住什么"与"如何检索"解耦。每个记忆条目由两部分构成：一个6-8词的主抽象（primary abstraction）概括记忆的核心主题，以及一个承载完整内容的记忆值（memory value）。当同一主题出现新信息时，系统会将其合并到已有条目下，而非生成一串部分重复的碎片。

伴随主抽象，Memora还引入了"线索锚点"（cue anchors）——从记忆值中提取的上下文感知标签，提供通往同一记忆的替代访问路径。这些标签作为灵活、有机生成的元数据，让检索不再局限于语义相似度匹配。

在检索层，Memora采用策略引导型检索器，它不是一次性返回最相似的top-k结果，而是迭代细化查询、通过线索锚点扩展相关记忆、并自主判断何时停止。

"当前智能体记忆最深的缺陷在于把检索当成了记忆。"Greyhound Research首席分析师Sanchit Vir Gogia指出，"矢量存储擅长找到看起来相关的文本，但企业级智能体需要的不仅仅是相似度。它需要知道什么变了、什么仍然有效、什么在当前任务中永远不该被调取。"

基准测试显示，Memora在LoCoMo（平均600轮对话）上取得86.3%的准确率，在LongMemEval（11.5万token上下文）上取得87.4%，超越了RAG、Mem0、Nemori、Zep、LangMem甚至全上下文推理。同时，每个对话的记忆条目数仅为Mem0的一半（344条对651条），token消耗较全上下文推理降低最多98%。

但Gogia提醒企业不要直接将这一数字等同于成本：这是基准测试中的上下文缩减，不是企业账单会降98%的承诺。实际成本还包括记忆构建、索引、存储和审计日志的开销。Memora最强的检索模式也是最慢的——策略检索器每次查询约需5至6秒，而简单语义模式不到1秒。

"提示token的节省被检索延迟和额外推理部分对冲。记忆瓶颈并没有消失，只是转移了——企业不能只关心提示变长，还得管理什么被写入、什么被更新、什么被遗忘，以及治理它们的索引和测试体系。"Gogia说。

Memora目前仍是微软研究院的活跃项目，研究代码已在GitHub公开。但纸面上的可移植性不等于生产就绪。Gogia建议IT领导者将其作为架构思路来研究，而非直接当作软件部署。企业还需建立治理和合规策略，明确谁可以写入记忆、谁可以读取、记忆保留多久，以及审计人员如何追溯某项记忆对决策的影响——"智能体记住了"这样的解释，在欧盟AI法案的可追溯性要求和印度数字个人数据保护法面前是站不住的。

©本站发布的所有内容，包括但不限于文字、图片、音频、视频、图表、标志、标识、广告、商标、商号、域名、软件、程序等，除特别标明外，均来源于网络或用户投稿，版权归原作者或原出处所有。我们致力于保护原作者版权，若涉及版权问题，请及时联系我们进行处理。

微软发布Memora：解决AI智能体的"健忘症"

相关推荐

智库专家

解决方案