HuggingFace Daily Papers（社区热门论文）

STALE：LLM智能体能知道自己的记忆何时失效吗？

2026-05-07 08:00·39天前

AI 摘要

研究揭示了LLM智能体长期记忆中的“隐性冲突”缺陷，即新证据在不明确否定的情况下使旧记忆失效。为此，研究者构建了STALE基准，包含400个冲突场景与1200个查询，从状态解析、前提抵抗和隐性策略适应三个维度进行评估。系统测试表明，前沿模型在根据更新证据行动上存在普遍差距，最佳模型准确率仅55.2%。研究进一步提出了CUPMem原型，通过结构化状态整合加强写入时修订，为构建状态感知的鲁棒记忆提供了初步基线。

该来源未收录可展示正文，站内仅提供摘要。

智能体推理论文/研究评测/基准

阅读原文

HuggingFace Daily Papers（社区热门论文）

STALE：LLM智能体能知道自己的记忆何时失效吗？

2026-05-07 08:00·39天前

AI 摘要

该来源未收录可展示正文，站内仅提供摘要。

阅读原文arxiv.org

智能体推理论文/研究评测/基准