SAGE：用新穎性閘門省下 18% LLM 呼叫的記憶寫入控制

一句話

杜克大學提出 SAGE（Spherical Adaptive Gate for memory Evolution），將 LLM 代理的記憶演化重新定義為新穎性偵測問題，用 von Mises-Fisher 分佈在嵌入球面上估計候選事實的新穎度分數，搭配追蹤記憶庫幾何變化的自適應閘門閾值，作為 A-Mem 的即插即用二元閘門，跳過 16-18% 的 LLM 呼叫且在五個開源模型上品質幾乎無損。

關鍵數據

項目	數據
作者/機構	Sijia Wang, Dhanajit Brahma, Ricardo Henao · Duke University
核心技術	von Mises-Fisher 密度估計 + 自適應閘門閾值
LLM 呼叫節省	16-18%（跨五個開源骨幹模型）
品質影響	開源骨幹上品質幾乎無損（minimal quality change）
基底系統	A-Mem（Agentic Memory）即插即用
問題定義	記憶寫入控制（write-side control）——先前研究多聚焦於讀取/儲存端

機制拆解

新穎性偵測框架：將「此事實該不該寫入記憶」從 LLM 判斷問題轉化為統計新穎性偵測問題。候選事實經嵌入後，在單位超球面上用 von Mises-Fisher（vMF）分佈估計其相對於現有記憶庫的密度——密度越高代表越不新穎，越可能被跳過。
vMF 密度估計器：vMF 是球面上的常態分佈等價物，天然適合歸一化嵌入向量。SAGE 用它來捕捉記憶嵌入在球面上的聚集結構，而非簡單的餘弦相似度閾值，能處理記憶分佈不均勻的現實場景。
自適應閘門閾值：閾值不是固定的，而是根據記憶庫的幾何特性（如嵌入空間的集中度、記憶數量）動態調整。記憶庫越密集，閾值越高（更嚴格的寫入門檻）；記憶庫稀疏時降低閾值（允許更多寫入），實現「記憶飽和時自動減速」。
即插即用設計：SAGE 是純粹的寫入端控制層，不修改底層記憶架構。作為二元閘門（binary gate）插入 A-Mem 的寫入管線，候選事實通過閘門才觸發 LLM 進行記憶更新/合併/新增，未通過則直接丟棄，從源頭節省 LLM 呼叫。

落地應用

Hermes fact_store 寫入閘門：目前 Hermes 的 sleep consolidation 分析每個候選記憶時都需要 LLM 推理。引入 SAGE 風格的 vMF 新穎性閘門，在分析前先用嵌入距離過濾明顯重複/已知的事實，可大幅減少固化循環中的 LLM 呼叫次數。
MEMORY 使用率優化：SAGE 的核心洞察是「不是所有新資訊都值得記住」。Hermes 的 MEMORY 使用率問題根源之一就是寫入端缺乏過濾，引入新穎性閘門可從源頭控制記憶膨脹。
自適應閾值對齊 trust score：SAGE 的自適應閘門概念可與 Hermes 現有的 trust score 機制結合——不只用 trust score 決定刪除，也用嵌入空間的幾何密度決定是否接受新事實進入。
成本敏感場景的寫入策略：對於使用昂貴 API（如 GPT-4o、Claude）的代理，SAGE 的 16-18% 呼叫節省直接轉化為成本節省，且不犧牲記憶品質，是 production 級的工程優化。

SAGE：用新穎性閘門省下 18% LLM 呼叫的記憶寫入控制

一句話

關鍵數據

機制拆解

落地應用

🏷️ 標籤