SAGE:用新穎性閘門省下 18% LLM 呼叫的記憶寫入控制
把記憶寫入當新穎性偵測問題——von Mises-Fisher 密度估計器 + 自適應閘門,省 16-18% LLM 呼叫品質不降。
一句話
杜克大學提出 SAGE(Spherical Adaptive Gate for memory Evolution),將 LLM 代理的記憶演化重新定義為新穎性偵測問題,用 von Mises-Fisher 分佈在嵌入球面上估計候選事實的新穎度分數,搭配追蹤記憶庫幾何變化的自適應閘門閾值,作為 A-Mem 的即插即用二元閘門,跳過 16-18% 的 LLM 呼叫且在五個開源模型上品質幾乎無損。
關鍵數據
| 項目 | 數據 |
| 作者/機構 | Sijia Wang, Dhanajit Brahma, Ricardo Henao · Duke University |
| 核心技術 | von Mises-Fisher 密度估計 + 自適應閘門閾值 |
| LLM 呼叫節省 | 16-18%(跨五個開源骨幹模型) |
| 品質影響 | 開源骨幹上品質幾乎無損(minimal quality change) |
| 基底系統 | A-Mem(Agentic Memory)即插即用 |
| 問題定義 | 記憶寫入控制(write-side control)——先前研究多聚焦於讀取/儲存端 |
機制拆解
- 新穎性偵測框架:將「此事實該不該寫入記憶」從 LLM 判斷問題轉化為統計新穎性偵測問題。候選事實經嵌入後,在單位超球面上用 von Mises-Fisher(vMF)分佈估計其相對於現有記憶庫的密度——密度越高代表越不新穎,越可能被跳過。
- vMF 密度估計器:vMF 是球面上的常態分佈等價物,天然適合歸一化嵌入向量。SAGE 用它來捕捉記憶嵌入在球面上的聚集結構,而非簡單的餘弦相似度閾值,能處理記憶分佈不均勻的現實場景。
- 自適應閘門閾值:閾值不是固定的,而是根據記憶庫的幾何特性(如嵌入空間的集中度、記憶數量)動態調整。記憶庫越密集,閾值越高(更嚴格的寫入門檻);記憶庫稀疏時降低閾值(允許更多寫入),實現「記憶飽和時自動減速」。
- 即插即用設計:SAGE 是純粹的寫入端控制層,不修改底層記憶架構。作為二元閘門(binary gate)插入 A-Mem 的寫入管線,候選事實通過閘門才觸發 LLM 進行記憶更新/合併/新增,未通過則直接丟棄,從源頭節省 LLM 呼叫。
落地應用
- Hermes fact_store 寫入閘門:目前 Hermes 的 sleep consolidation 分析每個候選記憶時都需要 LLM 推理。引入 SAGE 風格的 vMF 新穎性閘門,在分析前先用嵌入距離過濾明顯重複/已知的事實,可大幅減少固化循環中的 LLM 呼叫次數。
- MEMORY 使用率優化:SAGE 的核心洞察是「不是所有新資訊都值得記住」。Hermes 的 MEMORY 使用率問題根源之一就是寫入端缺乏過濾,引入新穎性閘門可從源頭控制記憶膨脹。
- 自適應閾值對齊 trust score:SAGE 的自適應閘門概念可與 Hermes 現有的 trust score 機制結合——不只用 trust score 決定刪除,也用嵌入空間的幾何密度決定是否接受新事實進入。
- 成本敏感場景的寫入策略:對於使用昂貴 API(如 GPT-4o、Claude)的代理,SAGE 的 16-18% 呼叫節省直接轉化為成本節省,且不犧牲記憶品質,是 production 級的工程優化。
🏷️ 標籤
記憶寫入控制
新穎性偵測
von Mises-Fisher
SAGE
A-Mem
Duke University
效率優化
← 回論文筆記列表