📖 學習資源

技術導讀、工具評測、論文筆記——自由探索

🏢 產業分析

OpenAI Codex 白領大擴張:Sites × Plugins × Annotations 全解析

Hermes Lab 分析 · 2026-06-04
62 應用、110 技能、6 角色 plugin、一鍵生成互動網站——Codex 從寫 code 工具轉型為白領工作指揮中心
OpenAICodexAI AgentSaaSorchestration

技術研究彙整:Voice Agent · WordPress · AI 原生公司 · LINE 工具

Hermes Lab 研究 · 2026-06-04
七個技術方向一次整理:語音下單平台比較、Headless WordPress + Astro、AI 原生開發模式、LINE Bot + LLM 整合、Jetpack AI 工作流
Voice AgentWordPressAI-NativeLINEHeadlessLLMAstro

2026,AI 終於開始「幫你做事」了 — 個人 AI 代理爆發的深層觀察

Hermes Lab 深度研究 · 2026-06-04
Scout vs Spark vs OpenClaw vs Odysseus vs nanobot vs Hermes — Always-On agent 元年,六大方案深度比較
AI AgentScoutSparkOpenClawOdysseusAlways-OnMCP

🛠 工具評測

pi (earendil-works/pi):極簡可擴展 AI Coding Agent 深度分析

earendil-works · GitHub 60.9K Stars · MIT · v0.79.0 · 2026-06-08
TypeScript 原生 AI agent 工具包:coding agent CLI + 統一 LLM API + TUI。極簡核心、全系統權限 extension、session 分支、供應鏈安全實踐
coding-agentTypeScriptCLItoolkitextension

Prompt-Engineering-Guide:提示工程領域最完整的開源知識庫

DAIR.AI · GitHub 97K+ Stars · 持續更新
不是一個工具,而是一張地圖——涵蓋 11 種提示技術、80+ 工具推薦、數十篇論文索引。
prompt-engineeringtool-reviewRAGReActCoT

📦 模型壓縮 / 邊緣部署

Gemma 4 QAT:量化感知訓練讓 E2B 壓到 1GB

Olivier Lacombe & Omar Sanseviero · Google DeepMind · 2026-06-05
QAT 品質完勝傳統 PTQ,行動端專用量化格式把 Gemma 4 E2B 文字版壓到 <1GB,手機原生執行 LLM 成真。
量化邊緣部署GemmaQATGoogle

🔬 多智能體 / 推理增強

多 Agent 系統故障復原:失敗模式、可靠性陷阱與生產級復原策略

Hermes Lab 研究彙整 · 2026-06-14
單步 95% → 10 步後 59.9%。五種真實失敗模式、三層復原架構、GitHub/DeepMind/Zylos 生產級實踐一次整理
multi-agentreliabilityfault-tolerancecheckpointcircuit-breaker

用多智能體系統增強弱推理模型

Sunkaraneni et al. · MIT/Tel Aviv · 2026-05-13 · arXiv:2605.14163
弱模型委員會 ×8 + 驗證器 ≈ 強模型單獨。瓶頸是 coverage 而非 selector。
multi-agentreasoningSWE-benchboosting

🧠 模型架構 / 記憶機制

Q-Evolve:LLM Agent 自主演進的共演化框架 — ICML 2026

Zhang, Fang, Chen, Pechenizkiy · ICML 2026 · arXiv:2606.07367
Critic-Policy 共演化閉環:自動標籤過程獎勵→自己學習→生成更好資料。不需人類標註,逐步自我改進長程決策。
self-evolvingICML2026IQLcredit-assignmentQ-Evolve

Tree-of-Experience:低重複隱式獎勵下的 Agent 結構化經驗管理

Deng, Zhu, Wang et al. · 2026-06-05 · arXiv:2606.06960
通用記憶機制在低重複、隱式獎勵環境下全面潰敗——甚至不如無經驗 baseline。Tree-of-Experience 用結構化經驗樹 + 非參數 RL 扭轉局面。
self-evolvingexperience-treeimplicit-rewardToE

MUSE-Autoskill:讓 AI 代理自己發明、記憶、改良技能

Lin, Li, Song, Jiang, Zhang · 2026-05-26 · arXiv:2605.27366
技能的五階段生命週期(創建→記憶→管理→評估→精煉),讓代理從「工具使用者」進化為「工具創造者」
self-evolvingskill-memoryMUSEagent-architecture

SAGE:用新穎性閘門省下 18% LLM 呼叫的記憶寫入控制

Wang, Brahma, Henao · Duke University · 2026-05-29 · arXiv:2605.30711
von Mises-Fisher 新穎性偵測 + 自適應閘門,即插即用 A-Mem 省 16-18% LLM 呼叫品質不降。
新穎性偵測寫入控制vMFSAGE

FluxMem:記憶是持續演化的異質圖拓撲

Fang, Xu, Wang et al. · 浙江大學/阿里巴巴 · 2026-05-27 · arXiv:2605.28773
記憶不該是靜態倉庫——三階段異質圖演化讓 LoCoMo 達 95.06,三基準全 SOTA。
異質圖記憶演化程序性記憶FluxMem

語言模型需要睡覺嗎?離線循環增強線上推理

Lee et al. · CMU/Maryland · 2026-05-25 · arXiv:2605.26099
記憶不是瓶頸,算力才是。讓模型在清空 KV cache 前多跑幾圈,把上下文真正「消化」。
SSMsleepfast-weightsmemory-consolidation

回 DKY 學習中心