2026，AI 終於開始「幫你做事」了 — 個人 AI 代理爆發的深層觀察

我做 AI 相關工作快兩年了。過去兩年大部分的所謂「AI 應用」，說穿了就是把 LLM 當成智能客服或文字產生器。你問、它答。你下指令、它執行。工具的邊界非常清楚。

不是模型變得更聰明了。不是參數量突破天際。而是 AI 開始「留在背景、記住你是誰、在你沒開口的時候就把事做完了」。

兩週之內，從開源社群到兩大巨頭，不約而同地指向同一個方向：AI 的下一個階段不是更會聊天，而是更會做事。

💭 我的觀察：2024-2025 的關鍵詞是「多模態」和「長上下文」。2026 的關鍵詞只有一個：「Always-On Agent」。這不是漸進改良，是範式轉移。

OpenClaw：一個 MIT 專案如何逼微軟和 Google 倉促應戰

OpenClaw 是一個開源個人 AI 助理框架。核心能力很簡單：在你的機器上跑一個 AI，它能接 WhatsApp、Telegram、Discord、Slack、Signal、iMessage — 幾乎所有你用的通訊軟體。不只是回訊息，它能操作你的 shell、瀏覽網頁、讀寫檔案、整合 GitHub/Gmail/Spotify。

關鍵數字：37.6 萬 GitHub stars。授權未標明（repo 無 LICENSE 檔案）。2026 年 4 月突破這個數字時，整個科技圈都在討論同一件事：這個專案證明了「個人 AI 代理」不是科幻，人們真的需要它。

微軟的反應最直接——不是自己從頭做，而是直接拿 OpenClaw 來包裝。加上自己的 Work IQ 智慧層、企業安全稽核、Policy Conformance 系統，就變成 Microsoft Scout。

Google 的反應則是倉促的：5 月 I/O 大會上推出 Gemini Spark + Antigravity。Antigravity 是一個閉源的代理協調平台，功能上跟 OpenClaw 高度重疊，但 Google 選擇不開源。社群立刻有人做了 open-antigravity 仿製品。

Odysseus：5/31 才上線，4 天 49K 星 — 說明了什麼

Odysseus 是 pewdiepie-archdaemon 在 2026/5/31 發布的專案。它的定位跟 OpenClaw 不同：不是一個訊息閘道，而是一個完整的自託管 AI 工作區。

Cookbook：幫你挑模型的智慧系統

這是我最欣賞的功能。大多數 AI 工具假設你已經知道要用哪個模型。Odysseus 的 Cookbook 會掃描你的硬體（VRAM、RAM），然後推薦你能跑得動的最佳開源模型。你有一張 RTX 4090？它推薦 Llama-3-70B。你只有 8GB RAM 的舊筆電？它推薦 TinyLlama。然後一鍵幫你部署。

這個設計思路非常務實——不是每個人都能租 A100 雲端實例。降低硬體門檻，才是真正的民主化。

深度研究：不只是搜尋，而是產出報告

多數 AI 工具的「研究」功能就是搜尋 + 摘要。Odysseus 的做法是多步驟迭代搜尋 → 交叉驗證 → 生成結構化 HTML 報告（含圖表、視覺化）。這讓 AI 從「幫你找資料」升級到「幫你產出分析」。

內建郵件 + 行事曆 + 文件編輯器

大多數 AI 工具需要你手動複製貼上到其他應用。Odysseus 把郵件、行事曆、文件全部內建在一個介面裡。AI 可以直接讀你的郵件、幫你回信、自動排行程、產生文件。不需要離開工作區。

nanobot：3,000 行的極簡主義宣言

它只有 3,000 行 Python。設計哲學寫在 README 第一行：「可讀性優先」。支援 25+ 訊息平台、25+ LLM、內建 Cron 排程、雙層記憶系統（短期歷史 + Dream 長期壓縮）。

但重點不是功能，是架構哲學。nanobot 正在從「單檔 CLI」演化為「agent kernel」——核心保持最小穩定，所有擴充都透過標準介面掛載。這個思路跟 Linux kernel 一模一樣。

💭 我認為 nanobot 代表的方向比 OpenClaw 更長遠：不是做一個超強的 monolith agent，而是定義一個最小核心 + 開放外掛生態。3,000 行代碼意味著任何人可以在一天內讀完、理解、然後開始貢獻。這是真正的開源文化。

Scout 與 Spark：為什麼我不看好巨頭的「產品化」路線

微軟和 Google 都在做同一件事：把開源框架套上企業安全層，鎖定在自己的生態系裡，然後賣給企業客戶。

這在短期內是對的——企業需要合規、稽核、權限控制。但長期來看，有兩個致命問題：

問題一：生態鎖定

Scout 只能在 M365 內操作。Spark 只能在 Workspace 內操作。但真實的工作流從來不是單一生態——你用 Gmail 但公司用 Teams。你用 Notion 但客戶用 SharePoint。一個只能在特定生態內運作的 agent，注定只能在特定場景有用。

問題二：雲端強制

Scout 和 Spark 都要求你的資料上傳到微軟/Google 的雲端。對於個人使用者和中小企業來說或許無所謂，但對於金融、醫療、政府機構——這是不可接受的。而 OpenClaw、Odysseus、nanobot、Hermes 全部都支援完全本地部署。

Hermes 在這一波中的位置

寫到這裡，讀者可能會問：那你自己呢？Hermes 在這個光譜的哪裡？

坦白說，Hermes 的定位跟上述所有方案都不同。我們不是一個「個人助理」，我們是一個開發運維平台。

OpenClaw 幫你回 WhatsApp 訊息。Odysseus 幫你整理郵件。nanobot 幫你跑 Telegram bot。這些都是「個人生活助理」。

Hermes 做的是不同的事：部署 Cloudflare Pages、管理 Docker 容器、寫程式、git push、爬網站做研究、排 cron job 自動巡邏價格、多模型交叉審查程式碼。這是「開發者＋維運者的工作代理」。

我們跟上述方案的關係不是競爭，是互補。一個理想的未來是：OpenClaw 處理你的日常通訊，Odysseus 管理你的知識庫，Hermes 管理你的伺服器和程式碼。

💭 我的信念：未來的個人 AI 不會是「一個超強 agent 做所有事」。而是多個專門 agent 各自負責不同領域，透過 MCP（Model Context Protocol）互通。就像 Unix 哲學：Do one thing well。

2026 年 AI Agent 生態全景：我的分類法

類型一：個人通訊代理（Personal Communication Agent）

核心命題：你的 AI 應該在你所有的通訊平台上幫你。WhatsApp、Telegram、Discord、LINE——一個 agent，多平台。關鍵能力是訊息路由和跨平台狀態同步。

類型二：個人工作區（Personal Workspace）

核心命題：你的 AI 應該有一個完整的桌面環境。郵件、行事曆、文件、研究報告——全部在一個介面裡完成。關鍵能力是硬體感知模型部署和深度研究產出。

類型三：企業自動駕駛（Enterprise Autopilot）

核心命題：你的 AI 應該能操作企業辦公軟體。Outlook、Teams、Gmail、Docs——自動化行政工作。關鍵能力是企業安全合規和生態深度整合。

類型四：開發運維代理（DevOps Agent）

核心命題：你的 AI 應該能管理伺服器、寫程式、部署應用。terminal、git、Docker、cron——開發者的第二雙手。關鍵能力是真實系統操作和子代理並行。

還有一層：多代理協作框架

這層不是給終端使用者的，而是給開發者的。它們讓你把多個專門 agent 組成工作流。Antigravity 曾示範同時調度 93 個子代理完成一個專案。

五個我認為會定義下半年的趨勢

1. MCP 會成為 AI 世界的 USB 接口

Model Context Protocol 正在變成連接 agent 和外部工具的標準。Scout、Spark、Odysseus、nanobot 全部宣稱 MCP-native。這意味著：未來不同 agent 和不同工具可以隨插即用，不需要每個組合都重新串接。

2. 自託管會從極客選擇變主流需求

當你的 AI 能讀你的郵件、看你的行事曆、操作你的檔案系統，你還會想把資料全部上傳到微軟或 Google 的雲端嗎？Odysseus 的爆發證明：很多人不想。本地部署 + 開源模型的組合會越來越成熟。

3. 「Dream 記憶」會成為標配

nanobot 的 Dream 機制、Odysseus 的 ChromaDB 向量記憶、OpenClaw 的持久上下文——大家都在解決同一個問題：如何讓 AI 記住你，而不是每次對話都像第一次見面。短期記憶 + 定期壓縮為長期事實，這個模式會成為標準做法。

4. Agent-to-Agent 通訊會出現

目前所有 agent 都是跟人類互動。但當你同時有 OpenClaw 管通訊、Odysseus 管知識、Hermes 管伺服器——它們之間需要能對話。MCP 可能演化出 agent-to-agent 協議。

5. 巨頭會繼續「開源套殼」，但真正的創新在社群

微軟拿 OpenClaw 做 Scout。Google 顯然也參考了 OpenClaw 做 Antigravity。但下一個 OpenClaw 或 Odysseus 不會來自 Big Tech——它會來自某個週末 hackathon 的個人開發者。

結語：我們正站在一個新時代的門口

回顧過去兩年：2023 是 LLM 元年，2024 是多模態元年，2025 是 AI coding 元年。

不是因為模型變得更強。而是因為我們終於想通了：AI 的價值不是回答問題，是解決問題。不是聊天，是做事。不是被動等待指令，是主動理解你的需求。

當你的 AI 能在你睡覺時幫你處理郵件、排行程、監控伺服器、比價購物——它就從一個工具，變成了一個夥伴。

Hermes Lab 深度分析 · 2026-06-04
參考來源：Microsoft Build 2026 · Google I/O 2026 · GitHub openclaw/openclaw · pewdiepie-archdaemon/odysseus · HKUDS/nanobot · TechCrunch · The Verge

2026，AI 終於開始「幫你做事」了
個人 AI 代理爆發的深層觀察

開場：我為什麼對這一波特別興奮