【速報】Hermes Agent 終於有了官方桌面版:AI Agent 開始從命令行走向真正的工作台

作者:效率火箭
日期:2026年6月7日 下午3:30
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

Hermes Agent 正式推出桌面版,降低門檻但保留 Agent 核心能力,強調記憶與技能沉澱

整理版摘要

呢篇文章係由一位技術用戶撰寫,佢之前比較過「小龍蝦」(OpenClaw)同 Hermes Agent,最後揀咗 Hermes,因為佢配置更人性化、支援自學習同持久記憶,仲會將完成嘅工作沉澱成 skill,下次自動複用。作者認為 Hermes 用起嚟似一個積極主動嘅團隊成員,而唔只係一個工具。文章主要係介紹 Nous Research 正式推出嘅 Hermes Desktop,即係 Hermes Agent 嘅官方桌面版。

喺桌面版推出之前,Hermes Agent 同小龍蝦一樣,主要係畀技術用戶用嘅 CLI/TUI 工具,門檻包括配置文件、provider、API key、gateway、toolset、MCP、dashboard 等。對普通用戶嚟講,根本唔知從邊度下手。桌面版將呢啲配置放入 UI,provider、model、tools、credentials、MCP servers、gateway、session management 都可以直接喺桌面管理,降低咗操作成本。但要注意,Hermes Desktop 唔係獨立嘅聊天客戶端,而係同一個 Agent Core 嘅唔同入口,共享配置、記憶同 skill。用戶可以喺命令行開任務,再到桌面版繼續睇;亦可以喺桌面版配置模型,再返 CLI 用。整體嚟講,門檻由「必須會命令行」降到「理解系統基本結構即可」。

作者特別強調 Hermes 嘅持久記憶同自動生成 skill…

  • Hermes Desktop 係同一個 Agent Core 嘅不同入口,共享配置、記憶同 skill,唔係獨立聊天客戶端。
  • 桌面版將複雜配置放入 UI,令門檻由「必須會命令行」降到「理解系統基本結構」,但仍需技術底。
  • 同普通 chatbot 唔同,Agent 會執行工具操作,桌面版將過程可視化,幫助用戶建立信任。
  • 持久記憶同自動生成 skill 係 Hermes 核心價值,可以將反覆任務沉澱成工作流,唔再係一次性對話。
  • 適合已經用 Claude CodeCodex 等工具嘅人、研究型工作者同自部署愛好者;簡單問答工具用戶則用 ChatGPT 等更直接。
整理重點

作者點解揀 Hermes 唔揀 OpenClaw?

作者之前比較過「小龍蝦」(OpenClaw)同 Hermes Agent,最後揀咗 Hermes。佢認為 Hermes 配置更人性化,支援自學習同持久記憶,仲會將完成嘅工作沉澱成 skill,下次自動複用。用起嚟似一個積極主動嘅團隊成員,而唔只係一個工具。

比較咗 OpenClawHermes

配置更人性化

支援自學習同持久記憶

將完成嘅工作沉澱成 skill

用起嚟似團隊成員

整理重點

桌面版降低咗咩門檻?

喺桌面版之前,Hermes 同小龍蝦一樣,係畀技術用戶用嘅 CLI/TUI 工具。配置包括配置文件、provider、API key、gateway、toolset、MCP、dashboard,每一項都係門檻。

  • 配置文件(YAML
  • ProviderAPI Key 管理
  • Gateway 同 toolset 設定
  • MCP server 連接
  • Dashboard 同 session 管理

桌面版將呢啲全部放入 UI,provider、model、tools、credentials、MCP servers、gateway、session management 都可以直接管理。但要注意,Hermes Desktop 唔係獨立聊天客戶端,而係同一個 Agent Core 嘅唔同入口,共享配置、記憶同 skill。

CLI/TUI 工具

配置文件、provider 等門檻

UI 管理

Agent Core 共享

門檻由命令行降到理解系統結構

整理重點

持久記憶同 skill 點樣改變 Agent 本質?

作者最感興趣嘅係 Hermes 嘅持久記憶(persistent memory)同自動生成 skill。好多 AI agent 都係一次性對話,但 Hermes 會記住解決問題嘅方法,並沉澱成可複用嘅 skill。呢個方向比「一次性更聰明」重要得多。

  1. 1 真實工作好多任務係反覆出現嘅,例如整理資料、生成報告、檢查文件。
  2. 2 如果 agent 每次都重新理解,本質上係高級聊天;如果將流程固化,下次自動套用,先算係工作系統。
  3. 3 桌面版將 skill、cron、profile、messaging、agents 同 command center 管理入口放喺桌面端,將長期運行嘅 AI 工作系統搬到用戶更容易觸及嘅位置。

作者認為真正嘅效率來自歸納:一類事情做多咗會形成工作流,工作流用多咗會沉澱成自動化工具。呢個就係 agent 嘅 skill 迭代邏輯。

持久記憶

自動生成 skill

一次性對話嘅侷限

工作流沉澱

長期運行嘅 AI 工作系統

整理重點

邊啲人適合而家用 Hermes Desktop?

先潑冷水Hermes Desktop 目前唔係面向零基礎用戶。技術門檻之外,佢嘅能力邊界太闊,可以連接唔同模型、調用工具、讀寫文件、跑瀏覽器自動化、執行定時任務、接 messaging gateway。如果日常事務冇複雜到需要 AI 介入,或者完全唔想歸納工作流,呢類 agent 幫唔到太多。

作者認為最適合三類人:第一類,已經用 Claude CodeCodexCursor、OpenHands、OpenWebUI、n8n、MCP 工具嘅人;第二類,研究型創作者、技術寫作者、獨立顧問,需要收集資料、整理文件、生成報告;第三類,有自部署習慣嘅人,願意喺本地或 VPS 跑工具,想掌握數據同流程。

零基礎用戶唔適合

已用 Claude Code 等人

研究型創作者

自部署習慣

未來桌面工作台

圖片
最近 Nous Research 正式推出咗 Hermes Desktop,即係 Hermes Agent 嘅官方桌面版。
有啲朋友可能對 Hermes Agent 仲比較陌生,我簡單講下背景。前排,「小龍蝦」(OpenClaw)呢個 AI 個人助理工具紅咗一排,Hermes Agent 係類似嘅助理工具。我當時對比咗兩者之後,二話不說揀咗 Hermes,之後就冇再用過 OpenClaw。Hermes 嘅配置同交互更人性化,支援自學習同持久記憶,亦都兼容多種 IM 工具同 TUI,迭代節奏一直好快。
令我印象最深刻嘅係:Hermes 會將完成過嘅工作沉澱成 skill,下次遇到類似任務時主動複用。用起上嚟更加似一個積極主動嘅團隊成員,而唔淨係一個工具。

桌面版出現之前,Hermes 嘅門檻喺邊度

圖片
喺桌面版推出之前,Hermes Agent 同小龍蝦一樣,本質上仲係一個俾技術用戶用嘅工具。用戶至少要對 CLI、TUI 有啲基礎,先至開始得配置。配置檔案、provider、API key、gateway、toolset、MCP、dashboard,每一項都係獨立嘅門檻。對鍾意折騰嘅人嚟講,呢啲係高自由度;對普通用戶嚟講,根本唔知從邊度入手。
所以,大多數淨係熟圖形界面、習慣撳「下一步」嘅用戶,基本上係冇緣呢類工具㗎。

唔係另一個聊天客戶端

理解 Hermes Desktop,首先要避開一個誤區:佢唔係獨立做咗一個 ChatGPT 或者 Codex 嘅替代品。
Hermes Desktop 用嘅係同一個 Hermes Agent core。CLI、TUI、Gateway、Desktop 唔係幾套割裂嘅系統,而係同一個 Agent 嘅唔同入口。佢哋共享配置、API key、session、skill、memory。你可以喺命令行開一個任務,再去桌面版繼續睇;亦可以喺桌面版配置模型、管理 skill,再返去其他入口繼續用。
嚴格嚟講,Hermes Desktop 係一個 agent 客戶端,更接近 Codex 而唔係 ChatGPT。Agent 會執行一系列動作,喺獲得授權之後控制瀏覽器或者文件系統,最終達成用戶目標。對話 chatbot 只係 agent 嘅一個子集。

桌面版降低嘅係操作成本

雖然 Hermes Desktop 嘅主界面依然以對話為中心,但佢唔係淨係俾你一個輸入框加一串回答。
左邊導航用嚟管理多個 agent 對話,中間係對話區,可以睇到 streaming response 同工具調用過程,右邊有 preview rail,可以並排睇網頁、文件同工具輸出。同時內置檔案瀏覽器,令你唔使離開 App 就可以睇到 agent 喺度讀寫緊邊啲項目檔案。
呢類設計看似普通,但對 AI Agent 非常關鍵。Agent 同普通聊天機械人嘅分別,正係佢會「做嘢」——讀檔案、寫檔案、搜尋網頁、執行腳本、調用工具。如果呢啲動作全部收埋喺黑箱裏面,用戶好難建立信任;如果每一步都要去睇終端日誌,普通用戶又頂唔順。桌面版將 agent 嘅工作過程可視化,降低嘅正係呢部分操作成本。
圖片

設定終於唔再全靠 YAML 同命令行

我一直覺得,AI Agent 工具要進入日常工作流程,最大嘅門檻唔係模型能力,而係配置體驗。
揀 provider、配置模型、決定啟用邊啲工具、管理 API key、連接 MCP server、設定 gateway——如果呢啲全部散落喺命令行參數同配置檔案裏面,用戶好快就會放棄。
Hermes Desktop 今次將呢啲配置全部放咗入 UI:provider、model、tools、credentials、MCP servers、gateway、session management,都可以喺桌面端直接管理。
當然,呢個唔代表佢變咗做「下載就可以冇腦用」嘅產品。複雜嘅配置仍然需要一定嘅專業背景,必要時仲要手動處理配置檔案同命令行——畢竟佢哋本來就係一體嘅。但至少門檻由「一定要識命令行」降到咗「理解系統基本結構就得」。呢個已經係好大嘅變化。

Windows 用戶都被照顧到

呢個係我好在意嘅一點。
好多開源 AI Agent 項目,名義上支援跨平台,實際上主要面向 Linux / macOS,Windows 用戶唔係被要求裝 WSL,就係喺各種依賴裏面折騰半日。
我喺 Windows 10 上測試咗 Hermes Desktop 嘅原生支援:唔需要 WSL、Cygwin 或者 Docker,安裝器會自動處理 Python、Node.js、PortableGit、ripgrep、ffmpeg 等依賴,放喺用戶目錄下,唔需要管理員權限。整體體驗同 macOS 下幾乎一致。
一個 AI agent 工具,如果淨係喺 Linux 伺服器上體驗好,佢更加似係伺服器基礎設施;如果能夠喺 Windows 同 macOS 枱機上面行到,佢先有機會成為個人工作流程嘅一部分。Windows 同 macOS 互為競爭對手,係對用戶最好嘅狀態。一個 agent app 只有覆蓋兩邊,先算完整。
圖片

我真正感興趣嘅係持久記憶同 skill

而家好多 AI 產品都喺度講 agent,但大多數實際上仲係一次性對話:俾一個任務,做一次,做完就結束。下次仲要重新解釋背景、偏好同注意事項。
Hermes Agent 更加有意思嘅地方,係佢強調 persistent memory 同自動生成嘅 skill。佢唔單止記住聊天記錄,而係將解決問題嘅方法沉澱成可複用嘅 skill。
從生產力工具嘅角度睇,呢個方向比「一次性更聰明」重要得多。真實工作裏面,好多任務唔係全新嘅,而係重複出現嘅——整理某類資料、生成某類報告、檢查某類檔案、定期做研究、將資訊推送去某個渠道。如果 agent 每次都重新理解一次,本質上仲係高級聊天;如果佢能夠將流程固化落嚟,下次自動套用,佢先開始接近一個工作系統。
Hermes Desktop 將 skill、cron、profile、messaging、agents 同 command center 呢啲管理入口放咗入桌面端,本質上係將「長期運行嘅 AI 工作系統」搬咗去用戶更容易觸及嘅位置。
我喺 AI 普及之前就已經有呢個認識:真正嘅效率來自歸納。一類事情做得多咗,會形成工作流程;工作流程用得多咗,會沉澱成自動化工具。用而家嘅角度嚟睇,呢個就係 agent 嘅 skill 迭代邏輯。

適合邊個用

先潑一啖冷水:Hermes Desktop 目前唔係面向完全零基礎用戶嘅產品。
技術門檻之外,更主要嘅問題係佢嘅能力邊界太闊。Hermes 可以連接唔同模型,調用工具,讀寫檔案,行瀏覽器自動化,執行定時任務,接 messaging gateway,連接遠端 backend……
如果日常事務仲未複雜到需要 AI 介入,或者完全唔想歸納自己嘅工作流程,目前嘅 agent 工具幫唔到太多。
我覺得 Hermes Desktop 目前最適合三類人。
第一類,已經在用 Claude Code、Codex、Cursor、OpenHands、OpenWebUI、n8n、MCP 工具嘅人。佢哋理解 AI 工具調用同自動化嘅價值,只係需要一個更完整嘅 agent 工作枱。
第二類,研究型創作者、技術寫作者、獨立顧問、產品研究人員。佢哋成日需要收集資料、閲讀網頁、整理檔案、生成報告、沉澱流程。Hermes 嘅 memory、skill、定時任務同多入口交互,可能會逐漸成為一套長期積累嘅個人研究助理。
第三類,有自部署習慣嘅人。例如願意喺本地機器、家用伺服器、VPS 或者 Tailscale 網絡裏面行自己工具嘅人,希望數據同流程盡量掌握喺自己手裏。Hermes 嘅整體方向同呢類用戶嘅偏好比較契合。
如果你只係想揾一個簡單嘅問答工具,ChatGPT、豆包、千問呢類會更加直接。
圖片

最後

Hermes Desktop 嘅發佈,喺某種意義上標誌住開源 AI Agent 正在進入下一個階段。
第一階段係命令行同開發者工具,大家關心嘅係行唔行到、調唔調到工具、自唔自動執行到任務,佢更加似係 AI 基礎設施。
第二階段係桌面工作枱,大家關心嘅係睇唔睇得清楚佢喺度做緊乜,管唔管理到多個任務,控唔控制到權限,將唔將經驗沉澱落嚟,長唔長期陪伴一個項目。呢個先係逐漸面向最終用戶嘅接口。
Hermes Desktop 目前仍然有啲粗糙,亦都仍然需要用戶理解唔少 AI Agent 基礎概念。但未來已經喺地平線上浮現——下一個操作系統、下一個 Office、下一個瀏覽器,呢種量級嘅應用框架已經有咗雛形。無論最終係咪 Hermes,呢個方向都值得認真關注。
圖片
圖片
最近 Nous Research 正式推出了 Hermes Desktop,也就是 Hermes Agent 的官方桌面版。
部分朋友可能對 Hermes Agent 還比較陌生,我簡單介紹一下背景。前段時間,「小龍蝦」(OpenClaw)這個 AI 個人助理工具火了一陣,Hermes Agent 是類似的助理工具。我當時對比了兩者之後,毫不猶豫選擇了 Hermes,此後再沒用過 OpenClaw。Hermes 的配置和交互更人性化,支持自學習和持久記憶,也兼容多種 IM 工具和 TUI,迭代節奏一直很快。
讓我印象最深的一點是:Hermes 會把完成過的工作沉澱成 skill,下次遇到類似任務時主動複用。用起來更像一個積極主動的團隊成員,而不只是一個工具。

桌面版出現之前,Hermes 的門檻在哪裏

圖片
在桌面版推出之前,Hermes Agent 和小龍蝦一樣,本質上還是一個給技術用戶準備的工具。用戶至少要對 CLI、TUI 有基礎,才能開始配置。配置文件、provider、API key、gateway、toolset、MCP、dashboard,每一項都是單獨的門檻。對喜歡折騰的人來說,這些是高自由度;對普通用戶來說,根本不知道從哪裏下手。
因此,大多數只熟悉圖形界面、習慣點擊「下一步」的用戶,基本上是無緣這類工具的。

不是另一個聊天客戶端

理解 Hermes Desktop,首先要避開一個誤區:它不是獨立做了一個 ChatGPT 或 Codex 的替代品。
Hermes Desktop 用的是同一個 Hermes Agent core。CLI、TUI、Gateway、Desktop 不是幾套割裂的系統,而是同一個 Agent 的不同入口。它們共享配置、API key、session、skill、memory。你可以在命令行裏開啓一個任務,再到桌面版繼續查看;也可以在桌面版配置模型、管理 skill,再回到其他入口繼續用。
嚴格來說,Hermes Desktop 是一個 agent 客戶端,更接近 Codex 而不是 ChatGPT。Agent 會執行一系列動作,在獲得授權後控制瀏覽器或文件系統,最終達成用戶目標。對話 chatbot 只是 agent 的一個子集。

桌面版降低的是操作成本

雖然 Hermes Desktop 的主界面依然以會話為中心,但它不只是給你一個輸入框加一串回答。
左側導航用於管理多個 agent 會話,中間是對話區,可以看到 streaming response 和工具調用過程,右側有 preview rail,可以並排查看網頁、文件和工具輸出。同時內置文件瀏覽器,讓你不用離開 App 就能看到 agent 正在讀寫哪些項目文件。
這類設計看似普通,但對 AI Agent 非常關鍵。Agent 和普通聊天機器人的差別,正是它會「做事」——讀文件、寫文件、搜索網頁、執行腳本、調用工具。如果這些動作全部藏在黑箱裏,用戶很難建立信任;如果每一步都要去看終端日誌,普通用戶又受不了。桌面版把 agent 的工作過程可視化,降低的正是這部分操作成本。
圖片

設置終於不再全靠 YAML 和命令行

我一直覺得,AI Agent 工具要進入日常工作流,最大的門檻不是模型能力,而是配置體驗。
選 provider、配置模型、決定啓用哪些工具、管理 API key、連接 MCP server、設置 gateway——如果這些全部散落在命令行參數和配置文件裏,用戶很快就會放棄。
Hermes Desktop 這次把這些配置都放進了 UI:provider、model、tools、credentials、MCP servers、gateway、session management,都可以在桌面端直接管理。
當然,這並不代表它變成了「下載就能無腦使用」的產品。複雜的配置仍然需要一定的專業背景,必要時還是得手動處理配置文件和命令行——畢竟它們本來就是一體的。但至少門檻從「必須會命令行」降到了「理解系統基本結構即可」。這已經是很大的變化。

Windows 用戶也被照顧到了

這是我很在意的一點。
很多開源 AI Agent 項目,名義上支持跨平台,實際上主要面向 Linux / macOS,Windows 用戶不是被要求裝 WSL,就是在各種依賴裏折騰半天。
我在 Windows 10 上測試了 Hermes Desktop 的原生支持:不需要 WSL、Cygwin 或 Docker,安裝器會自動處理 Python、Node.js、PortableGit、ripgrep、ffmpeg 等依賴,放在用戶目錄下,不需要管理員權限。整體體驗和 macOS 下幾乎一致。
一個 AI agent 工具,如果只在 Linux 服務器上體驗好,它更像是服務器基礎設施;如果能在 Windows 和 macOS 桌面上跑起來,它才有機會成為個人工作流的一部分。Windows 和 macOS 互為競爭對手,是對用戶最好的狀態。一個 agent app 只有覆蓋兩邊,才算完整。
圖片

我真正感興趣的是持久記憶和 skill

現在很多 AI 產品都在講 agent,但大多數實際還是一次性對話:給一個任務,做一次,做完結束。下次還要重新解釋背景、偏好和注意事項。
Hermes Agent 更有意思的地方,是它強調 persistent memory 和自動生成的 skill。它不只是記住聊天記錄,而是把解決問題的方法沉澱成可複用的 skill。
從生產力工具的角度看,這個方向比「一次性更聰明」重要得多。真實工作裏,很多任務不是全新的,而是反覆出現的——整理某類資料、生成某類報告、檢查某類文件、定期做研究、把信息推送到某個渠道。如果 agent 每次都重新理解一遍,本質上還是高級聊天;如果它能把流程固化下來,下次自動套用,它才開始接近一個工作系統。
Hermes Desktop 把 skill、cron、profile、messaging、agents 和 command center 這些管理入口放進桌面端,本質上是把「長期運行的 AI 工作系統」搬到了用戶更容易觸達的位置。
我在 AI 普及之前就有這樣的認識:真正的效率來自歸納。一類事情做多了,會形成工作流;工作流用多了,會沉澱成自動化工具。用現在的視角來看,這就是 agent 的 skill 迭代邏輯。

適合誰用

先潑一點冷水:Hermes Desktop 目前不是面向完全零基礎用戶的產品。
技術門檻之外,更主要的問題是它的能力邊界太寬。Hermes 可以連接不同模型,調用工具,讀寫文件,跑瀏覽器自動化,執行定時任務,接 messaging gateway,連接遠程 backend……
如果日常事務還沒有複雜到需要 AI 介入,或者完全不想歸納自己的工作流,目前的 agent 工具幫不了太多。
我覺得 Hermes Desktop 目前最適合三類人。
第一類,已經在用 Claude Code、Codex、Cursor、OpenHands、OpenWebUI、n8n、MCP 工具的人。他們理解 AI 工具調用和自動化的價值,只是需要一個更完整的 agent 工作台。
第二類,研究型創作者、技術寫作者、獨立顧問、產品研究人員。他們經常需要收集資料、閲讀網頁、整理文件、生成報告、沉澱流程。Hermes 的 memory、skill、定時任務和多入口交互,可能會逐漸成為一套長期積累的個人研究助理。
第三類,有自部署習慣的人。比如願意在本地機器、家用服務器、VPS 或 Tailscale 網絡裏跑自己工具的人,希望數據和流程儘量掌握在自己手裏。Hermes 的整體方向和這類用戶的偏好比較契合。
如果你只是想找一個簡單的問答工具,ChatGPT、豆包、千問這類會更直接。
圖片

最後

Hermes Desktop 的發佈,在某種意義上標誌着開源 AI Agent 正在進入下一個階段。
第一階段是命令行和開發者工具,大家關心的是能不能跑、能不能調工具、能不能自動執行任務,它更像是 AI 基礎設施。
第二階段是桌面工作台,大家關心的是能不能看清楚它在做什麼,能不能管理多個任務,能不能控制權限,能不能把經驗沉澱下來,能不能長期陪伴一個項目。這才是逐漸面向最終用戶的接口。
Hermes Desktop 目前仍然有些粗糙,也仍然需要用戶理解不少 AI Agent 基礎概念。但未來已經在地平線上浮現——下一個操作系統、下一個 Office、下一個瀏覽器,這種量級的應用框架已經有了雛形。無論最終是不是 Hermes,這個方向都值得認真關注。
圖片