我給 Claude Code 做了個 AI 硬件監工
整理版優先睇
用 M5Paper 墨水屏整咗個 Claude Code 硬件監工,支援多會話監控同物理按鍵審批
呢篇文章係作者親身經驗,佢見到 Anthropic 開源咗 claude-desktop-buddy,手頭啱好有塊 M5Paper 墨水屏開發板,就試下移植,結果愈做愈唔同,最後變成全新嘅 M5 Paper Buddy。佢想解決一個實際問題:同時開幾個 Claude Code 窗口嘅時候,終端切來切去好麻煩,唔知邊個窗口等緊審批,而且離開電腦就冇得審批,任務會卡死。佢嘅整體結論係:做一個獨立嘅物理設備,專門用嚟監控 Claude Code 狀態同審批操作,而佢真係做到咗,仲開源咗出嚟。
M5 Paper Buddy 嘅核心功能包括:多會話 Dashboard,喺墨水屏上顯示每個會話嘅上下文用量、模型、項目名同 dirty 檔案數;觸控切換會話,睇到詳細回覆同日誌;物理按鍵審批,全屏顯示審批卡內容(bash 命令、edit diff、write 預覽),按 PUSH 同意、DOWN 拒絕;藍牙遠程控制,離開書桌都可以按掣審批。技術上用 M5Paper V1.1 硬件(ESP32 + 4.7 吋墨水屏 + 觸屏),配合 Python Bridge Daemon 用藍牙通訊,仲支援中文顯示。
作者認為呢個項目本質係「手機小組件嘅物理化」,小組件只能顯示資訊,但物理設備可以有按鍵、觸屏、永遠亮住。佢覺得 AI 下一步唔止係更強模型,仲要有物理世界嘅交互,而模塊化小硬件門檻低到個人開發者都用 AI 幫手搞掂。佢提醒話大公司做硬…
- 結論:M5 Paper Buddy 係一個用 M5Paper 墨水屏做嘅 Claude Code 硬件監工,可以同時監控多個會話同進行物理按鍵審批,解決終端切換同遠程審批問題。
- 方法:作者將 Anthropic 開源項目移植到 M5Paper,重寫通訊協議同 UI,支援藍牙連線同觸控切換。
- 差異:同 Anthropic 官方項目相比,M5 Paper Buddy 支援多會話、物理按鍵審批同藍牙遠程控制,而唔係淨係單會話狀態顯示。
- 啟發:AI 同物理世界交互唔侷限於大硬件,模塊化小硬件(如 M5Stack)門檻低,個人開發者可以用 AI 輔助開發,快速做出實用硬件。
- 可行動點:有 M5Paper 嘅人可以試下用兩條命令安裝(/buddy-install, /buddy-start),體驗物理審批嘅儀式感。
M5 Paper Buddy GitHub
開源硬件項目,用 M5Paper 墨水屏監控 Claude Code 狀態,支援多會話 Dashboard 同物理按鍵審批。
點解要做呢個硬件監工?
Anthropic 開源咗 claude-desktop-buddy,用一塊小屏幕顯示 Claude Code 嘅 Buddy 狀態。作者手頭有塊 M5Paper 墨水屏開發板,諗住移植嚇,點知做着做着變咗第二樣嘢。佢話:「當你同時跑 3-4 個 Claude Code 窗口時,終端切來切去好煩。你唔知邊個窗口喺度跑任務、邊個等你審批、邊個已經閒置咗。」而且 Claude Code 嘅 Permission System 要在終端審批,離開電腦就搞唔掂,除非開自動模式。
終端擅長輸入,唔擅長做「狀態面板」——所以要整一個獨立嘅物理設備。
所以佢想做一個專用硬件,用嚟監控 Claude Code 狀態同審批操作,唔使成日喺終端之間跳來跳去。
M5 Paper Buddy 有咩功能?
呢個設備有幾個殺手功能。首先係多會話 Dashboard,所有 Claude Code 窗口嘅狀態顯示喺墨水屏上面,每個會話顯示上下文使用量(例如 45.8K / 200K)、模型(Opus 4.7)、項目名、分支同 dirty 檔案數。觸屏點擊可以切換關注嘅會話,右邊顯示該會話嘅詳細內容,包括最近回覆同日誌。
例如作者寫 AIGC Weekly 時同時跑 3 個項目,睇一睇就知每個進度同當前狀態。
另外仲有藍牙遠程控制,配對後自動連接。例如你喺梳化睇書,Claude 跑緊測試,突然需要審批一個 bash 命令,墨水屏喺枱面亮起,順手按掣就得。
斷電後墨水屏保持顯示,低功耗可以長開。
同 Anthropic 官方版本有咩分別?
Anthropic 嘅 claude-desktop-buddy 係單會話、只顯示狀態、唔支援審批,主要係得個樣嘅玩具。但 M5 Paper Buddy 支援多會話、觸屏切換、物理按鍵審批、藍牙遠程控制,增強咗工具屬性,仲用盡咗 M5 Paper 嘅大屏幕。
Anthropic 官方項目都用 M5Stack 硬件,但功能就冇咁全面。
硬件同 AI 結合嘅可能性
作者覺得呢個項目本質係「手機小組件嘅物理化」。手機小組件只能顯示資訊,冇得交互——唔可以㩒掣、唔可以語音回覆、唔可以觸屏操作。但如果整成物理設備,就可以有按鍵同觸屏,永遠亮住(墨水屏特性),而且唔依附手機屏幕。
做硬件嘅同做 AI 嘅本來係兩批人,但而家門檻低咗好多。作者以前冇掂過硬件開發,但用 M5Stack 模塊化硬件、AI 輔助讀 datasheet 同寫 driver,再配合深圳供應鏈同 3D 打印,好快就出到 Demo。佢話:「個人開發者可以先做出嚟,大公司仲喺立項階段。」
AI 同物理世界嘅交互,唔應該只得機器人、自動駕駛呢啲「大硬件」,仲有呢類模塊化小硬件。
點樣開始玩?
項目已經開源咗,喺 GitHub 可以揾到。安裝好簡單,只要喺 Claude Code 入面運行兩條命令就得:
/buddy-install
/buddy-start
如果有 M5Paper 硬件,跟住指示配對就可以開始用。作者希望大家試玩,感受嚇物理審批嘅儀式感,同埋呢種「AI 監工」嘅體驗。
開源協議係 GPL-3.0,任何人都可以改同貢獻。
前幾日,Anthropic 開源咗 claude-desktop-buddy,用一塊細屏幕顯示 Claude Code 裏面 Buddy 嘅狀態。
我睇到之後諗:手頭啱好有一塊 M5Paper 墨水屏開發板,可唔可以將呢個項目移植過嚟?
結果做嚇做嚇,佢變成咗一個完全唔同嘅嘢:M5 Paper Buddy (https://github.com/op7418/m5-paper-buddy)。
支援通過呢個墨水屏設備藍牙連接你嘅電腦,監控所有 Claude Code 對話狀態,仲可以快速審批對應嘅操作。

點解要做呢個?
當你同時行緊 3-4 個 Claude Code 視窗時,終端機切嚟切去好煩。
你唔知邊個視窗喺度行緊任務、邊個喺度等你審批、邊個已經閒置咗。
而且 Claude Code 嘅 Permission System 需要你喺終端機裏面進行審批操作(bash 命令、文件編輯等)。
如果你離開電腦,就冇辦法審批,任務就卡住咗,除非你開自動模式。
終端機擅長輸入,唔擅長做"狀態面板"。
所以我想做一個獨立嘅物理設備,專門用嚟監控 Claude Code 嘅狀態、審批操作。

M5 Paper Buddy 做到啲乜?
多會話 Dashboard
所有 Claude Code 視窗嘅狀態顯示喺一個叫做 M5 Paper 嘅墨水屏上面:
每個會話顯示:上下文使用量(45.8K / 200K)、模型(Opus 4.7)、項目名、分支、dirty 文件數。
觸屏點擊可以切換關注嘅會話,右側顯示該會話嘅詳細資訊(最近回覆、活動日誌)。
例如我喺寫 AIGC Weekly 嗰陣,同時行緊 3 個項目。
睇一眼就知道每個嘅進度,同埋佢哋當前嘅狀態。

M5Stack 係一個以模塊化、積木式堆疊設計出名嘅 ESP32 開源物聯網硬件生態,而 M5Paper 就係呢個生態入面一款專為低功耗資訊看板打造嘅觸控墨水屏極客終端。
物理按鍵審批
Claude Code 需要你喺終端機裏面進行審批操作。
全屏顯示審批卡:tool 名 + 項目 + 完整內容(bash 命令原文 / edit 嘅 diff / write 嘅文件預覽)
PUSH 掣同意,DOWN 掣拒絕
審批記錄喺活動日誌裏面留低痕跡
物理按鍵更加有儀式感。
尤其是 rm -rf、git push --force 呢種高風險操作,㩒物理按鍵會令你更加慎重。
而且你可以睇到完整嘅 diff 或命令內容,唔使喺終端機裏面上下翻頁。

藍牙遠程控制
通過藍牙連接電腦,可以離開書枱審批操作。
例如你喺梳化睇緊書,Claude 喺度行緊測試,突然需要審批一個 bash 指令。
墨水屏喺枱上面著咗,拎起嚟㩒一下掣就得。
配對後自動連接,斷電保持狀態。
技術實現
硬件:M5Paper V1.1(ESP32 + 4.7 吋墨水屏 + 3 個物理按鍵 + GT911 電容觸屏)
架構:Claude Code → Bridge Daemon(Python)→ M5Paper(藍牙/USB)
協議:JSON 行分隔,向後兼容
中文支援:3.4MB TTF 字體,專門寫咗 codepoint-aware 嘅 wrapText

呢個同 Anthropic 項目嘅分別
Anthropic 嘅 claude-desktop-buddy 係單會話、只係顯示狀態、唔支援審批。
主要用嚟顯示 Buddy 嘅狀態,係一個好玩嘅玩具。
M5 Paper Buddy 支援多會話、觸屏切換、物理按鍵審批、藍牙遠程控制。
增強咗工具屬性,而且利用咗 M5 Paper 設備嘅大屏幕。
Anthropic 官方項目用嘅都係 M5Stack 硬件。
開源協議、開源代碼,成日敵視國內涉及到硬件仲要用國內生態。

手機小組件嘅「物理化」
呢個項目本質上係「手機小組件嘅物理化」。
手機小組件只能「顯示資訊」,唔能夠「互動」。
你唔可以喺小組件上面㩒掣、唔可以用語音回覆、唔可以做觸屏操作。
如果將佢做成物理設備:
可以有按鍵同觸屏
「永遠著住」(墨水屏唔耗電,斷電保持顯示)
唔依賴手機屏幕,但係同手機/電腦嘅 AI Agent 保持連接
形態可以好多樣:磁吸喺手機背面、掛喺背囊上面(好似掛件)、放喺枱上面(好似桌面陪伴)
而家嘅 M5 Paper Buddy 係墨水屏加物理按鍵,但呢個只係第一步。
真正嘅「陪伴」應該係:無論你喺邊度,佢都可以主動話俾你知資訊,然後你再回覆。
唔需要你睇實屏幕,唔需要你行到設備前面。
語音互動會係下一步。
但係物理按鍵同語音唔係替代關係,而係互補:
喺書枱前面,你需要睇屏幕、㩒掣(尤其是高風險操作)
離開書枱,你需要語音播報、語音回覆

做呢個項目嘅過程入面,我發現咗一啲有意思嘅事
其實呢啲技術都唔新。
墨水屏、藍牙、觸摸屏都係成熟技術,M5Stack、Arduino 呢種模塊化硬件亦都一早就有咗。
但點解以前冇人做呢種嘢?
我覺得係因為做硬件嘅同做 AI 嘅係兩批人。
做硬件嘅(蘋果、三星)關心點樣賣更多手機,唔關心「AI Agent 狀態監控」。
做 AI 嘅(OpenAI、Anthropic)關心模型能力,唔關心硬件形態。
但而家唔同咗。
我做呢個項目嘅時候,幾乎冇掂過硬件開發。
以前做硬件需要識電路設計、畫 PCB、讀幾百頁嘅 datasheet。
而家 M5Stack 買返嚟就用得,官方提供完整嘅庫同示例代碼。
遇到問題,AI 可以幫你讀 datasheet、寫驅動、除錯代碼。
更加重要嘅係深圳供應鏈。快速打樣(1-2 星期)、小批量量產、成本低(M5Paper ¥500)。
做 AI 嘅人可以好快出一個 Demo,去同做硬件嘅人溝通交流。
再加上 3D 打印,你可以做出好精緻嘅外殼。
社區有大量開源模型(Thingiverse、Printables)。
所以而家做 AI 嘅人可以做硬件喇。
個人開發者可以先做出嚟,大公司仲喺度立項。

前幾日 OpenClaw(龍蝦)好紅
我覺得有幾個原因:開源(所有人都可以改)、可玩性(唔只係「有用」,而係「好玩」)、低門檻(模塊化 + AI 輔助開發)。
M5 Paper Buddy 都係呢個思路:開源(GPL-3.0)、可玩性(桌面陪伴、物理審批嘅儀式感)、低門檻(兩條命令:/buddy-install + /buddy-start)。
AI 同物理世界嘅互動,唔應該得返機械人、自動駕駛呢種「大硬件」。
呢種模塊化嘅細硬件,門檻低好多,可玩性都強。再搭配 3D 打印,會有唔少玩法。
大公司肯定會做呢種嘢
但大公司慢。做硬件需要供應鏈、認證、渠道,從立項到上市至少 1-2 年。
以前佢哋冇做,可能係因為比較遲鈍,而且做硬件同做 AI 嘅係兩批人。
所以而家有段窗口期。個人開發者可以先做出嚟,開源社區可以先驗證概念。
等大公司做出嚟,社區已經有成熟方案喇。

物理化嘅 AI 觸點
我覺得 AI 嘅下一步唔只係更強嘅模型,仲有物理世界嘅互動。
唔只係機械人、自動駕駛呢種「大硬件」,仲包括桌面細設備、可穿戴設備、手機配件呢種「細硬件」。
M5 Paper Buddy 係一個例子。將 AI 嘅狀態同決策「物理化」,令手機小組件從屏幕裏面走出來。
你嘅枱上面可能有一個「AI 監工」(墨水屏 + 按鍵)。
你嘅手機背面可能有一個「AI 小組件」(磁吸 + 觸屏)。
你嘅背囊上面可能有一個「AI 掛件」(語音 + 震動)。
呢啲可能都唔係大公司嘅產品,而係開源社區嘅創作。

GitHub 地址:https://github.com/op7418/m5-paper-buddy
安裝方式:
如果你覺得呢次嘅內容對你有幫助,可以幫我點個讚或者轉發俾需要嘅朋友。
✦
前幾天,Anthropic 開源了 claude-desktop-buddy,用一塊小屏幕顯示 Claude Code 裏 Buddy 的狀態。
我看到後想:手頭剛好有一塊 M5Paper 墨水屏開發板,能不能把這個項目遷移過來?
結果做着做着,它變成了一個完全不同的東西:M5 Paper Buddy (https://github.com/op7418/m5-paper-buddy)。
支持通過這個墨水屏設備藍牙連接你的電腦,監控所有 Cluade Code 對話狀態,還能快速審批對應的操作。

為什麼要做這個?
當你同時跑 3-4 個 Claude Code 窗口時,終端切來切去很煩。
你不知道哪個窗口在跑任務、哪個在等你審批、哪個已經閒置了。
而且 Claude Code 的 Permission System 需要你在終端裏進行審批操作(bash 命令、文件編輯等)。
如果你離開電腦,就沒法審批,任務就卡住了,除非你開自動模式。
終端擅長輸入,不擅長當"狀態面板"。
所以我想做一個獨立的物理設備,專門用來監控 Claude Code 的狀態、審批操作。

M5 Paper Buddy 能做什麼?
多會話 Dashboard
所有 Claude Code 窗口的狀態顯示在一個一個叫 M5 Paper 的墨水屏上:
每個會話顯示:上下文使用量(45.8K / 200K)、模型(Opus 4.7)、項目名、分支、dirty 文件數。
觸屏點擊可以切換關注的會話,右側顯示該會話的詳細信息(最近回覆、活動日誌)。
比如我在寫 AIGC Weekly 時,同時跑 3 個項目。
看一眼就知道每個的進度,以及他們當前的狀態。

M5Stack 是一個以模塊化、積木式堆疊設計聞名的 ESP32 開源物聯網硬件生態,而 M5Paper 則是該生態中一款專為低功耗信息看板打造的觸控墨水屏極客終端。
物理按鍵審批
Claude Code 需要你在終端裏進行審批操作。
全屏顯示審批卡:tool 名 + 項目 + 完整內容(bash 命令原文 / edit 的 diff / write 的文件預覽)
PUSH 按鈕同意,DOWN 按鈕拒絕
審批記錄在活動日誌裏留痕
物理按鍵更有儀式感。
尤其是 rm -rf、git push --force 這種高風險操作,按物理按鈕會讓你更慎重。
而且你可以看到完整的 diff 或命令內容,不用在終端裏上下翻頁。

藍牙遠程控制
通過藍牙連接電腦,可以離開書桌審批操作。
比如你在沙發上看書,Claude 在跑測試,突然需要審批一個 bash 命令。
墨水屏在桌上亮了,拿起來按一下按鈕就行。
配對後自動連接,斷電保持狀態。
技術實現
硬件:M5Paper V1.1(ESP32 + 4.7 寸墨水屏 + 3 個物理按鍵 + GT911 電容觸屏)
架構:Claude Code → Bridge Daemon(Python)→ M5Paper(藍牙/USB)
協議:JSON 行分隔,向後兼容
中文支持:3.4MB TTF 字體,專門寫了 codepoint-aware 的 wrapText

這個和 Anthropic 項目的區別
Anthropic 的 claude-desktop-buddy 是單會話、只顯示狀態、不支持審批。
主要用來顯示 Buddy 的狀態,是個好玩的玩具。
M5 Paper Buddy 支持多會話、觸屏切換、物理按鍵審批、藍牙遠程控制。
增強了工具屬性,而且利用了 M5 Paper 設備的大屏幕。
Anthropic 官方項目用的也是 M5Stack 硬件。
開源協議、開源代碼,天天敵視國內涉及到硬件還得用國內生態。

手機小組件的"物理化"
這個項目本質上是"手機小組件的物理化"。
手機小組件只能"顯示信息",不能"交互"。
你不能在小組件上按按鈕、不能語音回覆、不能觸屏操作。
如果把它做成物理設備:
可以有按鍵和觸屏
"永遠亮着"(墨水屏不耗電,斷電保持顯示)
不依賴手機屏幕,但和手機/電腦的 AI Agent 保持連接
形態可以很多樣:磁吸在手機背面、掛在揹包上(像掛件)、放在桌上(像桌面陪伴)
現在的 M5 Paper Buddy 是墨水屏 + 物理按鍵,但這只是第一步。
真正的"陪伴"應該是:無論你在哪裏,它都能主動告訴你信息,然後你再回復。
不需要你盯着屏幕,不需要你走到設備前。
語音交互會是下一步。
但物理按鍵和語音不是替代關係,而是互補:
在書桌前,你需要看屏幕、按按鈕(尤其是高風險操作)
離開書桌,你需要語音播報、語音回覆

做這個項目的過程中,我發現了一些有意思的事
其實這些技術都不新。
墨水屏、藍牙、觸摸屏都是成熟技術,M5Stack、Arduino 這種模塊化硬件也早就有了。
但為什麼以前沒人做這種東西?
我覺得是因為做硬件的和做 AI 的是兩撥人。
做硬件的(蘋果、三星)關心怎麼賣更多手機,不關心"AI Agent 狀態監控"。
做 AI 的(OpenAI、Anthropic)關心模型能力,不關心硬件形態。
但現在不一樣了。
我做這個項目的時候,幾乎沒碰過硬件開發。
以前做硬件需要懂電路設計、畫 PCB、讀幾百頁的 datasheet。
現在 M5Stack 買回來就能用,官方提供完整的庫和示例代碼。
遇到問題,AI 可以幫你讀 datasheet、寫驅動、調試代碼。
更重要的是深圳供應鏈。快速打樣(1-2 周)、小批量量產、成本低(M5Paper ¥500)。
做 AI 的人可以很快出一個 Demo,去跟做硬件的人溝通交流。
再加上 3D 打印,你可以做出很精緻的外殼。
社區有大量開源模型(Thingiverse、Printables)。
所以現在做 AI 的人可以做硬件了。
個人開發者可以先做出來,大公司還在立項。

前幾天 OpenClaw(龍蝦)火了
我覺得有幾個原因:開源(所有人都能改)、可玩性(不只是"有用",而是"好玩")、低門檻(模塊化 + AI 輔助開發)。
M5 Paper Buddy 也是這個思路:開源(GPL-3.0)、可玩性(桌面陪伴、物理審批的儀式感)、低門檻(兩條命令:/buddy-install + /buddy-start)。
AI 和物理世界的交互,不應該只有機器人、自動駕駛這種"大硬件"。
這種模塊化的小硬件,門檻低得多,可玩性也強。再搭配 3D 打印,會有不少玩法。
大公司肯定會做這種東西
但大公司慢。做硬件需要供應鏈、認證、渠道,從立項到上市至少 1-2 年。
以前他們沒做,可能是因為比較遲鈍,而且做硬件和做 AI 的是兩撥人。
所以現在有個窗口期。個人開發者可以先做出來,開源社區可以先驗證概念。
等大公司做出來,社區已經有成熟方案了。

物理化的 AI 觸點
我覺得 AI 的下一步不只是更強的模型,還有物理世界的交互。
不只是機器人、自動駕駛這種"大硬件",也包括桌面小設備、可穿戴設備、手機配件這種"小硬件"。
M5 Paper Buddy 是一個例子。把 AI 的狀態和決策"物理化",讓手機小組件從屏幕裏走出來。
你的桌上可能有一個"AI 監工"(墨水屏 + 按鍵)。
你的手機背面可能有一個"AI 小組件"(磁吸 + 觸屏)。
你的揹包上可能有一個"AI 掛件"(語音 + 震動)。
這些可能都不是大公司的產品,而是開源社區的創作。

GitHub 地址:https://github.com/op7418/m5-paper-buddy
安裝方式:
如果你覺得這次的內容對你有幫助,可以幫我點個贊或者轉發給需要的朋友。
✦