Codex 做產品的正確姿勢: 一套在Hermes跑的多 Agent 工作流

作者:蝦哥AI
日期:2026年6月6日 上午7:33
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

Codex放入多Agent工作流,先拆流程再談工具,先定角色再寫代碼——12個Agent組成產品流水線先係做產品嘅正確姿勢。

整理版摘要

呢篇文章係作者由實際經驗出發,反思好多用戶仲係將Codex當成高級程序員,淨係叫佢寫code、改bug、做PR Review。作者認為真正用Codex做產品嘅合理方式,唔係畀一個Agent由頭做到尾,而係放入一條多Agent生產線,例如Hermes Kanban呢種持久化任務板。

文章引用OpenAI官方文檔同Hermes Agent Docs,指出Codex擅長嘅係將清楚嘅產品方案快速推進到可驗證狀態,而唔係替你想一個偉大產品。整體結論係:Codex執行力 + Hermes協作結構 + 人做判斷,三者結合先係可持續嘅產品系統;未來用AI做產品嘅人會分成兩種,一種只係用Codex提高效率,另一種會組織Agent團隊跑完整條產品流程,後者嘅門檻會大幅下降。

  • Codex做產品唔應該由單一Agent由頭做到尾,而係要拆成多個角色分工嘅工作流。
  • Hermes Kanban提供持久化任務板,讓Agent可以交接、恢復、追蹤,避免上下文丟失。
  • 12個Agent包括市場研究、競品分析、網站復刻、產品經理、UX、UI、前端、後端、數據、測試、增長文案、部署覆盤,各司其職。
  • 多Agent流程最適合MVP驗證、內部工具、SaaS小功能等第一版唔需要完美、但需要快出嘅產品。
  • 人依然重要:定義問題、選擇方向、設定邊界、判斷結果;Agent流程唔係代替管理,而係用更強流程管理AI。
值得記低
連結

Codex for every role, tool, and workflow

OpenAI官方文檔,介紹Codex喺唔同角色同工作流嘅應用。

連結

Hermes Agent Docs: Kanban Multi-Agent Board

Hermes Kanban多Agent任務板嘅官方文檔,說明持久化任務、角色分工同交接機制。

連結

Hermes Agent Docs: Kanban Tutorial

Hermes Kanban嘅實際操作教程。

整理重點

問題:Codex做產品唔係佢更識寫code,而係佢可以入生產線

好多人仲係將Codex當成更強嘅程序員:叫佢寫code、修bug、改頁面、做PR Review。呢個當然冇問題,但如果你真係想用Codex做一個產品,更合理嘅方式係放佢入一套多Agent工作流,例如Hermes Kanban呢種模式。

產品唔係被「寫出來」嘅,而係被一輪一輪推進出來嘅

一個產品任務入嚟,唔係一個Agent揼埋頭寫曬,而係拆畀12個Agent:有人做調研、有人拆需求、有人寫PRD、有人復刻競品網站、有人做前端、有人寫接口、有人測Bug、有人寫文案、有人做部署、有人覆盤。

Codex真正開始似產品團隊,唔係因為佢更識寫code,而係因為佢能被放進一條產品生產線

整理重點

點解單Agent做產品好易變「漂亮廢品」?

而家好多人用AI做產品,最常見嘅方式係打開Codex,輸入一句話:「幫我做一個某某網站」,然後等佢生成code。有時效果確係幾驚豔,頁面跑到、樣式唔錯、仲有少少交互。

但呢種方式好易產出「漂亮廢品

呢類產品冇經過需求判斷、冇做用戶拆解、冇諗清楚第一版邊界、冇考慮數據結構、冇想後續維護、冇測試異常流程、冇考慮真實用戶點用。發朋友圈可以,畀客戶用就好危險。

所以我更鍾意多Agent工作流,因為佢天然會將產品拆成唔同角色,每個Agent只盯自己嗰段,更加似一個真實團隊。

整理重點

Hermes Kanban點樣令多Agent協作變得更實在?

Hermes Kanban最得意嘅地方唔係又多一個看板,而係佢將多Agent協作變得更加似一個真實工作系統。官方文檔話,Hermes Kanban係一個持久化任務板,任務會寫入本地SQLite數據庫,每個Agent都可以認領任務,每個handoff都可以被其他Agent讀取同寫入,每個worker都係獨立OS進程,有自己的身份、工具同上下文。

呢個同傳統「子Agent」好唔同

傳統子Agent經常似臨時分身,主Agent分出去一個任務,子Agent做完返嚟,中間過程好易丟、崩咗難恢復、上下文一壓縮好多細節就冇咗。Hermes Kanban更像一個多人項目管理系統:任務喺嗰度、狀態喺嗰度、交接喺嗰度、邊個做咗啲咩亦喺嗰度。

產品係一串長任務,今日做調研、聽日改PRD、後日做頁面、再後日測Bug,中間任何一步都可能中斷

如果冇一個持久化任務板,Agent協作就會變得好脆。多Agent真正有用嘅前提,唔係Agent數量多,而係佢哋有一個能交接、能恢復、能追蹤嘅工作台。

整理重點

12個Agent應該點樣分工?一個產品實例

假設我哋要做一個產品,例如復刻一個競品網站並做出自己嘅MVP。唔好諗得太大,就做一個能演示、能測試、能收集反饋嘅初版。我會拆成12個Agent:

  1. 1 市場研究Agent:搞清楚賽道、目標用戶、需求係咪剛需、有冇替代方案。
  2. 2 競品分析Agent:睇同類產品嘅頁面結構、核心功能、收費模式、註冊流程、用戶路徑。
  3. 3 網站復刻Agent:將目標網站拆成頁面結構同交互邏輯,唔係抄品牌同素材,而係學習產品結構。
  4. 4 產品經理Agent:將調研同競品結果變成MVP範圍,定義第一版做咩唔做咩、用戶路徑、核心閉環、驗收標準。
  5. 5 UX Agent:畫清楚用戶流程、引導、錯誤狀態、空狀態。
  6. 6 UI Agent:制定統一界面規範——字體、間距、按鈕、卡片、顏色、佈局、組件狀態。
  7. 7 前端Agent:用ReactNext.js將頁面實現,重點係產品能睇、能㩒、能走流程。
  8. 8 後端Agent:設計接口同數據結構——用戶表、項目表、任務表、權限、狀態、日誌、基礎API

呢12個Agent跑落嚟,先似一條產品生產線。一個人用Codex寫code叫提效,一組Agent跑完產品流程先叫生產方式變化。

復刻結構嘅過程本質上係逆向學習

好多人都想創新,但連成熟產品點解咁設計都未睇明。用Agent去拆頁面、路徑、組件、文案、信息層級、轉化邏輯,然後再做自己版本,咁樣比憑感覺做產品靠譜得多。

整理重點

人嘅位置同風險:Agent加速,但判斷依然要靠人

Codex嘅優勢唔係替你諗偉大產品,而係將清楚嘅產品方案快速推進到可驗證狀態。你畀佢混亂,佢就產出混亂;你畀佢結構,佢就能幫你推進。

呢套流程都有風險:目標唔清楚Agent越多越亂、上下文污染(前一個Agent判斷錯咗後續繼承)、過度生成(AI好擅長令嘢睇落好完整,但早期最需要剋制)、冇人驗收、版權同合規問題。

Agent流程唔係讓你放棄管理,而係要求你用更強嘅流程去管理AI

冇流程,多Agent只會變成多線程胡說;有流程,佢先可能變成生產線。未來用AI做產品會分成兩種人:一種只將Codex當高級代碼生成器,另一種將Codex放入流程,組織Agent團隊跑完整條產品流水線。後者會擁有一支更平、更快、更聽指揮嘅虛擬團隊。

圖片

Codex 做產品嘅正確姿勢:一套喺Hermes行嘅多Agent工作流

蝦哥導讀好多人而家用Codex,都仲係當佢做一個更勁嘅程序員。叫佢寫Code、改Bug、改頁面、做PR Review。呢啲當然冇問題。但係如果你真係想用Codex做一個產品,我覺得更合理嘅做法唔係畀一個Agent由頭做到尾。而係將佢擺入一套多Agent工作流程裏面。好似Hermes Kanban呢種模式。一個產品任務入嚟之後,唔係一個Agent死衝爛衝寫完。而係拆畀12個Agent。有人做調研、有人拆需求、有人寫PRD、有人復刻競爭對手網站、有人做前端、有人寫接口、有人測Bug、有人寫文案、有人做部署、有人做覆盤。Codex真正開始似產品團隊,唔係因為佢更識寫Code,而係因為佢可以被放進一條產品生產線。呢件事好重要。因為以前我哋話「AI做產品」,聽落總係似玄學。但如果拆做一套流程,佢突然間就變得好現實。

做產品,唔係寫一段Code

好多人會將「AI做產品」理解成:

我畀Codex一個諗法。

佢直接生成一個產品。

最好仲可以上線。

最好仲可以賺錢。

咁樣當然好吸引。

但現實入面,產品唔係咁樣做出嚟嘅。

一個產品由諗法到上線,中間有好多環節。

你要知道用戶係邊個。

你要知道痛點係咪真係存在。

你要睇競爭對手點樣做。

你要拆第一版功能。

你要判斷邊啲功能做先,邊啲功能做後。

你要畫頁面。

你要寫文案。

你要做前端。

你要做後端。

你要接數據庫。

你要測試。

你要部署。

你要收集反饋。

你要疊代。

呢啲嘢加埋先叫做產品。

寫Code只係其中一環。

而且有時仲唔係最難嗰一環。

真正難嘅,係將一個模糊諗法變成一條行得通嘅生產流程。

產品唔係被「寫出來」嘅,而係一輪一輪推出來嘅。

呢個就係點解我覺得,Codex做產品唔可以只睇佢識唔識寫Code。

要睇佢能唔能夠進入成個產品工作流。

一個Agent由頭做到尾,好易變成「靚嘅廢物」

而家好多人用AI做產品,最常見嘅方式係:

打開Codex。

輸入一句話:

幫我做一個某某網站。

然後等佢生成Code。

有時效果確實幾驚豔。

頁面行到。

樣式都仲可以。

甚至帶少少交互。

但問題係,呢種方式好易產出「靚嘅廢物」。

睇落似個產品。

其實冇經過需求判斷。

冇做用戶拆解。

冇諗清楚第一版邊界。

冇考慮數據結構。

冇諗後續維護。

冇測試異常流程。

冇考慮真實用戶點樣用。

呢啲嘢出Post就OK。

拎畀客用,就好危險。

因為產品最怕嘅唔係頁面樣衰。

而係方向錯咗。

你做咗一個好完整嘅嘢,但係佢解決嘅問題根本唔重要。

你做咗一個睇落好靚嘅頁面,但係用戶根本唔會㩒。

你做咗好多功能,但係第一版其實只需要一個核心動作。

一個Agent太容易順住你個諗法向前行,但係產品真正需要嘅係不斷停低判斷。

所以我更鍾意多Agent工作流。

因為佢天然會將產品拆成唔同角色。

調研Agent唔負責寫Code。

產品Agent唔負責部署。

測試Agent唔負責讚個頁面靚。

每個Agent只係睇住自己嗰段。

咁樣更似一個真實團隊。

Hermes Kanban嘅意義,係令Agent唔再逼埋喺一個腦袋入面

Hermes Kanban呢樣嘢,最得意嘅地方唔係「又多咗一個看板」。

而係佢將多Agent協作變得更似一個真實工作系統。

官方文檔入面話,Hermes Kanban係一個持久化任務板。

任務會寫入本地SQLite數據庫。

每個Agent都可以認領任務。

每次handoff都可以畀其他Agent讀取同寫入。

每個worker都係獨立OS進程,有自己的身份、工具同上文下理。

呢個同好多「子Agent」唔一樣。

傳統子Agent成日似臨時分身。

主Agent分配一個任務出去。

子Agent做完返嚟。

中間過程好易唔見咗。

死咗好難恢復。

上文下理一壓縮,好多細節就冇咗。

Hermes Kanban更似一個多人項目管理系統。

任務喺果度。

狀態喺果度。

交接喺果度。

邊個做咗啲咩,都喺果度。

呢樣嘢對做產品好重要。

因為產品唔係一次性問答。

佢係一串長任務。

今日做調研。

聽日改PRD。

後日做頁面。

再後日測Bug。

中間任何一步都可能中斷。

如果冇一個持久化任務板,Agent協作就會變得好脆。

多Agent真正有用嘅前提,唔係Agent數量多,而係佢哋有一個可以交接、可以恢復、可以追蹤嘅工作枱。

Hermes Kanban提供嘅就係呢個工作枱。

用12個Agent做一個產品,應該點樣拆?

假設我哋要做一個產品。

比如:

復刻一個競爭對手網站,並做出自己嘅MVP。

唔好諗得太大。

就做一個可以演示、可以測試、可以收集反饋嘅初版。

我會將佢拆成12個Agent。

第一個,市場研究Agent。

佢負責搞清楚呢個產品所屬嘅賽道。

目標用戶係邊個。

用戶點解需要佢。

呢個需求係咪剛需。

有冇替代方案。

用戶而家點樣解決。

佢唔寫Code。

佢只負責回答:

呢樣嘢值唔值得做?

第二個,競爭對手分析Agent。

佢負責睇同類產品。

頁面結構係點。

核心功能係乜。

收費模式係點。

註冊流程點行。

用戶第一次入嚟見到啲乜。

邊啲地方做得好。

邊啲地方可以抄,邊啲地方唔可以抄。

第三個,網站復刻Agent。

佢負責將目標網站拆成頁面結構。

首頁。

登錄頁。

Dashboard。

功能頁。

價格頁。

幫助頁。

每個頁面有邊啲模塊。

每個模塊嘅文案、佈局、按鈕、狀態係乜。

呢度講嘅復刻,唔係抄襲品牌同素材。

而係復刻產品結構同交互邏輯。

第四個,產品經理Agent。

佢負責將調研同競爭對手結果變成MVP範圍。

第一版做啲乜。

唔做啲乜。

用戶路徑點行。

核心功能閉環係乜。

驗收標準係乜。

第五個,UX Agent。

佢負責將流程畫清楚。

用戶從邊度進入。

第一步做啲乜。

邊度需要引導。

邊度可能會卡住。

錯誤狀態點樣提示。

空狀態點樣處理。

第六個,UI Agent。

佢負責頁面視覺。

唔係做藝術創作。

而係做一套統一嘅界面規範。

字體。

間距。

按鈕。

卡片。

顏色。

佈局。

組件狀態。

第七個,前端Agent。

佢負責將頁面做出嚟。

React、Next.js、Vue都得。

重點係先令產品睇到、㩒到、行到流程。

第八個,後端Agent。

佢負責接口同數據結構。

用戶表。

項目表。

任務表。

權限。

狀態。

日誌。

基礎API。

第九個,數據Agent。

佢負責埋點同指標。

用戶有冇完成核心動作。

由邊個步驟流失。

邊啲按鈕冇人㩒。

邊啲頁面停留時間長。

MVP上線之後,唔睇數據就等於盲目揸車。

第十個,測試Agent。

佢負責揾問題。

正常流程行唔行得通?

異常流程會唔會炒?

空數據點算?

重複提交點算?

接口失敗點算?

手機版用唔用到?

第十一個,增長文案Agent。

佢負責寫Landing Page文案、按鈕文案、引導文案、用戶電郵、發佈Post。

好多產品唔係功能唔得。

而係用戶根本睇唔明你喺度解決緊啲乜。

第十二個,部署同覆盤Agent。

佢負責部署、生成README、記錄變更、整理已知問題、畀出下一輪疊代建議。

呢12個Agent行曬,先似一條產品生產線。

一個人用Codex寫Code,叫提升效率;一組Agent行完產品流程,先叫生產方式轉變。

復刻網站,唔係為咗抄,而係為咗學習產品結構

呢度要講清楚。

我話「12個Agent復刻網站」,唔係叫你去抄人哋嘅品牌、代碼、素材同商業表達。

咁樣好危險。

真正有價值嘅係復刻結構。

即係拆清楚一個成熟產品係點樣組織頁面同流程。

點解首頁第一屏咁樣寫?

點解註冊流程咁短?

點解pricing頁面咁樣排?

點解dashboard先展示呢個指標?

點解onboarding只問三個問題?

點解某個按鈕放喺呢度?

呢啲先係產品學習嘅價值。

好多人做產品,一嚟就想創新。

但係其實你連成熟產品點解咁設計都未睇明。

復刻結構嘅過程,本質上係逆向學習。

用Agent去拆。

拆頁面。

拆路徑。

拆組件。

拆文案。

拆信息層級。

拆轉化邏輯。

然後再做自己嘅版本。

好嘅復刻唔係照搬,而係將人哋嘅產品邏輯拆開,再重組到自己嘅場景入面。

呢個過程好適合多Agent。

因為唔同Agent可以睇住唔同層級。

一個睇商業模式。

一個睇頁面結構。

一個睇交互路徑。

一個睇技術實現。

一個睇文案表達。

一個睇數據指標。

最後匯總成自己嘅MVP方案。

呢個比起一個人憑感覺做產品可靠得多。

Codex喺呢度最適合做啲乜?

Codex嘅優勢,唔係幫你做曬所有產品判斷。

而係佢可以將判斷之後嘅嘢快速變成可執行結果。

例如產品經理Agent定咗MVP範圍。

Codex可以將佢轉成任務列表。

UX Agent寫咗用戶流程。

Codex可以將佢轉成頁面路由。

UI Agent畀咗組件規範。

Codex可以生成組件庫。

前端Agent負責實現頁面。

Codex可以直接寫Code。

測試Agent提咗Bug。

Codex可以改。

數據Agent提咗埋點方案。

Codex可以加事件。

文案Agent畀咗Landing Page文案。

Codex可以將文案填入頁面。

部署Agent需要README。

Codex可以整理安裝、執行、部署說明。

呢個就係佢嘅價值。

佢將好多「從方案到產物」嘅中間環節壓縮咗。

以前一個產品經理寫完PRD,仲要等設計。

設計完仲要等開發。

開發完仲要等測試。

測試完仲要等修復。

而家唔一定完全唔使人。

但第一版可以更快出到。

**Codex最適合嘅唔係幫你想一個偉大產品,而係將一個清楚嘅產品方案快速推進到可驗證狀態。**

呢句好關鍵。

你畀佢混亂,佢就產出混亂。

你畀佢結構,佢就可以幫你推進。

一套流程行落嚟,真正產出啲乜?

用12個Agent做一個產品,最後唔應該得一堆Code。

應該得到一整套產品資產。

第一,調研摘要。

呢個產品點解值得做。

目標用戶係邊個。

痛點係乜。

競爭對手點樣解決。

第二,競爭對手拆解。

競爭對手頁面結構。

核心流程。

收費模式。

用戶路徑。

可學習點。

第三,MVP定義。

第一版做啲乜。

唔做啲乜。

核心閉環係乜。

驗收標準係乜。

第四,信息架構。

有邊啲頁面。

頁面之間點樣跳轉。

用戶由進入到完成任務點行。

第五,UI原型。

頁面係點樣。

組件點樣組織。

主要狀態有邊啲。

第六,前後端Code。

行得鬱。

㩒得入。

行到核心流程。

第七,測試報告。

邊啲流程通過。

邊啲Bug存在。

邊啲地方風險高。

第八,埋點方案。

上線之後睇邊啲指標。

點樣判斷用戶係咪用緊。

第九,發佈文案。

點樣介紹。

點樣發畀第一批用戶。

點樣收集反饋。

第十,疊代建議。

下一輪應該改啲乜。

邊啲功能應該斬。

邊啲地方要補返。

呢啲先叫「做產品」。

唔係淨係叫AI幫你生成一個靚首頁。

而係叫AI幫你將產品由諗法推進到一套可評審資產。

真正有價值嘅AI產品流程,唔係生成一個頁面,而係生成一整套可驗證嘅產品證據。

呢個亦係多Agent嘅意義。

每個Agent產出一塊證據。

最後拼成產品判斷。

點解唔用一個超級Agent?

好多人會問:

點解要12個Agent?

一個勁Agent唔得咩?

能做。

但係唔一定穩定。

因為一個Agent做曬所有嘢,好易角色混亂。

佢一邊做市場判斷,一邊寫Code。

一邊讚自己個頁面,一邊負責測試。

一邊定義需求,一邊又偷偷擴大範圍。

呢個就好似叫一個人同時做老細、產品、設計、開發、測試、營運。

唔係做唔到。

但好易自High。

多Agent嘅好處,係將角色分開。

產品Agent可以話:

呢個功能唔喺MVP範圍入面。

測試Agent可以話:

呢個流程行唔通。

增長Agent可以話:

呢個文案用戶睇唔明。

數據Agent可以話:

呢個指標冇辦法驗證。

部署Agent可以話:

呢個項目冇執行說明。

呢啲「互相挑刺」嘅過程,先似真實團隊。

做產品最需要嘅唔係一個永遠順住你講嘅AI,而係一組會由唔同角度拆你方案嘅Agent。

呢個亦都係Hermes Kanban呢種任務板有價值嘅地方。

佢令唔同Agent嘅產出可以留痕。

可以交接。

可以被下一個Agent接住用。

唔係所有嘢都混埋喺同一個上文下理入面。

產品經理喺呢套流程入面仲重要嗎?

重要。

而且更加重要。

只係工作變咗。

以前產品經理花好多時間寫文檔、追進度、整理會議記錄、反覆解釋需求。

以後呢啲工作會被壓縮。

但係產品經理要做更難嘅嘢。

定義問題。

選擇方向。

設定邊界。

決定MVP範圍。

判斷用戶反饋。

決定唔做啲乜。

協調Agent之間嘅衝突。

驗收最終結果。

例如市場研究Agent話,呢個方向有機會。

競爭對手分析Agent話,競爭對手已經做得好成熟。

產品Agent話,第一版只做一個核心功能。

增長Agent話,賣點應該再狠啲。

測試Agent話,而家版本唔穩定,唔可以發佈。

呢個時候邊個拍板?

都係人。

AI可以提供證據。

但產品判斷要人嚟做。

AI可以將產品流程行得快啲,但唔可以幫你承擔產品選擇嘅責任。

呢個就係產品經理嘅新位置。

唔係每一步都親手做。

而係設計流程、組織上文下理、判斷結果。

產品經理會由「文檔生產者」,變成「AI產品團隊嘅導演」。

呢套方法最適合邊啲產品?

唔係所有產品都適合咁做。

如果你做嘅係晶片、醫療、金融核心系統、自動駕駛,呢類高風險產品,AI生成嘅嘢一定要好小心。

但如果你做嘅係下面呢啲類型,就好啱用Codex + Hermes行一次:

內部工具。

SaaS小功能。

管理後台。

數據看板。

營銷Landing Page。

競爭對手復刻學習。

MVP驗證。

個人工具。

工作流自動化。

營運輔助系統。

AI應用Demo。

呢啲產品有一個共通點:

第一版唔需要完美。

但係要盡快見到。

盡快試用。

盡快暴露問題。

盡快收集反饋。

呢個正係多Agent流程擅長嘅地方。

佢可以令你由「我有一個諗法」,更快去到「我有一個可以演示嘅嘢」。

越係早期驗證型產品,越適合用Agent流程加速。

因為早期最怕嘅唔係做得唔夠精緻。

而係一直停喺諗法入面。

呢套流程都有風險

當然,唔可以神化佢。

12個Agent行產品,唔代表一定做到好產品。

佢都有好多風險。

第一個風險,係目標唔清楚。

目標唔清楚,Agent越多,行得越亂。

第二個風險,係上文下理污染。

一個Agent前面判斷錯咗,後面Agent可能會一路繼承錯誤。

第三個風險,係過度生成。

AI好擅長將嘢做到「睇落好完整」。

但產品早期最重要嘅,往往係剋制。

第四個風險,係冇人驗收。

如果人唔做判斷,Agent好易產出一堆冇人負責嘅嘢。

第五個風險,係版權同合規。

復刻競爭對手結構可以學習,但唔可以複製品牌、素材、Code同專有內容。

所以呢套流程要有規則。

每個Agent嘅任務要清楚。

每一步產出要可以檢查。

關鍵節點一定要人手確認。

競爭對手復刻必須避開侵權。

最終Code要審查。

上線前要測試。

Agent流程唔係叫你放棄管理,而係要求你用更強嘅流程去管理AI。

呢點好重要。

冇流程,多Agent只會變成多線程亂噏。

有流程,佢先有機會變成生產線。

我對呢件事嘅判斷

我覺得Codex做產品,真正值得睇嘅唔係「AI能唔能夠一個人做出完整App」。

呢個問題太粗疏。

更值得睇嘅問題係:

AI能唔能夠將產品生產鏈拆開,然後令唔同Agent分工推進?

呢個就好現實。

因為真實產品團隊本身就係多角色協作。

產品經理。

設計師。

前端。

後端。

測試。

數據。

運營。

增長。

而家,只係其中一部分角色開始可以由Agent承擔。

呢個唔會即刻取代團隊。

但會改變第一版產品嘅生產方式。

以前你要揾人、排期、開會、寫文檔、等開發。

以後你可能先開一個Hermes Kanban。

將任務拆開。

叫12個Agent行一輪。

人嚟驗收。

再叫Agent改。

最後將值得保留嘅部分交畀真實團隊工程化。

**產品開發嘅下一步,可能唔係一個萬能Agent,而係一條由多個Agent組成嘅產品流水線。**

呢個先係Codex同Hermes結合埋一齊最值得睇嘅地方。

Codex提供執行力。

Hermes提供協作結構。

人提供判斷。

呢三樣嘢夾埋一齊,先似一個可以行嘅產品系統。

最後講一句

未來用AI做產品,可能會分成兩種人。

一種人,將Codex當成高級Code生成器。

叫佢寫頁面。

改Bug。

生成幾個組件。

呢個當然有用。

另一種人,會將Codex放進一套流程裏面。

叫市場Agent做調研。

叫競爭對手Agent拆網站。

叫產品Agent定MVP。

叫UX Agent畫流程。

叫前端Agent做頁面。

叫後端Agent寫接口。

叫測試Agent揾Bug。

叫文案Agent寫Landing Page。

叫部署Agent上線。

然後人嚟判斷方向,控制邊界,決定下一步。

兩種用法,差距會好大。

Codex寫Code只係第一層,Codex進入產品流程先係第二層。

而Hermes呢種多Agent看板,提供嘅就係第二層所需要嘅結構。

佢令Agent唔再只係一個Chat窗口。

而係一組可以協作、交接、追蹤、覆盤嘅工作角色。

所以我覺得,Codex做產品呢件事,真正嘅想像力唔喺「佢能唔能夠生成一個網站」。

而在於:

**一個人能唔能夠用12個Agent,行完以前一個小團隊先至行得完嘅產品流程。**

如果呢個模式行得通,產品生產嘅門檻會被重新定義。

唔係每個人都會因此做到好產品。

但係啲識拆任務、識組織Agent、識判斷結果嘅人,會比以前快好多。

AI唔會自動幫你做出好產品,但佢會令識做產品嘅人,擁有一支更平、更快、更聽話嘅虛擬團隊。

呢個先係Codex + Hermes真正值得關注嘅地方。

參考來源:

· OpenAI:《Codex for every role, tool, and workflow》

· OpenAI:《Codex is becoming a productivity tool for everyone》

· OpenAI Developers:Codex Use Cases

· Hermes Agent Docs:Kanban Multi-Agent Board

· Hermes Agent Docs:Kanban Tutorial

圖片

Codex 做產品的正確姿勢: 一套在Hermes跑的多 Agent 工作流

蝦哥導讀很多人現在用 Codex,還是把它當成一個更強的程序員。 讓它寫代碼。 讓它修 Bug。 讓它改頁面。 讓它做 PR Review。 這當然沒問題。 但如果你真的想用 Codex 做一個產品,我覺得更合理的方式,不是讓一個 Agent 從頭幹到尾。 而是把它放進一套多 Agent 工作流裏。 比如 Hermes Kanban 這種模式。 一個產品任務進來以後,不是一個 Agent 悶頭寫完。 而是拆給 12 個 Agent。 有人做調研。 有人拆需求。 有人寫 PRD。 有人復刻競品網站。 有人做前端。 有人寫接口。 有人測 Bug。 有人寫文案。 有人做部署。 有人覆盤。 Codex 真正開始像產品團隊,不是因為它更會寫代碼,而是因為它能被放進一條產品生產線。 這件事挺重要。 因為過去我們說"AI 做產品",聽起來總像玄學。 但如果拆成一套流程,它就突然變得很現實。

做產品,不是寫一段代碼

很多人會把"AI 做產品"理解成:

我給 Codex 一個想法。

它直接生成一個產品。

最好還能上線。

最好還能賺錢。

這當然很誘人。

但現實裏,產品不是這麼做出來的。

一個產品從想法到上線,中間有很多環節。

你要知道用戶是誰。

你要知道痛點是不是真的。

你要看競品怎麼做。

你要拆第一版功能。

你要判斷哪些功能先做,哪些功能後做。

你要畫頁面。

你要寫文案。

你要做前端。

你要做後端。

你要接數據庫。

你要測試。

你要部署。

你要收集反饋。

你要迭代。

這些事情加起來,才叫做產品。

寫代碼只是其中一環。

而且有時候還不是最難的一環。

真正難的,是把一個模糊想法變成一條能跑通的生產流程。

產品不是被"寫出來"的,而是被一輪一輪推進出來的。

這就是為什麼我覺得,Codex 做產品不能只看它會不會寫代碼。

要看它能不能進入整個產品工作流。

一個 Agent 從頭做到尾,很容易變成"漂亮廢品"

現在很多人用 AI 做產品,最常見的方式是:

打開 Codex。

輸入一句話:

幫我做一個某某網站。

然後等它生成代碼。

有時候效果確實挺驚豔。

頁面能跑。

樣式也還行。

甚至還帶一點交互。

但問題是,這種方式很容易產出"漂亮廢品"。

看起來像個產品。

其實沒經過需求判斷。

沒做用戶拆解。

沒想清楚第一版邊界。

沒考慮數據結構。

沒想後續維護。

沒測試異常流程。

沒考慮真實用戶怎麼用。

這類東西發朋友圈可以。

拿去給客戶用,就很危險。

因為產品最怕的不是頁面醜。

而是方向不對。

你做了一個很完整的東西,但它解決的問題不重要。

你做了一個看起來很酷的頁面,但用戶根本不會點。

你做了很多功能,但第一版其實只需要一個核心動作。

一個 Agent 太容易順着你的想法往前跑,但產品真正需要的是不斷停下來判斷。

所以我更喜歡多 Agent 工作流。

因為它天然會把產品拆成不同角色。

調研 Agent 不負責寫代碼。

產品 Agent 不負責部署。

測試 Agent 不負責誇頁面好看。

每個 Agent 只盯自己那一段。

這更像一個真實團隊。

Hermes Kanban 的意義,是讓 Agent 不再擠在一個腦子裏

Hermes Kanban 這個東西,最有意思的地方不是"又多了一個看板"。

而是它把多 Agent 協作變得更像一個真實工作系統。

官方文檔裏說,Hermes Kanban 是一個持久化任務板。

任務會寫進本地 SQLite 數據庫。

每個 Agent 都可以認領任務。

每個 handoff 都可以被其他 Agent 讀取和寫入。

每個 worker 都是獨立 OS 進程,有自己的身份、工具和上下文。

這和很多"子 Agent"不太一樣。

傳統子 Agent 經常像臨時分身。

主 Agent 分出去一個任務。

子 Agent 做完回來。

中間過程很容易丟。

崩了不好恢復。

上下文一壓縮,很多細節就沒了。

Hermes Kanban 更像一個多人項目管理系統。

任務在那裏。

狀態在那裏。

交接在那裏。

誰做了什麼,也在那裏。

這對做產品很重要。

因為產品不是一次性問答。

它是一串長任務。

今天做調研。

明天改 PRD。

後天做頁面。

再後天測 Bug。

中間任何一步都可能中斷。

如果沒有一個持久化任務板,Agent 協作就會變得很脆。

多 Agent 真正有用的前提,不是 Agent 數量多,而是它們有一個能交接、能恢復、能追蹤的工作台。

Hermes Kanban 提供的就是這個工作台。

用 12 個 Agent 做一個產品,應該怎麼拆?

假設我們要做一個產品。

比如:

復刻一個競品網站,並做出自己的 MVP。

不要想得太大。

就做一個能演示、能測試、能收集反饋的初版。

我會把它拆成 12 個 Agent。

第一個,市場研究 Agent。

它負責搞清楚這個產品所在的賽道。

目標用戶是誰。

用戶為什麼需要它。

這個需求是不是剛需。

有沒有替代方案。

用戶現在怎麼解決。

它不寫代碼。

它只負責回答:

這個東西值不值得做?

第二個,競品分析 Agent。

它負責看同類產品。

頁面結構是什麼。

核心功能是什麼。

收費模式是什麼。

註冊流程怎麼走。

用戶第一次進來看到什麼。

哪些地方做得好。

哪些地方可以抄,哪些地方不能抄。

第三個,網站復刻 Agent。

它負責把目標網站拆成頁面結構。

首頁。

登錄頁。

Dashboard。

功能頁。

價格頁。

幫助頁。

每個頁面有哪些模塊。

每個模塊的文案、佈局、按鈕、狀態是什麼。

這裏說的復刻,不是抄襲品牌和素材。

而是復刻產品結構和交互邏輯。

第四個,產品經理 Agent。

它負責把調研和競品結果變成 MVP 範圍。

第一版做什麼。

不做什麼。

用戶路徑怎麼走。

核心功能閉環是什麼。

驗收標準是什麼。

第五個,UX Agent。

它負責把流程畫清楚。

用戶從哪裏進入。

第一步做什麼。

哪裏需要引導。

哪裏可能卡住。

錯誤狀態怎麼提示。

空狀態怎麼處理。

第六個,UI Agent。

它負責頁面視覺。

不是做藝術創作。

而是做一套統一的界面規範。

字體。

間距。

按鈕。

卡片。

顏色。

佈局。

組件狀態。

第七個,前端 Agent。

它負責把頁面做出來。

React、Next.js、Vue 都可以。

重點是先讓產品能看、能點、能走流程。

第八個,後端 Agent。

它負責接口和數據結構。

用戶表。

項目表。

任務表。

權限。

狀態。

日誌。

基礎 API。

第九個,數據 Agent。

它負責埋點和指標。

用戶有沒有完成核心動作。

從哪個步驟流失。

哪些按鈕沒人點。

哪些頁面停留時間長。

MVP 上線之後,不看數據就等於盲開車。

第十個,測試 Agent。

它負責找問題。

正常流程能不能跑。

異常流程會不會炸。

空數據怎麼辦。

重複提交怎麼辦。

接口失敗怎麼辦。

移動端能不能用。

第十一個,增長文案 Agent。

它負責寫落地頁文案、按鈕文案、引導文案、用戶郵件、發佈帖。

很多產品不是功能不行。

是用戶根本沒看懂你在解決什麼。

第十二個,部署和覆盤 Agent。

它負責部署、生成 README、記錄變更、整理已知問題、給出下一輪迭代建議。

這 12 個 Agent 跑下來,才像一條產品生產線。

一個人用 Codex 寫代碼,叫提效;一組 Agent 跑完產品流程,才叫生產方式變化。

復刻網站,不是為了抄,而是為了學習產品結構

這裏要講清楚。

我說"12 個 Agent 復刻網站",不是讓你去抄別人的品牌、代碼、素材和商業表達。

那是很危險的。

真正有價值的是復刻結構。

也就是拆清楚一個成熟產品是怎麼組織頁面和流程的。

為什麼首頁第一屏這麼寫。

為什麼註冊流程這麼短。

為什麼 pricing 頁面這樣排。

為什麼 dashboard 先展示這個指標。

為什麼 onboarding 只問三個問題。

為什麼某個按鈕放在這裏。

這才是產品學習的價值。

很多人做產品,一上來就想創新。

但其實你連成熟產品為什麼這麼設計都沒看懂。

復刻結構的過程,本質上是逆向學習。

用 Agent 去拆。

拆頁面。

拆路徑。

拆組件。

拆文案。

拆信息層級。

拆轉化邏輯。

然後再做自己的版本。

好的復刻不是照搬,而是把別人的產品邏輯拆開,再重組到自己的場景裏。

這個過程非常適合多 Agent。

因為不同 Agent 可以盯不同層級。

一個看商業模式。

一個看頁面結構。

一個看交互路徑。

一個看技術實現。

一個看文案表達。

一個看數據指標。

最後彙總成自己的 MVP 方案。

這比一個人憑感覺做產品靠譜得多。

Codex 在這裏最適合幹什麼?

Codex 的優勢,不是替你做所有產品判斷。

而是它能把判斷之後的東西快速變成可執行結果。

比如產品經理 Agent 定了 MVP 範圍。

Codex 可以把它轉成任務列表。

UX Agent 寫了用戶流程。

Codex 可以把它轉成頁面路由。

UI Agent 給了組件規範。

Codex 可以生成組件庫。

前端 Agent 負責實現頁面。

Codex 可以直接寫代碼。

測試 Agent 提了 Bug。

Codex 可以修。

數據 Agent 提了埋點方案。

Codex 可以加事件。

文案 Agent 給了落地頁文案。

Codex 可以把文案填到頁面裏。

部署 Agent 需要 README。

Codex 可以整理安裝、運行、部署說明。

這就是它的價值。

它把很多"從方案到產物"的中間環節壓縮了。

過去一個產品經理寫完 PRD,還要等設計。

設計完還要等開發。

開發完還要等測試。

測試完還要等修復。

現在不一定完全不用人。

但第一版可以更快出來。

**Codex 最適合的不是替你想一個偉大產品,而是把一個清楚的產品方案快速推進到可驗證狀態。**

這句話很關鍵。

你給它混亂,它就產出混亂。

你給它結構,它就能幫你推進。

一套流程下來,真正產出的是什麼?

用 12 個 Agent 做一個產品,最後不應該只得到一堆代碼。

應該得到一整套產品資產。

第一,調研摘要。

這個產品為什麼值得做。

目標用戶是誰。

痛點是什麼。

競品怎麼解決。

第二,競品拆解。

競品頁面結構。

核心流程。

收費模式。

用戶路徑。

可學習點。

第三,MVP 定義。

第一版做什麼。

不做什麼。

核心閉環是什麼。

驗收標準是什麼。

第四,信息架構。

有哪些頁面。

頁面之間怎麼跳轉。

用戶從進入到完成任務怎麼走。

第五,UI 原型。

頁面長什麼樣。

組件怎麼組織。

主要狀態有哪些。

第六,前後端代碼。

能跑起來。

能點擊。

能走核心流程。

第七,測試報告。

哪些流程通過。

哪些 Bug 存在。

哪些地方風險高。

第八,埋點方案。

上線後看哪些指標。

如何判斷用戶是不是用起來了。

第九,發佈文案。

怎麼介紹。

怎麼發給第一批用戶。

怎麼收集反饋。

第十,迭代建議。

下一輪該改什麼。

哪些功能該砍。

哪些地方要補。

這才是"做產品"。

不是隻讓 AI 給你生成一個漂亮首頁。

而是讓 AI 幫你把產品從想法推進到一套可評審資產。

真正有價值的 AI 產品流程,不是生成一個頁面,而是生成一整套可驗證的產品證據。

這也是多 Agent 的意義。

每個 Agent 產出一塊證據。

最後拼成產品判斷。

為什麼不用一個超級 Agent?

很多人會問:

為什麼要 12 個 Agent?

一個強 Agent 不行嗎?

能做。

但不一定穩。

因為一個 Agent 做所有事,很容易角色混亂。

它一邊做市場判斷,一邊寫代碼。

一邊誇自己的頁面,一邊負責測試。

一邊定義需求,一邊又偷偷擴大範圍。

這就像讓一個人同時當老闆、產品、設計、研發、測試、運營。

不是不能做。

但很容易自嗨。

多 Agent 的好處,是把角色分開。

產品 Agent 可以說:

這個功能不在 MVP 範圍內。

測試 Agent 可以說:

這個流程跑不通。

增長 Agent 可以說:

這個文案用戶看不懂。

數據 Agent 可以說:

這個指標沒法驗證。

部署 Agent 可以說:

這個項目沒有運行說明。

這些"互相挑刺"的過程,才像真實團隊。

做產品最需要的不是一個永遠順着你說的 AI,而是一組會從不同角度拆你方案的 Agent。

這也是 Hermes Kanban 這種任務板有價值的地方。

它讓不同 Agent 的產出可以留痕。

可以交接。

可以被下一個 Agent 接着用。

不是所有東西都揉在同一個上下文裏。

產品經理在這套流程裏還重要嗎?

重要。

而且更重要。

只是工作變了。

以前產品經理大量時間花在寫文檔、催進度、整理會議紀要、反覆解釋需求。

以後這些工作會被壓縮。

但產品經理要做更難的事。

定義問題。

選擇方向。

設定邊界。

決定 MVP 範圍。

判斷用戶反饋。

決定什麼不做。

協調 Agent 之間的衝突。

驗收最終結果。

比如市場研究 Agent 說,這個方向有機會。

競品分析 Agent 說,競品已經做得很成熟。

產品 Agent 說,第一版只做一個核心功能。

增長 Agent 說,賣點應該更激進。

測試 Agent 說,現在版本不穩定,不能發佈。

這個時候誰拍板?

還是人。

AI 可以提供證據。

但產品判斷要人來做。

AI 可以把產品流程跑得更快,但不能替你承擔產品選擇的責任。

這就是產品經理的新位置。

不是每一步都親手做。

而是設計流程、組織上下文、判斷結果。

產品經理會從"文檔生產者",變成"AI 產品團隊的導演"。

這套方法最適合哪些產品?

不是所有產品都適合這樣做。

如果你做的是芯片、醫療、金融核心系統、自動駕駛,這種高風險產品,AI 生成的東西必須非常謹慎。

但如果你做的是下面這些類型,非常適合用 Codex + Hermes 跑一遍:

內部工具。

SaaS 小功能。

管理後台。

數據看板。

營銷落地頁。

競品復刻學習。

MVP 驗證。

個人工具。

工作流自動化。

運營輔助系統。

AI 應用 Demo。

這些產品有一個共同點:

第一版不需要完美。

但需要儘快看見。

儘快試用。

儘快暴露問題。

儘快收集反饋。

這正是多 Agent 流程擅長的地方。

它能讓你從"我有一個想法",更快走到"我有一個能演示的東西"。

越是早期驗證型產品,越適合用 Agent 流程加速。

因為早期最怕的不是做得不夠精緻。

而是一直停在想法裏。

這套流程也有風險

當然,不能把它神化。

12 個 Agent 跑產品,不代表一定做出好產品。

它也有很多風險。

第一個風險,是目標不清楚。

目標不清楚,Agent 越多,跑得越亂。

第二個風險,是上下文污染。

一個 Agent 前面判斷錯了,後面 Agent 可能一路繼承錯誤。

第三個風險,是過度生成。

AI 很擅長把東西做得"看起來很完整"。

但產品早期最重要的,往往是剋制。

第四個風險,是沒人驗收。

如果人不做判斷,Agent 很容易產出一堆沒人負責的東西。

第五個風險,是版權和合規。

復刻競品結構可以學習,但不能複製品牌、素材、代碼和專有內容。

所以這套流程要有規則。

每個 Agent 的任務要清楚。

每一步產出要能檢查。

關鍵節點必須人工確認。

競品復刻必須避開侵權。

最終代碼要審查。

上線前要測試。

Agent 流程不是讓你放棄管理,而是要求你用更強的流程去管理 AI。

這點非常重要。

沒有流程,多 Agent 只會變成多線程胡說。

有流程,它才可能變成生產線。

我對這件事的判斷

我覺得 Codex 做產品,真正值得看的不是"AI 能不能一個人做出完整 App"。

這個問題太粗暴。

更值得看的問題是:

AI 能不能把產品生產鏈條拆開,然後讓不同 Agent 分工推進?

這就很現實。

因為真實產品團隊本來就是多角色協作。

產品經理。

設計師。

前端。

後端。

測試。

數據。

運營。

增長。

現在,只是其中一部分角色開始可以被 Agent 承擔。

這不會立刻替代團隊。

但會改變第一版產品的生產方式。

以前你要找人、排期、開會、寫文檔、等開發。

以後你可能先開一個 Hermes Kanban。

把任務拆開。

讓 12 個 Agent 跑一輪。

人來驗收。

再讓 Agent 修改。

最後把值得保留的部分交給真實團隊工程化。

**產品開發的下一步,可能不是一個萬能 Agent,而是一條由多個 Agent 組成的產品流水線。**

這才是 Codex 和 Hermes 結合起來最值得看的地方。

Codex 提供執行力。

Hermes 提供協作結構。

人提供判斷。

這三者合在一起,才像一個可以跑起來的產品系統。

最後說一句

未來用 AI 做產品,可能會分成兩種人。

一種人,把 Codex 當成高級代碼生成器。

讓它寫頁面。

改 Bug。

生成幾個組件。

這當然有用。

另一種人,會把 Codex 放進一套流程裏。

讓市場 Agent 做調研。

讓競品 Agent 拆網站。

讓產品 Agent 定 MVP。

讓 UX Agent 畫流程。

讓前端 Agent 做頁面。

讓後端 Agent 寫接口。

讓測試 Agent 找 Bug。

讓文案 Agent 寫落地頁。

讓部署 Agent 上線。

然後人來判斷方向,控制邊界,決定下一步。

兩種用法,差距會很大。

Codex 寫代碼只是第一層,Codex 進入產品流程才是第二層。

而 Hermes 這種多 Agent 看板,提供的就是第二層所需要的結構。

它讓 Agent 不再只是一個聊天窗口。

而是一組可以協作、交接、追蹤、覆盤的工作角色。

所以我覺得,Codex 做產品這件事,真正的想象力不在"它能不能生成一個網站"。

而在於:

**一個人能不能用 12 個 Agent,跑完過去一個小團隊才能跑完的產品流程。**

如果這個模式跑通,產品生產的門檻會被重新定義。

不是每個人都會因此做出好產品。

但那些會拆任務、會組織 Agent、會判斷結果的人,會比過去快很多。

AI 不會自動替你做出好產品,但它會讓會做產品的人,擁有一支更便宜、更快、更聽指揮的虛擬團隊。

這才是 Codex + Hermes 真正值得關注的地方。

參考來源:

· OpenAI:《Codex for every role, tool, and workflow》

· OpenAI:《Codex is becoming a productivity tool for everyone》

· OpenAI Developers:Codex Use Cases

· Hermes Agent Docs:Kanban Multi-Agent Board

· Hermes Agent Docs:Kanban Tutorial