產品經理Vibe Coding 評測實錄：用戶故事模式的高光與風險

作者：產品AI力學

日期：2026年5月11日下午7:30

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

用戶故事模式能激發AI追問，但需求文檔過細壓縮團隊討論空間

整理版摘要

作者係產品經理，進行Vibe Coding評測，比較用戶故事同功能說明書嘅效果。呢篇文章記錄用戶故事模式下嘅需求澄清過程（階段2）。整體結論係用戶故事令AI抓到用戶場景，提出有價值嘅追問，但最終輸出嘅需求文檔寫得太詳細，違反敏捷原則，壓縮咗團隊討論空間。

AI先將口語需求翻譯成需求地圖，透過視覺助手（visual-companion）交互釐清幾個關鍵點：重置語義、關閉頁面後計時、界面佈局方向，仲逼產品經理補齊隱含需求（例如後續統計報表同Kanban）。呢啲交互有效補充咗原始用戶故事嘅模糊位。

總體嚟講，用戶故事模式有高光亦有風險。AI輸出嘅需求文檔係寫俾AI嘅新物種，唔係傳統用戶故事，人類需要調整期望。作者俾9分，但認為從敏捷實踐睇寫得太細。

結論：用戶故事口吻能激發AI有效追問，但最終需求文檔過於詳細，壓縮團隊討論空間。
方法：AI先用視覺助手列出需求地圖，透過交互選擇釐清關鍵語義，例如重置定義。
差異：相比功能說明書，用戶故事更能引導AI發現隱含需求，例如佈局切換、後續報表需要。
啟發：用戶故事輸入暴露架構風險，逼產品經理補齊真實意圖，避免後續大規模重構。
可行動點：Vibe Coding產出嘅需求文檔本質係寫俾AI嘅，人類應調整期望，唔好當傳統用戶故事。

整理重點

評測背景：用戶故事模式嘅階段2實錄

呢篇評測記錄Vibe Coding A組——用戶故事口吻進行嘅階段2（需求澄清同確認）。輸入材料係產品經理未解之謎：AI更喜歡用戶故事定功能說明書？評測環境係用戶故事vs功能說明書。

作者首先將口語需求翻譯成需求地圖，透過skill嘅visual-companion進行直觀交互，推進需求澄清。

整理重點

五個關鍵問題：從重置語義到架構選擇

第一個關鍵問題係「重置」嘅定義。原始用戶故事只話「需要重置按鈕，但要二次確認」，AI問清楚後，產品語義變清楚：普通重置唔應該抹掉今日努力，清空今日數據先係危險操作。

呢個係有價值嘅澄清點

第二問聚焦關閉頁面後嘅計時語義。原始用戶故事只要求「關閉瀏覽器再打開，今日成績唔好清零」，但冇講應該點計時。AI提出三種選項，作者選擇B：關閉視為暫停。

一句話需求典型問題：只講唔要咩，唔講要咩

第三，visual-companion展示三種界面佈局方向，作者選擇「3個都要」，加入佈局切換功能。呢個係Aha高點，AI點出作者未講但實際渴望嘅需求。

呢個係需求驗證過程中嘅Aha高點

第四，AI推薦純前端靜態應用，但作者需要前後端分離同數據庫持久化，因為後續有統計報表同Kanban需要。呢個問題逼作者補齊真實產品意圖。

原始用戶故事冇顯式寫後續報表同Kanban

第五，AI彙總產品範圍同核心流程，再確認設計草案，將零散回答拼成產品邊界。

整理重點

觀察點評價：高光與冗餘

重置語義被拆開有價值，避免混淆。關閉頁面後計時被追問有價值，補充關鍵corner case。三種佈局加入提升類提示，幫助PM提升關鍵體驗。

推薦純前端靜態應用基於原始需求係合理

單用戶/登錄問題略顯多餘，因為原始需求已經話「自己一個人用」，有冗餘嫌疑，但可接受。

原始用戶故事只說關閉瀏覽器再打開成績唔好清零，冇講計時點處理
AI追問逼PM補齊真實意圖
最終需求文檔太細，背離敏捷原則

整理重點

總體評價與反思：高光同風險

總體評價：用戶故事口吻能令AI抓到用戶場景，激發出不錯嘅追問。最終輸出嘅需求文檔，作者俾9分，但從經典敏捷實踐睇，寫得太細，壓縮團隊討論空間。

佢寫出來嘅嘢係個新物種：長得似用戶故事，但肯定唔係傳統用戶故事

呢種需求文檔本質係寫俾AI嘅，下一步Vibe Coding能跑好先係目的。同軟件從卷GUI轉向卷CLI原理一樣。

呢篇評測記錄嘅係Vibe Coding A 組：用戶故事口吻進行緊嘅階段 2 （需求澄清同確認）。

輸入材料：產品經理未解之謎：AI 鍾意用戶故事定係功能說明書多啲？入嚟落注、睇下結果
評測環境同方法：用戶故事 vs 功能說明書，AI 更鍾意邊種？評測標準

過程實錄

1. 首先將口語需求翻譯成需求地圖

喺 brainstorming 技能加持之下，AI 一開始冇直接寫需求文檔，而係先將佢認為已經明確嘅需求列出嚟，包括大號倒計時、暫停繼續、自動切換階段、今日完成數持久化等。而且藉助 skill 裏面嘅可視化助手（visual-companion）同我進行咗直觀嘅交互選擇，推進需求澄清同確認：

第一個關鍵問題係「重置」到底係咩意思，我嘅選擇係 C。

呢個係比較有價值嘅澄清點。原始用戶故事裏面只係話「需要一個重置按鈕，但要俾我二次確認」，冇對重置對象做具體定義。
如果 AI 唔問，開發時好容易將佢做成一個危險嘅大按鈕；問咗出嚟之後，產品語義變清楚咗：普通重置唔應該抹走今日嘅努力，清空今日數據先至係危險操作。

2. 第二條問題聚焦喺關閉頁面之後嘅計時語義

Codex 接着問：如果專注中途關閉網頁或者瀏覽器，等一陣再開返，希望計時點樣處理？

• A. 按真實時間繼續流逝計算
• B. 關閉就當暫停，重新打開仍然顯示關閉前嘅剩餘時間
• C. 唔恢復進行緊嘅計時，只保留今日完成數

我嘅選擇係 B。

呢個問題都有效。原始用戶故事只係要求「關閉瀏覽器再打開，今日嘅成績唔好清零」，呢個係一句話需求裏面嘅典型問題：冇話要啲乜、只係話唔要啲乜。

3. visual-companion 俾出三種界面佈局方向

隨後 skill 透過 visual-companion 展示咗三種主界面佈局方向：

佢叫我揀一種。我冇淨係揀一個，而係揀咗「3 個都要」：喺右上角提供一個佈局切換圖標，等用戶喺審美疲勞嘅時候可以切換顯示樣式。

呢個本質上係需求驗證過程入面嘅 Aha 高點，AI 點出咗一個我冇講出嚟、但實際上非常渴望嘅一個需求。

4. 架構問題暴露出用戶故事輸入嘅一個風險

接下來 AI 推薦首版採用「單頁靜態應用」：理由係自用、瀏覽器行到、唔使登錄協作，純前端方案最輕，維護成本最低。

我嘅反饋係：

我需要前後端分離並用數據庫（PG）持久化儲存數據，避免之後做開發統計報表、Kanban 嘅時候仲要搞大規模重構。

呢個問題非常及時。原始用戶故事冇明確寫之後嘅報表同 Kanban。
佢逼我補齊咗真實嘅產品意圖。

Codex 隨後俾出技術路線選項：

我揀咗 A：單用戶 API + PostgreSQL。佢暫時唔做登錄，但係所有數據透過後端寫入 PG，並喺數據模型裏面預留用戶擴展點。

5. 彙總產品範圍同核心流程

喺得到上面幾個關鍵答案之後，Codex 先做咗一輪設計草案嘅二次確認，全部都係之前已經確認咗嘅具體問題，放埋一齊再俾我睇一次整體。

呢一步嘅價值在於，佢將「零散回答」重新拼成一個可以確認嘅產品邊界。對於公開評測嚟講，呢個都係一個關鍵節點：如果呢度已經出現誤讀，後面嘅需求文檔好大機會會繼續放大誤差。

6. 最後一輪確認架構、數據模型同接口邊界

隨後 Codex 進入第二份設計草案：架構、數據模型同接口邊界。

呢一輪明確咗幾個工程邊界：

從評測角度睇，呢一步已經超出咗單純「用戶故事複述」，進入咗「將產品意圖轉成工程可執行邊界」。

由呢度開始，作為產品經理就唔再需要關注，呢個喺實際研發工程體系裏面，應該由架構師接手喇。

階段 2 過程觀察

觀察點	評價
重置語義被拆開	有價值，避免將 2 個危險操作混淆。
關閉頁面之後嘅計時語義被追問	有價值，對關鍵 corner case 進行咗補充。
三種佈局被加入範圍	提升類提示，幫 PM 提升咗關鍵體驗。
推薦純前端靜態應用	基於原始需求嘅輸入，AI 嘅建議係絕對合理嘅。而且將「後續統計報表、Kanban」呢個隱含方向挖咗出嚟。
單用戶/登錄問題略顯多餘	原始需求已經話「自己一個人用」，有冗餘嫌疑，但係可以接受：AI 已經發現呢個人類用戶嘅原始輸入並唔係鐵板一塊

總體評價：

1. 用戶故事口吻能夠令 AI 捉到用戶場景，亦都可以激發到唔錯嘅追問。

2. 最終輸出嘅需求文檔，我俾 9 分（唔計入成績）

從經典敏捷實踐嚟睇嘅話，佢寫得太多、太細喇，背離咗敏捷實踐嘅基本原理——佢將團隊討論嘅空間壓縮到非常之細。
但係從 AI 嘅工作原理睇，佢唔係咁樣寫，後面嘅 coding 係冇辦法被有效約束嘅。

佢寫出嚟嘅嘢係一個新品種：雖然睇落係用戶故事，但肯定唔係傳統意義上嘅用戶故事。
下一步嘅vibe coding 行得好先至係佢嘅目的，佢本來就係寫俾 AI 嘅，唔係寫俾人類嘅。

本質上，同軟件由卷 GUI（圖形用戶界面）轉向卷 CLI（命令行界面）係同一個原理。

滿分 10 分嘅話，你哋願意俾幾分？留言區講低你嘅評分。

最終嘅需求文檔全文好長，冇辦法放喺度。如果有興趣想睇一眼嘅，可以私訊我。

這篇評測記錄的是Vibe Coding A 組：用戶故事口吻進行的階段 2 （需求澄清和確認）。

輸入材料：產品經理未解之謎：AI更喜歡用戶故事還是功能說明書？進來下個注、看看結果
評測環境和方法：用戶故事 vs 功能說明書，AI更愛哪種？評測標準

過程實錄

1. 先把口語需求翻譯成需求地圖

在brainstorming技能加持下，AI一開始沒有直接寫需求文檔，而是先把它認為已經明確的需求列出來，包括大號倒計時、暫停繼續、自動切換階段、今日完成數持久化等。並且藉助skill裏的可視化助手（visual-companion）和我進行了直觀的交互選擇，推進需求澄清和確認：

第一個關鍵問題是“重置”到底是什麼意思，我的選擇是 C。

這是比較有價值的澄清點。原始用戶故事裏只說“需要一個重置按鈕，但要讓我二次確認”，沒有對重置對象做具體定義。
如果 AI 不問，開發時很容易把它做成一個危險的大按鈕；問出來以後，產品語義變清楚了：普通重置不應該抹掉今天努力，清空今日數據才是危險操作。

2. 第二問聚焦在關閉頁面後的計時語義

Codex 接着問：如果專注中途關閉網頁或瀏覽器，過一會兒再打開，希望計時怎麼處理？

• A. 按真實時間繼續流逝計算
• B. 關閉就視為暫停，重新打開仍顯示關閉前剩餘時間
• C. 不恢復進行中的計時，只保留今天完成數

我的選擇是 B。

這個問題也有效。原始用戶故事只要求“關閉瀏覽器再打開，今天的成績別清零”，這是一句話需求裏的典型問題：沒說要什麼、只說不要什麼。

3. visual-companion 給出三種界面佈局方向

隨後skill通過 visual-companion 展示了三種主界面佈局方向：

它讓我選擇一種。我沒有隻選一個，而是選擇了“3 個都要”：在右上角提供一個佈局切換圖標，讓用戶在審美疲勞時可以切換顯示樣式。

這本質上是在需求驗證過程中的Aha高點，AI點出了一個我沒說出來，但實際非常渴望的一個需求。

4. 架構問題暴露出用戶故事輸入的一個風險

接下來AI推薦首版採用“單頁靜態應用”：理由是自用、瀏覽器能跑、不要登錄協作，純前端方案最輕，維護成本最低。

我的反饋是：

我需要前後端分離並用數據庫（PG）持久化存儲數據，避免後續執行開發統計報表、Kanban 的時候還要做大規模重構。

這個問題非常及時。原始用戶故事沒有顯式寫後續報表和 Kanban。
它逼我補齊了真實的產品意圖。

Codex 隨後給出技術路線選項：

我選擇了 A：單用戶 API + PostgreSQL。它暫不做登錄，但所有數據通過後端寫入 PG，並在數據模型裏預留用戶擴展點。

5. 彙總產品範圍和核心流程

在得到上面的幾個關鍵答案後，Codex 先做了一輪設計草案的二次確認，都是之前已經確認的具體問題，放到一起再讓我看一遍整體。

這一步的價值在於，它把“零散回答”重新拼成了一個可確認的產品邊界。對於公開評測來說，這也是一個關鍵節點：如果這裏已經出現誤讀，後面的需求文檔大概率會繼續放大誤差。

6. 最後一輪確認架構、數據模型和接口邊界

隨後 Codex 進入第二份設計草案：架構、數據模型與接口邊界。

這一輪明確了幾個工程邊界：

從評測角度看，這一步已經超出了單純“用戶故事複述”，進入了“把產品意圖轉成工程可執行邊界”。

從這裏開始，作為產品經理就不再需要關注，這在實際研發工程體系裏，應該由架構師接手了。

階段 2 過程觀察

觀察點	評價
重置語義被拆開	有價值，避免把2個危險操作混淆。
關閉頁面後的計時語義被追問	有價值，對關鍵corner case進行了補充。
三種佈局被加入範圍	提升類提示，幫助PM提升了關鍵體驗。
推薦純前端靜態應用	基於原始需求的輸入，AI的建議是絕對合理的。並把“後續統計報表、Kanban”這個隱含方向挖了出來。
單用戶/登錄問題略顯多餘	原始需求已經說“自己一個人用”，有冗餘嫌疑，但可以接受：AI已經發現這個人類用戶的原始輸入並不是鐵板一塊

總體評價：

1.用戶故事口吻能讓 AI 抓到用戶場景，也能激發出不錯的追問。

2.最終輸出的需求文檔，我給9分（不計入成績）

從經典敏捷實踐來看的話，它寫的太多、太細了，背離了敏捷實踐的基本原理——它把團隊討論的空間壓縮的非常小。
但從AI的工作原理看，它不這麼寫，後面的coding是無法被有效約束的。

它寫出來的東西是個新物種：雖然長得是用戶故事，但肯定不是傳統意義上的用戶故事。
下一步的vibe coding能跑好才是它的目的，它本來就是寫給AI的，不是寫給人類的。

本質上，和軟件從卷GUI（圖形用戶界面），到轉向卷CLI（命令行界面）是一個原理。

滿分10分的話，你們願意給幾分？評論區給出你的評分。

最終的需求文檔全文很長，沒法放進來。如果感興趣想看一眼的，可以私信我。