產品經理未解之謎：AI更喜歡用戶故事還是功能說明書？進來下個注、看看結果

作者：產品AI力學

日期：2026年5月9日上午11:30

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

AI 更鍾意用戶故事定功能說明書？實測番茄時鐘原型話你知

整理版摘要

呢篇文章係由一位產品經理寫嘅，佢想探討一個困擾好多 PM 嘅問題：當用 AI 編程工具（例如 Claude Code、Codex、Cursor）開發原型時，到底用「用戶故事」定係「功能說明書」嘅口吻輸入需求，會令 AI 更易理解、做出更好嘅嘢？作者用一個番茄時鐘網頁版做實驗，分別用第一人稱嘅用戶故事（A）同第三人稱嘅功能說明書（B）描述完全一樣嘅產品邊界，然後睇下 AI 喺 brainstorming 階段嘅追問、生成嘅需求文檔同最終原型有咩分別。

實驗刻意保持公平：兩個版本都係「想法級」，唔寫狀態機、字段、API 等工程細節，畀 AI 自己去補完。作者認為，vibe coding 嘅目的係加速需求驗證同產品決策，唔係寫靚代碼。最後佢發現，用戶故事版本嘅 AI 更主動反問用戶場景同心理，功能說明書版本就比較專注技術實現細節；但兩者都能成功做出可演示嘅原型。

整體結論係：表達形式有影響，但唔係決定性因素。關鍵係 PM 腦入面嘅想法要清晰、有價值。AI 時代，PM 可以按自己風格揀輸入形式，而工具會逐漸熨平差異。文章最後呼籲讀者投票，同埋預告會繼續分享詳細評測結果。

用戶故事用自然語言，AI 易理解但易產生幻覺；功能說明書結構清晰，但可能限制 AI 創意。
兩種輸入都成功做出可演示原型，但追問方向唔同：用戶故事版問用戶場景，功能說明書版問技術實現。
作者強調想法質素比表達形式更重要，AI 時代 PM 應該專註定義有價值嘅產品邊界。
實驗係「想法級」輸入，唔寫工程細節，模擬早期 PM 真實表達，結果對 vibe coding 有參考價值。
產品經理可以按目標揀輸入形式：快速驗證用故事，嚴謹開發用說明書，或者混合使用。

整理重點

點解要比拼用戶故事同功能說明書？

寫用戶故事嘅 PM 覺得自己最貼近用戶，暗地裏嫌寫「系統需支持 X」嘅同事似翻譯機；寫功能說明書嘅 PM 就覺得自己最嚴謹，睇用戶故事好似劣質小說，缺乏專業感。呢種分歧喺 AI 編程工具流行之後更加明顯——到底邊種輸入形式對 AI 更友好？

呢個實驗就係為咗解答呢個問題

作者用一個番茄時鐘網頁版做測試，分別用兩種口吻寫同一份想法級需求，然後投餵畀 Codex high 模式，配上 brainstorming skill 同可視化助手，全程記錄 AI 嘅反應同最終產出。

整理重點

A vs B：同一件事，兩種口吻

A 版係用戶故事口吻，用第一人稱，好似同朋友傾偈：「我係一個容易分心嘅知識工作者，想做一個番茄鍾幫我管理時間……」講咗好多使用場景同感受，例如想睇到倒計時跳動、被同事叫走時可以暫停、完成番茄有滿足感等。

呢種寫法充滿人性化細節

B 版係功能說明書口吻，用第三人稱，似同工程師下任務單：「需要做一個基於番茄工作法嘅網頁版計時器……」列出核心功能、操作、非功能要求，語氣客觀冷靜。

兩種寫法字面上完全唔似同一件事

1 A 版強調用戶動機同體驗：例如「想從其他標籤頁一眼睇到剩餘時間」、「不同階段用顏色區分」。
2 B 版強調系統行為同約束：例如「暫停後繼續從剩餘時間開始」、「重置需要二次確認」、「數據需後端持久化」。

整理重點

AI 點反應？實測結果出爐

作者將兩個版本分別輸入全新 CLI 會話，掛上 brainstorming skill 同可視化助手，全程記錄 AI 嘅追問、生成嘅需求文檔，最後真係用 React + FastAPI + PG 庫做出本地可運行嘅原型。

AI 對用戶故事版本嘅追問更深入

例如佢會反問：「你平時通常喺咩情況下分心？係咪需要一個白噪音功能？」而對功能說明書版本就問：「數據庫用邊個？API 接口設計有冇限制？」

用戶故事版：AI 主動探索用戶場景，提出「跳過階段後點樣提醒用戶返嚟？」等問題。
功能說明書版：AI 直接開始設計架構，問「是否考慮用 WebSocket 更新標籤頁標題？」

兩個版本最終都成功跑起原型

不過用戶故事版嘅原型喺 UI 細節上更貼近用戶期望（例如顏色區分、標籤頁標題動態更新），功能說明書版就喺數據持久化同錯誤處理上更穩陣。

整理重點

產品經理可以點樣揀？

實驗結論唔係邊個贏，而係話畀 PM 知：輸入形式會影響 AI 嘅關注點，但唔會決定最終成敗。關鍵係你作為 PM 諗得夠唔夠清楚，個想法本身有冇價值。

工具會熨平差異

作者建議：想快速驗證用戶體驗，用用戶故事口吻；想嚴謹定義系統邊界，用功能說明書口吻；最理想係混合使用——先用故事捕捉需求，再用說明書補結構。

快速驗證：用戶故事 + 自然語言，引導 AI 關注用戶體驗同場景。
系統開發：功能說明書 + 結構化描述，確保 AI 理解技術約束。
混合模式：先寫故事原型，再轉成說明書細化，適合複雜產品。

作者最後話，佢會繼續分享完整評測過程，包括 AI 嘅逐條追問同最終原型對比，有興趣嘅可以關注公眾號。

寫用戶故事嘅人，自以為最貼近用戶，暗地裏嫌嗰啲寫「系統需支持 X」嘅同事似翻譯機；

寫功能說明書嘅人，自以為最嚴謹，睇用戶故事覺得似劣質小說，缺乏專業感。

跟住落嚟幾日，我由一段粗略需求，用兩種輸入形態，將佢變成兩個可以行得鬱、可以演示畀老細睇、甚至令陌生人坐低用一陣嘅原型。嚟睇嚇：

🤔 邊個 AI 聽得明啲？
🤔 邊個 AI 會問到更深嘅反問？
🤔 邊個 AI 最後做出嚟嘅嘢更實用？

呢個就係今次評測要解答嘅問題。

實驗說明

評測目的：比較「用戶故事」同「功能說明書」兩種 PM 輸入口吻，做 AI 編程工具（Claude Code / Codex / Cursor 等）嘅提示詞時，邊種可以更有效率咁將諗法變成可以演示嘅產品。

公平性原則：A、B 兩個版本描述完全一樣嘅產品邊界，只係 PM 嘅口吻/角度唔同。兩個版本都刻意停留喺「諗法層面」——唔寫狀態機、欄位、API、狀態命名，工程細節交畀 AI 喺 brainstorming 階段補全。呢份係「模擬早期 PM 真實表達」嘅輸入，唔係 PRD。

評測主題：vibe coding 一個「番茄時鐘」。

說明1：唔關注架構同代碼質素，我哋產品經理 vibe coding 係為咗加速需求驗證同產品決策，唔係同架構師、程序員爭嗰個要變形嘅飯碗。
說明2：評測結果唔代表A同B邊個好，作為「邊種輸入形式對AI更友好嘅佐證（評測環境、樣本量等都有好大侷限性）」，畀產品經理 vibe coding 做參考。

喺你繼續睇落去之前，先落個注 🎲

下面係兩份功能完全等價嘅「諗法層面」需求。

一個用第一人稱，好似同朋友吐苦水；一個用第三人稱，好似同工程師落任務單。

睇完之前，喺心入面畀自己 30 秒——

你賭邊邊？	喺心入面揀一個
A 用戶故事贏	「AI 係大語言模型，自然語言先係佢嘅母語」
B 功能說明書贏	「AI 越似寫 code 嘅人越好明」
平局，AI 時代 PM 點寫都得	「工具會熨平差異，最緊要係諗法本身」

記住你嘅答案，文末投票落注。

A · 用戶故事口吻（諗法層面）

我係一個容易分心嘅知識工作者，想用番茄工作法管理我嘅工作時間。希望你幫我做一個網頁版番茄鍾，我自己一個人用，可以喺瀏覽器入面行到就得。詳細講嚇我嘅期望：

• 我希望打開網頁就見到一個大大嘅倒數計時，撳「開始」即刻入 25 分鐘嘅專注。專注時可以睇住數字一秒一秒咁跳。
• 專注嗰陣我可能被同事臨時叫走，所以想可以隨時暫停，返嚟再繼續。繼續時應該由我離開嗰陣嘅剩餘時間計落去，唔係由頭開始。
• 倒數結束我希望聽到一聲提示音，然後系統自動入休息——通常係 5 分鐘短休息，每完成 4 個專注就嚟一次 15 分鐘長休息——唔使我手動轉。
• 唔想休息或者唔想繼續嘅時候，我希望可以直接跳過當前階段。但被跳過嘅專注番茄，唔應該算我完成。
• 開始之前我想可以寫一句今次要做乜，例如「寫週報」，幫自己集中注意力。唔寫都得。
• 我想睇到今日總共完成咗幾個番茄，畀自己一啲正面回饋。熄咗瀏覽器再開，今日嘅成績唔好清零；但過咗半夜 12 點就應該自動歸零、重新開始。
• 我成日喺幾個分頁之間轉來轉去，希望由第二個分頁一眼睇到我仲剩幾多時間。
• 唔同階段（專注 / 短休 / 長休）可以用顏色區分就更好了。
• 萬一我想推倒重來，需要一個重置按鈕，但要我二次確認，免得手震一下今日嘅努力冇曬。

唔使登入、唔使協作。手機同電腦都希望用到。

B · 功能說明書口吻（諗法層面）

需要做一個基於番茄工作法嘅網頁版計時器，用於知識工作者嘅專注管理。單用戶場景，桌面端同移動端都要用到，唔使登入同協作。

核心功能：

• 倒數計時器：預設 25 分鐘為一個專注階段。專注結束後系統自動進入 5 分鐘短休息；每完成 4 個專注階段後自動進入 15 分鐘長休息；休息結束後自動返去下一個專注，循環往復。
• 五種基本操作：開始 / 暫停 / 繼續 / 跳過 / 重置。

• 暫停後繼續，應由剩餘時間繼續，唔可以重置；
• 重置需要二次確認；
• 被跳過嘅專注階段唔應該計入「今日完成數」。

• 任務名標註：用戶可以在專注開始前輸入一段文字（長度上限 30 字），用嚟提醒自己當前番茄要做嘅嘢；唔輸入都可以正常使用。
• 提示音：倒數歸零時需要播放提示音；轉到瀏覽器後台分頁時都要正常響起。
• 今日已完成數：界面需要展示當日完成嘅專注番茄數。呢啲數據需要後端持久化，關閉瀏覽器再開當日都會保留；跨日自動清零。
• 分頁標題同步：瀏覽器分頁標題需要實時顯示剩餘時間同當前階段，方便用戶喺其他分頁時掌握節奏。
• 階段視覺區分：唔同階段（專注 / 短休 / 長休）需要有視覺區分。

非功能要求：數據需要後端持久化，唔接受淨係前端 localStorage 方案。

謎底揭曉前——你願意賭邊邊？

由產品研發嘅角度睇，佢哋講嘅係同一件事。
由字面睇，佢哋一啲都不像同一個嘢。
產品經理應該都明，呢個係需求表達嘅兩種形態。

接下來我要做嘅嘢：

1. 打開兩個全新CLI會話——分別將 A 同 B 餵畀 Codex high 模式，掛上 brainstorming skill 同可視化助手；
2. 全程記錄——一連串追問、一張草圖、一個反問，爭取唔放過每一個細節；
3. 人工核對——AI整理後嘅需求文檔，係咪真係仲係我講嘅意思？定係佢靜靜雞「幻覺」咗我冇講過嘅嘢？呢啲嘢對我嘅產品係提升定拉低？
4. 真係做出嚟——前端 React + 後端 FastAPI + PG庫，可以本地啓動；

我而家唔知結果，你都唔知。關注公眾號，之後一齊睇評測。

如果對評測方法同輸入內容嘅公平性有意見，可以喺評論區留言。

落注區：

寫用戶故事的人，自認為最貼近用戶，私下裏嫌寫"系統需支持 X"的同事像翻譯機；

寫功能說明書的人，自認為最嚴謹，看用戶故事覺得像劣質小說，缺乏專業感。

接下來的幾天，我從一段粗略需求，用兩種輸入形態，把它做成2個能跑起來、能演示給老闆看、甚至能讓陌生人坐下來用一會兒的原型。來看看：

🤔 哪一個 AI 聽得更明白？
🤔 哪一個 AI 會問出更深的反問？
🤔 哪一個 AI 最後做出來的東西更能用？

這就是這次評測要回答的問題。

實驗說明

評測目的：對比「用戶故事」與「功能說明書」兩種 PM 輸入口吻，作為 AI 編程工具（Claude Code / Codex / Cursor 等）的提示詞時，哪種能更高效地把想法變成可演示的產品。

公平性原則：A、B 兩版描述完全相同的產品邊界，僅 PM 的口吻/視角不同。兩版都刻意停留在「想法級」——不寫狀態機、字段、API、狀態命名，工程細節交給 AI 在 brainstorming 階段補全。這是一份"模擬早期 PM 真實表達"的輸入，不是 PRD。

評測主題：vibe coding 一個"番茄時鐘"。

說明1：不關注架構和代碼質量，我們產品經理 vibe coding 是為了加速需求驗證和產品決策，而非去跟架構師、程序員搶那個要變形的飯碗。
說明2：評測結果不代表A和B誰更好，作為“哪種形式輸入對AI更友好的佐證（評測環境、樣本量等都有很大侷限性）”，給產品經理vibe coding作為參考。

在你往下讀之前，先押個注 🎲

下面是兩份功能完全等價的"想法級"需求。

一個用第一人稱、像在跟朋友倒苦水；一個用第三人稱、像在跟工程師下任務單。

讀完之前，先在心裏給自己 30 秒——

你賭哪邊？	在心裏選一個
A 用戶故事贏	"AI 是大語言模型，自然語言才是它的母語"
B 功能說明書贏	"AI 越像寫代碼的人越好懂"
平局，AI 時代 PM 怎麼寫都行	"工具會熨平差異，關鍵是想法本身"

記住你的答案，文末投票押注。

A · 用戶故事口吻（想法級）

我是一個容易分心的知識工作者，想用番茄工作法管理我的工作時間。希望你幫我做一個網頁版番茄鍾，我自己一個人用，能在瀏覽器裏跑起來就行。具體說說我的期待：

• 我希望打開網頁就能看到一個大大的倒計時，點"開始"立刻進入 25 分鐘的專注。專注時能看着數字一秒一秒地跳。
• 專注的時候我可能被同事臨時叫走，所以想能隨時暫停，回來再繼續。繼續時應該從我離開時的剩餘時間往下走，而不是從頭開始。
• 倒計時結束我希望聽到一聲提示音，然後系統自動進入休息——通常是 5 分鐘短休息，每完成 4 個專注就來一次 15 分鐘長休息——不用我手動切換。
• 不想休息或不想繼續的時候，我希望能直接跳過當前階段。但被我跳過的專注番茄，不應該算我完成的。
• 開始之前我想能寫一句這次要做什麼，比如"寫週報"，幫自己集中注意力。不寫也行。
• 我想看到今天總共完成了幾個番茄，給自己一點正反饋。關了瀏覽器再打開，今天的成績別清零；但跨過 0 點就該自動歸零、重新開始。
• 我經常在好幾個標籤頁之間切換，希望從別的標籤頁一眼能看到我還剩多少時間。
• 不同階段（專注 / 短休 / 長休）能用顏色區分就更好了。
• 萬一我想推倒重來，需要一個重置按鈕，但要讓我二次確認，免得手抖一下今天的努力全沒了。

不需要登錄、不需要協作。手機和電腦都希望能用。

B · 功能說明書口吻（想法級）

需要做一個基於番茄工作法的網頁版計時器，用於知識工作者的專注管理。單用戶場景，桌面端與移動端均需可用，無需登錄與協作。

核心功能：

• 倒計時器：默認 25 分鐘為一個專注階段。專注結束後系統自動進入 5 分鐘短休息；每完成 4 個專注階段後自動進入 15 分鐘長休息；休息結束後自動回到下一個專注，循環往復。
• 五種基礎操作：開始 / 暫停 / 繼續 / 跳過 / 重置。

• 暫停後繼續，應從剩餘時間繼續，不可重置；
• 重置需要二次確認；
• 被跳過的專注階段不應計入"今日完成數"。

• 任務名標註：用戶可在專注開始前輸入一段文字（長度上限 30 字），用於提醒自己當前番茄要做的事；不輸入也可正常使用。
• 提示音：倒計時歸零時需播放提示音；切換到瀏覽器後台標籤頁時仍需正常響起。
• 今日已完成數：界面需展示當日完成的專注番茄數。該數據需後端持久化，關閉瀏覽器再打開當日仍保留；跨日自動清零。
• 標籤頁標題同步：瀏覽器標籤頁標題需實時顯示剩餘時間與當前階段，便於用戶在其他標籤頁時掌握節奏。
• 階段視覺區分：不同階段（專注 / 短休 / 長休）需有視覺區分。

非功能要求：數據需後端持久化，不接受僅前端 localStorage 方案。

謎底揭曉前——你願意賭哪一邊？

從產品研發的角度看，它們說的是同一件事。
從字面上，它們一點都不像同一個東西。
產品經理應該都懂，這是需求表達的兩種形態。

接下來我要做的事：

1. 打開兩個全新CLI會話——分別把 A 和 B 投餵給 Codex high 模式，掛上 brainstorming skill 和可視化助手；
2. 全程記錄——一行追問、一張草圖、一個反問，爭取不放過每一個細節；
3. 人工核對——AI 整理後的需求文檔，是不是真的還是我說的那個意思？還是它默默"幻覺"出了我沒說過的東西？這個東西對我的產品是提升還是拉低？
4. 真做出來——前端 React + 後端 FastAPI + PG庫，可以本地啓動；

我現在不知道結果，你也不知道。關注公眾號，後面一起看評測。

如果對評測方法和輸入內容的公平性有建議，可以評論區留言。

下注區：