AI 越來越能幹,為什麼你還是用不好?
整理版優先睇
用好AI嘅關鍵係畀佢一張清楚嘅任務單,而唔係一句模糊嘅指令
呢篇文章係一個做公眾號嘅作者反思點解好多人覺得AI唔好用。佢發現問題唔喺AI度,而係用戶自己冇將任務講清楚。作者引用咗OpenAI Codex同Google Gemini近排嘅更新,指出AI已經由「答問題」變成「接任務做嘢」,所以用戶需要嘅係一張清楚嘅任務單,而唔係一句靚嘅prompt。
作者認為,好多時用戶畀AI一句「幫我寫篇文」或者「幫我整理下」,但自己腦入面有一大堆默認前提,AI完全唔知。結果出嚟嘅嘢「好似交到差但唔放心」。要解決呢個問題,就要將模糊嘅需求拆成目標、背景、對象、材料、約束、交付物同驗收標準呢7樣嘢。咁樣AI先可以真正幫你推進工作。
總括而言,隨住AI越嚟越能幹,人之間嘅差距反而更明顯:一種人仲停留喺搜索框模式,另一種人已經進入工作流模式,識得將模糊想法拆成結構化任務。下次打開AI,不妨先問自己一句:我把任務講清楚未?
- AI輸出泛、空嘅根本原因係用戶冇將任務講清楚,而唔係AI能力不足
- 有效嘅任務單要包含目標、背景、對象、材料、約束、交付物同驗收標準7項
- 唔同AI工具適合唔同崗位:Gemini做資料員、Claude做編輯、ChatGPT做多面手、Codex做執行者
- 任務單同提示詞嘅層次唔同:提示詞解決點樣問,任務單解決點樣交付
- 未來識用AI嘅人,會將模糊想法拆成結構化任務,而唔係沉迷「萬能提示詞」
AI任務單模板
一個可直接複製使用嘅結構化任務單,包含目標、背景、對象、材料、約束、交付物同驗收標準7項,幫你將模糊需求變成可執行指令。
問題根源:模糊指令令AI輸出得個樣
好多人用AI嘅第一句都係「幫我寫篇公眾號」、「幫我整理下資料」,跟住AI好快交嚟一份嘢,但睇落總係「好似交到差但唔放心」。其實問題唔喺AI度,而係自己交代得唔清楚。
你畀佢一句模糊嘅話,佢就只能畀你一個大概能睇嘅結果
作者話以前AI似聊天窗口,問得唔清楚答得泛啲都還好;但而家AI開始接任務做嘢,OpenAI Codex同Google Gemini嘅更新都顯示呢個趨勢。所以用戶需要嘅係一張清楚嘅任務單,而唔係一句靚prompt。
一張好任務單要講清楚7件事
- 1 目標:你希望AI最終完成咩?「幫我想想」太虛,要改成「整理成10分鐘課程大綱」呢類具體嘢
- 2 背景:件事點解要做?而家卡喺邊?以前試過咩?背景越清,AI越唔會套模板
- 3 對象:內容畀邊個睇?學生、同事定客戶?對象唔清,語氣就會飄
- 4 材料:你有咩資料可以畀?文章、表格、連結、舊稿,全部可以畀,AI唔會讀心
- 5 約束:唔好做咩?例如唔好堆術語、唔好超過1500字、唔好憑空編數據
- 6 交付物:最後要咩?文章、清單、表格、程序碼定下一步行動方案?越明確越少返工
- 7 驗收標準:點樣叫好?你會用邊幾個標準判斷?呢步好多人漏,結果AI只能估你偏好
任務單嘅價值在於令你有地方下手,第一稿粗啲好正常,但要講得出邊度唔對
分清崗位:唔同AI有唔同角色
好多人成日問「ChatGPT、Gemini、Claude邊個最強?」呢個問題有啲似問「編輯、資料員、項目經理邊個最強?」應該先問清楚件事需要邊個崗位。
- Gemini — 資料員:資料同背景可以先交畀佢,佢同搜索、長上下文結合得更緊
- Claude — 編輯:長文結構、語氣審查、邏輯拆解,佢更似一個有耐性嘅編輯
- ChatGPT — 多面手:多版本生成、清單整理、流程設計、反複改表達,做得好順
- Codex — 執行者:文件、代碼、網頁、自動化呢啲具體任務,尤其係做完要驗證嘅,佢似可以進入工作台嘅執行者
唔好做排行榜,要先做分工表;而分工嘅前提,仲係任務單
未來會用AI嘅人,識得將活派清楚
作者唔贊成繼續沉迷「萬能提示詞」。提示詞解決嘅係一句話點樣問,任務單解決嘅係一件事點樣交付,兩個層級唔同。未來AI越嚟越能幹,人之間嘅差距反而更明顯。
一種用法仲停留喺搜索框,另一種用法已經進入工作流
收藏再多提示詞,最後都要回到一件事:你能唔能夠將一團模糊想法,拆成目標、背景、對象、材料、約束、交付物同驗收標準。下次打開AI,先問自己一句:我今次,真係將任務講清楚未?
好多人用 AI 嘅第一句說話,通常都好類似:
"幫我寫一篇公眾號。"
"幫我整理嚇啲資料。"
"幫我做個方案。"
AI 好快交咗份嘢嚟。標題有咗,結構都有,語言仲幾順。
但係你越睇越覺得唔對路。
好似一篇交到差嘅稿。
但係真係要出,你又唔放心。
我做公眾號嘅時候最怕呢種稿。佢冇明顯嘅錯,但係邊度都差少少。你想改,又唔知從邊度落刀。
呢個時候好多人會話:呢個 AI 唔得。
我更願意先回頭睇一句話:頭先嗰個嘢,真係交代清楚咗未?
以前 AI 似一個聊天窗口多啲。你問一句,佢答一句。問得唔清楚,佢就答得空泛啲,問題都仲未算好大。
但係而家唔同咗。
AI 正喺度由"回答問題",變成"接任務做嘢"。
OpenAI 最近喺 Codex 上連續更新:手機端遠程接入、Goal mode、Windows 上嘅 Computer Use。意思好直接,AI 唔再係齋坐喺聊天框入面等你問問題,佢開始可以喺你嘅設備、文件、網頁同項目入面推進一段真實嘅工作。
Google 都喺 Gemini 入面推 Daily Brief 同 Gemini Spark,一個方向係主動整理你每日應該睇嘅資訊,另一個方向係畀 AI 喺後台幫你推進跨應用任務。
呢啲更新唔好剩係當產品新聞咁睇。
背後嘅變化好樸素:AI 已經開始接嘢做喇。
咁個問題都跟住變咗。
當 AI 淨係可以傾偈嘅時候,你需要一句好 prompt。
當 AI 開始識得做嘢嘅時候,你需要一張清楚嘅任務單。
同樣係畀 AI 寫文章,呢兩種講法差別好大。
幫我寫一篇關於 AI 使用技巧嘅公眾號文章。
目標:寫一篇大概 1800 字嘅公眾號文章,話畀普通人知點解 AI 輸出空泛、空洞、唔似自己想要嘅,核心方法係將模糊需求改成任務單。
讀者:已經開始用 ChatGPT、Gemini、Claude,但係仲未形成工作流程嘅人。
材料:可以參考最近 Codex 同 Gemini 嘅 agent 化趨勢,但係唔好寫成新聞盤點。
約束:唔好堆砌術語,唔好寫成提示詞大全,唔好用居高臨下嘅語氣。
交付物:畀出完整文章、一個可以複製嘅模板、一個改寫示例。
驗收標準:讀者睇完之後可以即刻改寫自己嘅一條 AI 需求,仲願意轉畀一個"成日話 AI 唔好用"嘅朋友。
第一句好似隨口叫人幫手咁。
第二段已經可以交畀人繼續做。
好多人對 AI 嘅失望,成日從呢度開始:你個腦入面有一堆默認前提,AI 一個都唔知。
比如"寫得好啲"。
呢句話太常見喇,但係 AI 聽唔明你嘅"好"到底指咩。係觀點更硬啲,語言更似人話,定係更適合公眾號傳播?
"要有深度"都一樣。深度可以係行業趨勢,可以係個人經驗,亦都可以係將一個普通人日日遇到嘅問題講到透。
至於"排版好睇啲",範圍更大。公眾號雜誌感、小紅書知識卡、PPT 式資訊圖,都可以叫好睇,但係做法完全唔同。
AI 唔怕你要求高。
佢怕嘅係你自己都唔知想要咩。
我而家越來越少將 AI 當"搜索框"咁用。
更多時候,我會將佢當成一個新同事。
既然係同事,就唔可以剩係掉低一句"你搞搞佢"。你要話畀佢知:呢件事點解要做,畀邊個睇,有啲咩材料,界線喺邊度,最後交啲咩,點樣先算合格。
一張好用嘅 AI 任務單,至少寫清楚呢 7 件事。
首先寫目標
你想 AI 最後幫你完成啲咩?"幫我想諗"太虛啦。可以改成:"整理成一份 10 分鐘課程大綱""寫一篇可以發布嘅公眾號初稿""將呢份資料轉成表格"。
再補返背景
呢件事點解要做?而家卡喺邊度?以前試過啲乜?背景越清楚,AI 越唔容易畀你套模板。
跟住說明對象
內容畀邊個睇?學生、家長、同事、客戶、公眾號讀者,佢哋在意嘅點完全唔一樣。對象唔清,語氣就會飄。
材料都要畀
你手上有啲咩資料?文章、表格、連結、舊稿、課堂經驗、歷史案例,都可以畀。AI 唔會讀心,佢只能根據你畀嘅嘢繼續做。
限制要提前講清楚
唔好做啲咩,同樣重要。例如唔好堆砌術語,唔好寫成營銷文,唔好超過 1500 字,唔好憑空編數據,唔好將語氣寫得太似老師訓人。
然後講清楚交付物
最後畀你啲咩?文章、清單、表格、腳本、PPT 大綱、代碼、檢查報告,定係下一步行動方案。交付物越明確,返工越少。
最後唔好漏咗驗收標準
點樣先算好?你會用邊幾個標準判斷佢用唔用得?好多人漏咗呢一點,所以 AI 只能估你嘅偏好。
呢 7 件事寫清楚之後,AI 嘅輸出未必一步到位,但至少進入咗一個可以改、可以驗收、可以繼續推進嘅狀態。
咁就夠啦。
做內容、做課件、做方案,第一稿粗啲好正常。真正麻煩嘅係你睇完淨係會話"唔啱",但係講唔出邊度唔啱。
任務單嘅價值就在呢度。
佢令到你落手落腳有地方。
下次你要畀 AI 做嘢,可以將呢段先複製過去:
【AI 任務單】
目標:
我希望你最尾幫我完成啲咩?
背景:
呢件事點解要做?而家卡喺邊度?有啲咩前置資訊?
對象:
內容畀邊個睇?佢最在意啲咩?佢唔鍾意啲咩?
材料:
你可以參考邊啲資料、文稿、數據、連結或者歷史經驗?
約束:
唔好做啲咩?語氣、字數、格式、界線係咩?
交付物:
最後畀我啲咩?文章、清單、表格、腳本、PPT 大綱,定係可執行步驟?
驗收標準:
點樣先算合格?我會用邊幾個標準判斷佢好唔好?
唔使每次都寫咁滿。
小任務可以短啲。
比如:
目標:將下面呢段話改得更適合公眾號開頭。
對象:讀者係已經用過 AI,但成日覺得輸出空泛嘅人。
約束:唔好雞湯,唔好誇張標題,唔好超過 200 字。
驗收標準:第一段可以令讀者覺得"呢度講嘅咪就係我囉"。
呢個已經比"幫我潤色嚇"強好多。
因為佢將"潤色"呢個模糊動作,拆成咗目標、讀者、界線同判斷標準。
好多人而家仲喺度問:
"ChatGPT、Gemini、Claude,到底邊個最強?"
呢個問題有啲似問:
"辦公室入面,編輯、資料員、項目經理、程序員,邊個最強?"
冇得咁樣比。
先問清楚:呢件事需要邊個崗位?
Gemini — 資料員
資料同背景,可以交畀佢先。同搜索、長上下文結合更緊密。
Claude — 編輯
長文結構、語氣審查、邏輯拆解,往往更似一個有耐性嘅編輯。
ChatGPT — 多面手
多版本生成、清單整理、流程設計、反反覆覆改表達,做起身好順。
Codex — 執行者
遇到文件、代碼、網頁、自動化,尤其係"做完之後要可以驗證"嘅任務,更似可以入工作枱嘅執行者。
呢度唔好做排行榜,先做分工表。
而分工嘅前提,都係任務單。
你連任務係咩都冇講清楚,換再強嘅模型,都只係令佢更快咁估錯。
我唔係好建議大家繼續沉迷"萬能提示詞"。
提示詞當然有用,但係佢解決嘅係一句話點樣問。
任務單解決嘅係一件事點樣交付。
呢兩個層級唔一樣。
將來 AI 越來越犀利之後,人嘅差距反而會更明顯。
我見到嘅差距大概係咁:一種用法仲停留喺搜索框,每次問一句,複製一段,刪刪改改。
另一種用法已經進入工作流程:先定目標,再畀材料,再講界線,見到交付物之後,按驗收標準繼續改。
提示詞收藏得再多,最後都係要返返去一件事:你能否將一團模糊嘅想法,拆成目標、背景、對象、材料、限制、交付物同驗收標準。
講到尾,AI 再犀利,方向盤都係喺你手度。
你畀佢一句模糊嘅話,佢就淨係可以畀你一個大概見得人嘅結果。
你畀佢一張清楚嘅任務單,佢先有機會幫你將件事向前推一段。
下次開 AI,不妨先唔好咁急問"邊個最強"。
先問自己一句:
我今次,真係將任務講清楚咗未?
很多人用 AI 的第一句話,通常都很像:
"幫我寫一篇公眾號。"
"幫我整理一下資料。"
"幫我做個方案。"
AI 很快交來一份東西。標題有了,結構也有,語言還挺順。
可你越看越彆扭。
像一篇能交差的稿子。
但真要發,你又不放心。
我做公眾號時最怕這種稿子。它沒有明顯錯誤,卻哪裏都差一點。你想改,又不知道從哪一刀下去。
這時候很多人會說:這個 AI 不行。
我更願意先回頭看一句話:剛才那活,真的交代清楚了嗎?
以前 AI 更像一個聊天窗口。你問一句,它答一句。問得不清楚,它答得泛一點,問題還不算太大。
但現在不一樣了。
AI 正在從"回答問題",變成"接任務幹活"。
OpenAI 最近在 Codex 上連續更新:手機端遠程接入、Goal mode、Windows 上的 Computer Use。意思很直接,AI 不再只是坐在聊天框裏等你提問,它開始能在你的設備、文件、網頁和項目裏推進一段真實工作。
Google 也在 Gemini 裏推 Daily Brief 和 Gemini Spark,一個方向是主動整理你每天該看的信息,另一個方向是讓 AI 在後台幫你推進跨應用任務。
這些更新別隻當產品新聞看。
背後的變化很樸素:AI 已經開始接活了。
那問題也跟着變了。
當 AI 只能聊天時,你需要一句好 prompt。
當 AI 開始能幹活時,你需要一張清楚的任務單。
同樣是讓 AI 寫文章,這兩種說法差別很大。
幫我寫一篇關於 AI 使用技巧的公眾號文章。
目標:寫一篇 1800 字左右的公眾號文章,告訴普通人為什麼 AI 輸出泛、空、不像自己要的,核心方法是把模糊需求改成任務單。
讀者:已經開始用 ChatGPT、Gemini、Claude,但還沒有形成工作流的人。
材料:可以參考最近 Codex 和 Gemini 的 agent 化趨勢,但不要寫成新聞盤點。
約束:不要堆術語,不要寫成提示詞大全,不要用居高臨下的語氣。
交付物:給出完整文章、一個可複製模板、一個改寫示例。
驗收標準:讀者看完能馬上改寫自己的一條 AI 需求,並願意轉給一個"總說 AI 不好用"的朋友。
第一句像隨口喊人幫忙。
第二段已經能交給人接着做。
很多人對 AI 的失望,常常從這裏開始:你腦子裏有一堆默認前提,AI 一個都不知道。
比如"寫得好一點"。
這句話太常見了,但 AI 聽不懂你的"好"到底指什麼。是觀點更硬一點,語言更像人話,還是更適合公眾號傳播?
"要有深度"也一樣。深度可以是行業趨勢,可以是個人經驗,也可以是把一個普通人天天遇到的問題講透。
至於"排版好看一點",範圍更大。公眾號雜誌感、小紅書知識卡、PPT 式信息圖,都能叫好看,但做法完全不同。
AI 不怕你要求高。
它怕的是你自己也不知道要什麼。
我現在越來越少把 AI 當"搜索框"用。
更多時候,我會把它當成一個新同事。
既然是同事,就不能只甩一句"你弄一下"。你得告訴它:這件事為什麼做,給誰看,有什麼材料,邊界在哪裏,最後交什麼,什麼樣算合格。
一張好用的 AI 任務單,至少寫清楚這 7 件事。
先寫目標
你希望 AI 最終幫你完成什麼?"幫我想想"太虛了。可以改成:"整理成一份 10 分鐘課程大綱""寫一篇能發佈的公眾號初稿""把這份資料轉成表格"。
再補背景
這件事為什麼要做?現在卡在哪裏?以前試過什麼?背景越清楚,AI 越不容易給你套模板。
接着說明對象
內容給誰看?學生、家長、同事、客戶、公眾號讀者,他們在意的點完全不一樣。對象不清,語氣就會飄。
材料也要給
你手裏有什麼資料?文章、表格、連結、舊稿、課堂經驗、歷史案例,都可以給。AI 不會讀心,它只能根據你給的東西往下做。
約束要提前說
不要做什麼,同樣重要。比如不要堆術語,不要寫成營銷文,不要超過 1500 字,不要憑空編數據,不要把語氣寫得太像老師訓人。
然後說清交付物
最後給你什麼?文章、清單、表格、腳本、PPT 大綱、代碼、檢查報告,還是下一步行動方案。交付物越明確,返工越少。
最後別漏掉驗收標準
什麼樣算好?你會用哪幾個標準判斷它能不能用?很多人漏掉這一點,所以 AI 只能猜你的偏好。
這 7 件事寫清楚以後,AI 的輸出不一定一步到位,但至少進入了一個能改、能驗收、能繼續推進的狀態。
這就夠了。
做內容、做課件、做方案,第一稿粗一點很正常。真正麻煩的是你看完只會說"不對",卻說不出哪裏不對。
任務單的價值就在這裏。
它讓你有地方下手。
下次你要讓 AI 做事,可以先把這段複製過去:
【AI 任務單】
目標:
我希望你最終幫我完成什麼?
背景:
這件事為什麼要做?現在卡在哪裏?有哪些前置信息?
對象:
內容給誰看?他最在意什麼?他不喜歡什麼?
材料:
你可以參考哪些資料、文稿、數據、連結或歷史經驗?
約束:
不要做什麼?語氣、字數、格式、邊界是什麼?
交付物:
最後給我什麼?文章、清單、表格、腳本、PPT 大綱,還是可執行步驟?
驗收標準:
什麼樣算合格?我會用哪幾個標準判斷它好不好?
不用每次都寫這麼滿。
小任務可以短一點。
比如:
目標:把下面這段話改得更適合公眾號開頭。
對象:讀者是已經用過 AI,但總覺得輸出泛的人。
約束:不要雞湯,不要誇張標題,不要超過 200 字。
驗收標準:第一段能讓讀者覺得"這說的不就是我嗎"。
這已經比"幫我潤色一下"強很多。
因為它把"潤色"這個模糊動作,拆成了目標、讀者、邊界和判斷標準。
很多人現在還在問:
"ChatGPT、Gemini、Claude,到底哪個最強?"
這個問題有點像問:
"辦公室裏,編輯、資料員、項目經理、程序員,誰最強?"
沒法這麼比。
先問清楚:這件事需要哪個崗位?
Gemini — 資料員
資料和背景,可以先交給它。和搜索、長上下文結合更緊。
Claude — 編輯
長文結構、語氣審查、邏輯拆解,往往更像一個耐心編輯。
ChatGPT — 多面手
多版本生成、清單整理、流程設計、反覆改表達,做起來很順。
Codex — 執行者
碰到文件、代碼、網頁、自動化,尤其是"做完以後要能驗證"的任務,更像能進工作台的執行者。
這裏別做排行榜,先做分工表。
而分工的前提,還是任務單。
你連任務是什麼都沒說清楚,換再強的模型,也只是讓它更快地猜錯。
我不太建議大家繼續沉迷"萬能提示詞"。
提示詞當然有用,但它解決的是一句話怎麼問。
任務單解決的是一件事怎麼交付。
這兩個層級不一樣。
未來 AI 越來越能幹以後,人的差距反而會更明顯。
我看到的差距大概在這裏:一種用法還停在搜索框,每次問一句,複製一段,刪刪改改。
另一種用法已經進入工作流:先定目標,再給材料,再說邊界,看到交付物以後,按驗收標準繼續改。
提示詞收藏得再多,最後還是要回到一件事:你能不能把一團模糊想法,拆成目標、背景、對象、材料、約束、交付物和驗收標準。
說到底,AI 再能幹,方向盤還是在你手裏。
你給它一句模糊的話,它就只能給你一個大概能看的結果。
你給它一張清楚的任務單,它才有機會替你把事情往前推一段。
下次打開 AI,不妨先別急着問"哪個最強"。
先問自己一句:
我這次,真的把任務說清楚了嗎?