1年半,我把公眾號流水線壓縮了30倍
整理版優先睇
將公眾號內容生產效率提升 30 倍的關鍵,在於將「真人大腦的判斷力」餵給 AI,而非單純追求提示詞技巧。
- 核心結論:AI 工作流的起點是精確定義輸入與輸出(如 4000 字命門),而非直接寫提示詞。
- 迭代方法:採用「增量迭代」而非推翻重寫,從能用到加入身份場景,再到四階段工作流與技巧指導。
- 邏輯差異:一套提示詞的人格基調必須統一(全理性或全感性),避免模型因指令矛盾而產生輸出搖擺。
- 核心啟發:真正的壁壘是 AI 看不見的「黑盒數據」,包括私有後台數據、客戶溝通細節與實戰覆盤經驗。
- 可行動點:追求「85 分的穩定輸出」遠比「95 分的偶爾驚艷」重要,應保留多個版本提示詞以應對模型升級風險。
公眾號內容生產 7 步流水線
語音轉文字 -> 洗稿優化 -> 邏輯梳理 -> 標題生成 -> 加粗與圖位設定 -> 評論區生成 -> Markdown 插件排版。
單屏視覺鐵律
任何一屏的純文字佔比不能超過 75%,否則跳出率會平均高出 30% 以上。
提示詞迭代:唔好諗住一嚟就完美
好多人寫 Prompt 嘅誤區係想一次過到位,結果跑唔通就放棄。其實高質嘅提示詞係「磨」出嚟嘅,每一版只做一個增量。
最重要係保持「人格一致」,唔好又要 AI 理性又要佢感性,指令矛盾只會令輸出變得好古怪。
邏輯重構:將口語碎料變做結構化乾貨
嘉賓分享通常好散,洗稿只係令文字通順,真正嘅價值在於邏輯梳理。我將呢個過程拆成四個階段,確保內容有深度又有節奏感。
階段一:問題意圖深度分析(拆解表層、結構、深層意圖)
階段二:原回答邏輯精準解構(識別因果、並列、遞進關係)
階段三:邏輯重構與優化(建立「開門見山 -> 逐層深入 -> 總結昇華」架構)
階段四:語言潤色與自然化處理(第一人稱表達、長短句交替、戰略性使用破折號)
點擊與留存:標題決定生死,排版決定跳出
內容再好,標題唔得都係嘥氣。我會要求 AI 同時扮演「增長黑客、資深編輯、用戶心理師」三個角色,等佢哋內部互相制衡,出嚟嘅標題先至夠穩。
單屏純文字佔比唔可以超過 75%,呢條係用數據換返嚟嘅鐵律。
加粗唔係亂加,係要點綴視覺;小標題要承接大標題嘅情緒,唔好大標題好爆,入到去變咗散文,讀者會即刻出戲。
真正的壁壘:工具只係放大你嘅判斷力
AI 唔會替代你嘅判斷,佢只係幫你將判斷標準化。先累積自己嘅「黑盒」,再去搭工作流,呢條路先至行得通。
1年半,我把公眾號流水線壓縮了30倍
這篇文章的起點,其實是前段時間一個朋友找我聊天。他也做內容,問我,你到底是怎麼把那件事做到現在這個效率的。
我當時沒回答好,只說了一句,"慢慢磨出來的"。
後來回去想想,這個"慢慢"其實不是敷衍,它真的是一年半的事,是四版提示詞的迭代,是無數次對着屏幕重排、加粗、換小標題的過程。但如果我不把它一次性講清楚,下次還有人問我,我可能還是說"慢慢磨出來的"。
所以這一篇,算是給自己做一份完整的覆盤,也給感興趣的朋友一份可以參考的路徑圖。
希望能給正在做內容、正在搭流水線、或者對"提示詞工程到底是什麼"好奇的朋友,帶來一些啓發~

01. 起點:4000 字是一條命門
很多人會覺得,做公眾號內容工作流的第一步,是先寫提示詞。
其實不是。
任何一套工作流的第一步,是先搞清楚你的原始輸入是什麼、最終產品長什麼樣。這一點不先定下來,後面所有的提示詞都會飄。
我的場景,是一個內容社羣每週 3-4 場嘉賓線上分享的稿件生產。原始輸入有三種:音頻(嘉賓現場分享,帶 PPT)、視頻(要拆字幕)、還有直接的 webhook 轉文字稿(錄音軟件自動轉出來的粗稿)。
這三種進來都是一個毛病——口語化、有卡殼、有重複、有改口、信息跳躍、邏輯板塊零散。
那產品呢?是一篇大標題 + 4-5 個板塊 + 每板塊有小標題的結構化推文。
中間還有一個關鍵的業務約束——最終只輸出 4000 字。
不是 3000,也不是 5000,就是 4000。
這個數不是我個人審美定的。是我們在前期用不同字數實測跑過之後,發現超過 4000 字,現場業務團隊就消化不動了。下游的反饋、內部的同步、後續的推廣,全都會在這個數字後面開始堵。
所以 4000 字是一條命門。
這個數一定下來,我知道洗稿要壓到多少、邏輯梳理要保留哪些、哪些板塊必須砍。後面所有提示詞的寫法,都是圍繞這個數字在服務。

一切工作流的地基,不是提示詞,是你對"輸入"和"輸出"有多清楚的定義。
很多朋友跑工作流跑不穩,不是因為提示詞不夠牛,是因為這個地基沒打好——模型不知道要把文章壓到多長、保留多少、風格朝哪邊走。它就只能猜,猜出來的東西自然飄。
所以我一直會跟身邊的朋友說,你先把"終點產品"擺在桌上,再回頭想"起點"怎麼處理。這條路才走得穩。
02. v1 → v4:所有迭代不推翻,只做"增量"
第二件我想先講的事,是提示詞本身的迭代哲學。
因為幾乎所有人一開始寫提示詞,都會陷入一個誤區——總想一次寫完美。
結果呢,寫到一半寫不下去,或者寫完跑一次不行就整個推翻重來。重來兩三次之後,整個人就泄氣了,覺得"提示詞也沒那麼神"。
其實不是提示詞沒那麼神,是你一開始就對"第一版"的期待太高了。
我做洗稿提示詞(我給它編號叫 SF01),從第一版到現在,整整迭代了 4 個版本。每一版,我只做一件事的增量。
v1 版本,我只要求它做一件事——能用。
不要求美觀、不要求精修、不要求風格一致,只要它能把一份粗稿變成一份通順可讀的稿子,我就認這是 1.0。
這一步是最關鍵的,也是大部分人跨不過去的一步。1.0 不能追求完美,因為 1.0 的價值不在完美,在"能跑通整條鏈"。只要 1.0 跑通了,後面的 2.0、3.0,都是在這條已經跑通的鏈上做微調,每一次的成本都很小。
如果你在 1.0 上就陷進去追求完美,後面每一次修改都等於重啓,你永遠跑不到 v4。

v2 版本,我加了兩樣東西——具體身份 + 具體場景。
v1 的輸出不穩定,有時候連貫性夠,有時候保留度不對。我觀察了幾次之後,發現一個問題——模型不知道自己在扮演誰。
所以我給它加了一句身份:"你是一名資深內容編輯助理,對處理採訪類文字稿件有深厚經驗。"
再加了一句場景:"我們是一家新媒體內容公司,剛完成一對一採訪。"
就這兩句話,v1 的輸出質量立刻穩了一個檔。
v3 版本,我加了四階段工作流:分析 → 基礎語言優化 → 內容結構優化 → 最終精細調整。
這一步是我當時最大的一次認知躍遷。
傳統寫提示詞,通常只寫一個身份、一個要求。但模型並不會像一個日常做這件事的真人那樣思考——一個真正做了幾年採訪稿的編輯,是不會拿到稿子就開始改的,他會先看一遍稿件、再掃錯字、再定重點、最後才開始改。
四階段工作流,就是把"真人大腦裏的步驟"翻譯給模型。
模型不再猜順序,它一步一步走完,每一步有每一步的任務。輸出穩定性和深度立刻都上了一個台階。
v4 版本,是完成體。
加了兩樣東西:一是技巧指導(五類具體規則,比如"句中主語重複冗餘要簡化""保留感情色彩不要變成沒感情的文字"),二是事項複述確認——讓模型先複述一遍我講的話,我確認它真的聽懂了,才讓它開始做。
複述這個動作是我後來加的一個小習慣,但效果特別好。因為模型有時候會"以為自己聽懂了",但實際上它抓的重點跟我要的不是一回事。複述這一步,相當於在開始之前做一次對齊,把它跑偏的概率壓下去。
這一整套 4 版迭代下來,其實有一個核心的原則:
每一版都是在上一版的基礎上改一小塊。不是全部推翻重寫。
v2 只改身份、v3 只加工作流、v4 只加技巧。每一版的改動都很小,但每一版都能在前一版的產物上直接接着跑。
這就意味着我的時間投入永遠是增量的,不是每次重來。
v1 不要追求完美,v2-v4 不要推翻重寫。
迭代不是重來,迭代是堆疊。
這個哲學,後來我也套到了小標題提示詞、加粗提示詞、評論生成提示詞上。每一套提示詞現在都有 3-5 個版本,但每一版之間的跨度都很小,我從來不怕某一版失敗——因為最多退回上一版。
扯遠了,我們回到主題。
03. 邏輯梳理:一套提示詞的整體人格必須一致
洗完稿只是文字順了。邏輯還是散的。
因為嘉賓本來就經常繞圈、跳回前面的話題、說一半跳走。這些跳躍在口語裏沒問題,但放到文字裏,讀者會跟不上。
所以我做了第二步提示詞,編號 LW01——邏輯梳理。
這一步也用了四階段:
階段一 · 問題意圖深度分析:把嘉賓回答的問題拆成表層意圖、結構意圖、深層意圖。問題本身也分類(事實型、過程型、觀點型、背景型),不同類型的問題需要不同的回答結構。 階段二 · 原回答邏輯精準解構:把回答裏的關鍵觀點逐個提出來,識別因果、並列、遞進、轉折關係,找出邏輯跳躍和斷點。 階段三 · 邏輯重構與優化:基於意圖設計最優結構,建立"開門見山 → 逐層深入 → 總結昇華"的回答架構。 階段四 · 語言潤色與自然化處理:第一人稱表達(避免連續"我"開頭)、口語化但不學術化、節奏感(破折號 ——戰略性使用)、長短句交替。
這一步我踩過一個很大的坑,值得專門講一下。
提示詞裏的指令,不能互相矛盾。
我舉個例子。最開始我在 v1 裏寫:"你是一個處理文檔的理性編輯。"然後在階段四的語言潤色部分又寫:"你是一個富有感性和創造力的人。"
看起來沒問題對吧?一個理性一個感性,各司其職。
但模型不是人。它接到兩個相反指令時,會"猜",會搖擺。結果就是它輸出的東西兩頭不靠——偏感性但又帶理性分析,非常彆扭。
一套提示詞的整體人格必須一致。
要理性就整套理性,要感性就整套感性。不要在同一個 prompt 裏讓模型精分。
這句話我後來也反覆跟身邊寫提示詞的朋友強調。因為這個坑真的太隱蔽了——你寫的時候覺得很自然,兩個要求都合理,但模型接到手裏就是亂的。
所以從 v3 開始,我寫任何一套新提示詞,都會先定整體的人格基調。是理性還是感性、是嚴謹還是放鬆、是書面還是口語——先定基調,後面所有階段都圍着它走。

04. 標題:一篇推文的點擊率,90% 取決於它
講到標題,我要先說一個我花了很久才接受的事實——
一篇推文的點擊率,90% 取決於大標題。
內容人會本能抗拒這個事實。我們總覺得"內容好才是王道"。但數據一次次打臉:好內容 + 爛標題 = 沒人看。
所以大標題提示詞這一套,我也做得很重。v1.0 我直接把它定義成"公眾號爆款標題生成器",四階段:
階段一 · 深度內容解構與價值提煉:找核心敍事(有沒有明顯的起點-終點轉變)、挖掘關鍵要素(數字、金額、時間、成就、排名)、分析目標受眾(痛點和癢點)、識別傳播鈎子(反常識、戲劇性、新穎性)。 階段二 · 多元策略制定與視角切換:讓模型同時扮演三個角色——增長黑客(最大化點擊率)+ 資深編輯(避免標題黨)+ 用戶心理師(觸動情緒需求)。然後從 8 種標題原型裏選 1-2 種組合:強對比/逆襲、數字/量化、揭秘/稀缺、痛點/解決方案、身份/羣體、名人/名企背書、顛覆認知、情緒共鳴/價值觀。 階段三 · 標題生成與精煉打磨:先生成 8-10 個初稿覆蓋不同角度(聚焦人物/聚焦成就/聚焦方法/聚焦情緒),再應用最佳實踐——中文全角 |做分隔符創造節奏、嵌入核心關鍵詞、用精準有力的動詞、保持簡潔、避免過度承諾。階段四:從初稿裏按相關性、吸引力、清晰度、差異性、目標性 5 個維度篩出 5 個最終版本。
輸出就是乾淨的 5 個候選標題,不要解釋、不要分析過程。我再人工選一個。
這裏有一個細節,我要專門講——"讓模型同時扮演三個角色"。
一開始我是用一個角色的。讓模型當"增長黑客",結果出來的標題全是追求點擊率的標題黨。讓它當"資深編輯",出來的又太穩、不抓人。讓它當"用戶心理師",又過於煽情。
三個角色同時扮演之後,三個價值觀在它內部互相制衡,出來的東西自然就在三者的平衡點上。

這個做法後來我也套到了別的提示詞上。比如寫社羣文案時讓模型同時扮演"銷售 + 內容編輯 + 社羣運營者"。多角色平衡,是我後來一個比較穩定的技巧。
05. 小標題:段落之間的閲讀鈎子
大標題決定點擊,小標題決定翻不翻下去。
90% 的人忽略這一環——以為小標題就是分隔符。其實它承擔的是"每讀一段就重新激活興趣"的任務。
我小標題提示詞對標的是一個在小標題這件事上做得非常穩的號。
它的風格長這樣:
格式:常用 -數字-開頭,標題分兩行寫,利用換行增強視覺衝擊語氣:口語化、直接、大膽、帶戲謔或挑戰("醒醒吧,菜鳥!""竟值得鼓勵?!""多到你懵逼!") 內容聚焦:衝突與反差、痛點與疑問、核心方法或認知、具體成果
這一套對標下來,我的稿子小標題質量直接上了一個檔。
但這裏有一個我反覆強調的點——小標題要跟大標題在情緒上連貫。
大標題如果是數字反差型("18.5 萬字之後"),小標題就應該延續數字 / 反差的節奏。大標題如果是痛點質疑型,小標題就要繼續帶鋒利感。大標題如果是治癒共鳴型,小標題就應該是温潤的。

最怕的是大標題衝得像 10 萬加,小標題寫得像散文集。讀者的情緒是一根連續的線,你中途換風格,等於把線剪斷。
大標題和小標題必須在情緒上連貫。
兩頭不連,讀者會出戲。
06. 加粗與圖片位:單屏 75% 是一條鐵律
一篇 4000-5000 字的推文,如果純文字鋪下來不加粗、不插圖,用戶讀到第二屏就會退出。
我的加粗提示詞是 v2.0,編號 GZH_Format_02,做的是"內置風格版"。加粗邏輯分兩塊:
加粗什麼:核心觀點(段首或段尾的主旨句)、強對比/轉折("但是"後面那句通常要加粗)、關鍵建議、數據成就、強情感句子。
加粗多少:幾乎每個邏輯完整的短段落(2-5 句話)內都應該有一處加粗,但單個段落不超過 2 處。視覺上要形成點綴感,不是大面積塗抹。
圖片位置規則更嚴格:
每個主小標題下的第一段結束後必須插入一張圖 文章引言/人物介紹之後插 1-2 張 每 5-7 個短段落插一張圖,維持閲讀節奏
這裏有一條我反覆驗證過的鐵律——
任何一屏的純文字佔比不能超過 75%,否則跳出率平均高出 30%+。

這個 75% 不是我拍腦袋定的。是我們覆盤過幾十篇跳出率高的文章之後,發現的共性——一屏純文字 > 75% 的文章,平均跳出率比同類高 30% 以上。
這套規則其實完全不是 AI 自己能推出來的。模型只能根據語義給你建議加粗,它不知道"哪種加粗會被用戶划走、哪種加粗會被記住"。
這種判斷,必須你自己親手做過才能有。
我以前在公眾號後台親手當過小編——手動加粗、手動調圖位、手動看預覽、手動跑數據。那段時間我沒什麼別的事,就是不斷地自己加、自己看、自己改。所以現在我寫加粗提示詞的時候,那 75% 的閾值是刻在我肌肉記憶裏的。
07. 評論區:9 種類型是社交證明 + 算法信號的雙重活
這是很多人忽略的一環。
公眾號推文發出後,如果 30 分鐘內評論區沒有聲音,整體的推薦權重就會被壓下去。評論區不光是社交證明,它還是給算法的信號。
我研究過自己賬號以及市面上爆款號的評論區,把評論分成了 9 種類型:
01. 共鳴型——"原來我也是這樣!" 02. 行業內涵型——帶行業黑話或圈內梗 03. 實操落地反饋型——"我按你的方法做了,結果 XXX" 04. 提問互動延展型——"那如果遇到 XX 場景呢?" 05. 原文發散型——引用原文一段再展開 06. 情緒碰撞觀點觸碰型——對某個觀點激烈認同或反對 07. 吐槽調侃型——輕鬆的玩梗 08. 感謝認可型——直接表達收穫 09. 補充信息型——基於自己經驗補充一個案例
我寫了一個評論生成 skill——每次文章發完之後,它會按 9 種類型混搭生成 10 條參考評論。不是要我複製用,是給我做參考。每條評論的口吻不是正式演講體,而是輕薄的方言口吻——就像你在朋友圈底下隨口回覆一樣。

這裏還有一個小細節——我跟模型說"從今以後我給你這個(文章),你就給我 10 條評論",它就自動記住這個觸發條件,不用每次重新下指令。
08. 最後一步:排版用一個 Markdown 公眾號插件
講到最後一步排版,我現在的工作流是——所有稿子在 Markdown 編輯器裏寫完,然後用一個公眾號排版插件直接預覽、選模板、一鍵複製、粘貼到後台。
這一步的核心能力有三個:
內嵌若干套排版模板,對應不同的文章類型 只要你的 Markdown 帶基本格式(大小標題、段落、加粗、引用塊、圖片位置),插件會自動套樣式 直接複製到剪貼板,粘貼到公眾號後台編輯器,排版完整保留
更進一步,如果你想要一套自己專屬的風格模板——標題字號、段落間距、引用塊底色、首圖樣式——完全可以自己寫樣式文件或改源碼。
我自己就是這麼幹的。做了一版"嘉賓訪談專用模板"——固定首圖樣式、一級標題、二級標題、引用塊樣式,每次稿子寫完,套進去立刻能用。
這套做法最大的好處,是把"寫作"和"排版"徹底分開。你在 Markdown 裏只關心內容,排版是最後 30 秒的事情。

整個鏈路壓到最後是什麼樣子?
語音轉文字(1 分鐘) 洗稿提示詞(30 秒) 邏輯梳理提示詞(1 分鐘) 大標題 + 小標題 + 加粗圖位(每個 30 秒) 排版插件套模板(30 秒) 評論 skill 生成 10 條參考(20 秒) 手動粘貼到公眾號後台(2 分鐘)
全流程 8-10 分鐘一篇推文。 過去人工做半個月到一個月的事情,現在縮到一頓午飯的時間。
09. 但真正的壁壘,其實不是這 7 步
講到這裏,我要說一句我這一年半最想講的話——
這套 7 步流水線和 4 版提示詞,就算我全部公開出去,別人拿去也用不出我這個效果。
很多朋友聽到這裏第一反應是"你在藏私"。我一開始也擔心被這麼理解。但後來我想清楚了——不是藏,是真的文字本身不是壁壘。
壁壘在我另一層東西上。我給它起了個名字,叫"黑盒"。
我的黑盒裏裝着什麼?
第一層:甲方公眾號後台的閲讀、點贊、轉發時間序列。這些數據第三方工具爬不到,只有我給甲方服務的時候能拿到。 第二層:跟甲方的所有微信語音 + 電話記錄。甲方為什麼要改這一段?他夜裏 11 點的語音裏情緒怎麼樣?他不滿意的具體是標題的那個字還是第三段的一個比喻?這些東西只有在場的人知道。 第三層:小編跟甲方對接時"究竟什麼是好內容"的判斷原文。這不是一份 SOP 能記錄的。是 200 次修改對話裏總結出來的"哦,他說的'順'是指這種感覺"。 第四層:幾十篇爆款 vs 幾十篇撲街的對比拆解。同樣的選題,為什麼 A 爆了 B 撲了?這種拆解只有"親自發過 100 篇"的人能做出來。
四層加起來,叫黑盒。

提示詞的真正競爭力不在文字,而在你餵給它的黑盒。
這句話我講過很多次,但每一次講出來都有新的感受。
因為黑盒的四層裏,至少三層是第三方 AI 看不見的——後台數據要甲方信任才能拿到、微信語音電話是私密溝通、小編修改原文在內部文檔裏。AI 能看到的只有最後一層,公開的爆撲對比。但這一層大家都能看到。大家都看到了,就不構成壁壘。
所以當我說"prompt 不是壁壘"——我說的是基於公開數據能寫出來的 prompt 誰都能寫,區別只在你有沒有前三層的私有數據。
10. 工具只把你的判斷放大
這一年半做下來,我有一句話我覺得應該印在 T 恤上——
工具只把你的判斷放大。
你判斷力是 60 分,工具放大到 70 分。
你判斷力是 90 分,工具放大到 110 分。
這是一個乘法。不是加法。
你是 60 分的判斷力抄了一套 95 分的提示詞,跑出來不是 95 分,是 (60 × 1.1) = 66 分。
別人是 90 分的判斷力拿同樣的提示詞,跑出來是 (90 × 1.1) = 99 分。
提示詞是乘數,你的判斷力是基數。基數不夠,乘再大也上不了天。

這也是為什麼"先抄最牛的 prompt"是一條錯的起點。正確的起點是先把你自己的判斷力基數撐起來。
怎麼撐?我給自己當年的路徑做個總結:
我做過小編——自己親手在後台加粗、調圖位、看預覽、跑數據 我覆盤過幾十篇爆款和撲街——對着數據去猜哪個字、哪個結構、哪個圖位起了作用 我跟甲方吃過 200 次修改的飯——理解他們嘴裏的"順""重""拖沓"到底是什麼手感
這些東西全是"親手做過"才有的。AI 推不出來。
11. 最後一條原則:85 分穩定 > 95 分偶爾
覆盤到最後,我想講一條方法論層面的原則。
這條原則我給很多來問我提示詞工程的朋友都講過——
永遠不要追求極致。85 分穩定大於 95 分偶爾。
為什麼?
因為你給客戶做包周服務,客戶要的不是某一週你交了一篇爆文,是每一週你都能穩定交出能用的稿子。
能每天交的,才叫產品。只能偶爾交的,叫運氣。
所以我判斷一套提示詞/一個工作流能不能用,不是看它最高分是多少。是問它:跑 10 次裏有幾次能跑?最低那一次多爛?
如果最低那次能看——85 分穩定,這套流水線成立。 如果最低那次崩了——你沒有工作流,你只有運氣。
同樣的道理,每一版提示詞我都會留着。冠軍、亞軍、季軍都保留。萬一下一個模型升級把你的 v4 跑崩了(這種事我見過),你還有 v3 能頂上。
永遠給自己留後手,永遠不把雞蛋放在一個版本里。這也是"穩定"兩個字背後的一層意思。

12. 寫在最後
這一年半的過程,說長不長,說短不短。
表面上看,我做了 7 套提示詞 × 4 版迭代 = 28 版本的文字工作。
但底下的東西其實是:
把一件重複性的工作標準化;
把你最稀缺的那部分能力餵給 AI;
讓 AI 替代流程,不替代判斷。
這三件事,是我現在覺得所有"AI 工作流"能跑通的底層。
最後一件事——別直接抄這套流水線。
不是怕你學會,是你學不會。
真正的起點,不是抄別人的流水線,是先把你自己的黑盒積累起來。
你親手發過的 30 篇稿子,你後台跑出來的真實數據,你跟讀者/客戶 200 次的溝通原話,你覆盤時的一次次對比——這些才是你真正的積累。
工具只放大它們,永遠不替代它們。
好了,今天的覆盤就到這裏。
希望能給還在搭自己工作流的朋友,帶來一點可以直接拿去用的東西~~~
我們下期不見不散~
byebye~