AI做PPT的正確姿勢：不是一鍵生成，而是分14步提案

作者：神器每日推送

日期：2026年5月5日下午3:09

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

AI做PPT唔應該一鍵生成，而係分14步提案，確保尾部質量

整理版摘要

大家用AI做PPT，最常見就係用Gamma呢類一鍵生成工具，30秒就有份12頁幻燈片，但拎唔出手。點解？因為「還行」同「能用」之間仲差好遠。呢啲工具跳過曬所有需要確認嘅環節，直接俾個「睇落完整」嘅成品你，導致風格漂移、排版崩潰、內容空洞。尾部10%嘅質量欠佳，最終你都要自己重做。

為瞭解決呢個問題，開源項目ppt-image-first提出另一種工作流——先俾你睇夠咗，先至繼續。佢係一個14階段狀態機，核心係5個階段：Intake、內容基底、風格預覽、規劃鎖定同生成評審。最特別係風格預覽，先出3套共9張真實內容預覽圖，讓你揀最接近想要嘅質感。然後進行風格反演，確保成份PPT視覺一致。最後用HTML評審工作台直標修改。成個過程你只需要回答「邊個更貼近我想要的」，AI就係提案機器，你係決策者。

呢個工作流適合答辯、彙報、路演、產品介紹呢類需要設計感但時間緊嘅場景。但藝術創作同極致定製就唔太啱，因為美學範圍受預訓練模型限制。開源Apache-2.0，支援Claude Code、Codex CLI、WorkBuddy。

一鍵生成AI PPT只達到90%質量，尾部10%需要大量手動調整；ppt-image-first透過14步提案流程確保每個環節有確認，提升尾部質量。
核心方法係5階段：Intake輸入需求、內容基底結構化、風格預覽出9張真實圖、規劃鎖定用風格反演提取一致性、生成評審用HTML工作台直標修改。
同Gamma等工具最大分別係「AI提案，人決策」：AI輸出多個方案由你選擇，唔係直接生成完稿。
啟發：高質量輸出需要先分離風格探索同內容生成，等用戶確認方向先至生成，大幅減少返工。
可行動點：使用ppt-image-first GitHub開源項目，或者用作者提供嘅優化Skill，應用係路演、彙報等場景。

值得記低

工具 github.com

ppt-image-first

開源AI PPT工作流，14階段狀態機，支援風格預覽與HTML評審

Skill pan.quark.cn

優化好嘅Skill（夸克網盤）

由作者優化，用於Claude Code / Codex CLI / WorkBuddy

整理重點

一鍵生成嘅90%陷阱

用AI做PPT最大問題唔係做唔出，係做得太容易。你輸入「產品路演」，30秒就出一份12頁幻燈片，封面有圖、目錄有結構、配色和諧，但係你唔會用呢份野——因為「還行」同「能用」之間隔住一個數量級。

生成只係流程嘅最後一步，前面該確認嘅環節全被跳過咗。

市面上嘅AI PPT工具，從Gamma到Beautiful.ai，底層邏輯都係俾個模板庫，塞文字入去，揀配色，交貨。呢個模式係90%場景睇落冇問題，但決定你用唔用嘅係剩低嗰10%。

march of nines

最終你仲要自己重做，仲不如一開始就用啱方法。

整理重點

先睇夠再行動——ppt-image-first嘅設計哲學

ppt-image-first係一個開源AI PPT工作流，思路同「一鍵生成」完全相反：先俾你睇夠咗，先至繼續。佢係一個14階段狀態機，由5個階段構成，每個階段都要你確認方向先向前行。

14階段狀態機

作者NyxTides設計呢個工作流嘅核心哲學係：AI負責提案，人負責決策。唔係AI替你做完，而係AI俾你多個選擇，你揀一個最貼近想要嘅方向，再繼續深化。

風格反演

continuity anchor

成個工作流設計得好流暢——填需求、自動出基底、自動出預覽，每一步都俾你睇結果、等你確認，認知負荷好低。

整理重點

核心工作流拆解——5階段實戰

1 Intake：你話俾AI知用途、受眾、有咩材料，AI輸出baseline judgment，你確認，約3分鐘。
2 內容基底：AI根據材料整理成content_report.md，將散亂素材結構化，約2分鐘自動完成。
3 風格預覽：呢個係核心環節！AI先出3套完整嘅首頁、目錄頁、正文頁預覽圖，總共9張，基於你嘅真實內容生成，唔係佔位符。你可以直接對比，揀最接近想要嘅質感。
4 規劃鎖定：揀定風格後，AI做「風格反演」——從生成的圖提取風格事實，鎖定配色、材質、裝飾等一致性，然後寫設計規範、頁面藍圖同鎖定文件。
5 生成評審：最終頁面生成後，用HTML評審工作台直標修改，可以畫筆、矩形框、註釋點，標註數據自動保存，確認後導出PPTX。

baseline judgment

content_report.md

3套風格、9張預覽圖

HTML評審工作台

由啟動到睇到9張預覽圖，大概20分鐘，中間冇卡頓。之後嘅規劃鎖定同生成評審更順，因為方向已經定過。

整理重點

適用場景同限制

答辯

彙報

路演

產品介紹

呢個工作流最適合需要設計感但時間緊嘅場景。你唔需要從零諗排版，只需要揀方向就得。

項目係開源嘅，Apache-2.0授權，支援Claude Code、Codex CLI同WorkBuddy。作者仲提供咗一個優化好嘅Skill，可以係夸克網盤下載，直接用喺呢啲工具上，減少設定時間。

開源Apache-2.0

Claude Code

Codex CLI

WorkBuddy

AI 做 PPT 最大嘅問題唔係做唔出嚟，而係做出嚟太容易。

我第一次用 Gamma，輸入「產品路演」，30 秒就拎到一份 12 頁嘅幻燈片。封面有圖，目錄有結構，配色都算和諧。我睇咗兩次，一個字都冇改，就直接閂咗——因為呢份嘢根本拎唔出手。

點解？因為「還行」同「用得」之間差咗一個數量級。生成只係流程嘅最後一步，前面應該確認嘅環節全部 skip 曬。

90% 場合用到嘅嘢，唔值得用

市面上嘅 AI PPT 工具，由 Gamma 到 Beautiful.ai 到各種國產 SaaS，底層邏輯都一樣：俾你一個模板庫，將你啲文字塞入去，揀個配色方案，然後交貨。

呢個模式喺 90% 嘅場景下睇落冇問題。封面有圖，目錄有結構，正文有排版。但決定你用唔用呢份 PPT 嘅，從來都唔係嗰 90%——而係剩低嗰 10%。

風格由頭到尾飄忽不定，封面係科技藍、正文變成文藝綠。排版喺某啲頁面突然崩潰，資訊密度時高時低。內容空洞，每頁都似佔位符。呢啲唔係 bug，係一鍵生成工作流程嘅必然結果：跳過所有需要確認嘅環節，直接俾你一個「睇落完整」嘅嘢。

工程上有個講法叫 march of nines——由 90% 到 99.9% 嘅爬坡，比由 0 到 90% 仲難。AI PPT 卡住嘅就係呢最後一截：尾部質量唔得，你最終仲要自己重新做。

ppt-image-first：將生成當成終局嘅反面

ppt-image-first 係一個開源嘅 AI PPT 工作流程，10 日之內喺 GitHub 攞到 555 粒星。思路同「一鍵生成」完全相反：先俾你睇夠，先至繼續行落去。

佢嘅工作流程係一個 14 階段狀態機。簡單講，5 個階段：

1. Intake — 你話俾佢知用途、受眾、有啲咩材料。佢輸出一個 baseline judgment，你確認。3 分鐘。

2. 內容基底 — 佢根據你嘅材料整理出一份 content_report.md。做嘅係結構化，將散亂嘅素材整理成層級。2 分鐘，自動完成。

3. 風格預覽 — 呢個係核心環節。佢唔直接生成最終 PPT，而係先出 3 套完整嘅首頁、目錄頁、正文頁預覽圖。每套 3 張，總共 9 張，係根據你嘅真實內容生成，唔係佔位符。

我測試時見到三套：塗鴉創意風——手繪感、便籤元素、高飽和色塊；現代卡片風——超大標題、藍紫漸變、網格佈局；漸變潮玩風——柔和漸變、玻璃擬態。三套風格差異好明顯，但每套裏面嘅三張圖視覺語言統一。你可以直接對比，揀一個最接近你想要嘅質感。

實測截圖，佢係 workbuddy 內置嘅生圖工具生成嘅，模型水平有限，影響效果發揮。

再嚟一組

4. 規劃鎖定 — 揀好風格之後，佢做一件好有意思嘅事：風格反演。佢唔信任當初寫嗰段 prompt 文本，反過嚟由生成嘅圖裏面提取風格事實——邊啲配色係真係穩定出現嘅，邊啲材質只係渲染嘅偶然效果，邊啲裝飾只喺某一頁成立。提取出嚟嘅結果生成一個 continuity anchor，鎖定成份 PPT 嘅視覺一致性。然後先寫設計規範、頁面藍圖同鎖定文件。

5. 生成評審 — 最終頁面生成之後，進入一個有畫筆、矩形框、註釋點嘅 HTML 評審工作台。你可以喺圖上面直接標註邊度要改，標註數據自動保存。改完確認，先導出 PPTX。

三個 HTML 外殼——風格預覽、候選選擇、評審標註——係呢個工具產品能力嘅具體體現。少咗任何一個，工作流程就斷咗一截。

我嘅體驗

由啟動到見到 9 張預覽圖，20 分鐘。中間冇乜卡頓——填完需求佢自動出基底，基底確認完佢自動出預覽，每一步都俾你睇結果、等你確認。之後嘅規劃鎖定同生成評審就更加順暢，方向已經定好咗。

呢個工作流程嘅認知負荷好低。你唔需要諗圖層點排、配色點襯，只需要答「邊個更加貼近我想要嘅」。三個方案擺喺面前，比起一個方案逼你表態，輕鬆得多。

實測截圖：

呢個就係佢同其他 AI PPT 工具嘅根本分別：AI 係提案機器，人係決策者。唔係 AI 幫你做 PPT，而係 AI 俾你著上一套 Iron Man 套裝——令你更加強，但方向由你定。

適合答辯、匯報、路演、產品介紹呢類場景——需要設計感，但時間趕。藝術創作同極致定製就唔太啱，佢嘅美學範圍受限於預訓練模型，天花板喺嗰度。

GitHub 地址：

https://github.com/NyxTides/ppt-image-first

Apache-2.0 開源，支援 Claude Code / Codex CLI / WorkBuddy。

我優化好嘅 skill：

https://pan.quark.cn/s/6e74fab5d47c

其他 PPT 類 skill：

我將 59 個品牌設計語言做咗成 PPT 提示詞庫，配圖終於唔使靠靈感喇（附成品）

AI 做 PPT 成日翻車？呢套有 6 道質檢嘅開源框架，徹底終結排版災難

AI 做 PPT 最大的問題不是做不出來，是做出來太容易了。

我第一次用 Gamma，輸入"產品路演"，30 秒拿到一份 12 頁幻燈片。封面有圖，目錄有結構，配色也算和諧。我看了兩遍，沒改一個字，直接關了——因為這份東西拿不出手。

為什麼？因為"還行"和"能用"之間隔着一個數量級。生成只是流程的最後一步，前面該確認的環節全被跳過了。

90% 場景能用的東西，不值得用

市面上的 AI PPT 工具，從 Gamma 到 Beautiful.ai 到各種國產 SaaS，底層邏輯都一樣：給你一個模板庫，把你的文字塞進去，選個配色方案，交付。

這個模式在 90% 的場景下看起來沒問題。封面有圖，目錄有結構，正文有排版。但決定你用不用這份 PPT 的，從來不是那 90%——是剩下的 10%。

風格從頭到尾漂移，封面是科技藍、正文變成文藝綠。排版在某些頁面突然崩掉，信息密度忽高忽低。內容空洞，每頁都像佔位符。這些不是 bug，是一鍵生成工作流的必然結果：跳過所有需要確認的環節，直接給你一個"看起來完整"的東西。

工程上有個說法叫 march of nines——從 90% 到 99.9% 的爬坡，比從 0 到 90% 還難。AI PPT 卡的就是這最後一截：尾部質量不行，你最終還得自己重做。

ppt-image-first：把生成當終局的反面

ppt-image-first 是一個開源的 AI PPT 工作流，10 天內在 GitHub 拿到 555 顆星。思路跟一鍵生成完全反着來：先讓你看夠了，再往下走。

它的工作流是一個 14 階段狀態機。簡單來說，5 個階段：

1. Intake — 你告訴它用途、受眾、有什麼材料。它輸出一個 baseline judgment，你確認。3 分鐘。

2. 內容基底 — 它根據你的材料整理出一份 content_report.md。做的是結構化，把散亂素材理成層級。2 分鐘，自動完成。

3. 風格預覽 — 這是核心環節。它不直接生成最終 PPT，而是先出 3 套完整的首頁、目錄頁、正文頁預覽圖。每套 3 張，總共 9 張，基於你的真實內容生成，不是佔位符。

我在測試時看到了三套：塗鴉創意風——手繪感、便籤元素、高飽和色塊；現代卡片風——超大標題、藍紫漸變、網格佈局；漸變潮玩風——柔和漸變、玻璃擬態。三套風格差異明顯，但每套內部的三張圖視覺語言統一。你可以直接對比，選一個最接近你想要的質感。

實測截圖，它時workbuddy內置的生圖工具生成的，模型水平有限，影響效果發揮。

再來一組

4. 規劃鎖定 — 選定風格後，它做一件有意思的事：風格反演。它不信任當初寫的那段 prompt 文本，反過來從生成的圖裏提取風格事實——哪些配色是真的穩定出現的，哪些材質只是渲染的偶然效果，哪些裝飾只在某一頁成立。提取出來的結果生成一個 continuity anchor，鎖定整份 PPT 的視覺一致性。然後才寫設計規範、頁面藍圖和鎖定文件。

5. 生成評審 — 最終頁面生成後，進入一個帶畫筆、矩形框、註釋點的 HTML 評審工作台。你可以在圖上直接標註哪裏要改，標註數據自動保存。改完確認，才導出 PPTX。

三個 HTML 外殼——風格預覽、候選選擇、評審標註——是這個工具產品能力的具體體現。少了任何一個，工作流就斷了一截。

我的體驗

從啓動到看到 9 張預覽圖，20 分鐘。中間沒什麼卡頓——填完需求它自動出基底，基底確認完它自動出預覽，每一步都給你看結果、讓你確認。之後的規劃鎖定和生成評審就更順了，方向已經定過。

這個工作流的認知負荷很低。你不需要想圖層怎麼排、配色怎麼搭，只需要回答"哪個更貼近我想要的"。三個方案擺面前，比一個方案逼你表態，輕鬆得多。

實測截圖：

這就是它和其他 AI PPT 工具的根本區別：AI 是提案機器，人是決策者。不是 AI 替你做 PPT，是 AI 給你穿上一套 Iron Man 套裝——讓你更強，但方向你定。

適合答辯、彙報、路演、產品介紹這類場景——需要設計感，但時間緊。藝術創作和極致定製就不太合適了，它的美學範圍受限於預訓練模型，天花板在那兒。

GitHub地址：

https://github.com/NyxTides/ppt-image-first

Apache-2.0 開源，支持 Claude Code / Codex CLI / WorkBuddy。

我優化好的skill：

https://pan.quark.cn/s/6e74fab5d47c

其它ppt類skill：

我把59個品牌設計語言做成了PPT提示詞庫，配圖終於不用靠靈感了（附成品）

AI做PPT總翻車？這套帶6道質檢的開源框架，徹底終結排版災難