AI做PPT的正確姿勢:不是一鍵生成,而是分14步提案

作者:神器每日推送
日期:2026年5月5日 下午3:09
來源:WeChat 原文

整理版優先睇

速讀 5 個重點 高亮

AI做PPT唔應該一鍵生成,而係分14步提案,確保尾部質量

整理版摘要

大家用AI做PPT,最常見就係用Gamma呢類一鍵生成工具,30秒就有份12頁幻燈片,但拎唔出手。點解?因為「還行」同「能用」之間仲差好遠。呢啲工具跳過曬所有需要確認嘅環節,直接俾個「睇落完整」嘅成品你,導致風格漂移、排版崩潰、內容空洞。尾部10%嘅質量欠佳,最終你都要自己重做。

為瞭解決呢個問題,開源項目ppt-image-first提出另一種工作流——先俾你睇夠咗,先至繼續。佢係一個14階段狀態機,核心係5個階段:Intake、內容基底、風格預覽、規劃鎖定同生成評審。最特別係風格預覽,先出3套共9張真實內容預覽圖,讓你揀最接近想要嘅質感。然後進行風格反演,確保成份PPT視覺一致。最後用HTML評審工作台直標修改。成個過程你只需要回答「邊個更貼近我想要的」,AI就係提案機器,你係決策者。

呢個工作流適合答辯、彙報、路演、產品介紹呢類需要設計感但時間緊嘅場景。但藝術創作同極致定製就唔太啱,因為美學範圍受預訓練模型限制。開源Apache-2.0,支援Claude CodeCodex CLIWorkBuddy

  • 一鍵生成AI PPT只達到90%質量,尾部10%需要大量手動調整;ppt-image-first透過14步提案流程確保每個環節有確認,提升尾部質量。
  • 核心方法係5階段Intake輸入需求、內容基底結構化、風格預覽出9張真實圖、規劃鎖定用風格反演提取一致性、生成評審用HTML工作台直標修改。
  • Gamma等工具最大分別係「AI提案,人決策」:AI輸出多個方案由你選擇,唔係直接生成完稿。
  • 啟發:高質量輸出需要先分離風格探索同內容生成,等用戶確認方向先至生成,大幅減少返工。
  • 可行動點:使用ppt-image-first GitHub開源項目,或者用作者提供嘅優化Skill,應用係路演、彙報等場景。
值得記低
工具 github.com

ppt-image-first

開源AI PPT工作流,14階段狀態機,支援風格預覽與HTML評審

Skill pan.quark.cn

優化好嘅Skill(夸克網盤)

由作者優化,用於Claude Code / Codex CLI / WorkBuddy

整理重點

一鍵生成嘅90%陷阱

用AI做PPT最大問題唔係做唔出,係做得太容易。你輸入「產品路演」,30秒就出一份12頁幻燈片,封面有圖、目錄有結構、配色和諧,但係你唔會用呢份野——因為「還行」同「能用」之間隔住一個數量級。

生成只係流程嘅最後一步,前面該確認嘅環節全被跳過咗。

市面上嘅AI PPT工具,從GammaBeautiful.ai,底層邏輯都係俾個模板庫,塞文字入去,揀配色,交貨。呢個模式係90%場景睇落冇問題,但決定你用唔用嘅係剩低嗰10%。

march of nines

最終你仲要自己重做,仲不如一開始就用啱方法。

整理重點

先睇夠再行動——ppt-image-first嘅設計哲學

ppt-image-first係一個開源AI PPT工作流,思路同「一鍵生成」完全相反:先俾你睇夠咗,先至繼續。佢係一個14階段狀態機,由5個階段構成,每個階段都要你確認方向先向前行。

14階段狀態機

作者NyxTides設計呢個工作流嘅核心哲學係:AI負責提案,人負責決策。唔係AI替你做完,而係AI俾你多個選擇,你揀一個最貼近想要嘅方向,再繼續深化。

風格反演

continuity anchor

成個工作流設計得好流暢——填需求、自動出基底、自動出預覽,每一步都俾你睇結果、等你確認,認知負荷好低。

整理重點

核心工作流拆解——5階段實戰

  1. 1 Intake:你話俾AI知用途、受眾、有咩材料,AI輸出baseline judgment,你確認,約3分鐘。
  2. 2 內容基底:AI根據材料整理成content_report.md,將散亂素材結構化,約2分鐘自動完成。
  3. 3 風格預覽:呢個係核心環節!AI先出3套完整嘅首頁、目錄頁、正文頁預覽圖,總共9張,基於你嘅真實內容生成,唔係佔位符。你可以直接對比,揀最接近想要嘅質感。
  4. 4 規劃鎖定:揀定風格後,AI做「風格反演」——從生成的圖提取風格事實,鎖定配色、材質、裝飾等一致性,然後寫設計規範、頁面藍圖同鎖定文件。
  5. 5 生成評審:最終頁面生成後,用HTML評審工作台直標修改,可以畫筆、矩形框、註釋點,標註數據自動保存,確認後導出PPTX

baseline judgment

content_report.md

3套風格、9張預覽圖

HTML評審工作台

由啟動到睇到9張預覽圖,大概20分鐘,中間冇卡頓。之後嘅規劃鎖定同生成評審更順,因為方向已經定過。

整理重點

適用場景同限制

答辯

彙報

路演

產品介紹

呢個工作流最適合需要設計感但時間緊嘅場景。你唔需要從零諗排版,只需要揀方向就得。

項目係開源嘅,Apache-2.0授權,支援Claude CodeCodex CLIWorkBuddy。作者仲提供咗一個優化好嘅Skill,可以係夸克網盤下載,直接用喺呢啲工具上,減少設定時間。

開源Apache-2.0

Claude Code

Codex CLI

WorkBuddy

AI 做 PPT 最大嘅問題唔係做唔出嚟,而係做出嚟太容易。

我第一次用 Gamma,輸入「產品路演」,30 秒就拎到一份 12 頁嘅幻燈片。封面有圖,目錄有結構,配色都算和諧。我睇咗兩次,一個字都冇改,就直接閂咗——因為呢份嘢根本拎唔出手。

圖片

點解?因為「還行」同「用得」之間差咗一個數量級。生成只係流程嘅最後一步,前面應該確認嘅環節全部 skip 曬。

90% 場合用到嘅嘢,唔值得用

市面上嘅 AI PPT 工具,由 Gamma 到 Beautiful.ai 到各種國產 SaaS,底層邏輯都一樣:俾你一個模板庫,將你啲文字塞入去,揀個配色方案,然後交貨。

呢個模式喺 90% 嘅場景下睇落冇問題。封面有圖,目錄有結構,正文有排版。但決定你用唔用呢份 PPT 嘅,從來都唔係嗰 90%——而係剩低嗰 10%。

風格由頭到尾飄忽不定,封面係科技藍、正文變成文藝綠。排版喺某啲頁面突然崩潰,資訊密度時高時低。內容空洞,每頁都似佔位符。呢啲唔係 bug,係一鍵生成工作流程嘅必然結果:跳過所有需要確認嘅環節,直接俾你一個「睇落完整」嘅嘢。

工程上有個講法叫 march of nines——由 90% 到 99.9% 嘅爬坡,比由 0 到 90% 仲難。AI PPT 卡住嘅就係呢最後一截:尾部質量唔得,你最終仲要自己重新做。

ppt-image-first:將生成當成終局嘅反面

ppt-image-first 係一個開源嘅 AI PPT 工作流程,10 日之內喺 GitHub 攞到 555 粒星。思路同「一鍵生成」完全相反:先俾你睇夠,先至繼續行落去。

佢嘅工作流程係一個 14 階段狀態機。簡單講,5 個階段:

1. Intake — 你話俾佢知用途、受眾、有啲咩材料。佢輸出一個 baseline judgment,你確認。3 分鐘。

2. 內容基底 — 佢根據你嘅材料整理出一份 content_report.md。做嘅係結構化,將散亂嘅素材整理成層級。2 分鐘,自動完成。

3. 風格預覽 — 呢個係核心環節。佢唔直接生成最終 PPT,而係先出 3 套完整嘅首頁、目錄頁、正文頁預覽圖。每套 3 張,總共 9 張,係根據你嘅真實內容生成,唔係佔位符。

圖片

我測試時見到三套:塗鴉創意風——手繪感、便籤元素、高飽和色塊;現代卡片風——超大標題、藍紫漸變、網格佈局;漸變潮玩風——柔和漸變、玻璃擬態。三套風格差異好明顯,但每套裏面嘅三張圖視覺語言統一。你可以直接對比,揀一個最接近你想要嘅質感。

實測截圖,佢係 workbuddy 內置嘅生圖工具生成嘅,模型水平有限,影響效果發揮。

圖片
圖片
圖片

再嚟一組

圖片

4. 規劃鎖定 — 揀好風格之後,佢做一件好有意思嘅事:風格反演。佢唔信任當初寫嗰段 prompt 文本,反過嚟由生成嘅圖裏面提取風格事實——邊啲配色係真係穩定出現嘅,邊啲材質只係渲染嘅偶然效果,邊啲裝飾只喺某一頁成立。提取出嚟嘅結果生成一個 continuity anchor,鎖定成份 PPT 嘅視覺一致性。然後先寫設計規範、頁面藍圖同鎖定文件。

5. 生成評審 — 最終頁面生成之後,進入一個有畫筆、矩形框、註釋點嘅 HTML 評審工作台。你可以喺圖上面直接標註邊度要改,標註數據自動保存。改完確認,先導出 PPTX。

圖片

三個 HTML 外殼——風格預覽、候選選擇、評審標註——係呢個工具產品能力嘅具體體現。少咗任何一個,工作流程就斷咗一截。

我嘅體驗

由啟動到見到 9 張預覽圖,20 分鐘。中間冇乜卡頓——填完需求佢自動出基底,基底確認完佢自動出預覽,每一步都俾你睇結果、等你確認。之後嘅規劃鎖定同生成評審就更加順暢,方向已經定好咗。

呢個工作流程嘅認知負荷好低。你唔需要諗圖層點排、配色點襯,只需要答「邊個更加貼近我想要嘅」。三個方案擺喺面前,比起一個方案逼你表態,輕鬆得多。

實測截圖:

圖片
圖片

呢個就係佢同其他 AI PPT 工具嘅根本分別:AI 係提案機器,人係決策者。唔係 AI 幫你做 PPT,而係 AI 俾你著上一套 Iron Man 套裝——令你更加強,但方向由你定。

適合答辯、匯報、路演、產品介紹呢類場景——需要設計感,但時間趕。藝術創作同極致定製就唔太啱,佢嘅美學範圍受限於預訓練模型,天花板喺嗰度。

GitHub 地址:

https://github.com/NyxTides/ppt-image-first

Apache-2.0 開源,支援 Claude Code / Codex CLI / WorkBuddy。

我優化好嘅 skill:

https://pan.quark.cn/s/6e74fab5d47c


其他 PPT 類 skill:

我將 59 個品牌設計語言做咗成 PPT 提示詞庫,配圖終於唔使靠靈感喇(附成品)

AI 做 PPT 成日翻車?呢套有 6 道質檢嘅開源框架,徹底終結排版災難

AI 做 PPT 最大的問題不是做不出來,是做出來太容易了。

我第一次用 Gamma,輸入"產品路演",30 秒拿到一份 12 頁幻燈片。封面有圖,目錄有結構,配色也算和諧。我看了兩遍,沒改一個字,直接關了——因為這份東西拿不出手。

圖片

為什麼?因為"還行"和"能用"之間隔着一個數量級。生成只是流程的最後一步,前面該確認的環節全被跳過了。

90% 場景能用的東西,不值得用

市面上的 AI PPT 工具,從 Gamma 到 Beautiful.ai 到各種國產 SaaS,底層邏輯都一樣:給你一個模板庫,把你的文字塞進去,選個配色方案,交付。

這個模式在 90% 的場景下看起來沒問題。封面有圖,目錄有結構,正文有排版。但決定你用不用這份 PPT 的,從來不是那 90%——是剩下的 10%。

風格從頭到尾漂移,封面是科技藍、正文變成文藝綠。排版在某些頁面突然崩掉,信息密度忽高忽低。內容空洞,每頁都像佔位符。這些不是 bug,是一鍵生成工作流的必然結果:跳過所有需要確認的環節,直接給你一個"看起來完整"的東西。

工程上有個說法叫 march of nines——從 90% 到 99.9% 的爬坡,比從 0 到 90% 還難。AI PPT 卡的就是這最後一截:尾部質量不行,你最終還得自己重做。

ppt-image-first:把生成當終局的反面

ppt-image-first 是一個開源的 AI PPT 工作流,10 天內在 GitHub 拿到 555 顆星。思路跟一鍵生成完全反着來:先讓你看夠了,再往下走。

它的工作流是一個 14 階段狀態機。簡單來說,5 個階段:

1. Intake — 你告訴它用途、受眾、有什麼材料。它輸出一個 baseline judgment,你確認。3 分鐘。

2. 內容基底 — 它根據你的材料整理出一份 content_report.md。做的是結構化,把散亂素材理成層級。2 分鐘,自動完成。

3. 風格預覽 — 這是核心環節。它不直接生成最終 PPT,而是先出 3 套完整的首頁、目錄頁、正文頁預覽圖。每套 3 張,總共 9 張,基於你的真實內容生成,不是佔位符。

圖片

我在測試時看到了三套:塗鴉創意風——手繪感、便籤元素、高飽和色塊;現代卡片風——超大標題、藍紫漸變、網格佈局;漸變潮玩風——柔和漸變、玻璃擬態。三套風格差異明顯,但每套內部的三張圖視覺語言統一。你可以直接對比,選一個最接近你想要的質感。

實測截圖,它時workbuddy內置的生圖工具生成的,模型水平有限,影響效果發揮。

圖片
圖片
圖片

再來一組

圖片

4. 規劃鎖定 — 選定風格後,它做一件有意思的事:風格反演。它不信任當初寫的那段 prompt 文本,反過來從生成的圖裏提取風格事實——哪些配色是真的穩定出現的,哪些材質只是渲染的偶然效果,哪些裝飾只在某一頁成立。提取出來的結果生成一個 continuity anchor,鎖定整份 PPT 的視覺一致性。然後才寫設計規範、頁面藍圖和鎖定文件。

5. 生成評審 — 最終頁面生成後,進入一個帶畫筆、矩形框、註釋點的 HTML 評審工作台。你可以在圖上直接標註哪裏要改,標註數據自動保存。改完確認,才導出 PPTX。

圖片

三個 HTML 外殼——風格預覽、候選選擇、評審標註——是這個工具產品能力的具體體現。少了任何一個,工作流就斷了一截。

我的體驗

從啓動到看到 9 張預覽圖,20 分鐘。中間沒什麼卡頓——填完需求它自動出基底,基底確認完它自動出預覽,每一步都給你看結果、讓你確認。之後的規劃鎖定和生成評審就更順了,方向已經定過。

這個工作流的認知負荷很低。你不需要想圖層怎麼排、配色怎麼搭,只需要回答"哪個更貼近我想要的"。三個方案擺面前,比一個方案逼你表態,輕鬆得多。

實測截圖:

圖片
圖片

這就是它和其他 AI PPT 工具的根本區別:AI 是提案機器,人是決策者。不是 AI 替你做 PPT,是 AI 給你穿上一套 Iron Man 套裝——讓你更強,但方向你定。

適合答辯、彙報、路演、產品介紹這類場景——需要設計感,但時間緊。藝術創作和極致定製就不太合適了,它的美學範圍受限於預訓練模型,天花板在那兒。

GitHub地址:

https://github.com/NyxTides/ppt-image-first

Apache-2.0 開源,支持 Claude Code / Codex CLI / WorkBuddy。

我優化好的skill:

https://pan.quark.cn/s/6e74fab5d47c


其它ppt類skill:

我把59個品牌設計語言做成了PPT提示詞庫,配圖終於不用靠靈感了(附成品)

AI做PPT總翻車?這套帶6道質檢的開源框架,徹底終結排版災難