來，立刻擁有你的私人AI圖片風格影像館

作者：Draco正在VibeCoding

日期：2026年4月29日下午11:31

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

利用半自動收藏工具訓練自己辨識AI圖片風格嘅能力，將視覺消費轉化為創作力。

整理版摘要

作者Draco Hu指出，隨住AI圖像生成普及，視覺辨識能力變得越來越重要，尤其係要能夠用自然語言講出圖片嘅風格關鍵詞。佢認為，如果唔掌握呢種能力，就只能消費而無法創作，而創作先係價值嘅源泉。為咗幫自己同其他非科班出身嘅人練習，佢整咗一個叫「Graphics Academy」嘅開源項目（即係t2i_museum）。

呢個工具嘅核心係半自動收集AI圖片嘅風格關鍵詞，用戶可以喺即夢等平台睇到圖片時，透過Chrome插件一鍵提取Prompt，然後由大模型解析出風格關鍵詞（包括審美風格、媒介、藝術家風格等），之後用戶必須手動審核、增刪改，最後先入館。作者特別強調，呢個「手動審核」嘅步驟係刻意練習嘅關鍵，避免跌入「收集者謬誤」——收藏咗就以為自己擁有，其實腦海冇留低任何痕跡。

整體結論係：收藏唔等於學習，入館前改一次關鍵詞，遠比入咗100張圖但冇睇過更有價值。作者鼓勵大家立即部署呢個開源項目，開始練習，從而掌握視覺風格辨識呢項未來必備嘅技能。

結論：視覺辨識能力係創作嘅基礎，要透過刻意練習去掌握風格關鍵詞。
方法：利用半自動收藏工具（t2i_museum）收集AI圖像，手動審核風格關鍵詞以強化記憶。
差異：避免「收集者謬誤」，強調每次入館前修改關鍵詞先算真正學到嘢。
啟發：大模型解析唔會100%正確，人機協作先係最有效學習路徑。
可行動點：即日起部署項目、安裝Chrome插件、開始練習風格辨識。

值得記低

連結 github.com

t2i_museum GitHub Repo

開源項目，用於收集AI圖片風格關鍵詞並進行刻意練習。包含後端、前端同Chrome插件，支援本地或雲端部署。

整理重點

點解視覺辨識咁重要？

作者認為，AI時代嘅視覺能力唔再係「識睇」就得，而係要能夠用自然語言精準描述一幅畫嘅風格、一條片嘅分鏡。呢個係由消費者轉變為創作者嘅必經之路。

視覺會變得更重要！重要到你要即刻講出幅畫嘅風格。

整理重點

呢套工具點幫你刻意練習？

整套系統包括一個GitHub倉庫同一個Chrome插件。部署之後，你去即夢睇圖片，右邊會多咗個「COLLECT」按鈕，一㩒就自動提取Prompt，然後用DeepSeek-V4-Flash解析出風格關鍵詞。

解析完會彈出一個分類彈窗，涵蓋審美風格、媒介、藝術家風格、流派主義、質量修飾、題材內容同情緒氛圍。

1 如果分類唔合理，你可以叫Coding Agent幫手調整。
2 大模型解析未必準確，你要手動增刪改關鍵詞，確保正確。
3 編輯完之後㩒「確認入館」，張圖就會存入本地數據庫，喺主頁可以瀏覽。

入館後仲可以重新編輯或刪除，管理好自己嘅風格資料庫。

整理重點

點解要做半自動，唔全自動？

作者刻意設計成半自動，因為全自動只會令你「無腦」確認，學唔到嘢。佢引用一個概念叫「Collector's Fallacy」，意思係收藏咗就覺得擁有了，其實大部份內容都喺度食灰。

視覺衝擊力再強嘅圖，都係人哋嘅能力，唔會自動變做你嘅。

整理重點

點樣擴展到其他網站？

如果覺得只支持即夢唔夠，而且你有一定動手能力，可以同Coding Agent講你想支持邊個網站。最方便係用CDP直連瀏覽器，讀取該網站圖片詳情頁嘅DOM結構，好快就可以擴展。

畀個網址俾Coding Agent，佢就可以幫你分析DOM，支援更多平台。

整理重點

而家就行動！

作者仲整咗個Anki閃卡風格測試，幫你鞏固所學。立即去GitHub下載代碼，用Coding Agent部署，安裝插件，開始收集第一張圖啦！

倉庫喺：https://github.com/dracohu2025-cloud/t2i_museum，歡迎俾Star！

快速部署指引 bash

git clone https://github.com/dracohu2025-cloud/t2i_museum.git
cd t2i_museum
# 使用Coding Agent（例如Claude Code）部署
# 前置條件：OpenRouter API Key、可選騰訊雲COS
# 啟動localhost: http://127.0.0.1:4317/museum

先睇幾張圖片，你講唔講得出佢哋嘅Prompt入面帶咗咩風格關鍵詞？

答案分別係：

1.
穆夏風格
2.
Moebius風格
3.
幾米繪本風格

如果你大致答啱曬，恭喜你，你係呢個時代嘅天選之人！

如果一個都估唔中，都唔使擔心，我畀你一個用嚟做「刻意練習」嘅工具。

在之前嘅文章入面我曾經咁樣寫：

視覺唔係唔重要；相反，視覺會變得更加重要！
重要到，當畀你睇一幅畫時，你要即刻講得出呢幅畫嘅風格，用自然語言對呢幅畫進行精準嘅描述（人腦反推）；畀你睇一條片時，你要即刻講得出呢條片嘅分鏡設計！係呀，就係要達到呢個程度～
否則，你就幾乎只能消費，而唔能夠創作。而創作係價值嘅泉源！
而呢個，就係我下個階段探索嘅方向！（我而家正喺度整一個叫 Graphics Academy 嘅網站/應用，嚟幫你（我自己）呢啲非科班出身嘅人掌握上面↑描述嘅呢種能力）～敬請期待！

今日嚟填返呢個坑：Graphics Academy V1.0 版！

所有 code 都喺 Github 倉庫：https://github.com/dracohu2025-cloud/t2i_museum

你可以將 code 下載到本地，然後叫 Coding Agent（例如 Claude Code/Codex/OpenCode 等等）喺本地進行部署（當然都可以部署喺雲端）。項目入面有啲前置條件：

OpenRouter 嘅 API KEY（默認會叫 DeepSeek-V4-Flash 做 prompt 解析器，當然，你都可以換成其他公司嘅 API）

騰訊雲 COS 存儲桶 SecretID、Secret Key、Region、空間名稱、域名等資訊（呢個可選 Optional；部署時可以問 Agent 點樣開通 COS 同攞相關資訊，如果你有其他雲廠商嘅存儲桶，都可以叫 Agent 幫你替換；存儲桶都好平）

喺本地部署並啟動 localhost（默認係運行喺：http://127.0.0.1:4317/museum）之後，需要將呢個項目自帶嘅 Chrome 插件裝上（插件名係 t2i_museum Collector），位置喺：

/t2i_museum/apps/extension/dist

裝好之後，隨便開一個即夢圖片嘅詳情頁，就會見到喺圖片右邊多咗一個 COLLECT 掣：

如果遇到冇呢個掣嘅情況，請 refresh 一下個頁面就得；如果仍然冇，就係 P0 bug 啦，叫 Coding Agent 嚟 fix；

幾秒之後，插件會將目前頁面嘅 Prompt 回傳到本地，經過大模型解析之後，會彈出一個呢張圖片所涉及嘅「風格關鍵詞」彈窗。

風格關鍵詞包括幾種類型：
審美風格、媒介/渲染、藝術家風格、流派主義、質量修飾、題材內容、情緒氛圍
如果你認為以上分類唔合理，可以叫你嘅 Agent 嚟調整呢啲分類

當然，大模型解析完嘅結果可能準，亦可能唔準，呢個時候你應該對「風格關鍵詞」進行加、刪、改嘅操作。

如果大模型返回嘅風格關鍵詞入面缺少某個類別，就撳左下角嘅「添加關鍵詞」手動添加：

添加關鍵詞時，系統會自動判斷呢個詞係新加嘅，定係已經喺數據庫入面出現過；如果已經出現過，提交之後會自動合併：

當風格關鍵詞編輯完成之後，撳「確認入館」：

一陣之後，入館成功：

呢個時候，返去 Graphics Academy 首頁，就可以見到啱先新入館嗰張圖喇：

當然，如果入館時填錯咗，都可以喺詳情頁重新編輯：

如果唔想收藏某張圖，都可以喺呢個隱蔽嘅角落揾到刪除掣，從數據庫度刪除：

點解要做成半自動而唔係全自動入館？

因為：
1.
首先，大模型嘅解析唔會100%正確；
2.
更重要嘅係，即使後續嘅迭代可以將大模型嘅正確率調到無限接近100%，都唔建議你每次都只係「無腦」撳「確認入館」（有個概念叫「Collector's Fallacy-收集者謬誤」，意思係收藏咗就覺得擁有咗，其實絕大多數情況下被收藏嘅內容都喺度食塵，喺腦入面留唔低一絲痕跡），而係每次入館前都要眼同腦配合，過一過風格關鍵詞啱唔啱，如果缺咗，要手動補上，呢個係一種「刻意練習」嘅過程；畢竟，視覺衝擊力再強嘅圖，都係人哋嘅能力，唔係你嘅。

如果你覺得只係支援即夢唔夠，而且自己有一定嘅動手能力，咁，成功部署呢個項目之後，可以同你嘅 Coding Agent 講你想支援邊啲其他網站，並且將網址話畀 Coding Agent 知，最方便係叫佢用 CDP 直接連你個瀏覽器嚟讀取嗰個網站圖片詳情頁嘅 DOM 結構等資訊，咁樣，應該可以好快支援更多你心儀嘅帶 Prompt 詳細資訊嘅 AIGC 生圖網站。

同時，我仲做咗個 Anki 閃卡風格測試：

仲等咩嘢，快啲用啦～

倉庫喺：https://github.com/dracohu2025-cloud/t2i_museum

歡迎畀個 Star～

先來看幾張圖片，你是否能說出它們的Prompt中攜帶的風格關鍵詞：

答案分別是：

1.
穆夏風格
2.
Moebius風格
3.
幾米繪本風格

如果你基本都答對了，恭喜你，你是這個時代的天選之人！

如果一個沒猜對，也不用擔心，我來給你一個用來做“刻意練習”的工具。

在之前的文章中，我曾這樣寫：

視覺不是不重要；相反，視覺會變得更重要！
重要到，當給你看一幅畫時，你需要馬上說出這幅畫的風格，用自然語言對這幅畫進行精準的描述（人腦反推）；給你看一條視頻時，你需要馬上講出這條視頻的分鏡設計！對，就是需要達到這個程度～
否則，你就幾乎只能消費，而無法創作。而創作是價值的源泉！
而這，就是我下個階段探索的方向！（正在搭建一個名為Graphics Academy的網站/應用，來幫助你（我自己）這些非科班出身的人來掌握上面👆描述的這種能力）～敬請期待！

今天來填上這個坑：Graphics Academy V1.0版！

所有代碼都在Github倉庫：https://github.com/dracohu2025-cloud/t2i_museum

你可以把代碼下載到本地，然後讓Coding Agent（比如Claude Code/Codex/OpenCode/etc.）在本地進行部署（當然也可以部署在雲端）。項目中有一些前置條件：

OpenRouter 的API KEY （默認調用DeepSeek-V4-Flash作為prompt解析器，當然，你也可以換成其他家的API）

騰訊雲COS存儲桶SecretID、Secret Key、Region、空間名稱、域名等信息（這個可選Optional；部署時可以詢問Agent如何開通COS和獲取相關信息，如果你有其他雲廠商的存儲桶，也可以讓Agent進行替換；存儲桶都很便宜）

在本地部署並啓動localhost（默認是運行在：http://127.0.0.1:4317/museum）之後，需要將該項目自帶的Chrome插件裝上（插件名字是t2i_museum Collector），位置在：

/t2i_museum/apps/extension/dist

安裝好之後，隨便打開一個即夢圖片的詳情頁，就能看到在圖片右側會多出一個COLLECT按鈕：

如果遇到沒有該按鈕的情況，請刷新一下頁面即可；如果依然沒有，那就是P0 bug了，讓Coding Agent來fix；

幾秒後，插件會將當前頁面中的Prompt回傳到本地，經大模型解析後，會彈出一個本張圖片所涉及的【風格關鍵詞】彈窗。

風格關鍵詞包括幾種類型：
審美風格、媒介/渲染、藝術家風格、流派主義、質量修飾、題材內容、情緒氛圍
如果你認為以上分類不合理，可以讓你的Agent來調整這些分類

當然，大模型解析後的結果可能準，也可能不準，這時候你應該對【風格關鍵詞】進行增、刪、改的操作。

如果大模型返回的風格關鍵詞裏缺少某個類別，則點擊左下角的【添加關鍵詞】手動添加：

添加關鍵詞時，系統會自動判斷這個詞是新加的，還是已經在數據庫中存在過；如果已經存在過，則提交後會自動合併：

當風格關鍵詞編輯完成之後，點擊“確認入館”：

片刻之後，入館成功：

這時，回到Graphics Academy首頁，就可以看到剛才新入館的那張圖了：

當然，如果入館時填錯了，也可以在詳情頁重新編輯：

如果不想收藏某張圖了，也可以在這個隱蔽的角落找到刪除按鈕，從數據庫中刪除：

為什麼要做成半自動而不是全自動入館？

因為：
1.
首先，大模型的解析不會100%正確；
2.
更重要的是，即便後續的迭代能把大模型的正確率調優到無限接近100%，也不建議你每次只是“無腦”點擊“確認入館”（有個概念叫“Collector's Fallacy-收集者謬誤”，意思是收藏了就覺得擁有了，其實絕大多數情況下被收藏的內容都在吃灰，在腦子裏留不下一絲痕跡），而是每次入館前都要眼睛和腦子配合，過一下風格關鍵詞對不對，如果缺失了，要手動補上，這是一種“刻意練習”的過程；畢竟，視覺衝擊力再強的圖，那也是別人的能力，不是你的。

如果你覺得只支持即夢不夠，並且自己有一定的動手能力，那麼，在成功部署該項目後，可以和你的Coding Agent說你希望支持哪些其他網站，並且將網址告訴Coding Agent，最方便是讓它用CDP直連你的瀏覽器來讀取該網站圖片詳情頁面的DOM結構等信息，如此，應該可以很快支持更多你心儀的帶Prompt詳細信息的AIGC生圖網站。

同時，我還做了個Anki閃卡風格測試：

還等啥，趕緊用起來啊～

倉庫在：https://github.com/dracohu2025-cloud/t2i_museum

歡迎給Star～