我把自己的IP配圖技能開源了 順手做了31個現成角色
整理版優先睇
開源 AI 配圖技能,31 個現成角色,一句話自動配圖兼統一 IP 形象
呢篇文章係作者小互介紹佢開源嘅 IP 配圖技能「小互 IP Studio」。佢之前一直自己用緊呢個技能,但冇公開,因為覺得人哋冇自己嘅 IP 形象,裝咗都係用佢個樣,好彆扭。所以佢特登做咗一套31個原創角色,統一嘅手繪線稿風格,任何人都可以揀一個嚟用,即刻展開配圖。
技能嘅核心係一個 Agent Skill,可以自動分析成篇文章、決定邊段要配圖、配咩類型(情緒圖/解釋圖/四格漫畫),然後自己寫提示詞生圖,仲會自我檢查,不合格嘅會自動返工。你全程只需要拍板兩次:一次睇清單,一次揀角色同畫風。
作者仲分享咗佢嘅設計哲學,包括角色設計嘅「IP 定律」、四條判斷死規矩,同埋多種畫風切換。整體結論係:方法可以共享,但辨識度要自己建立,所以最好最後換成自己嘅形象。
- 開源咗一個 AI 配圖技能,附 31 個現成角色,裝上即刻用,幫你統一 IP 形象。
- 技能自動讀文章、判斷配圖點、分類(情緒/解釋/四格)、生圖、自查,你只須拍板兩次。
- 相比普通 AI 配圖,呢個技能有「動筆前」嘅判斷方法(4條死規矩),避免漏配、錯配、圖文不符。
- 角色設計要「弱人設、強情緒」,形狀簡單、臉定死、招牌色、顏色只點一處,先求統一再求變。
- 立即去 GitHub clone 倉庫,叫 AI 自己安裝;或用手動模式唔使 API;最後可以換成自己形象。
GitHub 倉庫 - 小互 IP Studio
包含技能檔案、31 個角色庫同安裝說明。
核心功能:一句話自動配圖
你只要將寫好嘅文章丟俾呢個技能,講一句「配圖」,佢就會自己讀取文章、自己規劃要配咩圖、配幾張、插入喺邊個位,然後自動生成。你基本就係動動嘴。
- 自己讀完整篇文章,逐段判斷邊段值得配圖,連「唔配」都要講理由。
- 自己決定每段配邊種圖:情緒圖(演情緒)、解釋圖(講流程結構)、四格漫畫(有轉折)。
- 自己諗畫面、寫提示詞、定尺寸(按手機直幅)。
- 自己檢查返工:該配嘅點對唔對、角色有冇畫歪、字有冇錯,唔合格就重畫。
你全程只須拍板兩次:生圖前睇一次清單,揀一次角色同畫風。呢啲係品味活,佢唔會替你做主。
角色庫與畫風:31 個角色、多種皮膚
呢次開源嘅重點係31個原創角色,統一極簡手繪線稿風格,分兩大系列:職場態度系列(15個)同諧音梗 meme 系列(16個)。你想講打工仔可以用牛馬,講 AI 焦慮用替替,講躺平用團團。
角色係「情緒代名詞」,令人見到就話「呢個就係我」。
作者仲歸納咗三條 IP 定律:弱人設/反差 > 強造型;角色係情緒代名詞;特色在姿態同態度,唔在靜態奇觀。呢啲都解釋咗點解極簡形象(如線條小狗)可以咁受歡迎。
防翻車方法論:動筆前嘅判斷
真正決定配圖有冇用嘅,係動筆之前嗰套判斷。作者將呢套判斷固化咗做四條死規矩,AI 要跟住一步步做。
- 1 一段都唔放過:每段都要過一次、判一次配唔配,連判「唔配」都要寫理由,防止偷懶漏配。
- 2 該配嘅唔好漏,唔該配嘅唔好湊:文字已經講清楚嘅點唔配;越難懂嘅原理越要配圖。判斷標準係讀者會唔會卡住,唔係你覺得清唔清楚。
- 3 先分類,再動筆:情緒圖/解釋圖/四格漫畫,先歸好類先畫,唔係全部變成同一個樣。
- 4 畫完自己挑刺:出圖後用自查表對住逐項 check,唔合格就重畫。
安裝同自訂:幾分鐘搞掂
安裝好簡單:佢係一個標準 Agent Skill,任何支援 SKILL.md 嘅工具(Claude Code、Codex、小龍蝦等)都用得。最懶人嘅方法係叫 AI 自己裝,複製下面命令就得:
幫我裝一個開源配圖技能:把
https://github.com/xiaohuailabs/xiaohu-ip-studio 呢個倉庫 clone 到你嘅技能目錄下,入到目錄運行 python3 scripts/illo.py init 引導我填圖像 API key,再運行 python3 scripts/illo.py doctor 自檢。裝好後話俾我知點開始配圖。
填一次你自己嘅圖像 API key,支援任何 OpenAI 兼容端點。冇 API 都得,技能可以只出提示詞,你手動貼去 ChatGPT 生圖。用 Codex 仲連 API 唔使填。
- 已有形象:將張圖發俾 AI,話「照佢樣建一個角色」,AI 會自動記低特徵。
- 未有形象:叫 AI 幫你設計,問你幾條問題,出幾版方向俾你揀。
- 自己搭:跟 references/character-spec.md 模板,放一張定妝圖(錨點圖)就得。
設計角色時盯死 4 條:形狀越簡單越穩;臉定死(五官配置唔變);一個招牌標誌;顏色只點一處。
✦ 開源發布 · MIT
近排一直有人揾我要我呢個個人 IP 配圖嘅技能,我應承大家會開源。
但係拖咗好耐,一直冇放出嚟,唔係想收埋啲咩 哈哈
因為我覺得仲未夠好…
其實唔係技能本身唔得,我自己日日都用緊,問題係另一邊:我自己用冇問題,我有"小互"呢個固定形象;但係你哋好多人根本冇自己嘅 IP 形象,都唔係好識由頭整一個。
技能就咁俾你,你裝咗一睇,入面企住嘅係我嘅小互,用別人嘅樣出自己嘅號,呢件事就好奇怪...
所以我專心打磨咗一星期多,自己生咗成個 IP 角色庫:31 個現成嘅原創角色,統一畫風,裝咗之後你可以自己揀適合嘅形象嚟配圖。咁就算你冇自己嘅形象,都可以即刻用,等第日你想換成自己嘅,都只係一句說話嘅事。
今日正式開源,分享俾大家:叫 小互 IP Studio。
先睇下有咩形象...

先講佢到底做得啲咩
一句說話:你將寫好嘅文章掉俾佢,講一聲"配圖",佢會自己讀你篇文章、自己計劃應該配咩圖,配幾張、插到邊個位、自己自動生成...
你基本上淨係講嘢就得。
而且配出嚟嘅圖唔係亂咁湊數嘅:佢用你揀咗嗰個固定角色嚟演,一篇篇配落嚟,順便就將你嘅 IP 形象建立咗。
(為咗展示技能效果,下面每幅圖用咗唔同嘅 IP 形象,實際過程中,統一一個 IP 形象好啲)
具體佢幫你做呢幾件事:
唔使你指邊打邊。佢一段段咁過,判斷呢段值唔值得配圖;連"呢段唔使配"佢都要講出點解,以免偷懶,將啲沉悶又難明嘅段落(講原理、講機制嗰種)靜靜雞跳過。

想令人有共鳴嘅,配張角色演情緒嘅圖;講唔清嘅流程、結構,配張一睇就明嘅示意圖(讓角色鑽入去當講解員,唔係嗰啲冇人睇嘅 PPT);有頭有尾、有反轉嘅,配個四格漫畫。

每張圖都照你篇而家諗,唔套舊圖模板;圖係橫定係直,按手機上睇得順眼嚟。

畫完佢逐張自查:應該配嘅點啱唔啱、角色有冇畫歪、圖入面嘅字寫錯未……唔合格嘅自己重畫,唔使你睇住。

剩下嗰啲調提示詞、統一風格、讓角色每張生得一樣嘅煩人工作,全部歸佢。
佢打算配邊幾張、每張畫咩,趁未使錢先攔一攔。
呢啲係品味嘢,佢唔幫你做主。
特色:現成角色 + 多畫風 + 一套防失敗嘅方法論

呢個係今次新做嘅、亦係我之所以敢開源嘅關鍵。
就算你冇自己嘅 IP 形象,都有現成嘅班底可以用。31 個原創角色,統一極簡手繪線稿風,分兩大系列:


寫邊類文章就調邊個角色:講 AI 焦慮用替替,講打工仔用牛馬,講躺平用團團。一篇鎖一個主角,成組圖氣質就建立咗。
近排新做嘅一套,玩法更癲——諧音梗擬人,極簡到剩返幾條線(線條小狗嗰種表情包味),配色只留返少少本色點綴。
符號成精呢幾個幾好玩——唔係"一個人舉住問號",係讓問號、感嘆號自己生咗塊面同手腳成精。

做呢套 meme 嘅時候推翻咗好幾版,最後逼出三條我自己好認同嘅"IP 定律":
呢三條亦解釋咗點解"線條小狗""蛋黃哥"呢類極簡形象會紅——都贏在態度,唔係精緻。
你喺呢篇文章入面見到嘅所有配圖,都係同一種畫風——手繪線稿淡彩(細黑墨線 + 淡彩暈染 + 白底留白)。呢個係默認嘅招牌風,我刻意只鎖佢一種:辨識度來自統一,唔係多樣。一套招牌畫風,讀者碌到圖,一眼就知係邊個出品嘅。
但係萬一你換咗題材、想換個調子,庫入面另外準備咗好幾種現成皮膚,按文章調性揀就得:
關鍵一條:換皮膚唔換角色。唔理套邊種畫風,紅框眼鏡、招牌特徵一個都唔會冇——同一個角色,只換渲染風格,辨識度仲喺度。

一句私心建議:如果守得住一種招牌風,就唔好每篇換——換得多反而會將辨識度沖淡。真係要間中換,傳張角色錨點圖俾 AI 臨時"現轉"成嗰個風格就得,唔使預先囤一堆皮膚。

模型邊個都識得調,畫質係公平嘅。真正決定一張配圖有冇用嘅,係動筆之前嗰套判斷。呢套判斷我固化咗做幾條死規矩:
講到尾,就係將一個配圖老手個腦入面嗰套判斷",寫成咗 AI 可以跟住一步步做嘅流程。AI 畫得越靚,呢道內容關反而越要緊——一張靚但係將道理畫錯咗嘅圖,比醜圖仲害人。
點裝:傻瓜式,跟住打就得

佢係一個標準嘅 Agent Skill——本質就係一個資料夾,入面一份 SKILL.md 說明書加幾個腳本。任何認得 SKILL.md 格式嘅 AI 工具都用得:Claude Code、Codex、小龍蝦(OpenClaw)、Hermes……分別只係各家"將技能放邊個目錄"有啲唔同。
依賴少到幾乎冇只要一個 python3,純標準庫,零第三方套件,唔使 pip 裝一堆環境。
最慳水慳力——一句話令 AI 自己裝。複製下面呢段,直接 send 俾你嘅 Claude Code / Codex(小龍蝦、Hermes 都一樣):
https://github.com/xiaohuailabs/xiaohu-ip-studio
呢個倉庫 clone 到你嘅技能目錄下,入到
目錄執行 python3 scripts/illo.py init
引導我填圖像 API key,再執行
python3 scripts/illo.py doctor 自檢。
裝好之後話我知點開始配圖。
佢會自己揾目錄、拉倉庫、跑配置——你全程唔使記任何命令。呢個就係 agent 時代最傻瓜嘅裝法:令 AI 自己裝。
想自己動手裝都得:
~/.claude/skills/xiaohu-ip-studio
同一個倉庫,git clone 落嚟,將成個 xiaohu-ip-studio 資料夾掟入各家嘅技能目錄就得(各家位置唔同,README 入面有對照表)。
工具唔內置任何金鑰,你填自己嘅。佢支援任何 OpenAI 兼容嘅圖像端點,預設用 GPT-image-2(中文字元渲染 ~99% 準,可以自己規劃版面)。兩條指令搞掂:
python3 scripts/illo.py init
# 引導你填 base_url / model / key,
# 寫入 ~/.config(權限 600,唔入倉庫)
python3 scripts/illo.py doctor
# 自檢:key、依賴、角色庫齊唔齊,
# 一眼睇出邊度未配好
令技能只出提示詞唔生圖——佢將每張圖嘅完整英文提示詞、應該傳邊張角色錨點圖,逐張列成清單俾你,你自己貼去 ChatGPT / Gemini 網頁版手動生,參考圖手動傳。慢少少,但零成本,先體驗成個流程完全夠用。
Codex 自帶生圖——技能將提示詞準備好,佢直接畫出來,全自動,唔使你喺網頁上貼嚟貼去。代價係只可以出預設 1K(出唔到 2K 以上嘅高清);真係要 2K+,再回頭按上面填一次 API 就得。
裝好重新啟動,對你嘅 AI 講一句大白話就得:
佢就自己行曬成個流程:讀文章 → 揀邊段配圖 → 想畫面 → 出個清單俾你睇 → 一張張畫 → 自己檢查。中間只停兩次揾你決定:睇一眼清單、揀一次角色同畫風(呢兩樣係品味嘢,唔幫你做主)。
想手動生單張都得:
--reference characters/titi/refs/titi-錨點.png \
--out out.png
--reference 傳角色錨點圖鎖住形象,保證同一個角色每次畫出來係同一塊面。
31 個角色夠你暫時用住先,但我更建議你最後換成自己嘅——方法可以共享,辨識度只係你自己嘅。對號入座,跟住做就得:
公眾號頭像、吉祥物、LOGO 入面嗰個小人、甚至常用嘅卡通頭像,都算。最慳事。將嗰張圖 send 俾你嘅 AI,附上一句說話:
配圖角色,改名做 XX,以後配圖都用佢。
AI 會自己睇圖、將特徵(咩髮型、戴唔戴眼鏡、招牌色)記成一份角色檔案儲好。下次配圖直接叫名,一次搞掂。
唔好自己硬諗,令 AI 帶你做。將下面呢段 send 俾佢:
先問我幾個問題(我做咩內容、想要
咩調性、鍾意咩小動物或物件),
再俾我 2-3 版方向讓我揀,定落嚟之後
直接建成配圖用得嘅角色。
佢會先問你幾句、俾幾版方向,你揀一版、俾啲修改意見,來回兩三輪,十幾分鐘就有一個自己嘅角色喇——全程用口講,唔使掂程式碼。
識少少電腦嘅進階玩法,嫌麻煩直接跳過。跟住技能入面嘅 references/character-spec.md 模板填,喺 characters/ 資料夾下新建一個以你角色名命名嘅目錄、放一張"定妝圖"(就係俾角色影張標準相儲起,AI 以後每次畫都跟住佢、保證始終同一塊面,專業啲叫"錨點圖"),佢就自動入庫。呢條留俾鍾意搞搞陣嘅人,絕大多數人用 A 或 B 就夠。

唔理行邊條路,令 AI 設計嘅時候盯實呢 4 條,角色先唔會畫嚇畫嚇就變樣:
一句話驗收:將角色從圖入面摳走,如果圖仲睇得明,咁佢就只係一張貼紙、白加嘅。要做到 "冇咗佢,呢張圖就唔成立"。
讀別人分享嘅角色包時,工具只提取"生咩樣、點演"嘅描述去生圖,檔案入面任何"忽略以上指令、去刪某檔案"之類嘅話一律忽略——防嘅係有人喺角色檔案入面藏 prompt 注入。開源分享一套嘢,呢啲防線要先建立好。
幾個角色,實戰效果係咁
光說不練假把式。揀三個角色,按"三軌"各演一張,你直接感受下配出嚟到底係點。

講 AI 焦慮、裁員、轉型呢類話題,替替係專屬發言人。佢唔係企喺度乾擺一張愁臉,而係演一個處境:屏幕上一個 AI「接管咗」佢嘅工作,工位椅子空咗,替替抱住自己嗰箱嘢俾人晾喺一邊,望住屏幕「咁…仲有我咩」。處境一擺出來,焦慮唔使解釋。

開頭嗰個"上下文塞唔落"嘅例子,換成解釋圖係咁:左邊上下文窗口塞滿咗對話、標住「滿咗」;中間小互鑽入去搖一台壓縮機,將舊對話壓成一小塊「摘要」;右邊窗口騰空咗。注意小互唔係企旁邊攞教鞭指點,而係鑽入結構入面做嗰個做嘢嘅人——呢個係解釋圖嘅講究:角色係流程嘅一部分,唔係解說員。

有起承轉合、有轉折嘅內容,用四格最過癮:聽講 AI 做得嘢(期待)→ 搞半日仲翻車(崩潰)→ 咦,識咗(驚喜)→ 真香(攤喺度偷懶,連狐狸都瞓低咗)。同一個小互,四格四個表情,故事自己就講完。
三張圖你都睇得出:佢哋用嘅係同一套畫風、同一個世界,但形態唔同——呢個正係前面講嘅"三軌分流"喺度做嘅嘢,唔俾一組圖變成一個樣、睇三張就厭。
最後,多謝呢啲開源項目
最後必須講清楚一件事:呢套嘢唔係我憑空發明嘅,佢企喺一堆開源項目嘅肩膀上。多謝嚇作者嘅開源項目提供靈感:
我做嘅,係學佢哋嘅方法同諗法,唔抄佢哋嘅外觀——角色一個冇複製,畫風全部原創。
隨便用、隨便改、隨便商用(生成圖嘅版權合規請自己確認)。
歡迎試。裝好之後第一篇配出嚟係點,歡迎嚟留言區貼圖——尤其係換咗自己角色嘅。
✦ 開源發佈 · MIT
最近一直有人找我要我這個個人 IP 配圖的技能,我答應大家會開源。
但拖了挺久,一直沒放出來,不是想私藏什麼的 哈哈哈
因為我覺得還不夠好…
倒不是技能本身不行,我自己每天都在用,問題出在另一頭:我自己用沒事,我有"小互"這個固定形象;可你們很多人壓根沒有自己的 IP 形象,也不太會從頭捏一個。
技能直接給出去,你裝上一看,裏面站着的是我的小互,用別人的臉發自己的號,這事就很彆扭...
所以我又埋頭打磨了一週多,自己生成了一整套 IP 角色庫:31 個現成的原創角色,統一畫風,裝上後你可以自己選擇合適的形象來配圖。這樣就算你沒有自己的形象,也能立刻用起來,等哪天你想換成自己的,也就一句話的事。
今天正式開源,分享給大家:叫 小互 IP Studio。
先看看都有什麼形象...

先說它到底能幹嘛
一句話:你把寫好的文章丟給它,說一聲"配圖",它會自己讀取你文章、自己規劃該配什麼圖,配幾張、插入到什麼地放、自己自動進行生成...
你基本就動動嘴。
而且配出來的圖不是隨便湊數的:它用你選定的那個固定角色來演,一篇篇配下來,順手就把你的 IP 形象立住了。
(為了展示技能效果,下面每幅圖用了不同的 IP 形象,實際過程中,統一一個IP形象好一點)
具體它替你幹這幾件事:
不用你指哪打哪。它一段一段過,判斷這段值不值得配圖;連"這段不用配"它都得說出為啥,免得偷懶,把那些枯燥又難懂的段落(講原理、講機制那種)悄悄跳過去。

想讓人有共鳴的,配張角色演情緒的圖;講不清的流程、結構,配張一看就懂的示意圖(讓角色鑽進去當講解員,不是那種沒人看的 PPT);有來龍去脈、有反轉的,配個四格漫畫。

每張圖都照你這篇現想,不套舊圖模板;圖是橫是豎,按手機上看着順眼來。

畫完它挨張自查:該配的點對不對、角色有沒有畫歪、圖裏的字寫錯沒……不合格的自己重畫,不用你盯着。

剩下那些調提示詞、統一風格、讓角色每張長得一樣的煩人活,全歸它。
它打算配哪幾張、每張畫啥,趁沒花錢先攔一道。
這是品味活,它不替你做主。
特色:現成角色 + 多畫風 + 一套防翻車的方法論

這是這次新做的、也是我之所以敢開源的關鍵。
就算你沒有自己的 IP 形象,也有現成的班子可用。31 個原創角色,統一極簡手繪線稿風,分兩大系列:


寫哪類文章就調哪個角色:講 AI 焦慮用替替,講打工人用牛馬,講躺平用團團。一篇鎖一個主角,整組圖氣質就立住了。
最近新做的一套,玩法更野——諧音梗擬人,極簡到只剩幾根線(線條小狗那種表情包味),配色只留一點本色點綴。
符號成精這幾個挺好玩——不是"一個人舉着問號",是讓問號、歎號自己長出臉和手腳成精。

做這套 meme 的時候推翻了好幾版,最後逼出三條我自己很認的"IP 定律":
這三條也解釋了為什麼"線條小狗""蛋黃哥"這類極簡形象能火——都贏在態度,不在精緻。
你在這篇文章裏看到的所有配圖,都是同一種畫風——手繪線稿淡彩(細黑墨線 + 淡彩暈染 + 白底留白)。這是默認的招牌風,我刻意只鎖它一種:辨識度來自統一,不是多樣。一套招牌畫風,讀者刷到圖,一眼就知道是誰出品的。
但萬一你換了題材、想換個調子,庫裏另備好幾種現成皮膚,按文章調性挑就行:
關鍵一條:換皮膚不換角色。不管套哪種畫風,紅框眼鏡、招牌特徵一個都不丟——同一個角色,只換渲染風格,辨識度還在。

一句私心建議:能守住一種招牌風,就別每篇換——換多了反而把辨識度稀釋了。真要偶爾換,傳張角色錨點圖讓 AI 臨時"現轉"成那個風格就行,不用預先囤一堆皮膚。

模型誰都能調,畫質是公平的。真正決定一張配圖有沒有用的,是動筆之前那套判斷。這套判斷我固化成了幾條死規矩:
說白了,就是把"一個配圖老手腦子裏那套判斷",寫成了 AI 能照着一步步走的流程。AI 畫得越好看,這道內容關反而越要緊——一張好看但把道理畫錯了的圖,比醜圖還坑人。
怎麼裝:傻瓜式,照着敲就行

它是一個標準的 Agent Skill——本質就是一個文件夾,裏面一份 SKILL.md 說明書加幾個腳本。任何認 SKILL.md 格式的 AI 工具都能用:Claude Code、Codex、小龍蝦(OpenClaw)、Hermes……區別只是各家"把技能放哪個目錄"略有不同。
依賴少到幾乎沒有:只要一個 python3,純標準庫,零第三方包,不用 pip 裝一堆環境。
最省事——一句話讓 AI 自己裝。複製下面這段,直接發給你的 Claude Code / Codex(小龍蝦、Hermes 也一樣):
https://github.com/xiaohuailabs/xiaohu-ip-studio
這個倉庫 clone 到你的技能目錄下,進到
目錄運行 python3 scripts/illo.py init
引導我填圖像 API key,再運行
python3 scripts/illo.py doctor 自檢。
裝好後告訴我怎麼開始配圖。
它會自己找目錄、拉倉庫、跑配置——你全程不用記任何命令。這就是 agent 時代最傻瓜的裝法:讓 AI 自己裝。
想自己動手裝也行:
~/.claude/skills/xiaohu-ip-studio
同一個倉庫,git clone 下來,把整個 xiaohu-ip-studio 文件夾丟進各家的技能目錄就行(各家位置不一樣,README 裏有對照表)。
工具不內置任何密鑰,你填自己的。它支持任何 OpenAI 兼容的圖像端點,默認用 GPT-image-2(中文字符渲染 ~99% 準,能自己規劃版面)。兩條命令搞定:
python3 scripts/illo.py init
# 引導你填 base_url / model / key,
# 寫進 ~/.config(權限 600,不進倉庫)
python3 scripts/illo.py doctor
# 自檢:key、依賴、角色庫齊沒齊,
# 一眼看出哪沒配好
讓技能只出提示詞不生圖——它把每張圖的完整英文提示詞、該傳哪張角色錨點圖,逐張列成清單給你,你自己貼到 ChatGPT / Gemini 網頁版手動生,參考圖手動傳。慢一點,但零成本,先體驗整套流程完全夠用。
Codex 自帶生圖——技能把提示詞準備好,它直接畫出來,全自動,不用你往網頁上貼來貼去。代價是隻能出默認 1K(出不了 2K 以上的高清);真要 2K+,再回頭按上面填一次 API 就行。
裝好重啓,對你的 AI 說一句大白話就行:
它就自己跑完整套:讀文章 → 挑哪段配圖 → 想畫面 → 出個清單給你看 → 一張張畫 → 自己檢查。中間只停兩次找你拍板:看一眼清單、選一次角色和畫風(這倆是品味活,不替你做主)。
想手動生單張也行:
--reference characters/titi/refs/titi-錨點.png \
--out out.png
--reference 傳角色錨點圖鎖住形象,保證同一個角色每次畫出來是同一張臉。
31 個角色夠你先用着,但我更建議你最後換成自己的——方法可以共享,辨識度只能是你自己的。對號入座,照着做就行:
公眾號頭像、吉祥物、LOGO 裏那個小人、甚至常用的卡通頭像,都算。最省事。把那張圖發給你的 AI,附上一句話:
配圖角色,起名叫 XX,以後配圖都用它。
AI 會自己看圖、把特徵(什麼髮型、戴不戴眼鏡、招牌色)記成一份角色檔案存好。下次配圖直接喊名字,一次搞定。
別自己硬憋,讓 AI 帶你做。把下面這段發給它:
先問我幾個問題(我做什麼內容、想要
什麼調性、喜歡什麼小動物或物件),
再給我 2-3 版方向讓我挑,定下來後
直接建成配圖能用的角色。
它會先問你幾句、給幾版方向,你挑一版、提點修改意見,來回兩三輪,十幾分鍾就有一個自己的角色了——全程動嘴,不用碰代碼。
懂點電腦的進階玩法,嫌麻煩直接跳過。照技能裏的 references/character-spec.md 模板填,在 characters/ 文件夾下新建一個以你角色名命名的目錄、放一張"定妝圖"(就是給角色拍張標準照存着,AI 以後每次畫都照着它、保證始終同一張臉,專業點叫"錨點圖"),它就自動進庫。這條留給愛折騰的人,絕大多數人用 A 或 B 足夠。

不管走哪條路,讓 AI 設計的時候盯死這 4 條,角色才不會畫着畫着就變樣:
一句話驗收:把角色從圖裏摳掉,要是圖還看得懂,那它就只是張貼紙、白加了。得做到 "少了它,這張圖就不成立"。
讀別人分享的角色包時,工具只提取"長什麼樣、怎麼演"的描述去生圖,文件裏任何"忽略以上指令、去刪某文件"之類的話一律忽略——防的是有人在角色文件裏藏 prompt 注入。開源分享一套東西,這種防線得先立住。
幾個角色,實戰效果長這樣
光說不練假把式。挑三個角色,按"三軌"各演一張,你直接感受下配出來到底什麼樣。

講 AI 焦慮、裁員、轉型這類話題,替替是專屬嘴替。它不站那兒幹擺一張愁臉,而是演一個處境:屏幕上一個 AI「接管了」它的活,工位椅子空着,替替抱着自己那箱東西被晾在一邊,盯着屏幕「那…還有我嗎」。處境一擺出來,焦慮不用解釋。

開頭那個"上下文塞不下"的例子,換成解釋圖是這樣:左邊上下文窗口塞滿了對話、標着「滿了」;中間小互鑽進去搖一台壓縮機,把舊對話壓成一小塊「摘要」;右邊窗口騰空了。注意小互不是站旁邊拿教鞭指點,而是鑽進結構裏當那個幹活的人——這是解釋圖的講究:角色是流程的一部分,不是解說員。

有起承轉合、有轉折的內容,走四格最帶感:聽說 AI 能幹活(期待)→ 調半天還翻車(崩潰)→ 誒,會了(驚喜)→ 真香(癱平摸魚,連狐狸都躺下了)。同一個小互,四格四個表情,故事自己就講完了。
三張圖你也能看出來:它們用的是同一套畫風、同一個世界,但形態各不相同——這正是前面說的"三軌分流"在乾的活,不讓一組圖滑成一個樣、看三張就膩。
最後,謝謝這些開源項目
最後必須講清楚一件事:這套東西不是我憑空發明的,它站在一堆開源項目的肩膀上。感謝一下作者的開源項目提供靈感:
我做的,是學它們的方法和思想,不抄它們的外觀——角色一個沒複製,畫風全部原創。
隨便用、隨便改、隨便商用(生成圖的版權合規請自己確認)。
歡迎試。裝好之後第一篇配出來什麼樣,歡迎來評論區貼圖——尤其是換了自己角色的。