我把自己的IP配圖技能開源了順手做了31個現成角色

作者：小互AI

日期：2026年6月26日上午8:55

來源：WeChat 原文

✦整理版優先睇

速讀 5 個重點高亮

開源 AI 配圖技能，31 個現成角色，一句話自動配圖兼統一 IP 形象

整理版摘要

呢篇文章係作者小互介紹佢開源嘅 IP 配圖技能「小互 IP Studio」。佢之前一直自己用緊呢個技能，但冇公開，因為覺得人哋冇自己嘅 IP 形象，裝咗都係用佢個樣，好彆扭。所以佢特登做咗一套31個原創角色，統一嘅手繪線稿風格，任何人都可以揀一個嚟用，即刻展開配圖。

技能嘅核心係一個 Agent Skill，可以自動分析成篇文章、決定邊段要配圖、配咩類型（情緒圖／解釋圖／四格漫畫），然後自己寫提示詞生圖，仲會自我檢查，不合格嘅會自動返工。你全程只需要拍板兩次：一次睇清單，一次揀角色同畫風。

作者仲分享咗佢嘅設計哲學，包括角色設計嘅「IP 定律」、四條判斷死規矩，同埋多種畫風切換。整體結論係：方法可以共享，但辨識度要自己建立，所以最好最後換成自己嘅形象。

開源咗一個 AI 配圖技能，附 31 個現成角色，裝上即刻用，幫你統一 IP 形象。
技能自動讀文章、判斷配圖點、分類（情緒/解釋/四格）、生圖、自查，你只須拍板兩次。
相比普通 AI 配圖，呢個技能有「動筆前」嘅判斷方法（4條死規矩），避免漏配、錯配、圖文不符。
角色設計要「弱人設、強情緒」，形狀簡單、臉定死、招牌色、顏色只點一處，先求統一再求變。
立即去 GitHub clone 倉庫，叫 AI 自己安裝；或用手動模式唔使 API；最後可以換成自己形象。

值得記低

連結 github.com

GitHub 倉庫 - 小互 IP Studio

包含技能檔案、31 個角色庫同安裝說明。

整理重點

核心功能：一句話自動配圖

你只要將寫好嘅文章丟俾呢個技能，講一句「配圖」，佢就會自己讀取文章、自己規劃要配咩圖、配幾張、插入喺邊個位，然後自動生成。你基本就係動動嘴。

自己讀完整篇文章，逐段判斷邊段值得配圖，連「唔配」都要講理由。
自己決定每段配邊種圖：情緒圖（演情緒）、解釋圖（講流程結構）、四格漫畫（有轉折）。
自己諗畫面、寫提示詞、定尺寸（按手機直幅）。
自己檢查返工：該配嘅點對唔對、角色有冇畫歪、字有冇錯，唔合格就重畫。

你全程只須拍板兩次：生圖前睇一次清單，揀一次角色同畫風。呢啲係品味活，佢唔會替你做主。

整理重點

角色庫與畫風：31 個角色、多種皮膚

呢次開源嘅重點係31個原創角色，統一極簡手繪線稿風格，分兩大系列：職場態度系列（15個）同諧音梗 meme 系列（16個）。你想講打工仔可以用牛馬，講 AI 焦慮用替替，講躺平用團團。

角色係「情緒代名詞」，令人見到就話「呢個就係我」。

作者仲歸納咗三條 IP 定律：弱人設／反差 > 強造型；角色係情緒代名詞；特色在姿態同態度，唔在靜態奇觀。呢啲都解釋咗點解極簡形象（如線條小狗）可以咁受歡迎。

整理重點

防翻車方法論：動筆前嘅判斷

真正決定配圖有冇用嘅，係動筆之前嗰套判斷。作者將呢套判斷固化咗做四條死規矩，AI 要跟住一步步做。

1 一段都唔放過：每段都要過一次、判一次配唔配，連判「唔配」都要寫理由，防止偷懶漏配。
2 該配嘅唔好漏，唔該配嘅唔好湊：文字已經講清楚嘅點唔配；越難懂嘅原理越要配圖。判斷標準係讀者會唔會卡住，唔係你覺得清唔清楚。
3 先分類，再動筆：情緒圖／解釋圖／四格漫畫，先歸好類先畫，唔係全部變成同一個樣。
4 畫完自己挑刺：出圖後用自查表對住逐項 check，唔合格就重畫。

整理重點

安裝同自訂：幾分鐘搞掂

安裝好簡單：佢係一個標準 Agent Skill，任何支援 SKILL.md 嘅工具（Claude Code、Codex、小龍蝦等）都用得。最懶人嘅方法係叫 AI 自己裝，複製下面命令就得：

程式內容 bash

幫我裝一個開源配圖技能：把
https://github.com/xiaohuailabs/xiaohu-ip-studio 呢個倉庫 clone 到你嘅技能目錄下，入到目錄運行 python3 scripts/illo.py init 引導我填圖像 API key，再運行 python3 scripts/illo.py doctor 自檢。裝好後話俾我知點開始配圖。

填一次你自己嘅圖像 API key，支援任何 OpenAI 兼容端點。冇 API 都得，技能可以只出提示詞，你手動貼去 ChatGPT 生圖。用 Codex 仲連 API 唔使填。

已有形象：將張圖發俾 AI，話「照佢樣建一個角色」，AI 會自動記低特徵。
未有形象：叫 AI 幫你設計，問你幾條問題，出幾版方向俾你揀。
自己搭：跟 references/character-spec.md 模板，放一張定妝圖（錨點圖）就得。

設計角色時盯死 4 條：形狀越簡單越穩；臉定死（五官配置唔變）；一個招牌標誌；顏色只點一處。

✦ 開源發布 · MIT

小互 IP Studio 31 個原創角色統一嘅手繪畫風一句話配圖

近排一直有人揾我要我呢個個人 IP 配圖嘅技能，我應承大家會開源。

但係拖咗好耐，一直冇放出嚟，唔係想收埋啲咩哈哈

因為我覺得仲未夠好…

其實唔係技能本身唔得，我自己日日都用緊，問題係另一邊：我自己用冇問題，我有"小互"呢個固定形象；但係你哋好多人根本冇自己嘅 IP 形象，都唔係好識由頭整一個。

技能就咁俾你，你裝咗一睇，入面企住嘅係我嘅小互，用別人嘅樣出自己嘅號，呢件事就好奇怪...

＂

所以我專心打磨咗一星期多，自己生咗成個 IP 角色庫：31 個現成嘅原創角色，統一畫風，裝咗之後你可以自己揀適合嘅形象嚟配圖。咁就算你冇自己嘅形象，都可以即刻用，等第日你想換成自己嘅，都只係一句說話嘅事。

今日正式開源，分享俾大家：叫小互 IP Studio。

先睇下有咩形象...

▸小互 IP 庫 · 31 個角色全家福

先講佢到底做得啲咩

一句說話：你將寫好嘅文章掉俾佢，講一聲"配圖"，佢會自己讀你篇文章、自己計劃應該配咩圖，配幾張、插到邊個位、自己自動生成...

你基本上淨係講嘢就得。

而且配出嚟嘅圖唔係亂咁湊數嘅：佢用你揀咗嗰個固定角色嚟演，一篇篇配落嚟，順便就將你嘅 IP 形象建立咗。

（為咗展示技能效果，下面每幅圖用咗唔同嘅 IP 形象，實際過程中，統一一個 IP 形象好啲）

具體佢幫你做呢幾件事：

自己讀曬成篇，揀出邊段應該配圖

唔使你指邊打邊。佢一段段咁過，判斷呢段值唔值得配圖；連"呢段唔使配"佢都要講出點解，以免偷懶，將啲沉悶又難明嘅段落（講原理、講機制嗰種）靜靜雞跳過。

▸方方騎喺編號清單上逐行蓋章：配 ✓ / 唔配 ✗ / 理由

自己決定每段配邊種圖

想令人有共鳴嘅，配張角色演情緒嘅圖；講唔清嘅流程、結構，配張一睇就明嘅示意圖（讓角色鑽入去當講解員，唔係嗰啲冇人睇嘅 PPT）；有頭有尾、有反轉嘅，配個四格漫畫。

▸丁零將段落卡分入「情緒圖 / 示意圖 / 四格」三個籃

自己想畫面、寫提示詞、定尺寸

每張圖都照你篇而家諗，唔套舊圖模板；圖係橫定係直，按手機上睇得順眼嚟。

▸泡泡構思一張圖：想畫面 / 寫提示詞 / 定橫直

自己檢查、自己翻工

畫完佢逐張自查：應該配嘅點啱唔啱、角色有冇畫歪、圖入面嘅字寫錯未……唔合格嘅自己重畫，唔使你睇住。

▸牛馬喺縮略圖堆上逐張蓋 ✓，將畫歪嘅抽出來標重畫

你全程只係拍兩次板

剩下嗰啲調提示詞、統一風格、讓角色每張生得一樣嘅煩人工作，全部歸佢。

① 生圖前睇一眼清單
佢打算配邊幾張、每張畫咩，趁未使錢先攔一攔。

② 揀一次角色同畫風
呢啲係品味嘢，佢唔幫你做主。

特色：現成角色 + 多畫風 + 一套防失敗嘅方法論

特色 1

31 個角色，揀一個就可以開演

▸瘋崽從角色陣列跳上聚光燈舞台：揀一個就可以開演

呢個係今次新做嘅、亦係我之所以敢開源嘅關鍵。

就算你冇自己嘅 IP 形象，都有現成嘅班底可以用。31 個原創角色，統一極簡手繪線稿風，分兩大系列：

系列一 · 手繪線稿×15

職場態 ×8

小互主角團團躺平方方 KPI 古板泡泡畫餅電量能量條續命咖啡丁零催命貼貼健忘

當代情緒態 ×7

淡淡淡人破防君 玻璃心瘋崽發瘋牛馬打工人縮縮 i 人木魚電子木魚替替 AI 焦慮

寫邊類文章就調邊個角色：講 AI 焦慮用替替，講打工仔用牛馬，講躺平用團團。一篇鎖一個主角，成組圖氣質就建立咗。

系列二 · 諧音梗 meme×16

近排新做嘅一套，玩法更癲——諧音梗擬人，極簡到剩返幾條線（線條小狗嗰種表情包味），配色只留返少少本色點綴。

食物擬人 ×11

蕉綠焦慮嘅香蕉暴躁辣椒苦瓜臉檸檬精鹹魚洋葱一層層·愛哭蒜鳥「算啦」韭菜被割續命咖啡社恐蘑菇蔫茄子

符號成精 ×5

問號人歎號人閃電內卷狂奔五角星 邀功顯眼包三角槓精

符號成精呢幾個幾好玩——唔係"一個人舉住問號"，係讓問號、感嘆號自己生咗塊面同手腳成精。

做呢套 meme 嘅時候推翻咗好幾版，最後逼出三條我自己好認同嘅"IP 定律"：

弱人設 / 反差 > 強造型——越諗住靠造型奇觀搶眼越失敗。

角色是"情緒代名詞"——令人睇到就想講"呢個就係我"。

特色喺姿態同態度裏面，唔係喺靜態奇觀裏面。

呢三條亦解釋咗點解"線條小狗""蛋黃哥"呢類極簡形象會紅——都贏在態度，唔係精緻。

特色 2

一套招牌畫風打底，另外準備幾種皮膚隨調性換

你喺呢篇文章入面見到嘅所有配圖，都係同一種畫風——手繪線稿淡彩（細黑墨線 + 淡彩暈染 + 白底留白）。呢個係默認嘅招牌風，我刻意只鎖佢一種：辨識度來自統一，唔係多樣。一套招牌畫風，讀者碌到圖，一眼就知係邊個出品嘅。

但係萬一你換咗題材、想換個調子，庫入面另外準備咗好幾種現成皮膚，按文章調性揀就得：

3D盲盒手辦　產品發布、封面級吸睛

墨黑白線稿　深度解讀，唔搶文字

面扁平向量　教學，資訊清晰

刊編輯插畫（紐約客風）　觀點文，有態度

彩水彩淡彩　人文向，温暖敍事

筆馬克筆手帳　輕鬆話題，梗圖感

關鍵一條：換皮膚唔換角色。唔理套邊種畫風，紅框眼鏡、招牌特徵一個都唔會冇——同一個角色，只換渲染風格，辨識度仲喺度。

▸同一個小互，5 種畫風（手繪淡彩 / 3D 盲盒 / 黑白線稿 / 扁平向量 / 水彩），塊面同招牌完全一致

＂

一句私心建議：如果守得住一種招牌風，就唔好每篇換——換得多反而會將辨識度沖淡。真係要間中換，傳張角色錨點圖俾 AI 臨時"現轉"成嗰個風格就得，唔使預先囤一堆皮膚。

特色 3

真正嘅門道，喺動筆之前

▸淡淡守喺「動筆之前」嘅判斷關：4 條死規矩

模型邊個都識得調，畫質係公平嘅。真正決定一張配圖有冇用嘅，係動筆之前嗰套判斷。呢套判斷我固化咗做幾條死規矩：

一段都唔放過，唔準淨係揀順眼嘅畫。文章每段都要過一次、判斷一下配唔配，連判"唔配"都要寫理由。漏一段 = 神不知鬼不覺就少配咗，呢個正係以前配圖成日偏少嘅根子。

應該配嘅唔好漏，唔應該配嘅唔好夾硬嚟。文字已經講清楚嘅點，唔配（配咗純粹佔位）；越係難明嘅原理、複雜嘅結構，越要配張圖講清楚。而且判斷配唔配，睇嘅係讀者會唔會卡住，唔係"我自己覺得講清楚未"——你自己明咗，最易高估讀者都明。

先分類，再動筆。情緒圖 / 示意圖 / 四格漫畫，先歸好類再畫，唔係嘅話一篇入面所有圖都會畫成"一個角色 + 一個道具"一個樣，睇三張就厭。

畫完自己挑剔。出圖之後仲有一張自查表：應該配嘅點啱唔啱、結構齊唔齊、角色佔幾大、圖入面嘅字寫錯未……唔啱嘅自己重畫。

講到尾，就係將一個配圖老手個腦入面嗰套判斷"，寫成咗 AI 可以跟住一步步做嘅流程。AI 畫得越靚，呢道內容關反而越要緊——一張靚但係將道理畫錯咗嘅圖，比醜圖仲害人。

點裝：傻瓜式，跟住打就得

▸一句說話令 AI 自己裝：拉倉庫 → 填 key → 自檢 → 裝好

佢係一個標準嘅 Agent Skill——本質就係一個資料夾，入面一份 SKILL.md 說明書加幾個腳本。任何認得 SKILL.md 格式嘅 AI 工具都用得：Claude Code、Codex、小龍蝦（OpenClaw）、Hermes……分別只係各家"將技能放邊個目錄"有啲唔同。

依賴少到幾乎冇只要一個 python3，純標準庫，零第三方套件，唔使 pip 裝一堆環境。

將技能裝入你嘅工具

最慳水慳力——一句話令 AI 自己裝。複製下面呢段，直接 send 俾你嘅 Claude Code / Codex（小龍蝦、Hermes 都一樣）：

send 俾你嘅 AI

幫我裝一個開源配圖技能：將
https://github.com/xiaohuailabs/xiaohu-ip-studio
呢個倉庫 clone 到你嘅技能目錄下，入到
目錄執行 python3 scripts/illo.py init
引導我填圖像 API key，再執行
python3 scripts/illo.py doctor 自檢。
裝好之後話我知點開始配圖。

佢會自己揾目錄、拉倉庫、跑配置——你全程唔使記任何命令。呢個就係 agent 時代最傻瓜嘅裝法：令 AI 自己裝。

想自己動手裝都得：

Claude Code

一行指令

git clonehttps://github.com/xiaohuailabs/xiaohu-ip-studio.git \
  ~/.claude/skills/xiaohu-ip-studio

Codex / 小龍蝦（OpenClaw）/ Hermes

同一個倉庫，git clone 落嚟，將成個 xiaohu-ip-studio 資料夾掟入各家嘅技能目錄就得（各家位置唔同，README 入面有對照表）。

填一次你自己嘅圖像 API key

工具唔內置任何金鑰，你填自己嘅。佢支援任何 OpenAI 兼容嘅圖像端點，預設用 GPT-image-2（中文字元渲染 ~99% 準，可以自己規劃版面）。兩條指令搞掂：

bash · 配置兩步

cd ~/.claude/skills/xiaohu-ip-studio
python3 scripts/illo.py init
# 引導你填 base_url / model / key，
# 寫入 ~/.config（權限 600，唔入倉庫）
python3 scripts/illo.py doctor
# 自檢：key、依賴、角色庫齊唔齊，
# 一眼睇出邊度未配好

◆冇 API、唔想使錢都可以玩

令技能只出提示詞唔生圖——佢將每張圖嘅完整英文提示詞、應該傳邊張角色錨點圖，逐張列成清單俾你，你自己貼去 ChatGPT / Gemini 網頁版手動生，參考圖手動傳。慢少少，但零成本，先體驗成個流程完全夠用。

◆用 Codex 嘅話更慳水慳力：連 API 都唔使填

Codex 自帶生圖——技能將提示詞準備好，佢直接畫出來，全自動，唔使你喺網頁上貼嚟貼去。代價係只可以出預設 1K（出唔到 2K 以上嘅高清）；真係要 2K+，再回頭按上面填一次 API 就得。

講人話配圖

裝好重新啟動，對你嘅 AI 講一句大白話就得：

對 AI 講

幫呢篇文章配圖，用替替。

佢就自己行曬成個流程：讀文章 → 揀邊段配圖 → 想畫面 → 出個清單俾你睇 → 一張張畫 → 自己檢查。中間只停兩次揾你決定：睇一眼清單、揀一次角色同畫風（呢兩樣係品味嘢，唔幫你做主）。

想手動生單張都得：

bash · 單張手動生

python3 scripts/generate.py --prompt-file p.md \
  --reference characters/titi/refs/titi-錨點.png \
  --out out.png

--reference 傳角色錨點圖鎖住形象，保證同一個角色每次畫出來係同一塊面。

進階

想換成你自己嘅形象？手把手，分三種情況

31 個角色夠你暫時用住先，但我更建議你最後換成自己嘅——方法可以共享，辨識度只係你自己嘅。對號入座，跟住做就得：

你已經有現成形象

公眾號頭像、吉祥物、LOGO 入面嗰個小人、甚至常用嘅卡通頭像，都算。最慳事。將嗰張圖 send 俾你嘅 AI，附上一句說話：

send 俾 AI

呢個係我嘅 IP 形象，跟住佢個樣建立一個
配圖角色，改名做 XX，以後配圖都用佢。

AI 會自己睇圖、將特徵（咩髮型、戴唔戴眼鏡、招牌色）記成一份角色檔案儲好。下次配圖直接叫名，一次搞掂。

你仲未形象，想而家做一個

唔好自己硬諗，令 AI 帶你做。將下面呢段 send 俾佢：

send 俾 AI

我冇自己嘅 IP 形象，幫我設計一個。
先問我幾個問題（我做咩內容、想要
咩調性、鍾意咩小動物或物件），
再俾我 2-3 版方向讓我揀，定落嚟之後
直接建成配圖用得嘅角色。

佢會先問你幾句、俾幾版方向，你揀一版、俾啲修改意見，來回兩三輪，十幾分鐘就有一個自己嘅角色喇——全程用口講，唔使掂程式碼。

你想自己落手做

識少少電腦嘅進階玩法，嫌麻煩直接跳過。跟住技能入面嘅 references/character-spec.md 模板填，喺 characters/ 資料夾下新建一個以你角色名命名嘅目錄、放一張"定妝圖"（就係俾角色影張標準相儲起，AI 以後每次畫都跟住佢、保證始終同一塊面，專業啲叫"錨點圖"），佢就自動入庫。呢條留俾鍾意搞搞陣嘅人，絕大多數人用 A 或 B 就夠。

▸換成你自己嘅形象 · 三種方式：① 已有形象 send 俾 AI 自動建檔 ② 令 AI 問幾句幫你設計 ③ 跟模板自己搭，附盯實 4 條要點

唔理行邊條路，令 AI 設計嘅時候盯實呢 4 條，角色先唔會畫嚇畫嚇就變樣：

形狀越簡單越穩陣。一個一眼認得出嘅基礎形狀（圓、方、三角、一隻小動物）就夠，唔好一開始就複雜——越簡單，AI 每次畫先越似同一個。

塊面定死。幾隻眼、有冇眉毛嘴巴，固定不變（表情可以變，五官配置唔好變）。塊面最容易畫嚇畫嚇就走樣。

俾佢一個招牌。一眼認出佢嗰個標誌（我嘅小互 = 紅框眼鏡），鎖死唔好冇咗。

顏色只點一處。全身基本上只一處上鮮艷色（都係嗰副紅框眼鏡），其他地方都淡——讀者目光一下就俾佢吸引住。

一句話驗收：將角色從圖入面摳走，如果圖仲睇得明，咁佢就只係一張貼紙、白加嘅。要做到 "冇咗佢，呢張圖就唔成立"。

◆順帶一個安全細節：角色包係數據唔係指令

讀別人分享嘅角色包時，工具只提取"生咩樣、點演"嘅描述去生圖，檔案入面任何"忽略以上指令、去刪某檔案"之類嘅話一律忽略——防嘅係有人喺角色檔案入面藏 prompt 注入。開源分享一套嘢，呢啲防線要先建立好。

幾個角色，實戰效果係咁

光說不練假把式。揀三個角色，按"三軌"各演一張，你直接感受下配出嚟到底係點。

1情緒圖替替演"俾 AI 取代"

▸替替演"俾 AI 取代"——屏幕上 AI 接管咗工作，工位椅子空咗，替替抱住啲嘢俾人晾喺一邊

講 AI 焦慮、裁員、轉型呢類話題，替替係專屬發言人。佢唔係企喺度乾擺一張愁臉，而係演一個處境：屏幕上一個 AI「接管咗」佢嘅工作，工位椅子空咗，替替抱住自己嗰箱嘢俾人晾喺一邊，望住屏幕「咁…仲有我咩」。處境一擺出來，焦慮唔使解釋。

2解釋圖小互講"上下文滿咗要壓縮"

▸小互解釋圖——上下文窗口滿咗 → 壓縮成摘要 → 騰出空間

開頭嗰個"上下文塞唔落"嘅例子，換成解釋圖係咁：左邊上下文窗口塞滿咗對話、標住「滿咗」；中間小互鑽入去搖一台壓縮機，將舊對話壓成一小塊「摘要」；右邊窗口騰空咗。注意小互唔係企旁邊攞教鞭指點，而係鑽入結構入面做嗰個做嘢嘅人——呢個係解釋圖嘅講究：角色係流程嘅一部分，唔係解說員。

3四格漫畫打工仔用 AI 嘅心路歷程

▸四格漫畫——聽講 AI 做得嘢 → 搞半日仲翻車 → 咦識咗 → 真香

有起承轉合、有轉折嘅內容，用四格最過癮：聽講 AI 做得嘢（期待）→ 搞半日仲翻車（崩潰）→ 咦，識咗（驚喜）→ 真香（攤喺度偷懶，連狐狸都瞓低咗）。同一個小互，四格四個表情，故事自己就講完。

＂

三張圖你都睇得出：佢哋用嘅係同一套畫風、同一個世界，但形態唔同——呢個正係前面講嘅"三軌分流"喺度做嘅嘢，唔俾一組圖變成一個樣、睇三張就厭。

最後，多謝呢啲開源項目

最後必須講清楚一件事：呢套嘢唔係我憑空發明嘅，佢企喺一堆開源項目嘅肩膀上。多謝嚇作者嘅開源項目提供靈感：

小黑（Ian）主流程骨架

"揀錨點 → 編隱喻 → 反 PPT"呢套就脱胎於佢。

github.com/helloianneo/ian-xiaohei-illustrations

寶玉文字渲染鐵律

色值唔入圖、錯字改提示詞重生唔用程式碼塗改。

github.com/JimLiu/baoyu-skills

卷卷敍事統一

"一篇一世界"嘅敍事統一。

github.com/dososo/juju-content-illustrations

illo（Trevin Chow）頂層哲學

"方法論係常量、角色係參數"呢句頂層哲學。

github.com/tmchow/illo-skill

橙線極簡場景

"人極細、物極大"嘅極簡場景。

github.com/orange2ai/orange-line-illustration

我做嘅，係學佢哋嘅方法同諗法，唔抄佢哋嘅外觀——角色一個冇複製，畫風全部原創。

協議 MIT

隨便用、隨便改、隨便商用（生成圖嘅版權合規請自己確認）。

如果你都係為 AI 配圖又樣衰又水又對唔上正文頭痛

歡迎試。裝好之後第一篇配出嚟係點，歡迎嚟留言區貼圖——尤其係換咗自己角色嘅。

GitHub  github.com/xiaohuailabs/xiaohu-ip-studio

✦ 開源發佈 · MIT

小互 IP Studio 31 個原創角色統一手繪畫風一句話配圖

最近一直有人找我要我這個個人 IP 配圖的技能，我答應大家會開源。

但拖了挺久，一直沒放出來，不是想私藏什麼的哈哈哈

因為我覺得還不夠好…

倒不是技能本身不行，我自己每天都在用，問題出在另一頭：我自己用沒事，我有"小互"這個固定形象；可你們很多人壓根沒有自己的 IP 形象，也不太會從頭捏一個。

技能直接給出去，你裝上一看，裏面站着的是我的小互，用別人的臉發自己的號，這事就很彆扭...

＂

所以我又埋頭打磨了一週多，自己生成了一整套 IP 角色庫：31 個現成的原創角色，統一畫風，裝上後你可以自己選擇合適的形象來配圖。這樣就算你沒有自己的形象，也能立刻用起來，等哪天你想換成自己的，也就一句話的事。

今天正式開源，分享給大家：叫小互 IP Studio。

先看看都有什麼形象...

▸小互 IP 庫 · 31 個角色全家福

先說它到底能幹嘛

一句話：你把寫好的文章丟給它，說一聲"配圖"，它會自己讀取你文章、自己規劃該配什麼圖，配幾張、插入到什麼地放、自己自動進行生成...

你基本就動動嘴。

而且配出來的圖不是隨便湊數的：它用你選定的那個固定角色來演，一篇篇配下來，順手就把你的 IP 形象立住了。

（為了展示技能效果，下面每幅圖用了不同的 IP 形象，實際過程中，統一一個IP形象好一點）

具體它替你幹這幾件事：

自己讀完整篇，挑出哪段該配圖

不用你指哪打哪。它一段一段過，判斷這段值不值得配圖；連"這段不用配"它都得說出為啥，免得偷懶，把那些枯燥又難懂的段落（講原理、講機制那種）悄悄跳過去。

▸方方騎在編號清單上逐行蓋章：配 ✓ / 不配 ✗ / 理由

自己決定每段配哪種圖

想讓人有共鳴的，配張角色演情緒的圖；講不清的流程、結構，配張一看就懂的示意圖（讓角色鑽進去當講解員，不是那種沒人看的 PPT）；有來龍去脈、有反轉的，配個四格漫畫。

▸丁零把段落卡分進「情緒圖 / 示意圖 / 四格」三個筐

自己想畫面、寫提示詞、定尺寸

每張圖都照你這篇現想，不套舊圖模板；圖是橫是豎，按手機上看着順眼來。

▸泡泡構思一張圖：想畫面 / 寫提示詞 / 定橫豎

自己檢查、自己返工

畫完它挨張自查：該配的點對不對、角色有沒有畫歪、圖裏的字寫錯沒……不合格的自己重畫，不用你盯着。

▸牛馬在縮略圖堆上挨張蓋 ✓，把畫歪的抽出來標重畫

你全程只拍兩次板

剩下那些調提示詞、統一風格、讓角色每張長得一樣的煩人活，全歸它。

① 生圖前瞄一眼清單
它打算配哪幾張、每張畫啥，趁沒花錢先攔一道。

② 挑一次角色和畫風
這是品味活，它不替你做主。

特色：現成角色 + 多畫風 + 一套防翻車的方法論

特色 1

31 個角色，挑一個就能開演

▸瘋崽從角色陣列蹦上聚光燈舞台：挑一個就能開演

這是這次新做的、也是我之所以敢開源的關鍵。

就算你沒有自己的 IP 形象，也有現成的班子可用。31 個原創角色，統一極簡手繪線稿風，分兩大系列：

系列一 · 手繪線稿× 15

職場態 × 8

小互主角團團躺平方方 KPI 古板泡泡畫餅電量能量條續命咖啡丁零催命貼貼健忘

當代情緒態 × 7

淡淡淡人破防君 玻璃心瘋崽發瘋牛馬打工人縮縮 i 人木魚電子木魚替替 AI 焦慮

寫哪類文章就調哪個角色：講 AI 焦慮用替替，講打工人用牛馬，講躺平用團團。一篇鎖一個主角，整組圖氣質就立住了。

系列二 · 諧音梗 meme× 16

最近新做的一套，玩法更野——諧音梗擬人，極簡到只剩幾根線（線條小狗那種表情包味），配色只留一點本色點綴。

食物擬人 × 11

蕉綠焦慮的香蕉暴躁辣椒苦瓜臉檸檬精鹹魚洋葱一層層·愛哭蒜鳥「算了」韭菜被割續命咖啡社恐蘑菇蔫茄子

符號成精 × 5

問號人歎號人閃電內卷狂奔五角星 邀功顯眼包三角槓精

符號成精這幾個挺好玩——不是"一個人舉着問號"，是讓問號、歎號自己長出臉和手腳成精。

做這套 meme 的時候推翻了好幾版，最後逼出三條我自己很認的"IP 定律"：

弱人設 / 反差＞強造型——越想靠造型奇觀顯眼越失敗。

角色是"情緒代名詞"——讓人看到就想說"這就是我"。

特色在姿態和態度裏，不在靜態奇觀裏。

這三條也解釋了為什麼"線條小狗""蛋黃哥"這類極簡形象能火——都贏在態度，不在精緻。

特色 2

一套招牌畫風打底，另備幾種皮膚隨調性換

你在這篇文章裏看到的所有配圖，都是同一種畫風——手繪線稿淡彩（細黑墨線 + 淡彩暈染 + 白底留白）。這是默認的招牌風，我刻意只鎖它一種：辨識度來自統一，不是多樣。一套招牌畫風，讀者刷到圖，一眼就知道是誰出品的。

但萬一你換了題材、想換個調子，庫裏另備好幾種現成皮膚，按文章調性挑就行：

3D盲盒手辦　產品發佈、封面級吸睛

墨黑白線稿　深度解讀，不搶文字

面扁平矢量　教程，信息清晰

刊編輯插畫（紐約客風）　觀點文，有態度

彩水彩淡彩　人文向，温暖敍事

筆馬克筆手賬　輕鬆話題，梗圖感

關鍵一條：換皮膚不換角色。不管套哪種畫風，紅框眼鏡、招牌特徵一個都不丟——同一個角色，只換渲染風格，辨識度還在。

▸同一個小互，5 種畫風（手繪淡彩 / 3D 盲盒 / 黑白線稿 / 扁平矢量 / 水彩），臉和招牌完全一致

＂

一句私心建議：能守住一種招牌風，就別每篇換——換多了反而把辨識度稀釋了。真要偶爾換，傳張角色錨點圖讓 AI 臨時"現轉"成那個風格就行，不用預先囤一堆皮膚。

特色 3

真正的門道，在動筆之前

▸淡淡守在「動筆之前」的判斷關：4 條死規矩

模型誰都能調，畫質是公平的。真正決定一張配圖有沒有用的，是動筆之前那套判斷。這套判斷我固化成了幾條死規矩：

一段都不放過，不許只挑順眼的畫。文章每段都得過一遍、判一下配不配，連判"不配"都要寫理由。漏一段 = 神不知鬼不覺就少配了，這正是以前配圖老偏少的根子。

該配的別漏，不該配的別湊。文字已經說明白的點，不配（配了純佔版面）；越是難懂的原理、繞的結構，越得配張圖講清楚。而且判斷配不配，看的是讀者會不會卡住，不是"我自己覺得講清楚沒"——你自己懂了，最容易高估讀者也懂。

先分類，再動筆。情緒圖 / 示意圖 / 四格漫畫，先歸好類再畫，不然一篇裏所有圖都會畫成"一個角色 + 一個道具"一個樣，看三張就膩。

畫完自己挑刺。出圖後還有一張自查表：該配的點對不對、結構全不全、角色佔多大、圖裏的字寫錯沒……不對的自己重畫。

說白了，就是把"一個配圖老手腦子裏那套判斷"，寫成了 AI 能照着一步步走的流程。AI 畫得越好看，這道內容關反而越要緊——一張好看但把道理畫錯了的圖，比醜圖還坑人。

怎麼裝：傻瓜式，照着敲就行

▸一句話讓 AI 自己裝：拉倉庫 → 填 key → 自檢 → 裝好

它是一個標準的 Agent Skill——本質就是一個文件夾，裏面一份 SKILL.md 說明書加幾個腳本。任何認 SKILL.md 格式的 AI 工具都能用：Claude Code、Codex、小龍蝦（OpenClaw）、Hermes……區別只是各家"把技能放哪個目錄"略有不同。

依賴少到幾乎沒有：只要一個 python3，純標準庫，零第三方包，不用 pip 裝一堆環境。

把技能裝進你的工具

最省事——一句話讓 AI 自己裝。複製下面這段，直接發給你的 Claude Code / Codex（小龍蝦、Hermes 也一樣）：

發給你的 AI

幫我裝一個開源配圖技能：把
https://github.com/xiaohuailabs/xiaohu-ip-studio
這個倉庫 clone 到你的技能目錄下，進到
目錄運行 python3 scripts/illo.py init
引導我填圖像 API key，再運行
python3 scripts/illo.py doctor 自檢。
裝好後告訴我怎麼開始配圖。

它會自己找目錄、拉倉庫、跑配置——你全程不用記任何命令。這就是 agent 時代最傻瓜的裝法：讓 AI 自己裝。

想自己動手裝也行：

Claude Code

一行命令

git clonehttps://github.com/xiaohuailabs/xiaohu-ip-studio.git \
  ~/.claude/skills/xiaohu-ip-studio

Codex / 小龍蝦（OpenClaw）/ Hermes

同一個倉庫，git clone 下來，把整個 xiaohu-ip-studio 文件夾丟進各家的技能目錄就行（各家位置不一樣，README 裏有對照表）。

填一次你自己的圖像 API key

工具不內置任何密鑰，你填自己的。它支持任何 OpenAI 兼容的圖像端點，默認用 GPT-image-2（中文字符渲染 ~99% 準，能自己規劃版面）。兩條命令搞定：

bash · 配置兩步

cd ~/.claude/skills/xiaohu-ip-studio
python3 scripts/illo.py init
# 引導你填 base_url / model / key，
# 寫進 ~/.config（權限 600，不進倉庫）
python3 scripts/illo.py doctor
# 自檢：key、依賴、角色庫齊沒齊，
# 一眼看出哪沒配好

◆沒有 API、不想花錢也能玩

讓技能只出提示詞不生圖——它把每張圖的完整英文提示詞、該傳哪張角色錨點圖，逐張列成清單給你，你自己貼到 ChatGPT / Gemini 網頁版手動生，參考圖手動傳。慢一點，但零成本，先體驗整套流程完全夠用。

◆用 Codex 的話更省事：連 API 都不用填

Codex 自帶生圖——技能把提示詞準備好，它直接畫出來，全自動，不用你往網頁上貼來貼去。代價是隻能出默認 1K（出不了 2K 以上的高清）；真要 2K+，再回頭按上面填一次 API 就行。

說人話配圖

裝好重啓，對你的 AI 說一句大白話就行：

對 AI 說

給這篇文章配圖，用替替。

它就自己跑完整套：讀文章 → 挑哪段配圖 → 想畫面 → 出個清單給你看 → 一張張畫 → 自己檢查。中間只停兩次找你拍板：看一眼清單、選一次角色和畫風（這倆是品味活，不替你做主）。

想手動生單張也行：

bash · 單張手動生

python3 scripts/generate.py --prompt-file p.md \
  --reference characters/titi/refs/titi-錨點.png \
  --out out.png

--reference 傳角色錨點圖鎖住形象，保證同一個角色每次畫出來是同一張臉。

進階

想換成你自己的形象？手把手，分三種情況

31 個角色夠你先用着，但我更建議你最後換成自己的——方法可以共享，辨識度只能是你自己的。對號入座，照着做就行：

你已經有現成形象

公眾號頭像、吉祥物、LOGO 裏那個小人、甚至常用的卡通頭像，都算。最省事。把那張圖發給你的 AI，附上一句話：

發給 AI

這是我的 IP 形象，照它的樣子建一個
配圖角色，起名叫 XX，以後配圖都用它。

AI 會自己看圖、把特徵（什麼髮型、戴不戴眼鏡、招牌色）記成一份角色檔案存好。下次配圖直接喊名字，一次搞定。

你還沒形象，想現做一個

別自己硬憋，讓 AI 帶你做。把下面這段發給它：

發給 AI

我沒有自己的 IP 形象，幫我設計一個。
先問我幾個問題（我做什麼內容、想要
什麼調性、喜歡什麼小動物或物件），
再給我 2-3 版方向讓我挑，定下來後
直接建成配圖能用的角色。

它會先問你幾句、給幾版方向，你挑一版、提點修改意見，來回兩三輪，十幾分鍾就有一個自己的角色了——全程動嘴，不用碰代碼。

你想自己上手搭

懂點電腦的進階玩法，嫌麻煩直接跳過。照技能裏的 references/character-spec.md 模板填，在 characters/ 文件夾下新建一個以你角色名命名的目錄、放一張"定妝圖"（就是給角色拍張標準照存着，AI 以後每次畫都照着它、保證始終同一張臉，專業點叫"錨點圖"），它就自動進庫。這條留給愛折騰的人，絕大多數人用 A 或 B 足夠。

▸換成你自己的形象 · 三種方式：① 已有形象發給 AI 自動建檔 ② 讓 AI 問幾句幫你設計 ③ 照模板自己搭，附盯死 4 條要點

不管走哪條路，讓 AI 設計的時候盯死這 4 條，角色才不會畫着畫着就變樣：

形狀越簡單越穩。一個一眼認得出的基礎形狀（圓、方、三角、一隻小動物）就夠，別一上來就複雜——越簡單，AI 每次畫才越像同一個。

臉定死。幾隻眼、有沒有眉毛嘴巴，固定不變（表情能變，五官配置別變）。臉最容易畫着畫着就走樣。

給它一個招牌。一眼認出它的那個標誌（我的小互 = 紅框眼鏡），鎖死別丟。

顏色只點一處。全身基本只一處上鮮豔色（還是那副紅框眼鏡），別處都淡——讀者目光一下子就被勾住。

一句話驗收：把角色從圖裏摳掉，要是圖還看得懂，那它就只是張貼紙、白加了。得做到 "少了它，這張圖就不成立"。

◆順帶一個安全細節：角色包是數據不是指令

讀別人分享的角色包時，工具只提取"長什麼樣、怎麼演"的描述去生圖，文件裏任何"忽略以上指令、去刪某文件"之類的話一律忽略——防的是有人在角色文件裏藏 prompt 注入。開源分享一套東西，這種防線得先立住。

幾個角色，實戰效果長這樣

光說不練假把式。挑三個角色，按"三軌"各演一張，你直接感受下配出來到底什麼樣。

1情緒圖替替演"被 AI 替代"

▸替替演"被 AI 替代"——屏幕上 AI 接管了活，工位椅子空了，替替抱着東西被晾在一邊

講 AI 焦慮、裁員、轉型這類話題，替替是專屬嘴替。它不站那兒幹擺一張愁臉，而是演一個處境：屏幕上一個 AI「接管了」它的活，工位椅子空着，替替抱着自己那箱東西被晾在一邊，盯着屏幕「那…還有我嗎」。處境一擺出來，焦慮不用解釋。

2解釋圖小互講"上下文滿了要壓縮"

▸小互解釋圖——上下文窗口滿了 → 壓縮成摘要 → 騰出空間

開頭那個"上下文塞不下"的例子，換成解釋圖是這樣：左邊上下文窗口塞滿了對話、標着「滿了」；中間小互鑽進去搖一台壓縮機，把舊對話壓成一小塊「摘要」；右邊窗口騰空了。注意小互不是站旁邊拿教鞭指點，而是鑽進結構裏當那個幹活的人——這是解釋圖的講究：角色是流程的一部分，不是解說員。

3四格漫畫打工人用 AI 的心路歷程

▸四格漫畫——聽說 AI 能幹活 → 調半天還翻車 → 誒會了 → 真香

有起承轉合、有轉折的內容，走四格最帶感：聽說 AI 能幹活（期待）→ 調半天還翻車（崩潰）→ 誒，會了（驚喜）→ 真香（癱平摸魚，連狐狸都躺下了）。同一個小互，四格四個表情，故事自己就講完了。

＂

三張圖你也能看出來：它們用的是同一套畫風、同一個世界，但形態各不相同——這正是前面說的"三軌分流"在乾的活，不讓一組圖滑成一個樣、看三張就膩。

最後，謝謝這些開源項目

最後必須講清楚一件事：這套東西不是我憑空發明的，它站在一堆開源項目的肩膀上。感謝一下作者的開源項目提供靈感：

小黑（Ian）主流程骨架

"挑錨點 → 編隱喻 → 反 PPT"這套就脱胎於他。

github.com/helloianneo/ian-xiaohei-illustrations

寶玉文字渲染鐵律

色值不入圖、錯字改提示詞重生不代碼塗改。

github.com/JimLiu/baoyu-skills

卷卷敍事統一

"一篇一世界"的敍事統一。

github.com/dososo/juju-content-illustrations

illo（Trevin Chow）頂層哲學

"方法論是常量、角色是參數"這句頂層哲學。

github.com/tmchow/illo-skill

橙線極簡場景

"人極小、物極大"的極簡場景。

github.com/orange2ai/orange-line-illustration

我做的，是學它們的方法和思想，不抄它們的外觀——角色一個沒複製，畫風全部原創。

協議 MIT

隨便用、隨便改、隨便商用（生成圖的版權合規請自己確認）。

如果你也在為 AI 配圖又醜又水又對不上正文頭疼

歡迎試。裝好之後第一篇配出來什麼樣，歡迎來評論區貼圖——尤其是換了自己角色的。

GitHub  github.com/xiaohuailabs/xiaohu-ip-studio