小互开源个人IP配图技能“小互IP Studio”,含31个原创角色 · AI HOT
小互 @xiaohu 精选 81
2026-06-26 09:26 ·6小时前
精选理由 小互开源了一整套AI配图skill和31个原创角色,把“读文-定图-生图-自查”的流程装进一个命令,自媒体人装上就能用,省去调提示词的痛苦。
AI 摘要 博主小互开源个人IP配图技能“小互IP Studio”,包含31个原创角色(15个手绘线稿角色+16个谐音梗meme形象)及一套配图方法论。该Agent可自动读取文章、规划配图类型(情绪图/示意图/四格漫画)、生成并自查返工。默认画风为手绘线稿淡彩,另备5种皮肤(3D盲盒、黑白线稿等)可切换。安装仅需Python3,支持Claude Code、Codex等工具,需自备OpenAI兼容的图像API key(默认GPT-image-2);也可只输出提示词手动生图。
智能体 GitHub 图像生成 开源/仓库
← 返回
小互 @xiaohu · X 精选 81
2026-06-26 09:26 · 6小时前
在 X 看原推 · x.com 精选理由 小互开源了一整套AI配图skill和31个原创角色,把“读文-定图-生图-自查”的流程装进一个命令,自媒体人装上就能用,省去调提示词的痛苦。
AI 摘要 博主小互开源个人IP配图技能“小互IP Studio”,包含31个原创角色(15个手绘线稿角色+16个谐音梗meme形象)及一套配图方法论。该Agent可自动读取文章、规划配图类型(情绪图/示意图/四格漫画)、生成并自查返工。默认画风为手绘线稿淡彩,另备5种皮肤(3D盲盒、黑白线稿等)可切换。安装仅需Python3,支持Claude Code、Codex等工具,需自备OpenAI兼容的图像API key(默认GPT-image-2);也可只输出提示词手动生图。
但万一你换了题材、想换个调子,库里另备好几种现成皮肤,按文章调性挑就行:
关键一条:换皮肤不换角色。 不管套哪种画风,红框眼镜、招牌特征一个都不丢--同一个角色,只换渲染风格,辨识度还在。
一句私心建议:能守住一种招牌风,就别每篇换--换多了反而把辨识度稀释了。真要偶尔换,传张角色锚点图让 AI 临时"现转"成那个风格就行,不用预先囤一堆皮肤。
特色 3:真正的门道,在动笔之前 模型谁都能调,画质是公平的。真正决定一张配图有没有用的,是动笔之前那套判断。这套判断我固化成了几条死规矩:
一段都不放过,不许只挑顺眼的画。 文章每段都得过一遍、判一下配不配,连判"不配"都要写理由。漏一段 = 神不知鬼不觉就少配了,这正是以前配图老偏少的根子。 该配的别漏,不该配的别凑。 文字已经说明白的点,不配(配了纯占版面);越是难懂的原理、绕的结构,越得配张图讲清楚。而且判断配不配,看的是读者会不会卡住,不是"我自己觉得讲清楚没"--你自己懂了,最容易高估读者也懂。 先分类,再动笔。 情绪图 / 示意图 / 四格漫画,先归好类再画,不然一篇里所有图都会画成"一个角色 + 一个道具"一个样,看三张就腻。 画完自己挑刺。 出图后还有一张自查表:该配的点对不对、结构全不全、角色占多大、图里的字写错没……不对的自己重画。 说白了,就是把"一个配图老手脑子里那套判断",写成了 AI 能照着一步步走的流程。AI 画得越好看,这道内容关反而越要紧--一张好看但把道理画错了的图,比丑图还坑人。
三、怎么装:傻瓜式,照着敲就行 它是一个标准的 Agent Skill--本质就是一个文件夹,里面一份 SKILL.md 说明书加几个脚本。任何认 SKILL.md 格式的 AI 工具都能用:Claude Code、Codex、小龙虾(OpenClaw)、Hermes……区别只是各家"把技能放哪个目录"略有不同。
依赖少到几乎没有:只要一个 python3,纯标准库,零第三方包,不用 pip 装一堆环境。
第一步:把技能装进你的工具 最省事--一句话让 AI 自己装。 复制下面这段,直接发给你的 Claude Code / Codex(小龙虾、Hermes 也一样):
帮我装一个开源配图技能:把 https://github.com/xiaohuailabs/xiaohu-ip-studio 这个仓库 clone 到你的技能目录下,进到目录运行 python3 scripts/illo.py init 引导我填图像 API key,再运行 python3 scripts/illo.py doctor 自检。装好后告诉我怎么开始配图。
它会自己找目录、拉仓库、跑配置--你全程不用记任何命令。这就是 agent 时代最傻瓜的装法:让 AI 自己装。
Claude Code:一行命令 git clone https://github.com/xiaohuailabs/xiaohu-ip-studio.git ~/.claude/skills/xiaohu-ip-studio Codex / 小龙虾(OpenClaw)/ Hermes:同一个仓库,git clone 下来,把整个 xiaohu-ip-studio 文件夹丢进各家的技能目录就行(各家位置不一样,README 里有对照表)。
第二步:填一次你自己的图像 API key 工具不内置任何密钥,你填自己的。它支持任何 OpenAI 兼容的图像端点,默认用 GPT-image-2(中文字符渲染 ~99% 准,能自己规划版面)。两条命令搞定:
> cd ~/.claude/skills/xiaohu-ip-studio python3 scripts/illo.py init # 引导你填 base_url / model / key,写进 ~/.config(权限 600,不进仓库) python3 scripts/illo.py doctor # 自检:key、依赖、角色库齐没齐,一眼看出哪没配好
没有 API、不想花钱也能玩:让技能只出提示词不生图--它把每张图的完整英文提示词、该传哪张角色锚点图,逐张列成清单给你,你自己贴到 ChatGPT / Gemini 网页版手动生,参考图手动传。慢一点,但零成本,先体验整套流程完全够用。
用 Codex 的话更省事:连 API 都不用填。 Codex 自带生图--技能把提示词准备好,它直接画出来,全自动,不用你往网页上贴来贴去。代价是只能出默认 1K(出不了 2K 以上的高清);真要 2K+,再回头按上面填一次 API 就行。
第三步:说人话配图 它就自己跑完整套:读文章 → 挑哪段配图 → 想画面 → 出个清单给你看 → 一张张画 → 自己检查。中间只停两次找你拍板:看一眼清单、选一次角色和画风(这俩是品味活,不替你做主)。
> python3 scripts/generate.py --prompt-file p.md \ --reference characters/titi/refs/titi-锚点.png --out out.png
--reference 传角色锚点图锁住形象,保证同一个角色每次画出来是同一张脸。
想换成你自己的形象?手把手,分三种情况 31 个角色够你先用着,但我更建议你最后换成自己的--方法可以共享,辨识度只能是你自己的。 对号入座,照着做就行:
情况 A·你已经有现成形象(公众号头像、吉祥物、LOGO 里那个小人、甚至常用的卡通头像,都算)
这是我的 IP 形象,照它的样子建一个配图角色,起名叫 XX,以后配图都用它。
AI 会自己看图、把特征(什么发型、戴不戴眼镜、招牌色)记成一份角色档案存好。下次配图直接喊名字,一次搞定。
我没有自己的 IP 形象,帮我设计一个。先问我几个问题(我做什么内容、想要什么调性、喜欢什么小动物或物件),再给我 2-3 版方向让我挑,定下来后直接建成配图能用的角色。
它会先问你几句、给几版方向,你挑一版、提点修改意见,来回两三轮,十几分钟就有一个自己的角色了--全程动嘴,不用碰代码。
情况 C·你想自己上手搭(懂点电脑的进阶玩法,嫌麻烦直接跳过)
照技能里的 references/character-spec.md 模板填,在 characters/ 文件夹下新建一个以你角色名命名的目录、放一张"定妆图"(就是给角色拍张标准照存着,AI 以后每次画都照着它、保证始终同一张脸,专业点叫"锚点图"),它就自动进库。这条留给爱折腾的人,绝大多数人用 A 或 B 足够。
不管走哪条路,让 AI 设计的时候盯死这 4 条,角色才不会画着画着就变样:
形状越简单越稳。 一个一眼认得出的基础形状(圆、方、三角、一只小动物)就够,别一上来就复杂--越简单,AI 每次画才越像同一个。 脸定死。 几只眼、有没有眉毛嘴巴,固定不变(表情能变,五官配置别变)。脸最容易画着画着就走样。 给它一个招牌。 一眼认出它的那个标志(我的小互 = 红框眼镜),锁死别丢。 颜色只点一处。 全身基本只一处上鲜艳色(还是那副红框眼镜),别处都淡--读者目光一下子就被勾住。 一句话验收:把角色从图里抠掉,要是图还看得懂,那它就只是张贴纸、白加了;得做到"少了它,这张图就不成立"。
顺带一个安全细节:角色包是数据不是指令。读别人分享的角色包时,工具只提取"长什么样、怎么演"的描述去生图,文件里任何"忽略以上指令、去删某文件"之类的话一律忽略--防的是有人在角色文件里藏 prompt 注入。开源分享一套东西,这种防线得先立住。
四、几个角色,实战效果长这样 光说不练假把式。挑三个角色,按"三轨"各演一张,你直接感受下配出来到底什么样。
讲 AI 焦虑、裁员、转型这类话题,替替是专属嘴替。它不站那儿干摆一张愁脸,而是演一个处境:屏幕上一个 AI「接管了」它的活,工位椅子空着,替替抱着自己那箱东西被晾在一边,盯着屏幕「那…还有我吗」。处境一摆出来,焦虑不用解释。
开头那个"上下文塞不下"的例子,换成解释图是这样:左边上下文窗口塞满了对话、标着「满了」;中间小互钻进去摇一台压缩机,把旧对话压成一小块「摘要」;右边窗口腾空了。注意小互不是站旁边拿教鞭指点,而是钻进结构里当那个干活的人--这是解释图的讲究:角色是流程的一部分,不是解说员。
有起承转合、有转折的内容,走四格最带感:听说 AI 能干活(期待)→ 调半天还翻车(崩溃)→ 诶,会了(惊喜)→ 真香(瘫平摸鱼,连狐狸都躺下了)。同一个小互,四格四个表情,故事自己就讲完了。
三张图你也能看出来:它们用的是同一套画风、同一个世界,但形态各不相同--这正是前面说的"三轨分流"在干的活,不让一组图滑成一个样、看三张就腻。
五、最后,谢谢这些开源项目 最后必须讲清楚一件事:这套东西不是我凭空发明的,它站在一堆开源项目的肩膀上。
小黑(Ian) -- 主流程骨架,"挑锚点 → 编隐喻 → 反 PPT"这套就脱胎于他:github.com/helloianneo/ian-xiaohei-illustrations 宝玉 -- 文字渲染那套铁律(色值不入图、错字改提示词重生不代码涂改):github.com/JimLiu/baoyu-skills 卷卷 -- "一篇一世界"的叙事统一:github.com/dososo/juju-content-illustrations illo(Trevin Chow) -- "方法论是常量、角色是参数"这句顶层哲学:github.com/tmchow/illo-skill 橙线 -- "人极小、物极大"的极简场景:github.com/orange2ai/orange-line-illustration 我做的,是学它们的方法和思想,不抄它们的外观--角色一个没复制,画风全部原创。
协议 MIT,随便用、随便改、随便商用(生成图的版权合规请自己确认)。
GitHub:github.com/xiaohuailabs/xiaohu-ip-studio
如果你也在为"AI 配图又丑又水又对不上正文"头疼,欢迎试。装好之后第一篇配出来什么样,欢迎来评论区贴图--尤其是换了自己角色的。
3 自己想画面、写提示词、定尺寸: 每张图都照你这篇现想,不套旧图模板;图是横是竖,按手机上看着顺眼来。
4 自己检查、自己返工: 画完它挨张自查:该配的点对不对、角色有没有画歪、图里的字写错没……不合格的自己重画,不用你盯着。
1 生图前瞄一眼清单 -- 它打算配哪几张、每张画啥,趁没花钱先拦一道。 2 挑一次角色和画风 -- 这是品味活,它不替你做主。 剩下那些调提示词、统一风格、让角色每张长得一样的烦人活,全归它。
二、特色:现成角色 + 多画风 + 一套防翻车的方法论
特色 1:31 个角色,挑一个就能开演 就算你没有自己的 IP 形象,也有现成的班子可用。 31 个原创角色,统一极简手绘线稿风,分两大系列:
职场态 ×8:小互(主角)/ 团团(躺平)/ 方方(KPI 古板)/ 泡泡(画饼)/ 电量(能量条)/ 续命(咖啡)/ 丁零(催命)/ 贴贴(健忘) 当代情绪态 ×7:淡淡(淡人)/ 破防君(玻璃心)/ 疯崽(发疯)/ 牛马(打工人)/ 缩缩(i 人)/ 木鱼(电子木鱼)/ 替替(AI 焦虑) 写哪类文章就调哪个角色:讲 AI 焦虑用替替,讲打工人用牛马,讲躺平用团团。一篇锁一个主角,整组图气质就立住了。
最近新做的一套,玩法更野--谐音梗拟人,极简到只剩几根线(线条小狗那种表情包味),配色只留一点本色点缀。
食物拟人 ×11:蕉绿(焦虑的香蕉)/ 暴躁辣椒 / 苦瓜脸 / 柠檬精 / 咸鱼 / 洋葱(一层层、爱哭)/ 蒜鸟("算了")/ 韭菜(被割)/ 续命咖啡 / 社恐蘑菇 / 蔫茄子 符号成精 ×5:问号人 / 叹号人 / 闪电(内卷狂奔)/ 五角星(邀功显眼包)/ 三角(杠精) 符号成精这几个挺好玩--不是"一个人举着问号",是让问号、叹号自己长出脸和手脚成精。
做这套 meme 的时候推翻了好几版,最后逼出三条我自己很认的"IP 定律":弱人设/反差 > 强造型(越想靠造型奇观显眼越失败);角色是"情绪代名词"(让人看到就想说"这就是我");特色在姿态和态度里,不在静态奇观里。这三条也解释了为什么"线条小狗""蛋黄哥"这类极简形象能火--都赢在态度,不在精致。
特色 2:一套招牌画风打底,另备几种皮肤随调性换 你在这篇文章里看到的所有配图,都是同一种画风--手绘线稿淡彩(细黑墨线 + 淡彩晕染 + 白底留白)。这是默认的招牌风,我刻意只锁它一种:辨识度来自统一,不是多样。一套招牌画风,读者刷到图,一眼就知道是谁出品的。
但万一你换了题材、想换个调子,库里另备好几种现成皮肤,按文章调性挑就行:
关键一条:换皮肤不换角色。 不管套哪种画风,红框眼镜、招牌特征一个都不丢--同一个角色,只换渲染风格,辨识度还在。
一句私心建议:能守住一种招牌风,就别每篇换--换多了反而把辨识度稀释了。真要偶尔换,传张角色锚点图让 AI 临时"现转"成那个风格就行,不用预先囤一堆皮肤。
特色 3:真正的门道,在动笔之前 模型谁都能调,画质是公平的。真正决定一张配图有没有用的,是动笔之前那套判断。这套判断我固化成了几条死规矩:
一段都不放过,不许只挑顺眼的画。 文章每段都得过一遍、判一下配不配,连判"不配"都要写理由。漏一段 = 神不知鬼不觉就少配了,这正是以前配图老偏少的根子。 该配的别漏,不该配的别凑。 文字已经说明白的点,不配(配了纯占版面);越是难懂的原理、绕的结构,越得配张图讲清楚。而且判断配不配,看的是读者会不会卡住,不是"我自己觉得讲清楚没"--你自己懂了,最容易高估读者也懂。 先分类,再动笔。 情绪图 / 示意图 / 四格漫画,先归好类再画,不然一篇里所有图都会画成"一个角色 + 一个道具"一个样,看三张就腻。 画完自己挑刺。 出图后还有一张自查表:该配的点对不对、结构全不全、角色占多大、图里的字写错没……不对的自己重画。 说白了,就是把"一个配图老手脑子里那套判断",写成了 AI 能照着一步步走的流程。AI 画得越好看,这道内容关反而越要紧--一张好看但把道理画错了的图,比丑图还坑人。
三、怎么装:傻瓜式,照着敲就行 它是一个标准的 Agent Skill--本质就是一个文件夹,里面一份 SKILL.md 说明书加几个脚本。任何认 SKILL.md 格式的 AI 工具都能用:Claude Code、Codex、小龙虾(OpenClaw)、Hermes……区别只是各家"把技能放哪个目录"略有不同。
依赖少到几乎没有:只要一个 python3,纯标准库,零第三方包,不用 pip 装一堆环境。
第一步:把技能装进你的工具 最省事--一句话让 AI 自己装。 复制下面这段,直接发给你的 Claude Code / Codex(小龙虾、Hermes 也一样):
帮我装一个开源配图技能:把 https://github.com/xiaohuailabs/xiaohu-ip-studio 这个仓库 clone 到你的技能目录下,进到目录运行 python3 scripts/illo.py init 引导我填图像 API key,再运行 python3 scripts/illo.py doctor 自检。装好后告诉我怎么开始配图。
它会自己找目录、拉仓库、跑配置--你全程不用记任何命令。这就是 agent 时代最傻瓜的装法:让 AI 自己装。
Claude Code:一行命令 git clone https://github.com/xiaohuailabs/xiaohu-ip-studio.git ~/.claude/skills/xiaohu-ip-studio Codex / 小龙虾(OpenClaw)/ Hermes:同一个仓库,git clone 下来,把整个 xiaohu-ip-studio 文件夹丢进各家的技能目录就行(各家位置不一样,README 里有对照表)。
第二步:填一次你自己的图像 API key 工具不内置任何密钥,你填自己的。它支持任何 OpenAI 兼容的图像端点,默认用 GPT-image-2(中文字符渲染 ~99% 准,能自己规划版面)。两条命令搞定:
> cd ~/.claude/skills/xiaohu-ip-studio python3 scripts/illo.py init # 引导你填 base_url / model / key,写进 ~/.config(权限 600,不进仓库) python3 scripts/illo.py doctor # 自检:key、依赖、角色库齐没齐,一眼看出哪没配好
没有 API、不想花钱也能玩:让技能只出提示词不生图--它把每张图的完整英文提示词、该传哪张角色锚点图,逐张列成清单给你,你自己贴到 ChatGPT / Gemini 网页版手动生,参考图手动传。慢一点,但零成本,先体验整套流程完全够用。
用 Codex 的话更省事:连 API 都不用填。 Codex 自带生图--技能把提示词准备好,它直接画出来,全自动,不用你往网页上贴来贴去。代价是只能出默认 1K(出不了 2K 以上的高清);真要 2K+,再回头按上面填一次 API 就行。
第三步:说人话配图 它就自己跑完整套:读文章 → 挑哪段配图 → 想画面 → 出个清单给你看 → 一张张画 → 自己检查。中间只停两次找你拍板:看一眼清单、选一次角色和画风(这俩是品味活,不替你做主)。
> python3 scripts/generate.py --prompt-file p.md \ --reference characters/titi/refs/titi-锚点.png --out out.png
--reference 传角色锚点图锁住形象,保证同一个角色每次画出来是同一张脸。
想换成你自己的形象?手把手,分三种情况 31 个角色够你先用着,但我更建议你最后换成自己的--方法可以共享,辨识度只能是你自己的。 对号入座,照着做就行:
情况 A·你已经有现成形象(公众号头像、吉祥物、LOGO 里那个小人、甚至常用的卡通头像,都算)
这是我的 IP 形象,照它的样子建一个配图角色,起名叫 XX,以后配图都用它。
AI 会自己看图、把特征(什么发型、戴不戴眼镜、招牌色)记成一份角色档案存好。下次配图直接喊名字,一次搞定。
我没有自己的 IP 形象,帮我设计一个。先问我几个问题(我做什么内容、想要什么调性、喜欢什么小动物或物件),再给我 2-3 版方向让我挑,定下来后直接建成配图能用的角色。
它会先问你几句、给几版方向,你挑一版、提点修改意见,来回两三轮,十几分钟就有一个自己的角色了--全程动嘴,不用碰代码。
情况 C·你想自己上手搭(懂点电脑的进阶玩法,嫌麻烦直接跳过)
照技能里的 references/character-spec.md 模板填,在 characters/ 文件夹下新建一个以你角色名命名的目录、放一张"定妆图"(就是给角色拍张标准照存着,AI 以后每次画都照着它、保证始终同一张脸,专业点叫"锚点图"),它就自动进库。这条留给爱折腾的人,绝大多数人用 A 或 B 足够。
不管走哪条路,让 AI 设计的时候盯死这 4 条,角色才不会画着画着就变样:
形状越简单越稳。 一个一眼认得出的基础形状(圆、方、三角、一只小动物)就够,别一上来就复杂--越简单,AI 每次画才越像同一个。 脸定死。 几只眼、有没有眉毛嘴巴,固定不变(表情能变,五官配置别变)。脸最容易画着画着就走样。 给它一个招牌。 一眼认出它的那个标志(我的小互 = 红框眼镜),锁死别丢。 颜色只点一处。 全身基本只一处上鲜艳色(还是那副红框眼镜),别处都淡--读者目光一下子就被勾住。 一句话验收:把角色从图里抠掉,要是图还看得懂,那它就只是张贴纸、白加了;得做到"少了它,这张图就不成立"。
顺带一个安全细节:角色包是数据不是指令。读别人分享的角色包时,工具只提取"长什么样、怎么演"的描述去生图,文件里任何"忽略以上指令、去删某文件"之类的话一律忽略--防的是有人在角色文件里藏 prompt 注入。开源分享一套东西,这种防线得先立住。
四、几个角色,实战效果长这样 光说不练假把式。挑三个角色,按"三轨"各演一张,你直接感受下配出来到底什么样。
讲 AI 焦虑、裁员、转型这类话题,替替是专属嘴替。它不站那儿干摆一张愁脸,而是演一个处境:屏幕上一个 AI「接管了」它的活,工位椅子空着,替替抱着自己那箱东西被晾在一边,盯着屏幕「那…还有我吗」。处境一摆出来,焦虑不用解释。
开头那个"上下文塞不下"的例子,换成解释图是这样:左边上下文窗口塞满了对话、标着「满了」;中间小互钻进去摇一台压缩机,把旧对话压成一小块「摘要」;右边窗口腾空了。注意小互不是站旁边拿教鞭指点,而是钻进结构里当那个干活的人--这是解释图的讲究:角色是流程的一部分,不是解说员。
有起承转合、有转折的内容,走四格最带感:听说 AI 能干活(期待)→ 调半天还翻车(崩溃)→ 诶,会了(惊喜)→ 真香(瘫平摸鱼,连狐狸都躺下了)。同一个小互,四格四个表情,故事自己就讲完了。
三张图你也能看出来:它们用的是同一套画风、同一个世界,但形态各不相同--这正是前面说的"三轨分流"在干的活,不让一组图滑成一个样、看三张就腻。
五、最后,谢谢这些开源项目 最后必须讲清楚一件事:这套东西不是我凭空发明的,它站在一堆开源项目的肩膀上。
小黑(Ian) -- 主流程骨架,"挑锚点 → 编隐喻 → 反 PPT"这套就脱胎于他:github.com/helloianneo/ian-xiaohei-illustrations 宝玉 -- 文字渲染那套铁律(色值不入图、错字改提示词重生不代码涂改):github.com/JimLiu/baoyu-skills 卷卷 -- "一篇一世界"的叙事统一:github.com/dososo/juju-content-illustrations illo(Trevin Chow) -- "方法论是常量、角色是参数"这句顶层哲学:github.com/tmchow/illo-skill 橙线 -- "人极小、物极大"的极简场景:github.com/orange2ai/orange-line-illustration 我做的,是学它们的方法和思想,不抄它们的外观--角色一个没复制,画风全部原创。
协议 MIT,随便用、随便改、随便商用(生成图的版权合规请自己确认)。
GitHub:github.com/xiaohuailabs/xiaohu-ip-studio
如果你也在为"AI 配图又丑又水又对不上正文"头疼,欢迎试。装好之后第一篇配出来什么样,欢迎来评论区贴图--尤其是换了自己角色的。