5月1日

08:00

HuggingFace Daily Papers（社区热门论文）

研究团队提出一种端到端训练框架，联合优化图像重建与生成过程，使分词器能直接受到生成结果的监督。该方法突破了以往分词器与生成模型分两阶段训练的范式，并探索利用视觉基础模型提升一维分词器在自回归建模中的性能。最终模型在无引导的 ImageNet 256×256 图像生成任务中，取得了当前最优的 FID 分数 1.48。

图像生成论文/研究

07:10

Berryxia.AI@berryxia

这一波GPT-Image-2出圈的原因感觉更多的是将其结合游戏真实的UI设计融合且效果出奇好。省token简单的prompt就可以完成，开发3D游戏也可以快速打好草稿。

OpenAI 图像生成大佬观点

06:16

Midjourney@midjourney

两个快速公告--我们推送了一项更新，提升了V8.1的图像质量和清晰度，特别是在SREFs、情绪板和HD图像方面，但整体效果您也应该能注意到！其次，V8.1现已在我们主网站和Discord上可用。尽情享受吧！

产品更新图像生成

05:01

Midjourney：Updates（RSS）

精选56

V8.1 更新

Midjourney V8.1 版本现已登陆 Discord 平台及其官方网站。本次更新重点提升了图像的清晰度与整体画质，这一改进在风格参考（SREF）和情绪板（Moodboards）功能中效果最为显著，同时所有类型的图像生成质量均有所增强，为用户带来更精细的视觉体验。

图像生成模型发布

推荐理由：Midjourney V8.1 只是个小版本迭代，主要提升锐度和图像质量，用惯了 V8 的可以不急着换，但玩 SREF 和 Moodboard 的值得试一下，细节确实有提升。

04:16

ChatGPT@ChatGPTapp

精选63

一条针对GPT Image 2的特定图像生成提示词正在社交媒体上病毒式传播。该提示词的核心要求是：以最笨拙、潦草且极其糟糕的方式重绘所附图像，背景为白色，使其看起来像是用鼠标在MS Paint中绘制。生成效果需与原图似是而非，带有低质量像素感和令人困惑的别扭感，以突出其荒诞的"差劲"。推文引用者指出，这条提示词正引发疯狂传播。

CHOI: This GPT Image 2 prompt is going insanely viral right now. "Redraw the attached image in the most clumsy, scribbly, and ...

OpenAI 图像生成教程/实践

推荐理由：这 prompt 把 GPT Image 2 从「精美」逼成了「小学生涂鸦」，是近期最有网感的玩法，做内容的可以直接抄。

4月30日

23:13

SenseTime@SenseTime_AI

SenseNova U1 Lite系列：小规模多模态模型开源发布

SenseNova U1 Lite Series是新一代原生统一的多模态模型，在紧凑的8B/A3B规模下提供商业级性能。其核心能力包括复杂信息图生成，具备强语义完整性和像素级精度；高布局一致性，实现准确可靠的文本渲染；以及行业首创的连续图像-文本生成，支持统一推理和一致视觉风格。该模型现已完全开源，相关代码和资源可通过GitHub、Hugging Face等平台获取。

图像生成多模态模型发布

23:10

Berryxia.AI@berryxia

GPT效果空间理解力惊人，一键生成纪念碑谷风格场景

用户惊叹于GPT在效果空间理解方面的强大能力，尝试使用其文生图功能复现经典游戏《纪念碑谷》的风格场景，仅一次尝试便成功生成兼具静谧感与孤独美的图像。推文强调GPT能够准确捕捉并传递特定的美学氛围，同时作者已将生成所用的提示词公开分享供他人尝试。

图像生成教程/实践

17:41

向阳乔木@vista8

开发者利用Codex成功生成了一个类《杀戮尖塔》游戏的完整关卡演示。该演示目前已经相当完善，主要缺陷仅在于缺少声音。演示中的核心视觉素材，如主要场景和角色，是由GPT-Image生成的，其余素材则由开发者自行补充。这一成果展示了AI在游戏内容生成方面的强大潜力。

歸藏(guizang.ai): 太猛了,Codex 做类《杀戮尖塔》游戏完整关卡演示! 现在非常细了,除了没有声音以外,其他的都相当完美了! 主要的场景和角色素材是 GPT-Image 生成的,其他的素材是他自己找的。

OpenAI 图像生成现象/趋势

17:10

歸藏(guizang.ai)@op7418

Codex展示了其强大的游戏开发能力，仅根据"制作类似《杀戮尖塔》的中国风格游戏"的简单指令，便自主完成了从代码编写到素材整合的完整可玩关卡。主要场景和角色素材由GPT-Image生成，其余素材由Codex自行寻找。最终成果是一个除声音外相当完善的游戏演示，凸显了AI在理解复杂指令并执行完整项目上的巨大潜力。

歸藏(guizang.ai): 我操,Codex 太牛逼了! 自己给我做了一个类似于《杀戮尖塔》的爬塔游戏,从代码到素材全是自己搞。我就跟他说了一个要做类似《杀戮尖塔》的游戏,要中国风格的这是能玩的!

OpenAI 图像生成教程/实践编码

13:37

阿绎 AYi@AYi_AInotes

内容运营和生图生视频通常依赖多个工具，但GPT Image 2的出现使旧工作流过时。作者尝试使用flowith，发现它能将提示词直接转化为完整输出：生成多个瑜伽动作分镜，并整合分镜图与人物图生成图片，再通过可灵模型制作视频，全部在一个工具内完成。Agent模式支持联网，能自动生成日期准确的海报日历。flowith作为一站式生图agent，简化了工作流，提高了效率。

铁锤人: 做内容运营,生图生视频,你现在还在跑好几个工具吗? 被朋友拉去做瑜伽图,搭了无数工作流 GPT Image 2 出来后,发现全废了得重新规划一套,但这几天身体不舒服,没心思搞随手把提示词扔进 flowith 试了一下以为偷懒的结果会很...

智能体图像生成教程/实践视频

12:38

歸藏(guizang.ai)@op7418

我操，Codex 太牛逼了！自己给我做了一个类似于《杀戮尖塔》的爬塔游戏，从代码到素材全是自己搞。我就跟他说了一个要做类似《杀戮尖塔》的游戏，要中国风格的这是能玩的！

OpenAI 图像生成大佬观点编码

11:45

宝玉@dotey

极简线条与色彩点缀的插画提示词

该推文赞赏一个用于生成极简风格插画的提示词。其核心要求是：用干净纤细的线条描绘主体，整体采用黑白或低饱和色调，仅在局部添加鲜明色彩作为焦点。画面强调大量留白与精致构图，追求现代杂志编辑般的简洁、优雅高级感，并避免复杂背景或写实元素。推文引用的“Minimal Line + Color Accent Illustrations”模板也体现了同样的极简美学。

Aleena Amir: Minimal Line + Color Accent Illustrations PROMPT: "Minimal illustration of [SUBJECT/OBJECT], clean thin lines with selec...

图像生成教程/实践

10:21

Alibaba Cloud@alibaba_cloud

精选60

你知道吗？Wan2.7-Image 也有自己的"调色板"功能？😉 只需输入参考图像、精确色码，甚至插入自己的调色板，该模型就能确保色码匹配以保持品牌一致性，并克服长期困扰 AI 图像的色彩还原不一致问题 🎨 观看视频，立即完美掌控你的色彩！ #AlibabaAI #Wan #Innovation

产品更新图像生成

推荐理由：通义万相2.7新增调色板功能，靠参考图或色号就能锁定品牌色，算是解决了AI画图颜色跑偏的老问题，做品牌视觉的可以试试。