5月22日

02:14

Krea@krea_ai

1小时后开始！加入我们，一起聊聊LoRAs和Krea 2即将到来的新更新。【引用 @krea_ai】：我们明天将举办首次社区空间活动！通过X Spaces加入我们，讨论Krea 2的更新、分享反馈或展示你的作品。链接在下方 👇

Krea: we're hosting our first Community Spaces tomorrow! join us through X Spaces to chat about updates coming to Krea 2, shar...

图像生成行业动态

01:11

Berryxia.AI@berryxia

团队受Zara启发开发的Magic Slide项目正式发布，这是一个旨在解决日常幻灯片制作问题的AI工具。其转场和呈现效果被评为非常丝滑。项目联网与部分模型功能通过团队自研的网关PIPELLM实现。该团队目前除C端产品外，主要精力专注于AI Infra方向建设。

Cydiar: 团队小伙伴受到 Zara 的启发,闲暇时间搞了一个 Magic Slide 项目(终于发了,其实早就搞出来了),解决了日常 Slide 产出问题,欢迎大家一起体验,转场和效果非常丝滑!联网和部分模型使用我们自己的网关 PIPELLM 完成,...

产品更新图像生成

5月21日

22:41

Krea@krea_ai

精选69

为 Krea 2（测试版）引入 LoRA。我们迄今最强大的微调系统；现在你可以用惊人的精度，在 Krea 2 上训练你自己的特定风格、对象或角色。了解其工作原理 👇

产品更新图像生成数据/训练

推荐理由：Krea 2 把 LoRA 微调直接做进了产品，对需要固定角色或风格的设计师来说省事了，虽然不是新概念但低门槛就是好文明。

22:05

Luma@LumaLabsAI

优秀的活动视觉设计不仅传递信息，更能激发期待。定义关键时刻，指引方向。Luma Agents为每场活动制作从预告到最终号召的全套宣传视觉。统一创意，适配所有格式与渠道，旨在座无虚席。座无虚席 → http://lumalabs.ai/app

智能体产品更新图像生成

18:10

Alibaba Cloud@alibaba_cloud

阿里云助力摩纳哥首届AI电影节，重塑电影创作未来

2026年6月，摩纳哥将举办首届AI电影节，标志着人工智能与电影叙事的深度融合。阿里云作为合作方，强调其云与AI基础设施（从基础模型训练到大规模实时渲染）致力于赋能创作者，为电影人、艺术家提供实验与实现大胆创意的工具，共同探索由AI技术驱动的电影制作新范式。

图像生成行业动态视频

16:07

AYi@AYi_AInotes

精选79

游戏开发门槛被AI大幅降低

Grok展示了AI深度介入游戏开发的全新工作流。通过“提示词生成角色图→图片转动画视频→自动拼接成Spritesheet→导入引擎”四步流程，将传统需要美术与动画师耗时数天的工作，在几分钟内完成。这标志着AI不再仅生成静态内容，而是能实时生成可直接导入Unity或Godot等游戏引擎的可运行资产。该技术极大压缩了游戏原型的迭代周期，将反馈循环从“天”缩短至“秒”，使得独立开发者也能快速实现创意，显著降低了游戏创作的门槛。

Grok: Prototyping game assets directly with Grok @imagine

xAI 图像生成教程/实践

推荐理由：Grok 这波不是画张图那么简单，它把 AI 直接嵌进游戏引擎工作流，实时生成可运行的资产，solo 开发者周末搞个原型出来真的可行了。

08:03

Krea@krea_ai

我们将于明天举办首次社区空间活动！欢迎通过 X Spaces 加入我们，一起讨论 Krea 2 即将推出的更新、分享反馈或展示你的作品。链接如下 👇

图像生成行业动态

07:48

宝玉@dotey

这位博主做了系列 Google Omni vs Seedance 2.0的对比视频，看起来差距还是蛮明显

Ratul Ali: Google Omni vs Seedance 2.0 😳 Olympic Diving Test - Seedance 2.0 also wins this test!🔥 Prompt👇 Female Olympic diver f...

Google 图像生成视频评测/基准

06:17

karminski-牙医@karminski3

Midjourney 创始人自爆没有使用N卡导致落后一年？

Midjourney 创始人透露，团队因使用 TPU + JAX 训练、GPU + PyTorch 推理的混合技术栈，导致工具链断裂、调试困难，且无法利用开源社区丰富的 PyTorch 资源，严重拖慢了产品迭代速度。创始人反思，若重新开始会选择基于 NVIDIA 的统一方案。对比之下，其他文生图模型在功能上发展迅速，Midjourney 虽在风格艺术性上仍有优势，但在核心功能竞争上已显疲态。

Google 图像生成大佬观点

03:50

Midjourney@midjourney

同事件精选69

今日小幅更新。许多用户要求为V8模型恢复"反向提示"功能（旧版本已有），我们称之为--no标志。该功能现已在V8.1中上线！如果您想从图像中排除某些元素（例如人物），可以尝试使用--no people。玩得开心！

产品更新图像生成

同一事件，精选展示《Midjourney V8.1 已成为默认模型》

推荐理由：Midjourney 把老版本的反提示词带回到 V8.1 了，用 --no 就能剔除画面中不想要的东西，受够了多余路人甲的用户终于可以一键清场。

01:43

Luma@LumaLabsAI

促销已开启。确保每张视觉图都传递出这一信息。设定优惠。定义紧迫感。Luma Agents 从这里构建每张销售视觉图。立即行动 → http://lumalabs.ai/app

产品更新图像生成

01:16

ViggleAI@ViggleAI

好吧，这是2D版本。稍后回来看看 👀

ViggleAI: Introducing the World's First Meme-powered Game Where you can be anyone, and Fight your colleague Fight your friends Fig...

产品更新图像生成视频

00:36

Rohan Paul@rohanpaul_ai

商汤开源统一多模态模型SenseNova U1

商汤科技近日开源了SenseNova U1，其核心创新在于架构设计。该模型摒弃了传统的视觉编码器与变分自编码器分离结构，采用单一共享表示空间原生处理图像与文本，极大减少了模块间转换导致的信息损耗。这一设计使模型能够连贯地同时生成图文内容，在信息图、海报、漫画等需要高一致性的密集视觉内容创作上优势显著。性能方面，其信息图生成速度在同等质量下约为Qwen-Image-2.0/Seedream-4.5的两倍。

图像生成多模态开源/仓库模型发布

00:19

小互@xiaohu

Midjourney创始人称被Google TPU坑惨

Midjourney创始人暗示他们被Google的 TPU坑了白白浪费了一年时间… 如果回到过去他会选择英伟达的GPU🤣 “这大概让我们的研究进度，比起一开始就完全采用 Nvidia 技术栈，落后了差不多一年。并不算特别理想。如果我能回到过去，我会从第一天开始就全部使用 Nvidia 的方案。”

David: @bubbleboi it probably put our research a year behind where it could have been if we were pure Nvidia stack, not totally...

Google 图像生成大佬观点数据/训练

00:14

Google AI@GoogleAI

精选69

谷歌发布多款AI创意工具新功能

谷歌与创作者合作推出系列AI工具更新。Google Workspace新增图像创作编辑工具Pics；Google Flow支持Gemini Omni Flash模型，并推出Flow Agent作为多步骤创作伙伴；设计工具StitchbyGoogle支持实时文字或语音编辑布局并导出代码；音乐工具Google FlowMusic增加分段编辑、风格混音及视频生成功能。

智能体 Google 产品更新图像生成

关联讨论 1 条

推荐理由：Google这次更新的不是单点工具，而是把AI能力像乐高一样嵌入到创意工作流的每一步，Flow Agent的多步骤推理尤其值得做设计的人试试看。

5月20日

23:03

PixVerse@PixVerse_

AI视频的一致性始于动作之前。对于这个15秒的烹饪短片，我们首先在PixVerse中生成了一个清晰的角色分镜。然后将其用作视频的参考。相同的角色。清晰的故事节点。镜头指导。动作细节。转发 + 关注 + 回复 = 分镜工作流

产品更新图像生成视频

22:35

Chubby♨️@kimmonismus

从现在起，我需要知道： Seedance到底有什么魔力，能让他们的Model 2.0在Google I/O之后依然遥遥领先？ Seedance 2.0是在二月发布的（！）。 Model 3.0应该快了，而目前还没有任何模型能接近2.0的水平。

JSFILMZ: Google promised that Gemini Omni Flash would change the game, but when you put it side-by-side with Seedance 2.0... it's...

Google 图像生成大佬观点视频

22:08

Berryxia.AI@berryxia

黑神话悟空带火山西小西天，3D数字模型上线

推文分享了在通关《黑神话：悟空》后，对游戏中小西天场景原型——山西临汾隰县小西天悬塑艺术的震撼与实地探访。一个团队通过实地拍摄数千张照片，使用 Gaussian Splatting (3DGS) 技术，将其建成了一个可在线漫游的 3DGS 数字存档。该模型旨在保留明代悬塑密集的金色空间、细节与光感，让观众得以在屏幕前细细欣赏这一通常因平面印刷限制而难以被充分展现其震撼力的艺术瑰宝，并配有专门音乐。

MasterPa: 小西天,看着像视频,但其实是我们在现场实地拍摄 3,811 张 206 GB 的照片后建模的。FUNES 把《黑神话:悟空》里「既见未来,为何不拜」满天神佛的原型,来自自山西临汾隰县的小西天,做成了一个可漫游的 3DGS 数字存档。完全实...

图像生成教程/实践

22:02

向阳乔木@vista8

AI生成3D资产模型Rodin Gen-2.5发布：宣称千万级面数，助产业提效

AI 3D生成模型Rodin Gen-2.5发布，号称全球首款能实现千万级面数的同类产品，材质纹理精细。该模型可从单张图片生成高质量3D资产，快速输出obj等通用格式文件供进一步编辑，极大地简化了传统建模、绑骨、贴图的复杂流程。其技术亮点包括原生3D贴图算法，旨在为游戏、动画、影视等产业提供真正的生产力工具。

Hyper3D by Deemos: Introducing #Rodin Gen-2.5🚀 🔥World's 1st 10 MILLION polygon #3D GenAI - down to skin microstructures. 1️⃣1M-poly in 4s...

产品更新图像生成多模态

20:08

Berryxia.AI@berryxia

本地AI生图"意外"加速，Draw Things新发现

在开源生图软件Draw Things中，一项意外发现显著提升了本地AI生图速度。将原为Z-Image Base训练的Z-Image-Fun-Lora-Distill与Z Image Turbo搭配使用后，原本需要8-9步的生成过程可缩减至3-4步，大幅缩短了本地生成时间，同时保持了画质与细节的稳定。这一组合有效突破了此前本地生图速度较慢的限制。

Draw Things: 🔍 An interesting discovery! 🧩 Z-Image-Fun-Lora-Distill from alibaba-pai was originally trained for Z-Image Base, with ...

图像生成开源生态教程/实践

12:32

PixVerse@PixVerse_

体型不是一切！仓鼠在奥运会上举重超过了河马！

图像生成行业动态视频

12:06

Kling AI@Kling_ai

Kling AI戛纳展示全流程AI动画制作

Kling AI展示了其在动画《生来如潮》中全流程应用AI技术的实践。该项目以疍家文化为背景，利用Kling AI辅助完成了从美术指导、环境设计到角色动作、电影镜头规划等关键环节。通过AI驱动的动画制作，项目降低了制作门槛，减少了对大规模团队和漫长制作周期的依赖，使高质量、史诗级的视觉叙事变得更高效、更易扩展，指向了更具敏捷性和创作自由度的动画未来。

图像生成行业动态视频

11:34

Rohan Paul@rohanpaul_ai

SenseNova U1开源发布，革新原生多模态生成

商汤科技SenseNova U1已开源发布。其核心创新在于原生多模态统一建模，将视觉、语言与图像生成视为一个统一问题，而非分立模块的链式处理，从而减少了信息损失。该模型采用MoT架构（38B-Active 3B MoE），在生成信息图、海报、漫画等结构复杂的密集图文内容时能保持高度一致性。详细的技术报告披露了其包括近无损视觉接口、联合训练策略在内的完整构建方案，为行业提供了前沿参考。

SenseTime: 🔥 New week, New SenseNova-U1 Drop - and this one goes Deep!🔥 📄 The full Technical Report is OUT - the most detailed d...

图像生成多模态开源生态模型发布

05:44

OpenAI@OpenAI

精选70

人们每周在ChatGPT中生成超过15亿张图像。研究员 @kenjihata 与产品负责人 @adele__li 及主持人 @AndrewMayne 一起，探讨自 Images 2.0 发布以来出现的新用例和趋势。

OpenAI 图像生成现象/趋势

推荐理由：OpenAI 首次把内部图像生成数据摊开聊，每周 15 亿张的量级说明这功能已经不是玩具了，做图像产品的可以对着用例风向调方向。

05:08

Replit ⠕@Replit

隐秘的干预、互动装置、为其他艺术家打造的工具。@kcimc 的实践存在于机器学习、计算机视觉与社会技术的交汇处。在 Vibecon 首日观看他的新互动装置。纽约，6月17-18日。购票请访问 http://vibecon.ai

图像生成行业动态

02:55

AYi@AYi_AInotes

Google Gemini Omni重新定义视频生成

Google推出Gemini Omni，首个面向消费者的世界模型。它通过自然语言交互，将Gemini的智能与生成媒体系统结合，实现了对物理规律、历史、生物等世界的深刻理解。用户可以像编辑ChatGPT文本一样用单句指令编辑视频，实现人物一致性、风格迁移、角度调整等功能。它不是单纯生成像素，而是模拟连贯的物理与语义世界，标志着AI视频生成从拼接工具向智能创作系统的飞跃。

Google DeepMind: We're dropping Gemini Omni: our first step towards a model that can create anything from anything - starting with video....

DeepMind Google 图像生成多模态

02:13

OpenAI@OpenAI

我们正在为人们提供识别AI生成图像并了解其来源的新方法。除了C2PA内容凭证外，图像现在还包含SynthID水印，并可通过公开验证工具检查图像是否由OpenAI产品制作。 https://openai.com/index/advancing-content-provenance/

OpenAI 产品更新图像生成安全/对齐

01:27

Krea@krea_ai

精选73

Krea 2深度解析。学习如何使用风格参考、情绪板，以及如何用Krea 2进行提示。

Krea: today, Krea 2 goes live to everyone. to celebrate, we're offering unlimited Krea 2 generations to all our subscribers fo...

产品更新图像生成

推荐理由：Krea 2 正式全量发布，这个 deep dive 把风格参考和情绪板玩法讲得很透，做视觉内容的朋友今天就能用上。

5月19日

10:34

向阳乔木@vista8

AI批量生成艺术风格，一键浏览380+大师作品

作者利用GPT-Image-2模型，批量生成了超过380位艺术家的画风作品。为便于直观学习和借鉴（用于AI生图提示），他创建了一个可体验的网站，将蒙德里安、葛饰北斋等不同风格的创作并置展示，帮助用户快速建立对艺术风格的认知。该项目代码已在GitHub开源。

GitHub 图像生成开源/仓库

08:49

🚨 AI News | TestingCatalog@testingcatalog

谷歌I/O 🔥：这些传奇人物是通过即将推出的Gemini Omni模型生成的AI图像。 > 两段视频均为8秒高清样本。 > 与Sundar和Demis相关的视频很可能是使用Omni进行风格编辑的图像转视频生成。 > Logan的视频则可能是"相似度"虚拟形象与Omni视频的结合。而"GEMINI"意味着新模型的发布！🤯

Logan Kilpatrick: Gemini

Google 图像生成多模态模型发布

03:50

Claude@claudeai

精选75

现在你可以用 Claude Design 创作更多内容了。我们已将所有套餐的 token 限制翻倍。

Anthropic 产品更新图像生成多模态

推荐理由：Claude Design 令牌加倍，做图做设计的人现在可以更放肆地挥霍上下文了，Anthropic 这波更新把设计工具的可用性拉高了一个档次。

02:12

Rohan Paul@rohanpaul_ai

HiDream开源8B参数统一架构图像模型，挑战传统扩散管线

HiDream开源了8B参数的HiDream-O1-Image模型，其核心创新在于采用像素级统一变换器，用单一架构直接处理原始图像块、文本与任务条件，将文本生成图像、编辑、个性化等任务统一为上下文生成，无需传统的VAE和文本编码器管线。该模型内置推理提示代理，能原生支持最高2048×2048的高分辨率合成。在性能上，它在参数量仅为部分同类模型三分之一的情况下，达到了可比的水平，尤其在文本渲染任务上表现出色，结果接近更大规模的模型。

图像生成开源生态推理模型发布

00:56

Berryxia.AI@berryxia

xdm，这件事其实比看起来更值得注意。

AI绘画工具Krea 2.0发布了保持人物、风格与构图高度一致性的功能。这不仅是技术升级，更标志着创作范式的转移：创作者的核心工作从反复调试单张图像的提示词，转向如何运用多张一致图像进行序列化思考与构建完整视觉叙事。当“单图生成”变得容易，叙事能力便成为更稀缺的优势。目前该功能已向所有用户开放并有限时免费活动，正加速这种创作方式的普及。

Krea: today, Krea 2 goes live to everyone. to celebrate, we're offering unlimited Krea 2 generations to all our subscribers fo...

图像生成大佬观点

00:20

Elon Musk@elonmusk

xAI更新了Grok的Agent模式，这被视为其能力的一次重大提升。该模式显著简化了AI视频创作流程。基于Grok Imagine，创作者能更流畅地制作视频，并借助Grok的理解能力完成素材生成与对话，无需额外配音，极大节省了时间成本。据早期测试，生成视频的写实效果良好，且图片参考等功能增强了实用性。这标志着AI在自动化、高质量内容生成领域取得了新的进展。

Déborah: I've finished a video of just over 4 minutes, entirely created using Grok Imagine's Agent mode (see image). It's a much ...

智能体 xAI 产品更新图像生成

5月18日

23:13

Kling AI@Kling_ai

视角：把我的朋友变成视频游戏加载界面 ⌛️