7月3日

04:03

Krea@krea_ai

感谢Thinking Machines团队，我们使用Tinker原型化了我们的奖励模型，并通过RL训练了提示词扩展器。更多信息，请阅读关于Krea 2背后数据、架构和训练的完整技术报告 👇

Tinker: Training image models requires a surprising amount of Tinkering: prototyping reward models, training a prompt expander, ...

图像生成数据/训练论文/研究

00:02

Midjourney@midjourney

Marcin是Midjourney的硬件工程师（也是YouTube明星）。所以我们请他制作一个视频！

Marcin Plaza: I watched the Midjourney scanner get built from my desk; here's a look behind the scenes

产品更新图像生成

7月2日

20:21

AYi@AYi_AInotes

Claude Fable 5在ZenMux回归并限时免费，用户分享高质量人像提示词方法论

传闻中的顶级模型Claude Fable 5在ZenMux平台回归上线并限时免费，官方价格高达50美元/百万token，ZenMux上则零成本使用且无RPM限制。用户分享了一套利用Fable 5生成高质量人像提示词的方法论：先分析AI人像塑料感根源，再搭建涵盖主体人设、服装材质、表情瞬间等8个维度的框架，最后输出示例并自我修正。此外，ZenMux还免费提供Claude Sonnet 5和Gemini Nano banana 2 lite，支持同屏对比Fable 5、GPT-5.5、Opus 4.8等200+模型，自动充值每笔返20%余额（最高300美元赠金）。

AYi: Claude Fable 5今天回归上线啦,ZenMux上限时免费使用真的太香了! 怎么用Fable 5输出高质量的「不会塑料 + 顶级人像提示词方法论以及户外美女人像prompt方法论大家收好! 说真的,我以为上次的Fable 5总结的A...

Anthropic 图像生成教程/实践

19:29

fofr@fofrAI

Google DeepMind 的 Gemini 3.1 Flash Lite Image（代号 Nano Banana 2 Lite）在 Image Arena 排名第 7，Elo 1271。平均生成时间约 5 秒，比排名更高的模型平均快 37 秒，在图像偏好与速度之间建立了新的帕累托前沿。

Design Arena: BREAKING: Gemini 3.1 Flash Lite Image (Nano Banana 2 Lite) by @GoogleDeepMind is 7th on Image Arena with an Elo of 1271....

DeepMind 图像生成模型发布

19:01

Kling AI@Kling_ai

可灵AI广告片获戛纳狮子奖铜奖

可灵Kling AI官方宣布，由其生成的广告片《Lorem Ipsum》荣获戛纳狮子奖（Cannes Lions）电影类B2B铜奖。该片由阿根廷工作室Purga Films制作，片中所有角色均使用无意义的占位词“Lorem Ipsum”对话，但情感表达依然强烈。全片通过Kling AI生成，涵盖多种风格和世界，展现了可灵在表演一致性、情感深度和电影级控制上的能力。

图像生成行业动态视频

15:21

AYi@AYi_AInotes

Claude Fable 5 在 ZenMux 回归，免费使用无 RPM 限制

Claude Fable 5 在 ZenMux 平台回归上线，提供免费端点 claude-fable-5-free，账户有余额即可使用，无 RPM 限制，免去官方高价。博主分享用 Fable 5 生成高质量人像提示词的方法论：先拆解 AI 人像塑料感根源，再搭建覆盖主体人设、服装材质、表情瞬间等 8 维度的框架，最后输出示例并自我修正。三个关键技巧：赋予顶级专业人士身份、必须分析塑料感根源、利用 Fable 自检能力。ZenMux 另支持同屏 PK 模型、自动充值返 20% 余额等福利。

AYi: 跟大家分享下绝版的Claude Fable 5总结的AI生图焚决,+2个顶级美女人像提示词,这篇至少值3000块! 昨晚睡前让Fable 5总结了AI生图之性感人像提示词最有效的写法: 1️⃣用"成人 + 气质 + 材质"来定人设,比如 2...

图像生成教程/实践

11:25

歸藏(guizang.ai)@op7418

藏师傅社交卡片Skill更新：支持Live Photo生成与编辑

歸藏的guizang-social-card-skill新增Live Photo能力，支持单视频动态卡片、拼图式（二/三/四宫格）、三连Live Photo及长视频筛选。核心细节：第一帧可作为静态图发布；小红书5秒/公众号3秒时长区分；发布需将JPG+MOV打包为.pvt并通过AirDrop传到iPhone。建议先粗剪视频每段10秒左右，让AI判断适合做Live Photo的片段。安装或更新后即可使用。

智能体 GitHub 产品更新图像生成

08:21

AYi@AYi_AInotes

Seedance 2.0 生成逼真韩国社区生活视频

Seedance 2.0 通过详细 prompt 生成一段超真实视频，以 2000 年代初 DV 摄像机美学展示韩国女性日常：手持抖动、自动对焦搜索、曝光波动、运动模糊等不完美感，配合环境自然音（鸟鸣、风声、社区闲聊），实现家庭录像般的独特说服力。

图像生成教程/实践视频

07:37

elvis@omarsar0

谁做得最好？ GLM-5.2（左）| Fugu Ultra（中）| Fable 5（右）同样的一次性提示。最后那个是我的最爱！

图像生成评测/基准

06:33

Artificial Analysis@ArtificialAnlys

Reve 2.0 文生图模型发布，排行榜第二

Reve 2.0 文生图模型发布，在 Artificial Analysis 文生图排行榜上位列第二，仅次于 OpenAI 的 GPT Image 2。该模型将原始文本提示转换为结构化布局提示，生成原生 4K 图像，支持对布局中单个元素进行移动、编辑、替换和重新渲染，同时保留其他元素不变。目前可通过 Reve 应用使用，API 平台即将上线。

产品更新图像生成

04:28

HuggingFace Daily Papers（社区热门论文）

SpheRoPE：基于球形RoPE的零样本无优化360度全景生成

提出SpheRoPE框架，无需微调或优化，直接通过球形旋转位置编码（Spherical RoPE）将球面先验注入预训练扩散Transformer，实现零样本、无训练的360度全景图像与视频生成。低频率通道重参数化为3D笛卡尔坐标以编码球面流形，高频率通道进行谐波量化确保严格周期性，配合语义畸变无分类器引导（CFG）显式控制几何结构。在Flux.1、Flux.2和LTX-Video骨干上完成文生全景任务，性能达基线水平，无需任何训练。

图像生成论文/研究

7月1日

23:31

Berryxia.AI@berryxia

Omini的场景很适合做换装视频，包括家居装修类的这类前后对比的场景。

图像生成大佬观点视频

22:31

Berryxia.AI@berryxia

Boogu-Image-0.1-Edit-Turbo 开源：4步蒸馏图像编辑模型

ModelScope 上开源了 Boogu-Image-0.1-Edit-Turbo，一个 4 步蒸馏的 image-to-image 编辑模型，主打快速视觉编辑。支持物体替换、风格迁移、场景/背景修改，以及带文字感知的图像变换。

图像生成开源生态模型发布

19:22

fofr@fofrAI

Nano Banana 2 Lite 是一款图像生成工具，支持将动物头部替换为任意物体，并自动匹配颜色与纹理，实现无缝、自然的融合（如阿拉伯眼镜蛇头部替换为订书机，物体特征巧妙构成面部，原始动物面部完全不可见）。用户可快速迭代不同动物与物体组合，快速探索创意。

fofr: Nano Banana 2 Lite: > a photo of an arabian cobra, but the head is replaced with a stapler, seamless, perfect animal-obj...

图像生成教程/实践