4月28日

22:10

凡人小北@frxiaobei

当前图像生成产品主要分为追求单次生成效果极致与打通完整视觉工作流两大方向。Flowith属于后者，其推出的Image Agent不仅能够生成高质量图像，更核心的价值在于构建了稳定的视觉工作流体系。该平台底层集成多个模型（如Image2等），且上层工作流架构设计稳健，不受底层模型更换的影响。它能将单一文本提示转化为完整的营销活动工作流，提供可放大的细节、有效的文字渲染、具备搜索感知的创意智能，并能通过Seedance 2.0技术将图像转化为视频，从而成功融合了“单点极致”与“工作流闭环”两种路径，为用户提供了显著的综合价值。

Flowith: the most powerful image agent has arrived. flowith image agent doesn't just make better images. It builds perfect visual...

智能体产品更新图像生成

22:06

Greg Brockman@gdb

AI图像生成技术，特别是先进的2.0图像模型，正深刻改变产品开发流程。该技术能精准生成屏幕界面和视觉概念稿，使得数字表面的呈现效果非常"到位"。在内部协作中，大量产品创意开始通过图像生成来分享和具象化，而非依赖传统的原型制作。将此项能力整合进Codex后，Codex能扮演全栈设计工程师的角色，构建出精美的界面。这标志着产品构思与沟通方式向更快速、更视觉化的方向演进。

Rohan Varma: Our 2.0 image model is so good at making screens and vision mocks. Something about AI generated images of digital surfac...

OpenAI 图像生成大佬观点

21:35

阿绎 AYi@AYi_AInotes

GPT-image-2加Seedance2.0做的美女换装视频，丝滑到离谱😍

利用GPT-image-2与Seedance2.0生成AI美女换装或跳舞视频，已成为抖音、小红书等平台快速起号的低门槛路径。该方法无需真人出镜与实拍，通过调整提示词即可产出不同风格的高质量视频，成本极低且易于上手。目前平台提供流量分成，可覆盖成本并盈利；粉丝增长后还可承接品牌商单，是一条处于红利期的变现副业赛道。

阿绎 AYi: 很多人总说AI没用,我觉得那是因为你光刷不用,真正能赚钱的人早就闷声发大财了。分享一个用 AI 做副业的路子, 有点野,基本上算零门槛,见钱快(`・ω・ ́)💰 为啥说零门槛: 首先不用囤货不用开店不用露脸,一台电脑就能干,成本低到可以...

图像生成教程/实践视频

20:36

歸藏(guizang.ai)@op7418

优化Codex的PPT生成与图片一键生成功能

作者优化了在Codex中生成PPT的效果，核心是整合了GPT-Image-2模型，实现了一键生成图片的功能。该系统能根据内容生成具有独特风格的图片，类型包括人文纪实氛围图、各类信息图表（如流程图、对比图）以及对截图进行美化与比例优化。此外，Codex的生成流程也得到改进，系统会在生成PPT前增加询问确认步骤，而非直接跳过。

歸藏(guizang.ai): http://x.com/i/article/2047484171258634240

图像生成教程/实践编码

20:25

SenseTime@SenseTime_AI

SenseNova U1 Lite系列开源，统一多模态理解与生成

SenseNova宣布开源其U1 Lite系列模型。该系列基于NEO-unify架构，原生统一了多模态理解与生成能力。其核心优势包括：在开源模型中具备领先的效率，紧凑的8B和A3B模型在保持商业级性能的同时实现了优异的成本效益；支持原生的图像-文本交织生成，单一模型即可在单次流程中生成连贯交织的图文内容，适用于制作指南等实用场景；并拥有高密度信息渲染能力，擅长为知识图解、海报、PPT、漫画等信息密集型格式生成结构丰富的版式。模型已在Hugging Face、GitHub等平台发布。

图像生成多模态开源/仓库模型发布

19:35

公众号：生数科技（Vidu·视频）

降本50%，效率提升10倍，Vidu发布一键生成AI解说剧产品，重塑解说剧生产链路

Vidu发布一键生成AI解说剧产品，实现降本50%、效率提升10倍，重新塑造解说剧生产链路。该产品无需人工剪辑与配音，可自动完成解说剧的全部生成流程，推动内容创作进入全AI化阶段。

产品更新图像生成视频

18:36

Berryxia.AI@berryxia

商汤开源多模态大模型SenseNova-U1，推动本地化部署

商汤发布开源可商用的多模态大模型SenseNova-U1，采用NEO-Unify架构统一处理视觉与语言。其核心功能包括图文交错生成、智能图像编辑与图表渲染。模型提供8B密集版和约3B活性参数的轻量版，适合个人显卡本地部署。现提供每日5小时及1500次免费调用额度，并即将推出办公场景应用功能。

图像生成多模态开源生态模型发布