4月22日

21:14

Rohan Paul@rohanpaul_ai

好吧，我曾经向 Runable 提过一次我的品牌。而且它似乎处处都记得。幻灯片、图片、轮播图全都呈现出相同的外观（色调、布局、层级、间距、图片风格）。而且桌面到手机的切换感觉异常流畅。简直不可思议。一致性是让 AI 输出可用于生产环境的关键。

Umesh Kumar: The power to create anything is now in your pocket. Runable is now live on the App Store. Try it, tell us what sucks.

产品更新图像生成多模态

16:11

HuggingFace Daily Papers（社区热门论文）

HP-Edit：面向图像编辑的人类偏好后训练框架

本文提出HP-Edit图像编辑人类偏好后训练框架，发布涵盖8类真实任务的RealPref-50K数据集。通过预训练视觉大语言模型和少量偏好数据构建HP-Scorer评估器，用于高效扩展偏好数据集并作为奖励函数优化扩散模型。同步推出RealPref-Bench基准。实验表明，该方法显著提升Qwen-Image-Edit-2509等模型编辑质量，使输出更贴合人类偏好。

图像生成数据/训练论文/研究

12:14

Deedy@deedydas

ChatGPT 的新图像模型可以接收房屋照片并"生成完整的平面图" 它彻底击败了所有其他图像模型。我已经试了一整天，以下是它能做的 10 件令人难以置信的事情： 1/11

OpenAI 产品更新图像生成多模态

12:10

HuggingFace Daily Papers（社区热门论文）

SmartPhotoCrafter：自动摄影图像编辑的统一推理生成优化方法

SmartPhotoCrafter是一种无需显式人工指令的自动摄影图像编辑方法，通过Image Critic模块识别图像缺陷，Photographic Artist模块执行针对性增强。该方法采用三阶段训练：基础预训练建立审美能力，推理引导的多编辑监督融入语义指导，协调式强化学习联合优化两模块。实验表明，该方法在自动摄影增强任务中优于现有生成模型，在保持照片级真实感的同时对色调指令具有更高敏感度。

图像生成推理论文/研究

11:44

Greg Brockman@gdb

哇

adi: A massive pile of rice, on ONE rice grain there is text reading" wOw" - images-v2 in 4k

OpenAI 其他图像生成

11:36

宝玉@dotey

GPT Image 2提示词：成龙与功夫手办同框生成示例

推文展示GPT Image 2的提示词示例，呈现其生成真实人物与动漫手办同框的能力。提示词要求以手机随手拍风格，构建成龙功夫手办与真人同框场景，两者姿势呼应形成趣味对比。画面采用背景虚化突出主体，追求自然和谐的生活气息。这体现了GPT Image 2在理解复杂空间关系、人物一致性及模拟真实摄影质感方面的能力。

OpenAI 图像生成多模态教程/实践

11:06

宝玉@dotey

GPT Image 2 展示日本少年漫画生成能力

OpenAI 展示 GPT Image 2 生成日本少年漫画（shonen manga）的提示词案例，体现其创作复杂多格漫画的能力。提示词要求生成 1440x2560 纵向比例的彩色冒险漫画，主角发现带有 OpenAI logo 的魔法羽毛笔，需使用日语并模拟实体书页照片效果。这反映了 GPT Image 2 在特定艺术风格渲染、文字生成、品牌元素植入及物理质感模拟方面的精细控制水平。

OpenAI 图像生成多模态教程/实践

11:06

宝玉@dotey

GPT Image 2.0提示词示例：法式新浪潮电影海报

OpenAI发布GPT Image 2.0预览，通过法式新浪潮电影海报示例展示新模型的图像生成能力。提示词融合了1960年代法国新浪潮剧院海报风格、拼贴美学、波普艺术色彩与手工印刷质感等复杂艺术指令，并要求精确呈现"GPT Image 2.0"等英文标题文字。该示例体现模型在风格理解、构图控制和文本渲染方面的提升，官方页面显示功能即将上线。

OpenAI 图像生成教程/实践

11:06

宝玉@dotey

GPT Image 2 Prompt：根据你对我的所有了解，制作一份少年风格动漫角色的角色设定表，名字是宝玉

图像生成教程/实践

11:06

宝玉@dotey

GPT Image 2 提示词：一页现代独立漫画风格的漫画书，主题：一个适合6岁孩子的故事

OpenAI 图像生成教程/实践

10:36

宝玉@dotey

GPT Image 2提示词：视觉多语者杂志拼贴

OpenAI发布GPT Image 2复杂提示词，展示"视觉多语者"概念。该提示词要求生成题为"Create Everything at Once"的杂志拼贴，融合科学图表、中世纪手稿、工程示意图、UI界面等跨领域视觉元素，涵盖从实用文档到艺术创作的完整视觉文化。设计采用非结构化艺术布局，主张图像智能应基于整个视觉世界训练，而非仅限于精美美学，体现模型在多语言、符号系统和文化形式间的流畅转换能力。

OpenAI 图像生成教程/实践

10:10

HuggingFace Daily Papers（社区热门论文）

Tstars-Tryon 1.0：面向多样化时尚单品的稳健逼真虚拟试衣系统

Tstars-Tryon 1.0 是一款商业级虚拟试衣系统，能够在极端姿势、光照变化和动态模糊等复杂场景下保持高成功率，生成保留服装纹理与材质细节的高保真图像。系统支持多达6张参考图的多图合成，覆盖8个时尚品类，并针对推理速度进行优化实现近实时生成。该技术已在淘宝App大规模部署，服务数百万用户并处理数千万次请求，同时团队发布了综合基准数据集以支持后续研究。

arXiv 图像生成论文/研究

10:06

宝玉@dotey

GPT Image 2手绘信息图卡片提示词模板分享

分享了一个用于GPT Image 2生成手绘风格信息图卡片的提示词模板。该模板要求创作9:16竖版卡片，采用米色纸质背景，以红黑相间的毛笔草书呈现标题，正文使用中文草书分2-4节布局，并点缀手绘插画增强视觉效果。设计强调质朴亲切的手绘美感与视觉平衡，主题可自由替换，示例围绕IP长期复利与坚持的价值展开。

宝玉: 手绘风格的信息图卡片提示词(主题可以自由替换) ---- 创作一张手绘风格的信息图卡片,比例为9:16竖版。卡片主题鲜明,背景为带有纸质肌理的米色或米白色,整体设计体现质朴、亲切的手绘美感。卡片上方以红黑相间、对比鲜明的大号毛笔草书字体突...

OpenAI 图像生成教程/实践

10:06

宝玉@dotey

GPT Image 2 提示词：生成上海外滩四季全景图

分享适用于 GPT Image 2 的提示词，可在单幅超写实数字插画中无缝呈现四季轮回。画面从左至右自然过渡，由上海外滩历史建筑的皑皑冬雪，渐变为春意萌发、盛夏葱郁，直至陆家嘴天际线的金秋绚烂。采用连续构图消除季节分界线，通过光影与植被的细腻渐变，在 8K 分辨率与电影级光照下，构建出象征时间流逝的和谐全景。

宝玉: 🍌 nano banana prompt Create a mesmerizing passage of time with this prompt, seamlessly blending all four seasons-from W...

OpenAI 图像生成教程/实践

09:40

Ethan Mollick@emollick

近乎完美（尽管令人不安）。这是第一张照片，唯一真正的问题是双时针。

图像生成大佬观点

09:36

宝玉@dotey

GPT Image 2 手绘风格信息图卡片提示词

分享一个 GPT Image 2 提示词，用于生成手绘风格信息图卡片。采用 9:16 竖版格式与暖色调纸质背景，顶部以红黑毛笔书法突出标题，正文使用流动手写体，分 2-4 个区块布局，搭配简单手绘插图。示例展示费曼关于"简单解释"的经典名言，整体呈现温暖手工质感，适合制作富有艺术气息的知识分享卡片。

宝玉: 🍌 nano banana pro prompt Create a hand-drawn style infographic card for a topic. --- Prompt --- Create a hand-drawn sty...

OpenAI 图像生成教程/实践

09:06

宝玉@dotey

AI生成四格漫画：说Vibe Coding被扔出窗外

用户展示用GPT Image 2生成的"Out the Window"梗图风格四格漫画，描绘老板询问如何借助AI提升开发效率的会议场景。面对提问，三名员工分别回答用AI写单元测试、做代码审查以及"Vibe Coding"，而说出"Vibe Coding"的员工随即被暴怒的老板扔出窗外。作品以夸张手法讽刺程序员文化中对传统工程实践与完全依赖AI编程的态度差异，反映当下AI开发范式的争议性。

宝玉: Create an "Out the Window" meme-style four-panel comic titled "How to Improve Development Efficiency with AI? 如何借助 AI 提升...

OpenAI 图像生成教程/实践编码

07:36

宝玉@dotey

GPT Image 2 提示词：文章一键转卡通信息图

分享了一个 GPT Image 2 提示词，可将文章内容转换为卡通风格信息图。规范要求采用手绘插画风格、16:9 横向比例，通过简洁排版和留白突出核心概念与关键词。特别针对敏感或版权人物，提示词要求用视觉相似替代方案而非拒绝生成。该提示词源自 @dotey 的 "nano banana pro" 系列，适用于快速将文本内容视觉化呈现。

宝玉: 🍌 nano banana pro prompt convert your article/content to a cartoon-style infographic --- Prompt --- Please create a car...

OpenAI 图像生成教程/实践

07:36

宝玉@dotey

GPT Image 2黑板风格信息图提示词发布

开发者发布GPT Image 2专用提示词，可将文章内容转换为16:9横向黑板风格信息图。该提示词要求采用彩色粉笔手绘风格，突出关键词与核心概念，搭配极简卡通元素与图标，保持原文语言并留白以确保清晰。此提示词基于@dotey的"nano banana pro"框架改编，将绘画风格从香蕉主题替换为黑板粉笔质感，适用于教育类内容可视化呈现。

宝玉: 🍌 nano banana pro prompt --- Prompt --- Please create an infographic based on the input content, highlighting key theme...

OpenAI 图像生成教程/实践

07:36

宝玉@dotey

GPT Image 2蜡笔旅行日记提示词模板

该提示词专为GPT Image 2设计，可生成儿童蜡笔风格的9:16竖版旅行手账插画。用户输入城市名称与天数后，系统自动规划路线并填充当地景点、美食与地标，搭配童趣涂鸦、手写体文字与温暖明亮的色调。源自"nano banana prompt"系列，适合快速制作充满好奇心的个性化旅行纪念图。

宝玉: 🍌 nano banana prompt Kids' Crayon Travel Journal Illustration Prompt This prompt generates a vibrant, child-like crayon...

OpenAI 图像生成教程/实践

07:06

Chubby♨️@kimmonismus

是的，GPT image 2 就是*那么*牛。简直准得离谱。图片：20 人部落团队正以 2004 年 World of Warcraft 风格与 Sam Altman 战斗。有人被秒了。

OpenAI 产品更新图像生成

07:06

宝玉@dotey

GPT Image 2提示词：打造3D萌系品牌微型概念店

分享适用于GPT Image 2的提示词模板，可生成3D chibi-style品牌微型概念店。该提示词以品牌标志性产品作为建筑外观灵感，构建两层玻璃结构展示内部装潢，配合街道场景与行人，采用Cinema 4D渲染实现盲盒玩具美学与柔和光照。示例展示Starbucks概念店效果。此提示词来自@dotey的系列创作，适用于品牌视觉设计与创意场景生成。

宝玉: 🍌 nano banana prompt 3D chibi-style miniature concept store of {Brand Name} --- Prompt --- 3D chibi-style miniature con...

OpenAI 图像生成教程/实践

07:06

宝玉@dotey

GPT Image 2提示词：生成实时股票数据3D等距场景

GPT Image 2 提示词支持创建融合实时股票数据的等距迷你3D场景。用户输入公司名称或股票代码后，系统以45度俯视角生成精致卡通风格画面，中央呈现公司标志性建筑与产品元素，采用 Cinema 4D 渲染与 PBR 材质。场景顶部整合指定日期的股价区间与趋势图表，所有文本支持用户指定语言。系统严格要求基于准确实时数据生成，若数据不可用将立即停止。该方案适用于金融数据可视化与品牌展示。

宝玉: 🍌 nano banana pro prompt Isometric Miniature Stock Scene Enter a company name or stock ticker to generate an exquisite,...

OpenAI 图像生成教程/实践

07:06

宝玉@dotey

GPT Image 2 提示词：唐代仕女与小黄人侍从

推文分享了 GPT Image 2 的图像生成提示词，呈现工笔重彩风格的跨时空荒诞场景：唐代仕女身着汉服却搭配黑丝与红高跟，手持吹风机，由三只小黄人扮作古仆服侍——分别牵拉电源线、擦拭鞋履、举手机拍照。背景融入松竹、太湖石与书法印章等传统元素，展现 AI 对复杂文化混搭与风格一致性的把控能力。

宝玉: 🍌nano banana pro Prompt: A traditional Chinese ink and color painting in Gongbi style on aged rice paper texture. A nob...

OpenAI 图像生成教程/实践

05:38

OpenAI Developers@OpenAIDevs

gpt-image-2 新示例刚刚在我们的用例库上线。致那些打开文档"只想查一件事"，却带着五个新想法离开的人。

OpenAI 产品更新图像生成

05:20

Greg Brockman@gdb

真的很不可思议，你现在只需一点点算力就能创造出这样的东西。期待在教育、专业场景（如幻灯片、营销材料等）以及生产力（例如为代码文档创建图表）等领域的新应用。

OpenAI: Introducing ChatGPT Images 2.0 A state-of-the-art image model that can take on complex visual tasks and produce precise,...

OpenAI 产品更新图像生成

05:07

OpenAI@OpenAI

是什么让 ChatGPT Images 2.0 成为最先进的图像生成模型？模型背后的研究人员解释道。串帖： ChatGPT Images 2.0 中的思考与智能，由 @ayaanzhaque 演示

OpenAI 图像生成推理论文/研究

04:08

swyx 🏝️@AIEmiami@swyx

千万别错过。这是 @osanseviero 和 @GoogleDeepMind London Avengers 带来的疯狂收获之一。如果你总是觉得跟不上 Imagegen 的 SOTA 进展，无论现在还是平时，这就是你在互联网上能找到的最棒的 40 分钟，绝对如此。

AI Engineer: 🆕Building Generative Image & Video models at Scale https://www.youtube.com/watch?v=xOP1PM8fwnk A lot of interest in ima...

DeepMind 图像生成教程/实践视频

04:07

Ethan Mollick@emollick

用户沿用此前推文引用的"Nano banana 2"提示方法，在GPT图像生成器2中输入相同提示词，要求生成四本虚构书籍第113-114页的"照片"摘录。这些书籍包括《Eldritch Horrors as Pets： A Guide》、《How Womblenauts Work》、《Photographs of the People of New York Who Look Like Birds》以及《Cakes shaped like fish shaped like cakes》。生成结果图像中包含大量出色的细节文本行，进一步验证了该模型在理解和可视化复杂、荒诞文本概念方面的创意与图像生成能力。

Ethan Mollick: Nano banana 2: "Show me a photo taken of pages 113-114 from the books": "Eldritch Horrors as Pets: A Guide" "How Womblen...

OpenAI 图像生成教程/实践

03:48

Yuchen Jin@Yuchenj_UW

刚试了 gpt-image-2。真的很棒。OpenAI 终于在图像生成领域重新领先了。

OpenAI: Introducing ChatGPT Images 2.0 A state-of-the-art image model that can take on complex visual tasks and produce precise,...

OpenAI 图像生成大佬观点

03:45

Rohan Paul@rohanpaul_ai

ChatGPT Images 2.0发布：AI图像生成进入实用化阶段

OpenAI发布ChatGPT Images 2.0，凭借推理模式（reasoning mode）解决了AI图像生成在文本渲染与复杂布局上的历史短板。新系统不仅能生成逼真视觉，更能精确处理字母排版、多部分指令和特殊比例，直接产出可立即用于广告、海报等商业场景的设计稿。这标志着行业评估标准已从单纯追求照片级真实感，转向结构准确性、文本可用性与实际经济价值，AI图像生成正式进入可用化新阶段。

OpenAI: Introducing ChatGPT Images 2.0 A state-of-the-art image model that can take on complex visual tasks and produce precise,...

OpenAI 图像生成大佬观点推理

03:40

Sam Altman@sama

这是 ChatGPT Images 2.0 生成的漫画，画的是我和 @gabeeegoooh 寻找更多 GPU：

OpenAI 产品更新图像生成

03:40

宝玉@dotey

GPT-Image-2生成3D等距天气卡片示例

GPT-Image-2展示动态天气卡片生成能力。通过结构化提示词，模型可创建45°俯视的垂直等距3D卡通城市场景，采用PBR材质与真实光影，将天气元素与地标建筑动态融合。系统先检索指定城市实时气象数据，再以极简美学呈现天气图标、温度及日期信息，支持多语言本地化输出。示例展示上海城市景观与天气状况的沉浸式结合。

宝玉: 🍌 nano banana pro prompt (with gemini) Dynamically generate a current weather card based on a given city name. --- prom...