AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「图像生成」清除
4月22日周三
21:14Rohan Paul好吧,我曾经向 Runable 提过一次我的品牌。 而且它似乎处处都记得。幻灯片、图片、轮播图全都呈现出相同的外观(色调、布局、层级、间距、图片风格)。 而且桌面到手机的切换感觉异常流畅。简直不可思议。 一致性是让 AI 输出可用于生产环境的关键。
16:11HuggingFace Daily Papers(社区热门论文)HP-Edit:面向图像编辑的人类偏好后训练框架
12:14DeedyChatGPT 的新图像模型可以接收房屋照片并"生成完整的平面图" 它彻底击败了所有其他图像模型。 我已经试了一整天,以下是它能做的 10 件令人难以置信的事情: 1/11
12:10HuggingFace Daily Papers(社区热门论文)SmartPhotoCrafter:自动摄影图像编辑的统一推理生成优化方法
11:44Greg Brockman哇
11:36宝玉GPT Image 2提示词:成龙与功夫手办同框生成示例
11:06宝玉GPT Image 2 展示日本少年漫画生成能力
11:06宝玉GPT Image 2.0提示词示例:法式新浪潮电影海报
11:06宝玉68GPT生成动漫角色设定:宝玉
11:06宝玉GPT Image 2 提示词: 一页现代独立漫画风格的漫画书,主题: 一个适合6岁孩子的故事
10:36宝玉GPT Image 2提示词:视觉多语者杂志拼贴
10:10HuggingFace Daily Papers(社区热门论文)Tstars-Tryon 1.0:面向多样化时尚单品的稳健逼真虚拟试衣系统
10:06宝玉GPT Image 2手绘信息图卡片提示词模板分享
10:06宝玉GPT Image 2 提示词:生成上海外滩四季全景图
09:40Ethan Mollick35首试近乎完美,双时针成唯一瑕疵
09:36宝玉GPT Image 2 手绘风格信息图卡片提示词
09:06宝玉AI生成四格漫画:说Vibe Coding被扔出窗外
07:36宝玉GPT Image 2 提示词:文章一键转卡通信息图
07:36宝玉GPT Image 2黑板风格信息图提示词发布
07:36宝玉GPT Image 2蜡笔旅行日记提示词模板
07:06Chubby♨️是的,GPT image 2 就是*那么*牛。 简直准得离谱。 图片:20 人部落团队正以 2004 年 World of Warcraft 风格与 Sam Altman 战斗。有人被秒了。
07:06宝玉GPT Image 2提示词:打造3D萌系品牌微型概念店
07:06宝玉GPT Image 2提示词:生成实时股票数据3D等距场景
07:06宝玉GPT Image 2 提示词:唐代仕女与小黄人侍从
05:38OpenAI Developersgpt-image-2 新示例刚刚在我们的用例库上线。 致那些打开文档"只想查一件事",却带着五个新想法离开的人。
05:20Greg Brockman真的很不可思议,你现在只需一点点算力就能创造出这样的东西。 期待在教育、专业场景(如幻灯片、营销材料等)以及生产力(例如为代码文档创建图表)等领域的新应用。
05:07OpenAI是什么让 ChatGPT Images 2.0 成为最先进的图像生成模型? 模型背后的研究人员解释道。串帖: ChatGPT Images 2.0 中的思考与智能,由 @ayaanzhaque 演示
04:08swyx 🏝️@AIEmiami千万别错过。这是 @osanseviero 和 @GoogleDeepMind London Avengers 带来的疯狂收获之一。 如果你总是觉得跟不上 Imagegen 的 SOTA 进展,无论现在还是平时,这就是你在互联网上能找到的最棒的 40 分钟,绝对如此。
04:07Ethan Mollick61使用相同提示词在GPT图像生成器2中生成虚构书籍页面摘录
03:48Yuchen Jin刚试了 gpt-image-2。 真的很棒。OpenAI 终于在图像生成领域重新领先了。
03:45Rohan PaulChatGPT Images 2.0发布:AI图像生成进入实用化阶段
03:40Sam Altman这是 ChatGPT Images 2.0 生成的漫画,画的是我和 @gabeeegoooh 寻找更多 GPU:
03:40宝玉GPT-Image-2生成3D等距天气卡片示例
03:40宝玉官方一直都知道"稳稳地接住你"这梗😂
03:37Ethan Mollick虽然图像质量很好,但 ChatGPT Image 2.0 确实存在典型的 imagegen 问题,即编辑可能会很"固执",试图让 AI 修改细节在前一两轮效果不错,但之后进展会变慢。把图片放到新对话中有帮助。
00:14AK通过判别性文本表征将一步图像生成从类别标签扩展到文本 paper: https://huggingface.co/papers/2604.18168
4月21日周二
23:44Chubby♨️62ChatGPT图像功能今日升级
23:44Chubby♨️"有个东西要给你们看",所以他们将在太平洋时间中午12点发布 GPT Image gen 2(遗憾的是在我现在所在的中国是凌晨3点 :( 而 Spud(GPT 5.5)可能在周四
23:44Chubby♨️GPT-Image-2 现在会审查自己的输出,并迭代直到对输出的正确性满意为止。 从未对一个新的图像模型如此兴奋过!
22:19小互45GPT图像功能2今晚发布
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
4月22日
21:14
Rohan Paul@rohanpaul_ai
好吧,我曾经向 Runable 提过一次我的品牌。 而且它似乎处处都记得。幻灯片、图片、轮播图全都呈现出相同的外观(色调、布局、层级、间距、图片风格)。 而且桌面到手机的切换感觉异常流畅。简直不可思议。 一致性是让 AI 输出可用于生产环境的关键。

Umesh Kumar: The power to create anything is now in your pocket. Runable is now live on the App Store. Try it, tell us what sucks.

产品更新图像生成多模态
16:11
HuggingFace Daily Papers(社区热门论文)
HP-Edit:面向图像编辑的人类偏好后训练框架

本文提出HP-Edit图像编辑人类偏好后训练框架,发布涵盖8类真实任务的RealPref-50K数据集。通过预训练视觉大语言模型和少量偏好数据构建HP-Scorer评估器,用于高效扩展偏好数据集并作为奖励函数优化扩散模型。同步推出RealPref-Bench基准。实验表明,该方法显著提升Qwen-Image-Edit-2509等模型编辑质量,使输出更贴合人类偏好。

图像生成数据/训练论文/研究
12:14
Deedy@deedydas
ChatGPT 的新图像模型可以接收房屋照片并"生成完整的平面图" 它彻底击败了所有其他图像模型。 我已经试了一整天,以下是它能做的 10 件令人难以置信的事情: 1/11
OpenAI产品更新图像生成多模态
12:10
HuggingFace Daily Papers(社区热门论文)
SmartPhotoCrafter:自动摄影图像编辑的统一推理生成优化方法

SmartPhotoCrafter是一种无需显式人工指令的自动摄影图像编辑方法,通过Image Critic模块识别图像缺陷,Photographic Artist模块执行针对性增强。该方法采用三阶段训练:基础预训练建立审美能力,推理引导的多编辑监督融入语义指导,协调式强化学习联合优化两模块。实验表明,该方法在自动摄影增强任务中优于现有生成模型,在保持照片级真实感的同时对色调指令具有更高敏感度。

图像生成推理论文/研究
11:44
Greg Brockman@gdb
哇

adi: A massive pile of rice, on ONE rice grain there is text reading" wOw" - images-v2 in 4k

OpenAI其他图像生成
11:36
宝玉@dotey
GPT Image 2提示词:成龙与功夫手办同框生成示例

推文展示GPT Image 2的提示词示例,呈现其生成真实人物与动漫手办同框的能力。提示词要求以手机随手拍风格,构建成龙功夫手办与真人同框场景,两者姿势呼应形成趣味对比。画面采用背景虚化突出主体,追求自然和谐的生活气息。这体现了GPT Image 2在理解复杂空间关系、人物一致性及模拟真实摄影质感方面的能力。

OpenAI图像生成多模态教程/实践
11:06
宝玉@dotey
GPT Image 2 展示日本少年漫画生成能力

OpenAI 展示 GPT Image 2 生成日本少年漫画(shonen manga)的提示词案例,体现其创作复杂多格漫画的能力。提示词要求生成 1440x2560 纵向比例的彩色冒险漫画,主角发现带有 OpenAI logo 的魔法羽毛笔,需使用日语并模拟实体书页照片效果。这反映了 GPT Image 2 在特定艺术风格渲染、文字生成、品牌元素植入及物理质感模拟方面的精细控制水平。

OpenAI图像生成多模态教程/实践
11:06
宝玉@dotey
GPT Image 2.0提示词示例:法式新浪潮电影海报

OpenAI发布GPT Image 2.0预览,通过法式新浪潮电影海报示例展示新模型的图像生成能力。提示词融合了1960年代法国新浪潮剧院海报风格、拼贴美学、波普艺术色彩与手工印刷质感等复杂艺术指令,并要求精确呈现"GPT Image 2.0"等英文标题文字。该示例体现模型在风格理解、构图控制和文本渲染方面的提升,官方页面显示功能即将上线。

OpenAI图像生成教程/实践
11:06
宝玉@dotey
68
GPT Image 2 Prompt: 根据你对我的所有了解,制作一份少年风格动漫角色的角色设定表,名字是宝玉
图像生成教程/实践
11:06
宝玉@dotey
GPT Image 2 提示词: 一页现代独立漫画风格的漫画书,主题: 一个适合6岁孩子的故事
OpenAI图像生成教程/实践
10:36
宝玉@dotey
GPT Image 2提示词:视觉多语者杂志拼贴

OpenAI发布GPT Image 2复杂提示词,展示"视觉多语者"概念。该提示词要求生成题为"Create Everything at Once"的杂志拼贴,融合科学图表、中世纪手稿、工程示意图、UI界面等跨领域视觉元素,涵盖从实用文档到艺术创作的完整视觉文化。设计采用非结构化艺术布局,主张图像智能应基于整个视觉世界训练,而非仅限于精美美学,体现模型在多语言、符号系统和文化形式间的流畅转换能力。

OpenAI图像生成教程/实践
10:10
HuggingFace Daily Papers(社区热门论文)
Tstars-Tryon 1.0:面向多样化时尚单品的稳健逼真虚拟试衣系统

Tstars-Tryon 1.0 是一款商业级虚拟试衣系统,能够在极端姿势、光照变化和动态模糊等复杂场景下保持高成功率,生成保留服装纹理与材质细节的高保真图像。系统支持多达6张参考图的多图合成,覆盖8个时尚品类,并针对推理速度进行优化实现近实时生成。该技术已在淘宝App大规模部署,服务数百万用户并处理数千万次请求,同时团队发布了综合基准数据集以支持后续研究。

arXiv图像生成论文/研究
10:06
宝玉@dotey
GPT Image 2手绘信息图卡片提示词模板分享

分享了一个用于GPT Image 2生成手绘风格信息图卡片的提示词模板。该模板要求创作9:16竖版卡片,采用米色纸质背景,以红黑相间的毛笔草书呈现标题,正文使用中文草书分2-4节布局,并点缀手绘插画增强视觉效果。设计强调质朴亲切的手绘美感与视觉平衡,主题可自由替换,示例围绕IP长期复利与坚持的价值展开。

宝玉: 手绘风格的信息图卡片提示词(主题可以自由替换) ---- 创作一张手绘风格的信息图卡片,比例为9:16竖版。卡片主题鲜明,背景为带有纸质肌理的米色或米白色,整体设计体现质朴、亲切的手绘美感。 卡片上方以红黑相间、对比鲜明的大号毛笔草书字体突...

OpenAI图像生成教程/实践
10:06
宝玉@dotey
GPT Image 2 提示词:生成上海外滩四季全景图

分享适用于 GPT Image 2 的提示词,可在单幅超写实数字插画中无缝呈现四季轮回。画面从左至右自然过渡,由上海外滩历史建筑的皑皑冬雪,渐变为春意萌发、盛夏葱郁,直至陆家嘴天际线的金秋绚烂。采用连续构图消除季节分界线,通过光影与植被的细腻渐变,在 8K 分辨率与电影级光照下,构建出象征时间流逝的和谐全景。

宝玉: 🍌 nano banana prompt Create a mesmerizing passage of time with this prompt, seamlessly blending all four seasons-from W...

OpenAI图像生成教程/实践
09:40
Ethan Mollick@emollick
35
近乎完美(尽管令人不安)。这是第一张照片,唯一真正的问题是双时针。
图像生成大佬观点
09:36
宝玉@dotey
GPT Image 2 手绘风格信息图卡片提示词

分享一个 GPT Image 2 提示词,用于生成手绘风格信息图卡片。采用 9:16 竖版格式与暖色调纸质背景,顶部以红黑毛笔书法突出标题,正文使用流动手写体,分 2-4 个区块布局,搭配简单手绘插图。示例展示费曼关于"简单解释"的经典名言,整体呈现温暖手工质感,适合制作富有艺术气息的知识分享卡片。

宝玉: 🍌 nano banana pro prompt Create a hand-drawn style infographic card for a topic. --- Prompt --- Create a hand-drawn sty...

OpenAI图像生成教程/实践
09:06
宝玉@dotey
AI生成四格漫画:说Vibe Coding被扔出窗外

用户展示用GPT Image 2生成的"Out the Window"梗图风格四格漫画,描绘老板询问如何借助AI提升开发效率的会议场景。面对提问,三名员工分别回答用AI写单元测试、做代码审查以及"Vibe Coding",而说出"Vibe Coding"的员工随即被暴怒的老板扔出窗外。作品以夸张手法讽刺程序员文化中对传统工程实践与完全依赖AI编程的态度差异,反映当下AI开发范式的争议性。

宝玉: Create an "Out the Window" meme-style four-panel comic titled "How to Improve Development Efficiency with AI? 如何借助 AI 提升...

OpenAI图像生成教程/实践编码
07:36
宝玉@dotey
GPT Image 2 提示词:文章一键转卡通信息图

分享了一个 GPT Image 2 提示词,可将文章内容转换为卡通风格信息图。规范要求采用手绘插画风格、16:9 横向比例,通过简洁排版和留白突出核心概念与关键词。特别针对敏感或版权人物,提示词要求用视觉相似替代方案而非拒绝生成。该提示词源自 @dotey 的 "nano banana pro" 系列,适用于快速将文本内容视觉化呈现。

宝玉: 🍌 nano banana pro prompt convert your article/content to a cartoon-style infographic --- Prompt --- Please create a car...

OpenAI图像生成教程/实践
07:36
宝玉@dotey
GPT Image 2黑板风格信息图提示词发布

开发者发布GPT Image 2专用提示词,可将文章内容转换为16:9横向黑板风格信息图。该提示词要求采用彩色粉笔手绘风格,突出关键词与核心概念,搭配极简卡通元素与图标,保持原文语言并留白以确保清晰。此提示词基于@dotey的"nano banana pro"框架改编,将绘画风格从香蕉主题替换为黑板粉笔质感,适用于教育类内容可视化呈现。

宝玉: 🍌 nano banana pro prompt --- Prompt --- Please create an infographic based on the input content, highlighting key theme...

OpenAI图像生成教程/实践
07:36
宝玉@dotey
GPT Image 2蜡笔旅行日记提示词模板

该提示词专为GPT Image 2设计,可生成儿童蜡笔风格的9:16竖版旅行手账插画。用户输入城市名称与天数后,系统自动规划路线并填充当地景点、美食与地标,搭配童趣涂鸦、手写体文字与温暖明亮的色调。源自"nano banana prompt"系列,适合快速制作充满好奇心的个性化旅行纪念图。

宝玉: 🍌 nano banana prompt Kids' Crayon Travel Journal Illustration Prompt This prompt generates a vibrant, child-like crayon...

OpenAI图像生成教程/实践
07:06
Chubby♨️@kimmonismus
是的,GPT image 2 就是*那么*牛。 简直准得离谱。 图片:20 人部落团队正以 2004 年 World of Warcraft 风格与 Sam Altman 战斗。有人被秒了。
OpenAI产品更新图像生成
07:06
宝玉@dotey
GPT Image 2提示词:打造3D萌系品牌微型概念店

分享适用于GPT Image 2的提示词模板,可生成3D chibi-style品牌微型概念店。该提示词以品牌标志性产品作为建筑外观灵感,构建两层玻璃结构展示内部装潢,配合街道场景与行人,采用Cinema 4D渲染实现盲盒玩具美学与柔和光照。示例展示Starbucks概念店效果。此提示词来自@dotey的系列创作,适用于品牌视觉设计与创意场景生成。

宝玉: 🍌 nano banana prompt 3D chibi-style miniature concept store of {Brand Name} --- Prompt --- 3D chibi-style miniature con...

OpenAI图像生成教程/实践
07:06
宝玉@dotey
GPT Image 2提示词:生成实时股票数据3D等距场景

GPT Image 2 提示词支持创建融合实时股票数据的等距迷你3D场景。用户输入公司名称或股票代码后,系统以45度俯视角生成精致卡通风格画面,中央呈现公司标志性建筑与产品元素,采用 Cinema 4D 渲染与 PBR 材质。场景顶部整合指定日期的股价区间与趋势图表,所有文本支持用户指定语言。系统严格要求基于准确实时数据生成,若数据不可用将立即停止。该方案适用于金融数据可视化与品牌展示。

宝玉: 🍌 nano banana pro prompt Isometric Miniature Stock Scene Enter a company name or stock ticker to generate an exquisite,...

OpenAI图像生成教程/实践
07:06
宝玉@dotey
GPT Image 2 提示词:唐代仕女与小黄人侍从

推文分享了 GPT Image 2 的图像生成提示词,呈现工笔重彩风格的跨时空荒诞场景:唐代仕女身着汉服却搭配黑丝与红高跟,手持吹风机,由三只小黄人扮作古仆服侍——分别牵拉电源线、擦拭鞋履、举手机拍照。背景融入松竹、太湖石与书法印章等传统元素,展现 AI 对复杂文化混搭与风格一致性的把控能力。

宝玉: 🍌nano banana pro Prompt: A traditional Chinese ink and color painting in Gongbi style on aged rice paper texture. A nob...

OpenAI图像生成教程/实践
05:38
OpenAI Developers@OpenAIDevs
gpt-image-2 新示例刚刚在我们的用例库上线。 致那些打开文档"只想查一件事",却带着五个新想法离开的人。
OpenAI产品更新图像生成
05:20
Greg Brockman@gdb
真的很不可思议,你现在只需一点点算力就能创造出这样的东西。 期待在教育、专业场景(如幻灯片、营销材料等)以及生产力(例如为代码文档创建图表)等领域的新应用。

OpenAI: Introducing ChatGPT Images 2.0 A state-of-the-art image model that can take on complex visual tasks and produce precise,...

OpenAI产品更新图像生成
05:07
OpenAI@OpenAI
是什么让 ChatGPT Images 2.0 成为最先进的图像生成模型? 模型背后的研究人员解释道。串帖: ChatGPT Images 2.0 中的思考与智能,由 @ayaanzhaque 演示
OpenAI图像生成推理论文/研究
04:08
swyx 🏝️@AIEmiami@swyx
千万别错过。这是 @osanseviero 和 @GoogleDeepMind London Avengers 带来的疯狂收获之一。 如果你总是觉得跟不上 Imagegen 的 SOTA 进展,无论现在还是平时,这就是你在互联网上能找到的最棒的 40 分钟,绝对如此。

AI Engineer: 🆕Building Generative Image & Video models at Scale https://www.youtube.com/watch?v=xOP1PM8fwnk A lot of interest in ima...

DeepMind图像生成教程/实践视频
04:07
Ethan Mollick@emollick
61
用户沿用此前推文引用的"Nano banana 2"提示方法,在GPT图像生成器2中输入相同提示词,要求生成四本虚构书籍第113-114页的"照片"摘录。这些书籍包括《Eldritch Horrors as Pets: A Guide》、《How Womblenauts Work》、《Photographs of the People of New York Who Look Like Birds》以及《Cakes shaped like fish shaped like cakes》。生成结果图像中包含大量出色的细节文本行,进一步验证了该模型在理解和可视化复杂、荒诞文本概念方面的创意与图像生成能力。

Ethan Mollick: Nano banana 2: "Show me a photo taken of pages 113-114 from the books": "Eldritch Horrors as Pets: A Guide" "How Womblen...

OpenAI图像生成教程/实践
03:48
Yuchen Jin@Yuchenj_UW
刚试了 gpt-image-2。 真的很棒。OpenAI 终于在图像生成领域重新领先了。

OpenAI: Introducing ChatGPT Images 2.0 A state-of-the-art image model that can take on complex visual tasks and produce precise,...

OpenAI图像生成大佬观点
03:45
Rohan Paul@rohanpaul_ai
ChatGPT Images 2.0发布:AI图像生成进入实用化阶段

OpenAI发布ChatGPT Images 2.0,凭借推理模式(reasoning mode)解决了AI图像生成在文本渲染与复杂布局上的历史短板。新系统不仅能生成逼真视觉,更能精确处理字母排版、多部分指令和特殊比例,直接产出可立即用于广告、海报等商业场景的设计稿。这标志着行业评估标准已从单纯追求照片级真实感,转向结构准确性、文本可用性与实际经济价值,AI图像生成正式进入可用化新阶段。

OpenAI: Introducing ChatGPT Images 2.0 A state-of-the-art image model that can take on complex visual tasks and produce precise,...

OpenAI图像生成大佬观点推理
03:40
Sam Altman@sama
这是 ChatGPT Images 2.0 生成的漫画,画的是我和 @gabeeegoooh 寻找更多 GPU:
OpenAI产品更新图像生成
03:40
宝玉@dotey
GPT-Image-2生成3D等距天气卡片示例

GPT-Image-2展示动态天气卡片生成能力。通过结构化提示词,模型可创建45°俯视的垂直等距3D卡通城市场景,采用PBR材质与真实光影,将天气元素与地标建筑动态融合。系统先检索指定城市实时气象数据,再以极简美学呈现天气图标、温度及日期信息,支持多语言本地化输出。示例展示上海城市景观与天气状况的沉浸式结合。

宝玉: 🍌 nano banana pro prompt (with gemini) Dynamically generate a current weather card based on a given city name. --- prom...

OpenAI图像生成教程/实践
03:40
宝玉@dotey
官方一直都知道"稳稳地接住你"这梗😂

OpenAI: Introducing ChatGPT Images 2.0 A state-of-the-art image model that can take on complex visual tasks and produce precise,...

OpenAI产品更新图像生成
03:37
Ethan Mollick@emollick
虽然图像质量很好,但 ChatGPT Image 2.0 确实存在典型的 imagegen 问题,即编辑可能会很"固执",试图让 AI 修改细节在前一两轮效果不错,但之后进展会变慢。把图片放到新对话中有帮助。
OpenAI图像生成大佬观点
00:14
AK@_akhaliq
通过判别性文本表征将一步图像生成从类别标签扩展到文本 paper: https://huggingface.co/papers/2604.18168
Hugging Face图像生成论文/研究
4月21日
23:44
Chubby♨️@kimmonismus
62
ChatGPT 图像2 今天发布!

OpenAI: This is not a screenshot.

OpenAI产品更新图像生成
23:44
Chubby♨️@kimmonismus
"有个东西要给你们看",所以他们将在太平洋时间中午12点发布 GPT Image gen 2(遗憾的是在我现在所在的中国是凌晨3点 :( 而 Spud(GPT 5.5)可能在周四

Sam Altman: Really excited for this week! Next up, we've got something to show you at 12 pm PT today.

OpenAI图像生成模型发布
23:44
Chubby♨️@kimmonismus
GPT-Image-2 现在会审查自己的输出,并迭代直到对输出的正确性满意为止。 从未对一个新的图像模型如此兴奋过!
OpenAI产品更新图像生成
22:19
小互@xiaohu
45
GPT image 2 今晚发布💯 敬请期待…
OpenAI产品更新图像生成
‹ 上一页
1…2425262728…30
下一页 ›