5月12日

07:29

Luma@LumaLabsAI

最卓越的营销不只展示产品，更让你向往其存在的世界。设定愿景。定义美学。Luma Agents由此构建所有奢华营销视觉。树立标准 → http://lumalabs.ai/app

产品更新图像生成视频

04:59

Luma@LumaLabsAI

情绪板曾是最精彩的部分。如今它只是起点。上传你的参考素材。设定方向。Luma Agents 会将其从情绪板转化为完整的广告。生成广告 → http://lumalabs.ai/app

智能体产品更新图像生成视频

02:59

Luma@LumaLabsAI

Luma Agents现已支持通过Kling Omni生成内容。更多模型。更广范围。相同工作流程。立即体验 → https://lumalabs.ai/app

产品更新图像生成视频

01:53

PixVerse@PixVerse_

用户通过引用推文展示了由GPT Image 2在PixVerse平台上生成的一组高端时尚编辑图像。该图像采用2行4列的网格布局，包含8个独立面板。每个面板均以不同鲜艳纯色或渐变背景呈现一位身着现代街头服饰的年轻男模特，搭配滑板、吉他等道具，并采用简洁的工作室布景。图像整体追求商业广告摄影风格，具有奢侈品品牌广告的美学质感，强调柔和灯光、清晰阴影、逼真皮肤和电影级质感，且不含任何文字或标识。

Cherry 2.O: GPT Image 2 on @PixVerse_ Prompt 👇 Ultra high-end fashion editorial collage in a 2 rows and 4 columns grid layout (tota...

OpenAI 图像生成教程/实践

01:23

PixVerse@PixVerse_

PixVerse将我古老的144p梗图变成4K杰作。我的梗图存档刚刚完成华丽升级。🔥

产品更新图像生成视频

5月11日

23:50

向阳乔木@vista8

博客集成AI对话侧边栏，辅助内容创作

作者为博客增加了AI对话侧边栏功能，旨在提升内容创作效率。该功能允许用户在写作过程中随时与AI对话，以辅助完成配图、生成标题等任务。例如，用户可指令AI“给第一节配信息图，科普风格”，生成的图片会自动插入文中；对于AI生成的多个标题选项，用户只需说“选第一个”即可自动替换。该功能完善后，将同步至开源版本。

产品更新图像生成开源生态

23:32

凡人小北@frxiaobei

Tesla FSD跳过ISP，用原始光子计数重建清晰视觉

Tesla FSD通过跳过图像信号处理器，直接处理传感器记录的原始光子计数数据，而非传统相机处理后的人眼可见RGB图像。光子计数保留了完整的光强信息，神经网络据此重建出细节清晰的场景。这使得FSD在夜间或强眩光等极端视觉条件下，能超越人眼感知，从一片白茫茫中识别出路、树、车辆等关键信息，实现更优的视觉感知能力。

Elon Musk: The human-perceived RGB is image 1 and the Tesla AI photon count reconstruction is image 2. This is why Tesla FSD can se...

图像生成多模态教程/实践

22:48

Berryxia.AI@berryxia

兄弟们！这套结构，这个图理解后。GPT-Image-2 生图也就算是入门了吧。

推文介绍了一套提升AI生图质量的结构化提示词框架。其核心是“结构越清晰，输出质量越好”。框架将提示系统分解为几个关键模块：首先定义画幅与用途；其次明确主题与核心主体的位置、占比及情绪价值；接着通过视觉隐喻用具体元素象征抽象概念；然后选择如Apple风格等特定画面风格并强调干净、克制等视觉要求；最后规划包含主副标题、英文短句和关键词的文字系统，并列出应避免的限制元素。

图像生成教程/实践

22:31

Kling AI@Kling_ai

棒球赛氛围已锁定。⚾ 看看我们如何在Kling AI中创作它。

其他图像生成视频

20:31

凡人小北@frxiaobei

好看啊，这个就是 AI 时代的审美品味吧。【引用 @op7418】：http://x.com/i/article/2053655813877870592

歸藏(guizang.ai): http://x.com/i/article/2053655813877870592

其他图像生成

18:39

SenseTime@SenseTime_AI

精选72

SenseNova U1图像生成模型登陆ComfyUI平台

SenseNova U1图像生成模型现已在ComfyUI上可运行，并获得包括REBEL AI在内的评测者高度认可。REBEL AI发布的实践教程展示了该模型的部署工作流，并对其图像生成能力进行了真实场景测试。模型支持8步快速推理，生成速度极快，应用场景涵盖人像、超现实艺术、文字标志和生物设计等。相关资源已在Hugging Face、GitHub和Discord平台开放。

GitHub Hugging Face 图像生成模型发布

推荐理由：商汤把新模型U1的ComfyUI部署流程完整放出，还有实测视频，想在自己机器上跑国产图像模型的开发者可以直接抄作业了。

17:34

阿绎 AYi@AYi_AInotes

森马AI革新服装业，上新周期缩至15天

森马通过AI技术将服装上新周期从6个月压缩至15天，2025年实现数亿元回款并节省数千万元成本。AI作为全链路基础设施，覆盖供应链、库存、直播、运营等400多个场景，重构经营逻辑。AIGC视觉使图像生成效率提升，成本近乎零，支持全款式并行推进。AI不仅替代人工，更挖掘隐性成本，推动传统企业数字化转型。

图像生成教程/实践

16:22

PixVerse@PixVerse_

用户分享了一个高效AI视频创作流程。他首先利用ChatGPT，基于预设镜头描述，生成了一个结构严谨、支持多镜头序列的详细视频提示词。该提示词严格指定了品牌元素（如瓶身、包装、Logo及阿拉伯文/英文文本）需通过参考附件精确还原，并描述了超奢华、电影感的视觉风格。随后，他将此提示词输入PixVerse平台，借助其高速生成优势，快速产出了1080p分辨率的视频。此工作流有效结合了GPT的精准指令生成能力与PixVerse的快速视频渲染能力，实现了对品牌视觉的严格把控和高效率内容产出。

AZIZ | AI 🇸🇦: 5️⃣ عجبتني النتيجة وقلت ليه ماستخدم سي دانس ٢ ، ورحت على منصة @PixVerse_ لان احب ان السرعة عندهم عالية جدا لتوليد الفيدي...

图像生成教程/实践视频

15:48

歸藏(guizang.ai)@op7418

藏师傅PPT Skill更新第二套主题，集成AI生成与美化功能

藏师傅的PPT Skill工具发布了第二套主题，设计更简洁美观，适用于数据和事实性内容的演示。新主题提供4种颜色和20多种版式选择。其核心功能是集成了Codex内置的GPT-2.0模型，可辅助用户生成演示配图、美化截图，并能自动生成适用于各平台（如公众号）的封面图与配图。相关文章详细介绍了具体使用方法及操作技巧。

歸藏(guizang.ai): http://x.com/i/article/2053655813877870592

OpenAI 图像生成教程/实践

14:52

PixVerse@PixVerse_

图像生成功能即将登陆PixVerse应用。输入提示词，添加参考图，选择模型，调整比例和分辨率，即可在应用中直接生成。图像创作不再是次要工作流。它已成为PixVerse的一部分。转发+关注+回复=300积分（仅限72小时）

产品更新图像生成

10:48

歸藏(guizang.ai)@op7418

精选78

开源PPT工具"鬼藏PPT技能"迎重大更新，新增瑞士风格与AI配图功能

开源项目“鬼藏PPT技能”迎来重大更新，新增瑞士国际主义视觉风格，提供克莱因蓝等四套主题色。核心升级包括：通过接入GPT-Image 2.0，可根据PPT内容与风格自动生成胶片质感配图、流程图及UI截图美化；支持基于同一内容一键生成公众号、小红书、视频号等多种规格的封面图。更新旨在解决用户对多风格、自动配图及跨平台适配的需求，并通过预设22种版式和严格的视觉规则，确保设计的一致性与专业性。

智能体 GitHub 产品更新图像生成

推荐理由：藏师傅把做PPT的整条链闭环了，从大纲、配图到多平台封面一个对话走完。瑞士风的设计纪律直接写进skill，做出来的PPT终于甩掉AI模板味。

09:45

Berryxia.AI@berryxia

利用开源3D库与工具快速创建3D展示与互动应用

推文讨论了在精度要求不高的3D展示场景下，可直接利用开源3D库快速实现。作者提及Apple Reality Composer及其免费的USDZ/USDC格式官方3D模型库，适用于AR增强现实。对于需要自定义或教学互动的场景，推荐了JigSpace应用。同时，作者分享了使用GitHub上的glTF样本模型快速制作Demo的经验。引用的推文补充了关键应用：结合GPT-image-2和Gemini等AI工具生成3D生物结构，并开发可交互探索的应用，旨在为课堂教学等场景创造趣味互动体验。

Berryxia.AI: 从此告别无聊的课堂教学! 自己开发趣味互动科学应用创意 ~ 现在使用GPT-image-2 + Gemini 尝试生成3D生物结构,并开发了一款能交互探索这些结构的应用!

图像生成开源生态教程/实践

07:30

DogeDesigner@cb_doge

用这个 @Grok 提示词为妈妈制作一张精美的母亲节贺卡 ❤️ "将这张照片转化为精美专业的母亲节贺卡，采用宝丽来风格大幅居中设计，周围环绕鲜艳花朵与优雅装饰元素，搭配丰富欢快的色彩和典雅的'母亲节快乐'文字，整体保持温暖、精致、视觉惊艳的效果。"

xAI 图像生成教程/实践

04:58

elvis@omarsar0

作者受启发复现了一个利用AI工具栈快速生成3D生物结构的工作流。该流程整合了Gemini Nano Pro生成概念、Tripo进行3D生成、Codex组装代码，并通过HTML构件实现交互式查看。作者认为，此类AI应用将指数级加速学习过程，并推动高质量教育的民主化。其灵感来源于@DilumSanjaya展示的利用GPT生成UI、Gemini编写代码来创建交互式科学探索应用的概念。

Dilum Sanjaya: Fun interactive science app ideas | Part 3 Played around with generating 3D biological structures and made an app to exp...

MCP/工具图像生成多模态教程/实践

5月10日

22:33

阿绎 AYi@AYi_AInotes

精选80

教育科技门槛一夜归零：AI助力单人低成本开发3D教学应用

AI工具GPT Images 2和Gemini 3.1 Pro的出现，彻底颠覆了教育应用的开发模式。过去需多人团队、数月时间和高昂成本才能完成的3D教育应用，如今一个具备领域知识（如生物学）的普通人，仅用约48小时和不到10美元即可实现。这消除了对编程、3D建模等技术能力的依赖，使教师、家长等个体也能独立创造高质量互动教学工具。此举有望推动过去仅属于精英机构的教学资源（如虚拟实验室）普及，为缩小教育不平等提供了新的技术路径。

Dilum Sanjaya: Fun interactive science app ideas | Part 3 Played around with generating 3D biological structures and made an app to exp...

Google OpenAI 图像生成教程/实践

推荐理由：阿易这视频展示了 GPT Images 2 和 Gemini 3.1 Pro 的组合，48 小时从想法到可交互 3D 教学 App，零代码工作流直接可以抄，教育技术门槛真的归零了，做内容的别错过。

22:22

Baidu Inc.@Baidu_Inc

我们将几句经典的妈妈语录翻译成它们通常的真实含义。因为有时"有空打给我"蕴含的意义远不止字面这些。祝所有庆祝的人#母亲节快乐！ 📷 图片由ERNIE-Image生成

图像生成行业动态

10:13

小互@xiaohu

兄弟们这个创意牛P啊 3D 趣味互动科学应用用GPT生成图像，然后使用Gemini 3.1 Pro生成，可以将任何知识的内容制作成3D可交互的效果展示！效果炸裂！

Google OpenAI 图像生成多模态

10:13

小互@xiaohu

创建一个售卖机器人的未来网站效果也不错 GPT 生成图像 → Tripo 3D

图像生成多模态教程/实践

09:13

向阳乔木@vista8

GPT-Image-2为段落生成视觉解释，提升阅读体验

GPT-Image-2能够根据选中的文章段落直接生成视觉化的解释，极大地改善了阅读体验，使其不再枯燥。这一功能展示了AI在将文本内容转化为直观图像方面的应用潜力，为理解和消化复杂信息提供了新的辅助工具。

OpenAI 图像生成多模态教程/实践

07:58

Elon Musk@elonmusk

Grok Imagine 【引用 @heavypulp】：万物皆计算机，但计算机并非万物！

Heavy Pulp: Everything is Computer, but Computer isn't Everything!

xAI 产品更新图像生成

07:44

Berryxia.AI@berryxia

从此告别无聊的课堂教学！自己开发趣味互动科学应用创意 ~ 现在使用GPT-image-2 + Gemini 尝试生成3D生物结构，并开发了一款能交互探索这些结构的应用！

Google OpenAI 图像生成多模态

03:30

🚨 AI News | TestingCatalog@testingcatalog

从提示词到建筑设计：AI驱动住宅设计自动化

推文提出“从提示词到生产”的流程已成现实，并展望未来能实现“从提示词到房地产”，即由机器人从头建造完整建筑。虽然这仍属未来愿景，但 DraftedAI 已率先自动化了“从提示词到家居设计”这一环节。其工具允许用户免费生成理想房屋的详细渲染图并导出，用户既可混搭探索区的现有设计，也能从零开始，且所有细节均可定制。

产品更新图像生成

00:44

歸藏(guizang.ai)@op7418

厌倦了千篇一律的衬线字体和排版？歸藏的 PPT Skill 新主题预告【引用 @op7418】：http://x.com/i/article/2047484171258634240

歸藏(guizang.ai): http://x.com/i/article/2047484171258634240

图像生成教程/实践

5月9日

11:36

Berryxia.AI@berryxia

AI时代原来我的"嘴"才是核心竞争力！😂 靠"嘴口喷"代码，现在直接"靠嘴搞设计"！太特么好了，AI时代我也算是吃上细糠了。

图像生成大佬观点

11:25

宝玉@dotey

GPT Image 2 Prompt：水墨风格 Slides/PPT

本文介绍一个用于生成水墨风格幻灯片画图提示词的模板。该模板结构清晰，包含标题、关键要点、视觉元素、布局偏好、文字层级和延续性说明，旨在指导AI（如Codex）生成具有统一美学风格的幻灯片图像。视觉元素强调宣纸背景、水墨山水等东方元素，整体风格追求静谧、克制、侘寂或当代东亚奢华。通过应用此模板，用户可以简化AI驱动的设计流程，快速获得视觉一致且富有美感的水墨风格PPT素材。文末提供了一个简短的应用示例。

OpenAI 图像生成多模态教程/实践

10:55

宝玉@dotey

精选76

GPT Image 2 Prompt：中文科技新闻爆款封面生成器

这是一个用于生成中文科技新闻爆款封面图的详细提示词框架。它要求AI扮演顶级视觉设计师，根据输入的文章内容自动提取核心新闻、关键数字、产品及行业情绪等信息。设计需融合中国科技媒体头图、B站爆款缩略图等风格，强调强烈的视觉冲击与高信息密度，确保3秒内传递重点。构图包含顶部新闻区、中央超大标题区、主视觉产品区、数据卡片区和底部总结区，配色、字体、背景均需根据文章行业、品牌和情绪动态调整，最终输出专业的16:9横版媒体级封面图。