5月11日

10:48

歸藏(guizang.ai)@op7418

精选78

开源项目“鬼藏PPT技能”迎来重大更新，新增瑞士国际主义视觉风格，提供克莱因蓝等四套主题色。核心升级包括：通过接入GPT-Image 2.0，可根据PPT内容与风格自动生成胶片质感配图、流程图及UI截图美化；支持基于同一内容一键生成公众号、小红书、视频号等多种规格的封面图。更新旨在解决用户对多风格、自动配图及跨平台适配的需求，并通过预设22种版式和严格的视觉规则，确保设计的一致性与专业性。

智能体 GitHub 产品更新图像生成

推荐理由：藏师傅把做PPT的整条链闭环了，从大纲、配图到多平台封面一个对话走完。瑞士风的设计纪律直接写进skill，做出来的PPT终于甩掉AI模板味。

09:45

Berryxia.AI@berryxia

利用开源3D库与工具快速创建3D展示与互动应用

推文讨论了在精度要求不高的3D展示场景下，可直接利用开源3D库快速实现。作者提及Apple Reality Composer及其免费的USDZ/USDC格式官方3D模型库，适用于AR增强现实。对于需要自定义或教学互动的场景，推荐了JigSpace应用。同时，作者分享了使用GitHub上的glTF样本模型快速制作Demo的经验。引用的推文补充了关键应用：结合GPT-image-2和Gemini等AI工具生成3D生物结构，并开发可交互探索的应用，旨在为课堂教学等场景创造趣味互动体验。

Berryxia.AI: 从此告别无聊的课堂教学! 自己开发趣味互动科学应用创意 ~ 现在使用GPT-image-2 + Gemini 尝试生成3D生物结构,并开发了一款能交互探索这些结构的应用!

图像生成开源生态教程/实践

08:00

HuggingFace Daily Papers（社区热门论文）

基于多边形序列生成的平面图重建方法

本文提出Raster2Seq方法，将复杂平面图的重建任务转化为序列到序列学习问题。该方法将房间、门窗等平面图元素表示为同时编码几何与语义信息的多边形序列，并通过自回归解码器，利用可学习锚点引导注意力机制，依据图像特征与已生成角点预测下一个角点。这种设计使模型能够灵活、高效地处理包含大量房间和复杂多边形结构的平面图。实验表明，Raster2Seq在多个标准基准上取得了领先性能，并在更具挑战性的数据集上展现出强大的泛化能力。

arXiv 图像生成论文/研究

07:30

DogeDesigner@cb_doge

用这个 @Grok 提示词为妈妈制作一张精美的母亲节贺卡 ❤️ "将这张照片转化为精美专业的母亲节贺卡，采用宝丽来风格大幅居中设计，周围环绕鲜艳花朵与优雅装饰元素，搭配丰富欢快的色彩和典雅的'母亲节快乐'文字，整体保持温暖、精致、视觉惊艳的效果。"

xAI 图像生成教程/实践

04:58

elvis@omarsar0

作者受启发复现了一个利用AI工具栈快速生成3D生物结构的工作流。该流程整合了Gemini Nano Pro生成概念、Tripo进行3D生成、Codex组装代码，并通过HTML构件实现交互式查看。作者认为，此类AI应用将指数级加速学习过程，并推动高质量教育的民主化。其灵感来源于@DilumSanjaya展示的利用GPT生成UI、Gemini编写代码来创建交互式科学探索应用的概念。

Dilum Sanjaya: Fun interactive science app ideas | Part 3 Played around with generating 3D biological structures and made an app to exp...

MCP/工具图像生成多模态教程/实践

5月10日

22:33

阿绎 AYi@AYi_AInotes

精选80

教育科技门槛一夜归零：AI助力单人低成本开发3D教学应用

AI工具GPT Images 2和Gemini 3.1 Pro的出现，彻底颠覆了教育应用的开发模式。过去需多人团队、数月时间和高昂成本才能完成的3D教育应用，如今一个具备领域知识（如生物学）的普通人，仅用约48小时和不到10美元即可实现。这消除了对编程、3D建模等技术能力的依赖，使教师、家长等个体也能独立创造高质量互动教学工具。此举有望推动过去仅属于精英机构的教学资源（如虚拟实验室）普及，为缩小教育不平等提供了新的技术路径。

Dilum Sanjaya: Fun interactive science app ideas | Part 3 Played around with generating 3D biological structures and made an app to exp...

Google OpenAI 图像生成教程/实践

推荐理由：阿易这视频展示了 GPT Images 2 和 Gemini 3.1 Pro 的组合，48 小时从想法到可交互 3D 教学 App，零代码工作流直接可以抄，教育技术门槛真的归零了，做内容的别错过。

22:22

Baidu Inc.@Baidu_Inc

我们将几句经典的妈妈语录翻译成它们通常的真实含义。因为有时"有空打给我"蕴含的意义远不止字面这些。祝所有庆祝的人#母亲节快乐！ 📷 图片由ERNIE-Image生成

图像生成行业动态

16:33

IT之家（RSS）

尽管裁员千人，Epic 仍表示 AI 不会取代游戏从业者

Epic公司高管表示，人工智能不会取代游戏行业工作岗位，而是用于提升效率、减轻繁重工作负担。尽管该公司在2026年裁员1000人，但坚称裁员与AI无关。Epic正在探索AI工具以支持游戏开发，未来将应用于艺术创意领域，并强调《堡垒之夜》开发中的AI使用由公司统一管控，合作方不得擅自使用。这一立场与索尼、艺电等企业相似，但外界对其“AI不危及就业”的说法仍存质疑。

图像生成行业动态

10:13

小互@xiaohu

兄弟们这个创意牛P啊 3D 趣味互动科学应用用GPT生成图像，然后使用Gemini 3.1 Pro生成，可以将任何知识的内容制作成3D可交互的效果展示！效果炸裂！

Google OpenAI 图像生成多模态

10:13

小互@xiaohu

创建一个售卖机器人的未来网站效果也不错 GPT 生成图像 → Tripo 3D

图像生成多模态教程/实践

09:13

向阳乔木@vista8

GPT-Image-2为段落生成视觉解释，提升阅读体验

GPT-Image-2能够根据选中的文章段落直接生成视觉化的解释，极大地改善了阅读体验，使其不再枯燥。这一功能展示了AI在将文本内容转化为直观图像方面的应用潜力，为理解和消化复杂信息提供了新的辅助工具。

OpenAI 图像生成多模态教程/实践

08:00

HuggingFace Daily Papers（社区热门论文）

基于噪声追踪对的整流流离线偏好优化

针对文本到图像整流流模型，现有偏好数据集仅存储最终图像，无法描述其以特定先验噪声为索引的近似直线轨迹。本研究提出先验噪声感知偏好优化方法，通过保留生成胜出/落败图像时使用的配对先验噪声，将标准三元组扩展为六元组。利用整流流的直线特性，通过噪声-图像插值估计中间状态，从而约束轨迹估计空间并获得更紧致的代理优化目标。此外，引入动态正则化策略，根据奖励差距和训练进度自适应调整正则化强度，提升训练稳定性与样本效率。实验表明，该方法能持续改善偏好指标，同时显著降低训练计算量。

arXiv 图像生成数据/训练论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

微观缺陷暴露宏观伪造：通过局部分布偏移检测AI生成图像

针对AI生成图像检测，本研究提出MDMF框架，通过聚焦局部区域的微观统计异常来识别伪造。该方法引入可学习的“补丁取证签名”，将图像语义块映射到紧凑的取证潜在空间，并利用最大均值差异量化生成图像与真实图像间的分布差异。理论分析表明，当生成图像存在局部取证信号时，基于补丁的建模能产生可证明的更大分布差异，从而实现更可靠的区分。在多个基准测试上的实验表明，MDMF consistently outperforms baseline detectors，验证了其通用有效性。项目页面已公开。

arXiv 图像生成安全/对齐论文/研究

07:58

Elon Musk@elonmusk

Grok Imagine 【引用 @heavypulp】：万物皆计算机，但计算机并非万物！

Heavy Pulp: Everything is Computer, but Computer isn't Everything!

xAI 产品更新图像生成

07:44

Berryxia.AI@berryxia

从此告别无聊的课堂教学！自己开发趣味互动科学应用创意 ~ 现在使用GPT-image-2 + Gemini 尝试生成3D生物结构，并开发了一款能交互探索这些结构的应用！

Google OpenAI 图像生成多模态

03:30

🚨 AI News | TestingCatalog@testingcatalog

从提示词到建筑设计：AI驱动住宅设计自动化

推文提出“从提示词到生产”的流程已成现实，并展望未来能实现“从提示词到房地产”，即由机器人从头建造完整建筑。虽然这仍属未来愿景，但 DraftedAI 已率先自动化了“从提示词到家居设计”这一环节。其工具允许用户免费生成理想房屋的详细渲染图并导出，用户既可混搭探索区的现有设计，也能从零开始，且所有细节均可定制。

产品更新图像生成

00:44

歸藏(guizang.ai)@op7418

厌倦了千篇一律的衬线字体和排版？歸藏的 PPT Skill 新主题预告【引用 @op7418】：http://x.com/i/article/2047484171258634240

歸藏(guizang.ai): http://x.com/i/article/2047484171258634240

图像生成教程/实践

5月9日

12:49

Hacker News 热门（buzzing.cc 中文翻译）

人们讨厌AI艺术

近期网络社区对AI生成艺术的反对情绪显著。许多艺术家和网友批评AI艺术缺乏灵魂与原创性，认为其本质是剽窃人类作品训练而成。在Hacker News等平台的相关讨论中，该话题获得了超过102点热度，反映出广泛的争议。反对者主要担忧AI艺术会挤压人类艺术家的生存空间，并导致创意同质化。这一现象凸显了技术进步与人文价值在艺术领域的深刻冲突。

图像生成现象/趋势

11:36

Berryxia.AI@berryxia

AI时代原来我的"嘴"才是核心竞争力！😂 靠"嘴口喷"代码，现在直接"靠嘴搞设计"！太特么好了，AI时代我也算是吃上细糠了。

图像生成大佬观点

11:25

宝玉@dotey

GPT Image 2 Prompt：水墨风格 Slides/PPT

本文介绍一个用于生成水墨风格幻灯片画图提示词的模板。该模板结构清晰，包含标题、关键要点、视觉元素、布局偏好、文字层级和延续性说明，旨在指导AI（如Codex）生成具有统一美学风格的幻灯片图像。视觉元素强调宣纸背景、水墨山水等东方元素，整体风格追求静谧、克制、侘寂或当代东亚奢华。通过应用此模板，用户可以简化AI驱动的设计流程，快速获得视觉一致且富有美感的水墨风格PPT素材。文末提供了一个简短的应用示例。

OpenAI 图像生成多模态教程/实践

10:55

宝玉@dotey

精选76

GPT Image 2 Prompt：中文科技新闻爆款封面生成器

这是一个用于生成中文科技新闻爆款封面图的详细提示词框架。它要求AI扮演顶级视觉设计师，根据输入的文章内容自动提取核心新闻、关键数字、产品及行业情绪等信息。设计需融合中国科技媒体头图、B站爆款缩略图等风格，强调强烈的视觉冲击与高信息密度，确保3秒内传递重点。构图包含顶部新闻区、中央超大标题区、主视觉产品区、数据卡片区和底部总结区，配色、字体、背景均需根据文章行业、品牌和情绪动态调整，最终输出专业的16:9横版媒体级封面图。

OpenAI 图像生成教程/实践

推荐理由：对做科技自媒体的朋友，这个 prompt 直接把 GPT Image 2 从“能画图”变成了“会做封面”的生产力工具，复制粘贴就能用。

06:52

Luma@LumaLabsAI

你的展位是品牌在展会中最瞩目的时刻。确保它足够出众。定义品牌标识。设定美学风格。 Luma Agents 据此构建所有展位视觉设计。立即创建 → http://lumalabs.ai/app

产品更新图像生成

06:49

Chubby♨️@kimmonismus

这只是时间问题：索尼与万代南梦宫正围绕生成式AI启动合作试点，将这项技术定位为加速游戏开发的手段。索尼表示AI已在面部动画、质量检测、支付处理、视觉保真度以及未来推荐工具方面提供助力。 DLSS和PSSR仅仅是个开始。

图像生成行业动态

01:26

向阳乔木@vista8

AI辅助快速制作PPT的实战方法

作者分享利用AI工具高效制作PPT的流程：首先与AI讨论并生成内容大纲，随后使用Youmind或GPT等工具根据大纲生成配图与底图模板。将生成的图像直接粘贴至Keynote中，最后手动补充或调整无需AI生成的页面。该方法结合了AI自动化生成与人工灵活调整，显著提升了演示文稿的制作效率。

图像生成教程/实践

5月8日