AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 699 条
全部一手资讯X论文
标签「图像生成」清除
Luma@LumaLabsAI · 5月12日26

The finest campaigns don't just show the product. They make you want the world it lives in. Set the vision. Define the aesthetic. Luma Agents build every luxury campaign visual from there. Set the standard → http://lumalabs.ai/app

译最卓越的营销不只展示产品,更让你向往其存在的世界。 设定愿景。定义美学。Luma Agents由此构建所有奢华营销视觉。 树立标准 → http://lumalabs.ai/app

Luma@LumaLabsAI · 5月12日73

The moodboard was always the best part. Now it's just the beginning. Upload your reference. Set the direction. Luma Agents take it from moodboard to finished ad from there. Make it an ad → http://lumalabs.ai/app

译情绪板曾是最精彩的部分。如今它只是起点。 上传你的参考素材。设定方向。Luma Agents 会将其从情绪板转化为完整的广告。 生成广告 → http://lumalabs.ai/app

Luma@LumaLabsAI · 5月12日59

Luma Agents can now generate with Kling Omni. More models. More range. Same workflow. Try it today → https://lumalabs.ai/app

译Luma Agents现已支持通过Kling Omni生成内容。 更多模型。更广范围。相同工作流程。 立即体验 → https://lumalabs.ai/app

PixVerse@PixVerse_ · 5月12日70

ok @PixVerse_ these vibrant panels slap 🔥

译用户通过引用推文展示了由GPT Image 2在PixVerse平台上生成的一组高端时尚编辑图像。该图像采用2行4列的网格布局,包含8个独立面板。每个面板均以不同鲜艳纯色或渐变背景呈现一位身着现代街头服饰的年轻男模特,搭配滑板、吉他等道具,并采用简洁的工作室布景。图像整体追求商业广告摄影风格,具有奢侈品品牌广告的美学质感,强调柔和灯光、清晰阴影、逼真皮肤和电影级质感,且不含任何文字或标识。

PixVerse@PixVerse_ · 5月12日57

PixVerse turning my ancient 144p memes into 4K masterpieces. My meme archive just got a glow up. 🔥

译PixVerse将我古老的144p梗图变成4K杰作。 我的梗图存档刚刚完成华丽升级。🔥

向阳乔木@vista8 · 5月11日31

还是忍不住加功能,给博客增加AI对话侧边栏。 好处是随时对话配图,生成标题等。 比如:“给第一节配信息图,科普风格”,生成后自动插入。 标题生成后,可以说“选第一个”,自动换。 等完善后,同步到开源版本。

译作者为博客增加了AI对话侧边栏功能,旨在提升内容创作效率。该功能允许用户在写作过程中随时与AI对话,以辅助完成配图、生成标题等任务。例如,用户可指令AI“给第一节配信息图,科普风格”,生成的图片会自动插入文中;对于AI生成的多个标题选项,用户只需说“选第一个”即可自动替换。该功能完善后,将同步至开源版本。

凡人小北@frxiaobei · 5月11日49

Tesla 的 FSD 的对比还是挺震撼的,左边人眼看到的完全是一片白茫茫的眩光,右边AI重建出来的画面却清晰可辨。 简单科普一下这个技术: 你手机拍太阳方向会一片白对吧?这是因为相机要把光信号处理成人看得懂的照片,亮的地方直接爆掉了。 但传感器本身其实记录了每个像素接收到多少光子,这些数据还在,只是被 ISP 直接给扔掉了。 Tesla的做法是跳过ISP,把传感器的原始光子计数直接喂给神经网络。 光子计数保留了完整的光强信息,AI从中重建出场景细节,所以右图能在一片白里看到路、树、车。 一个不恰当的比喻,把一本学术论文改写成通俗读物,普通人更容易读了,但专家反而觉得关键细节被删了。

译Tesla FSD通过跳过图像信号处理器,直接处理传感器记录的原始光子计数数据,而非传统相机处理后的人眼可见RGB图像。光子计数保留了完整的光强信息,神经网络据此重建出细节清晰的场景。这使得FSD在夜间或强眩光等极端视觉条件下,能超越人眼感知,从一片白茫茫中识别出路、树、车辆等关键信息,实现更优的视觉感知能力。

Berryxia.AI@berryxia · 5月11日73

兄弟们!这套结构,这个图理解后。 GPT-Image-2 生图也就算是入门了吧。 结构化越清晰,输出的质量越好! 最简单,最实用的,结构拆解和布局! 生成一张【画幅比例】的【用途】视觉图。 主题: 【一句话说清楚要表达什么】 核心主体: 【主体物或人物】,必须位于【画面位置】,占画面【比例】。 主体需要体现【情绪价值】,例如陪伴、信任、重启、增长、专业、秩序、创造力。 视觉隐喻: 用【视觉元素A】象征【抽象概念A】; 用【视觉元素B】象征【抽象概念B】; 避免直白堆砌,要有高级感和传播感。 画面风格: 【Apple 风格 / 人文科技 / 像素风 / 高级信息图 / 博物馆海报 / 产品发布会风格】。 要求干净、克制、高清、可商用、版式精准、文字清晰。 文字系统: 主标题:【中文主标题】 副标题:【中文副标题】 英文短句:【英文短句】 关键词:【3 个关键词】 限制: 不要二维码、不要网址、不要水印、不要杂乱小字、不要廉价广告风、不要错误中文、不要真实墙面或相框。

译推文介绍了一套提升AI生图质量的结构化提示词框架。其核心是“结构越清晰,输出质量越好”。框架将提示系统分解为几个关键模块:首先定义画幅与用途;其次明确主题与核心主体的位置、占比及情绪价值;接着通过视觉隐喻用具体元素象征抽象概念;然后选择如Apple风格等特定画面风格并强调干净、克制等视觉要求;最后规划包含主副标题、英文短句和关键词的文字系统,并列出应避免的限制元素。

Kling AI@Kling_ai · 5月11日15

Baseball game vibe locked in. ⚾ Check out how we created it in Kling AI.

译棒球赛氛围已锁定。⚾ 看看我们如何在Kling AI中创作它。

凡人小北@frxiaobei · 5月11日26

好看啊, 这个就是 AI 时代的审美品味吧。

译好看啊, 这个就是 AI 时代的审美品味吧。 [引用 @op7418]:http://x.com/i/article/2053655813877870592

SenseTime@SenseTime_AI · 5月11日72

𝗦𝗲𝗻𝘀𝗲𝗡𝗼𝘃𝗮 𝗨𝟭 𝗶𝘀 𝗻𝗼𝘄 𝗿𝘂𝗻𝗻𝗮𝗯𝗹𝗲 𝗼𝗻 𝗖𝗼𝗺𝗳𝘆𝗨𝗜. Highly recognised by reviewers — including REBEL AI, who put together a great hands-on walkthrough of the 𝗱𝗲𝗽𝗹𝗼𝘆𝗺𝗲𝗻𝘁 𝘄𝗼𝗿𝗸𝗳𝗹𝗼𝘄, with 𝗿𝗲𝗮𝗹-𝘄𝗼𝗿𝗹𝗱 𝘁𝗲𝘀𝘁𝘀 𝗼𝗳 𝘁𝗵𝗲 𝗺𝗼𝗱𝗲𝗹'𝘀 𝗶𝗺𝗮𝗴𝗲 𝗴𝗲𝗻𝗲𝗿𝗮𝘁𝗶𝗼𝗻 𝗰𝗮𝗽𝗮𝗯𝗶𝗹𝗶𝘁𝗶𝗲𝘀. • 8-step turbo inference — ultra-fast generation • Portraits, surreal art, text signage, creature design & more Watch Video: https://www.youtube.com/watch?v=SYJhzEdN1S0 Try it yourself: 𝗛𝘂𝗴𝗴𝗶𝗻𝗴 𝗙𝗮𝗰𝗲: https://huggingface.co/collections/sensenova/sensenova-u1 𝗚𝗶𝘁𝗛𝘂𝗯: https://github.com/OpenSenseNova/SenseNova-U1 𝗗𝗶𝘀𝗰𝗼𝗿𝗱: https://discord.gg/cxkwXWjp

译SenseNova U1图像生成模型现已在ComfyUI上可运行,并获得包括REBEL AI在内的评测者高度认可。REBEL AI发布的实践教程展示了该模型的部署工作流,并对其图像生成能力进行了真实场景测试。模型支持8步快速推理,生成速度极快,应用场景涵盖人像、超现实艺术、文字标志和生物设计等。相关资源已在Hugging Face、GitHub和Discord平台开放。

阿绎 AYi@AYi_AInotes · 5月11日55

卧槽,6个月→15天! 森马用AI把整个服装行业的底裤都扒了。 真的兄弟们,看完森马的 AI 落地,我直接懵了, 光2025年,AI就给森马带来几个亿的确收回款, 节省视觉、营销、样衣研发等成本数千万, 上新周期从 6 个月,直接压到了 15 天。 这才是真正的AI落地啊,能对业务带来增量价值, 而不是瞎折腾消耗token重复造轮子! 很多人以为传统企业用 AI,就是拍个图写个文案, 没想到森马直接把 AI 做成了全链路基础设施, 覆盖供应链、库存、直播、运营、物流、客服、财务。 整整 400 多个场景。 连整个经营逻辑都重构了, 最狠的是 AIGC 视觉, 以前拍一组模特图要等两个月, 改个背景换个动作,还要再等两个月, 现在 AI 几分钟出图, 效果不输实拍,成本几乎为零, 所有款式全量覆盖,不用再只赌几个爆款, 传统上新是串行的, 一个环节等一个环节, 现在 AI 介入后全并行推进, 不用空等,不用排队, 以上这些都是 2025 年已经跑通的真实案例, 一年带来几亿回款, 省了几千万的成本。 通过森马这个案例让我们看到了, 其实AI 不只是替代人工干活, 还能挖出那些我们根本想不到的隐性成本, 把以前不可能的事,变成日常。 我感觉以后所有传统企业,都会被逼着走这条路啊。 视频大家收好,非常值得收藏和学习! #森马 #AI落地 #服装行业 #AIGC #企业数字化

译森马通过AI技术将服装上新周期从6个月压缩至15天,2025年实现数亿元回款并节省数千万元成本。AI作为全链路基础设施,覆盖供应链、库存、直播、运营等400多个场景,重构经营逻辑。AIGC视觉使图像生成效率提升,成本近乎零,支持全款式并行推进。AI不仅替代人工,更挖掘隐性成本,推动传统企业数字化转型。

PixVerse@PixVerse_ · 5月11日67

Thanks for sharing @aziz4ai ! Great practice!

译用户分享了一个高效AI视频创作流程。他首先利用ChatGPT,基于预设镜头描述,生成了一个结构严谨、支持多镜头序列的详细视频提示词。该提示词严格指定了品牌元素(如瓶身、包装、Logo及阿拉伯文/英文文本)需通过参考附件精确还原,并描述了超奢华、电影感的视觉风格。随后,他将此提示词输入PixVerse平台,借助其高速生成优势,快速产出了1080p分辨率的视频。此工作流有效结合了GPT的精准指令生成能力与PixVerse的快速视频渲染能力,实现了对品牌视觉的严格把控和高效率内容产出。

歸藏(guizang.ai)@op7418 · 5月11日75

来了!藏师傅的 PPT Skill 更新了第二套主题 新主题更加简洁美观,适合讲一些数据和事实性的内容 而且支持 4 种颜色、20 多个版式。 支持用 Codex 内置的 GPT-2.0 帮你生成配图和美化截图。 还能让它帮你生成各种平台的封面,以及公众号配图。 文章里详细讲了一下怎么用,还有一些小技巧。

译藏师傅的PPT Skill工具发布了第二套主题,设计更简洁美观,适用于数据和事实性内容的演示。新主题提供4种颜色和20多种版式选择。其核心功能是集成了Codex内置的GPT-2.0模型,可辅助用户生成演示配图、美化截图,并能自动生成适用于各平台(如公众号)的封面图与配图。相关文章详细介绍了具体使用方法及操作技巧。

PixVerse@PixVerse_ · 5月11日53

Create Image is coming to PixVerse App. Prompt, add references, choose your model, adjust ratio and resolution, then generate directly in the app. Image creation is no longer a side workflow. It is part of PixVerse. RT+Follow+Reply=300Creds(72H ONLY)

译图像生成功能即将登陆PixVerse应用。 输入提示词,添加参考图,选择模型,调整比例和分辨率,即可在应用中直接生成。 图像创作不再是次要工作流。它已成为PixVerse的一部分。 转发+关注+回复=300积分(仅限72小时)

歸藏(guizang.ai)@op7418 · 5月11日78

http://x.com/i/article/2053655813877870592 # 压进我十年设计经验的 PPT Skills,迎来大波更新 上次开源 guizang-ppt-skill(github.com/op7418/guizang-ppt-skill) 之后,大家都非常喜欢,短短几周 Github Star 来到了 6000 多。而且也被非常火的开源 Claude Design 参考放了进去。 我也在线上线下非常多的地方看到了这个 PPT Skill 生成的 PPT。 发布之后,后台收到的问题里出现频率最高的是这几条: "能不能多几种风格?" "配图能不能也帮我搞定?" "做完 PPT 的封面要重新画一遍吗?" 我自己一边用一边记,攒了两周。这次一次性把这些洞补上。 ## 更新了什么 多了一套全新的视觉风格,配图能力直接接入 Codex,PPT 之外的封面也能顺手做了。 具体三件事: - 新增风格 B 瑞士国际主义。全程无衬线、单一高饱和锚点色、网格至上。 - Codex 接入 GPT-Image 2.0。直接生成符合调性的配图,胶片质感的人像、流程图、UI 截图美化。 - 还能多平台封面生成。同一份内容直接拼出小红书、公众号、视频号等多种规格。 ## 触发新风格 装好之后对 Claude 或 Codex 说一句:"帮我做一份瑞士风 PPT。" 如果你之前已经安装的话也可以跟你的 AI 说:帮我更新一下 guizang-ppt-skill 它会反过来问你:克莱因蓝、柠檬黄、柠檬绿、安全橙,四套主题里选哪一套? - 克莱因蓝 IKB,通用、商业发布、AI 产品,默认推荐 - 柠檬黄,年轻、运动、零售、Y2K 复古 - 柠檬绿,生态、可持续、Z 世代品牌 - 安全橙,警示、新闻、活力主题 跟之前一样,不接受自定义 hex。 这条规则我专门写进了 SKILL.md 的硬约束里,原因之前那篇文章讲过,就不重复了。 几个最常用的版式 瑞士风内置了 22 个开箱即用的具名版式,覆盖封面、章节、数据、对比、收尾。 挑六个最有辨识度的说一下: Cover 封面。左半 IKB 底色压一行反白巨字,右半留白配 meta 信息。开场第一页几乎必用。 Statement 巨字宣言。单句话占 9.6vw,整页只剩它和一行小字注脚。适合章节起手、抛核心论点。 KPI Tower 柱阵。四根高度由数据决定的纯色柱子,柱子下面接一行类目。利润率分层、价格档位、转化漏斗这种纵向数字对比一眼就能读懂。 Loop Diagram 闭环图。同心圆环上分布编号步骤,一圈环绕收束。适合讲自学闭环、Agent 自动化循环、产品反馈飞轮这种循环结构。 Duo Compare 对照。中线一道发丝,左右各一组文字加数据。旧体系 vs 新方案、传统 vs AI、Before vs After 都用它。 Closing Manifesto 收尾。左半 IKB 反白一句宣言,右半三条 takeaway 收束全篇。Deck 最后一页推荐固定用这个,和封面构成色彩闭环。 剩下还有横向时间线、Loop 闭环图、Three Forces 三力对峙、System Diagram 系统层级、Why Now 三论点支撑、Tech Spec 产品规格、Image Hero 案例图加 KPI 等等。 每个都对应一种典型内容形态。你一开口说"我要做行业排名"或者"我要做产品 benchmark",AI 自己会从这 22 个里挑最合适的,不用你记名字。 选完主题,剩下的流程跟上一版一样:6 个澄清问题,先出大纲和主题节奏表,对齐之后再写代码。 让 GPT-Image 2.0 帮你出图 如果你在 Codex 环境里用,PPT 写完它会主动问你:"要不要给这份 PPT 生成几张配图?" 如果你需要他会自动帮你按照所选的 PPT 风格和内容生成合适类型配图: 人文纪实照片(胶片质感)、信息图(流程、对比、系统关系)、截图再设计(把你的原图按 PPT 比例重做一遍)、数据大字报、流程图、系统关系图 生成图会自动适配你当前 deck 的风格和主题色。 具体怎么走: - 电子杂志风,信息图就走电子墨水基调,黑白灰为主、少量低饱和强调色、细线条、网格、留白克制 - 瑞士风,信息图就走 Swiss modernism 基调,Helvetica/Inter 气质的无衬线短标签、12/16 列网格、直角 - 选了克莱因蓝 IKB,生成的图就用 IKB 蓝做唯一锚点色。选了柠檬黄、柠檬绿、安全橙也一样跟着换 - 文字语言跟着 deck 走,中文 deck 用中文标签,英文 deck 用英文 - 生成图不带 PPT 外壳,不会冒出页眉、页脚、页码、署名、装饰边框这些东西 这个细节的好处是,整本 deck 的视觉一致性不用你来盯。 你不会遇到 PPT 是 IKB 蓝、配图却跑出一抹绿这种割裂,也不用一边写 PPT 一边给 GPT-Image 调 prompt。 跨工具的视觉漂移,是我自己用 AI 做内容这两年最折腾的隐形成本。 能在 Skill 这一层把它消化掉,用户就少操心一件事。 让它帮你做平台封面 PPT 做完,发出去之前永远要解决三种规格:公众号 21:9 头图、小红书 3:4 竖图、视频号横版封面。 直接说:"基于这份 PPT 的核心观点,给我一张 3:4 的小红书封面。"或者:"来一张 21:9 的公众号头图。"AI 会按 Skill 的视觉规则出图(同一套主题色、同一套字体、单焦点法则)。 需要批量也行。小红书的轮播图机制下,让它"批量出 6 张,风格统一、字号一致、版式各异",一次出齐。 公众号比较特殊,头图是 21:9,但分享卡用的是 1:1 的方图,两张需要视觉连贯。 做法是分两次生成,但用同一套色彩和文案: - 第一张 21:9 主头图,主标题压在左侧,右侧留视觉锚点 - 第二张 1:1 方图,作为分享卡的视觉延伸,主元素和头图呼应 我自己常用的两套版式:纯色底 + 巨字 + 角标日期,或者左半图右半字的对开。 ## 几个值得分享的小巧思 巧思一:用胶片质感对抗"AI 感" 写一个分享,讲"一个人做了一个产品",需要一张能传递"独自工作"情绪的图。 以前的办法是去 Unsplash 翻半小时,或者放一张明显是 stock photo 的摆拍。 现在直接说:"生成一张 16:10 的纪实照片,主题是深夜工作室一个人对着屏幕,自然光、低饱和、轻微胶片颗粒、Fujifilm 质感。" 出来的图带克制的人文温度,看不太出塑料感。 我把这个判断写进了 references/image-prompts.md: 胶片质感是 GPT-Image 2.0 之于 PPT 配图最大的价值。它把"AI 生成"这个标签从图里去掉了。 巧思二:把奇葩比例的截图重做一遍 很多内容创作者手头都有一堆原始截图:产品 UI、后台页面、数据看板,比例各异,留白也不一致。 塞进 PPT 之后整本视觉立刻乱掉。以前的解决办法是 Photoshop 修。 现在你只需要把原图丢给 Codex: "按照 16:10 比例重做一版,保留所有 UI 元素,加点真实工作场景的环境,画面密度中等。" 它会重新生成一张符合 PPT 规范的图,关键信息一个不落,比例和留白完全统一。 这件事对产品测评类内容尤其有用。所有截图过一遍 GPT-Image 2.0,整本 PPT 立刻像同一个人做的。 巧思三:用 PPT 模板"包裹"AI 图 这是我自己测出来的一个用法。 GPT-Image 2.0 生成的图单独发出去,AI 检测工具大概率会标"疑似 AI 生成"。 这件事在社交媒体这种平台上会影响推荐权重。 但把这张图放进 PPT 模板,再整体截图,结果就完全不一样了。 这件事的本质是把 AI 生成的素材组装成一个完整作品,添加了人工痕迹。 还是基于你的大纲事实的表达,没有虚构,只是避免被算法误伤。 ## 它为什么好看 聊完攻略,最后聊聊设计思路。这套瑞士风的视觉规则到底从哪来。 我给它的视觉锚点是 Massimo Vignelli 加 Helvetica Forever。 纽约地铁系统、Unimark、Müller-Brockmann 那一脉的瑞士国际主义传统。 如果你打开过 Helvetica Forever 那本书,或者看过 Vignelli 给纽约地铁做的 1970 年版导视系统,就会认出这套语言。 把两种风格放在一起对比,差别一下就出来了: 简单说:A 适合讲故事,B 适合讲事实。 7 条设计纪律 瑞士风的视觉规则其实就七条,每一条都是行业沉淀,一百年前就有了。 我做的事,是把它们一条条写进 Skill,让 AI 替我执行。 第一条,单一锚点色。一份 deck 里只允许一个高亮色。蓝就只有蓝,黄就只有黄,绝对不能蓝黄拼贴。这是瑞士风的灵魂。Less is more 不止是口号,要落到代码层面写成硬规则。 第二条,极致字号对比。主标题与正文比例至少 8:1。封面巨字宣言用 min(11.6vw, 19vh),正文 1.1vw。视觉张力全靠这种对比拉出来,靠装饰是出不来的。 第三条,大字越大越细。主标题字重 200(ExtraLight),别用 700、800、900。瑞士风的大字像建筑蓝图上的标尺,要被看见但不能喧哗。这条我吃过亏,一开始写的是 800,整页瞬间像 PowerPoint。 第四条,直角纯色。border-radius、box-shadow、linear-gradient,三件事一律砍掉。所有色块都是直角,所有边界都是 1px 发丝线。看上去苛刻,但你看到的所有"消费 app 感""SaaS 模板感",都是这三个属性滥用出来的。 第五条,网格至上。16 列 grid 加 16px gap,所有元素吸附到网格,左对齐加大幅留白做非对称美学。不要居中,不要平均分布。 第六条,没有 WebGL 背景。风格 A 用 WebGL 流体做呼吸感,瑞士风刻意把这个去掉了。纯白底就是它的底色,任何动态背景都是干扰。 ## 写在最后 这次更新的核心,其实只回答了一个问题:人 × AI 协作做内容这件事,链条到底有多长? 之前那次开源,我把"做 PPT"这个环节做完了。 这次往前接了"配图生成",往后接了"多平台封面"。再加一个新风格、一套新色彩闭环,整个链条就闭合了。 从写大纲、生成 PPT、配图、导出、到发布到不同平台。以前要打开 5 个软件,现在在一个对话里能走完。 为什么在市面上已经有了如此多的 PPT Skills 的情况下。 藏师傅的 PPT Skills 依然能获得如此大的使用量和关注量呢? AI 永远只能做 70 分的事情。这两套模板的每一页版式,都是在 AI 的基础上,我通过人工一点一点的微调实现的。也就是说,我在用自然语言进行设计。 即使在 AI 时代,90 分的内容依然是弥足珍贵的。 Skill 已经更新到 GitHub:github.com/op7418/guizang-ppt-skill 更新方式跟上次一样。README 里有"给 AI 的安装 prompt",复制粘贴给你的 Claude Code、Codex 或任何有 shell 权限的 AI Agent,它会自动拉取最新版本。 装好之后对它说一句"帮我做一份瑞士风 PPT"就会触发新风格。 如果觉得对你有帮助,欢迎点赞分享,也欢迎在评论区贴一下你用这套 Skill 做的 PPT 或者封面。

译开源项目“鬼藏PPT技能”迎来重大更新,新增瑞士国际主义视觉风格,提供克莱因蓝等四套主题色。核心升级包括:通过接入GPT-Image 2.0,可根据PPT内容与风格自动生成胶片质感配图、流程图及UI截图美化;支持基于同一内容一键生成公众号、小红书、视频号等多种规格的封面图。更新旨在解决用户对多风格、自动配图及跨平台适配的需求,并通过预设22种版式和严格的视觉规则,确保设计的一致性与专业性。

Berryxia.AI@berryxia · 5月11日56

看大家昨天都因为这个项目卧槽了一天! 朋友们都开始整活儿,其实对于精度要求不高只是展示3D的就是可以直接使用开源的一些3D库就可以拿来使用。 我最早接触和了解这玩意还是Apple的 Reality Composer,官方也提供了对应的3D USDZ/USDC 格式的3D 模型库,并且都是免费的。 直接导入页面还可以做AR增强现实使用,如果说你需要自定义或者进行进行教学互动炸裂就可以看看JigSpace 做的非常不错的教学类的App。 Apple 官方组3D模型库:https://developer.apple.com/augmented-reality/quick-look/ 我这个做的Demo 用的github:https://github.com/KhronosGroup/glTF-Sample-Models 模型:https://modelviewer.dev/ 看看各位还可以玩出什么花儿,这个是花了20分钟搞出来的,后面可以继续迭代一下。

译推文讨论了在精度要求不高的3D展示场景下,可直接利用开源3D库快速实现。作者提及Apple Reality Composer及其免费的USDZ/USDC格式官方3D模型库,适用于AR增强现实。对于需要自定义或教学互动的场景,推荐了JigSpace应用。同时,作者分享了使用GitHub上的glTF样本模型快速制作Demo的经验。引用的推文补充了关键应用:结合GPT-image-2和Gemini等AI工具生成3D生物结构,并开发可交互探索的应用,旨在为课堂教学等场景创造趣味互动体验。

DogeDesigner@cb_doge · 5月11日62

Use this @Grok prompt to create a beautiful Mother’s Day greeting card for your mom ❤️ "Transform this into a beautiful, professional Happy Mother’s Day greeting card, featuring the photo as a large Polaroid-style centerpiece, surrounded by bright vibrant flowers, elegant decorative elements, rich cheerful colors, and classy ‘Happy Mother’s Day’ text while keeping the overall design warm, polished, and visually stunning."

译用这个 @Grok 提示词为妈妈制作一张精美的母亲节贺卡 ❤️ "将这张照片转化为精美专业的母亲节贺卡,采用宝丽来风格大幅居中设计,周围环绕鲜艳花朵与优雅装饰元素,搭配丰富欢快的色彩和典雅的‘母亲节快乐’文字,整体保持温暖、精致、视觉惊艳的效果。"

elvis@omarsar0 · 5月11日66

This is just mindblowing stuff! I couldn't resist replicating this workflow to generate 3D biological structures. In a few minutes, I designed an artifact specifically built to generate these for any topic. Stack: - HTML Artifact to view diagrams - Gemini Nano Pro for concept generation - Tripo for generative 3D - Codex for assembling everything AI will exponentially accelerate learning and democratize high-quality education. Stay tuned! We have a few releases on this front.

译作者受启发复现了一个利用AI工具栈快速生成3D生物结构的工作流。该流程整合了Gemini Nano Pro生成概念、Tripo进行3D生成、Codex组装代码,并通过HTML构件实现交互式查看。作者认为,此类AI应用将指数级加速学习过程,并推动高质量教育的民主化。其灵感来源于@DilumSanjaya展示的利用GPT生成UI、Gemini编写代码来创建交互式科学探索应用的概念。

阿绎 AYi@AYi_AInotes · 5月10日80

holy shit,The barrier to educational technology has vanished overnight. 这回教育科技的门槛,一夜之间归零了, why?来往下看,最后附上了任何人都可以做的零代码工作流教程 💻 • 2020年:做一个同等质量的3D教育App,需要3D建模师×2 + UI设计师×1 + 生物学家×1 + 前端工程师×3 + 产品经理×1,耗时6个月,成本80万美元。 • 2026年:一个懂生物的普通人,用GPT Images 2 + Gemini 3.1 Pro,48小时,成本不到10美元。 没有团队,没有融资,没有技术门槛, 你甚至都不需要会3D建模,不需要会写React,不需要懂Three.js。 你只需要懂生物学,知道什么是对学生重要的。 AI会帮你把所有的技术活全部干完。 damn,这简直就是生产关系的效率革命, 以前教育科技是大公司和亿万富翁的游戏。 现在,任何一个老师,任何一个父母,任何一个对某个领域有热情的人,都能做出比教科书好100倍的教学工具。 过去只有伊顿公学和哈佛附中才有虚拟实验室, 现在,任何一个能上网的家庭,花10美元就能给自己的孩子做一个专属的。 教育不平等,第一次有了被反向拉平的可能! 可1:1复制的零代码工作流,任何人都能做,老规矩评论区自取👇

译AI工具GPT Images 2和Gemini 3.1 Pro的出现,彻底颠覆了教育应用的开发模式。过去需多人团队、数月时间和高昂成本才能完成的3D教育应用,如今一个具备领域知识(如生物学)的普通人,仅用约48小时和不到10美元即可实现。这消除了对编程、3D建模等技术能力的依赖,使教师、家长等个体也能独立创造高质量互动教学工具。此举有望推动过去仅属于精英机构的教学资源(如虚拟实验室)普及,为缩小教育不平等提供了新的技术路径。

Baidu Inc.@Baidu_Inc · 5月10日25

We translated a few classic mom phrases into what they usually actually mean. Because sometimes "call me when you can" means a lot more than just the words themselves. Happy #MothersDay to all who celebrate! 📷 Images created with ERNIE-Image

译我们将几句经典的妈妈语录翻译成它们通常的真实含义。 因为有时“有空打给我”蕴含的意义远不止字面这些。 祝所有庆祝的人#母亲节快乐! 📷 图片由ERNIE-Image生成

小互@xiaohu · 5月10日58

兄弟们 这个创意牛P啊 3D 趣味互动科学应用 用GPT生成图像,然后使用Gemini 3.1 Pro生成,可以将任何知识的内容制作成3D可交互的效果展示! 效果炸裂!

小互@xiaohu · 5月10日53

搞个售卖机器人的未来网站效果也不错 GPT 生图 → Tripo 3D

译创建一个售卖机器人的未来网站效果也不错 GPT 生成图像 → Tripo 3D

向阳乔木@vista8 · 5月10日60

GPT-Image-2 给文章配图太爽了。 选中一个段落,直接生成视觉化的解释,这比读枯燥的文字体验好不少。 https://blog.qiaomu.ai/what-are-diffusion-models

译GPT-Image-2能够根据选中的文章段落直接生成视觉化的解释,极大地改善了阅读体验,使其不再枯燥。这一功能展示了AI在将文本内容转化为直观图像方面的应用潜力,为理解和消化复杂信息提供了新的辅助工具。

Elon Musk@elonmusk · 5月10日44

Grok Imagine

译Grok Imagine [引用 @heavypulp]:万物皆计算机,但计算机并非万物!

Berryxia.AI@berryxia · 5月10日48

从此告别无聊的课堂教学! 自己开发趣味互动科学应用创意 ~ 现在使用GPT-image-2 + Gemini 尝试生成3D生物结构,并开发了一款能交互探索这些结构的应用!

🚨 AI News | TestingCatalog@testingcatalog · 5月10日46

The "prompt-to-production" flow is already a reality. I hope that in the foreseeable future, we will be able to "prompt-to-real estate" as well, with robots building a complete building from the ground up. For now, it is still too futuristic, but @DraftedAI has already automated the "prompt-to-home-design" step. > Drafted AI has a tool that lets you generate your dream house for FREE and export its detailed rendering. > Users can remix existing designs from the explore section or start from scratch. All the details can be customized. I need a new house now 👀

译推文提出“从提示词到生产”的流程已成现实,并展望未来能实现“从提示词到房地产”,即由机器人从头建造完整建筑。虽然这仍属未来愿景,但 DraftedAI 已率先自动化了“从提示词到家居设计”这一环节。其工具允许用户免费生成理想房屋的详细渲染图并导出,用户既可混搭探索区的现有设计,也能从零开始,且所有细节均可定制。

歸藏(guizang.ai)@op7418 · 5月10日31

厌倦了千篇一律的衬线字体和排版? 歸藏的 PPT Skill 新主题预告

译厌倦了千篇一律的衬线字体和排版? 歸藏的 PPT Skill 新主题预告 [引用 @op7418]:http://x.com/i/article/2047484171258634240

Berryxia.AI@berryxia · 5月9日28

AI时代原来我的“嘴”才是核心竞争力!😂 靠“嘴口喷”代码,现在直接“靠嘴搞设计”! 太特么好了,AI时代我也算是吃上细糠了。

宝玉@dotey · 5月9日71

GPT Image 2 Prompt:水墨风格 Slides/PPT 可以把下面的提示词模板发给 Agent,让 Agent 帮你生成每一页 Slides 的画图 Prompt,Codex 这样有画图能力的直接出图。 --- 提示词模板 --- Title: [在此输入幻灯片标题] Key Points: - [要点 1:简洁的描述] - [要点 2:核心数据或事实] - [要点 3:关键结论] Visual Elements: [描述视觉元素,例如:纹理宣纸背景 (Textured rice paper background)、水墨山水 (Ink-wash motifs)、 简约的圆圈 (Enso circle)、红色印章 (Red seal mark)、雾气效果 (Mist-grey effects)]。 整体风格应保持 [Quiet / Restrained / Wabi-Sabi / Contemporary East-Asian Luxury]。 Layout Preference: [布局说明,例如:左右分割 (Split layout)、居中对齐 (Centered layout)、 文字居左且右侧留白 (Left-aligned text with negative space)]。 Text Hierarchy: [文字层级,例如:标题使用大号衬线字体 (Large Display Serif),正文使用易读的衬线字体 (Body Serif), 确保视觉平衡和清晰的阅读顺序]。 Continuity Note: [延续性说明,例如:保持与前一页相同的背景纹理和色调 (#F5F0E8, #2C3E2D), 使用相似的印章位置以维持视觉一致性]。 ----- 示例 ------ Title: Agent Loop 深度解析: 揭秘 AI 智能体的心脏. Key Points: 核心定义、主要职责、设计目标。 Visual Elements: 大号优雅标题,背景为宣纸纹理,带有淡淡的水墨山水和圆圈笔触,角落处有红色小印章。 Layout: 干净的布局,大量留白(Open Sky)。 Text Hierarchy: 标题最为突出,下方是较小的正文。

译本文介绍一个用于生成水墨风格幻灯片画图提示词的模板。该模板结构清晰,包含标题、关键要点、视觉元素、布局偏好、文字层级和延续性说明,旨在指导AI(如Codex)生成具有统一美学风格的幻灯片图像。视觉元素强调宣纸背景、水墨山水等东方元素,整体风格追求静谧、克制、侘寂或当代东亚奢华。通过应用此模板,用户可以简化AI驱动的设计流程,快速获得视觉一致且富有美感的水墨风格PPT素材。文末提供了一个简短的应用示例。

宝玉@dotey · 5月9日76

GPT Image 2 Prompt:中文科技新闻爆款封面生成器 --- Prompt --- 你是一名顶级中文科技媒体视觉设计师。 你的任务是: 根据用户输入的一整篇文章内容,自动提取核心新闻、关键数字、核心产品、行业情绪和信息层级,并生成一张高冲击力的中文科技新闻文章封面图。 图片比例:16:9 横版。 --- 【整体风格】 生成一张「中文科技媒体爆款封面图」。 整体风格参考: * 中国科技媒体头图 * B站科技区爆款缩略图 * 财经新闻视觉 * 游戏行业信息图 * 高冲击力 YouTube Thumbnail * “行业突发新闻”视觉风格 要求: * 强烈视觉冲击 * 信息密度高 * 3 秒内看懂新闻重点 * 专业媒体感 * 大量数据卡片 * 中文粗黑大标题 * 明确的产品主视觉 * 明确的情绪表达 * 不要极简风 * 不要 Apple 风 * 不要电影海报风 * 要像“行业大事件” --- 【自动分析文章】 你必须先自动从文章中提取: 1. 最适合作为封面的主标题 2. 最有冲击力的副标题 3. 最重要的数字 4. 最大涨幅、跌幅或变化幅度 5. 最核心的产品、品牌或人物 6. 最能制造视觉冲击的信息 7. 用户最关心的结论 8. 文章整体情绪 文章情绪可以是: * 暴涨 * 暴跌 * 涨价 * 崩盘 * 封禁 * 突破 * 发布 * 革命 * 危机 * 反转 * 震动 * 警告 * 机会 * 行业洗牌 然后把这些信息转化为视觉设计。 --- 【构图结构】 画面采用高密度信息图式布局,自动生成以下区域: 1. 顶部新闻区 * 放品牌名、产品名或行业标签 * 加入“突发”“官方宣布”“重磅”“最新”“行业震动”等新闻标签 * 标签内容根据文章情绪自动选择 2. 中央超大标题区 * 使用超巨大中文标题 * 字体粗壮 * 强烈立体感 * 可带轻微破损、压迫、速度或科技纹理 * 关键词用高亮色突出 * 标题必须短、狠、直接 * 让读者 3 秒内知道发生了什么 3. 主视觉产品区 * 自动识别文章中的核心产品、品牌、设备、人物或象征物 * 将其作为画面最大视觉主体之一 * 产品应有透视感、层次感、光效和冲击力 * 背后可以加入行情图、能量光、箭头、爆炸线、科技 HUD、速度线等元素 4. 数据卡片区 自动把文章中的关键信息做成多个卡片,包括但不限于: * 价格变化 * 涨跌幅 * 时间节点 * 地区差异 * 销量 * 成本 * 市值 * 用户影响 * 行业对比 数据卡片要求: * 旧数据可以使用删除线 * 新数据必须更醒目 * 百分比、金额、时间必须突出 * 每张卡片只表达一个重点 * 卡片之间层级清晰,不要堆成一团 5. 底部总结区 自动提取文章中的 3–5 个结论,做成图标化摘要: * 原因 * 影响 * 趋势 * 风险 * 机会 * 用户建议 * 行业判断 每个结论用「图标 + 短句」呈现。 --- 【配色策略】 不要固定使用某一种配色。 你必须根据文章的行业、品牌、情绪和新闻性质,自动生成一套高冲击力封面配色。 配色必须遵循以下原则: 1. 品牌优先 如果文章中出现明确品牌、产品或公司,优先提取其品牌识别色作为主色调。 但不要机械复制 Logo 颜色,要转化为更适合封面的高对比视觉系统。 2. 情绪优先 根据新闻情绪自动选择色彩方向: * 涨价、危机、封禁、暴雷、裁员、监管、事故: 使用高压迫感、高警示感、高对比色彩。 * 发布、升级、突破、胜利、增长: 使用更明亮、更有能量的科技色彩。 * AI、芯片、未来科技、模型发布: 使用冷色科技感配色。 * 财经、股价、市值、成本、价格: 使用金融信息图配色。 * 游戏、娱乐、消费电子: 使用更强烈、更年轻、更商业化的高饱和配色。 3. 对比关系 画面必须建立清晰的对比层级: * 背景色:负责情绪氛围 * 主标题色:必须与背景形成强烈反差 * 重点数字色:必须是全图最醒目的颜色之一 * 辅助信息色:降低饱和度,避免抢主标题 * 警示/强调色:只用于关键词、箭头、涨跌幅和标签 4. 色彩数量控制 整张图控制在 3–5 个主要颜色内: * 1 个主背景色 * 1 个品牌/主题主色 * 1 个强强调色 * 1 个文字高对比色 * 1 个辅助信息色 不要使用过多杂乱颜色。 即使信息密度很高,配色也必须统一。 5. 信息情绪匹配 配色必须服务于文章核心情绪: * 坏消息:压迫感、警示感、冲击感 * 好消息:爆发感、速度感、未来感 * 行业分析:专业感、数据感、冷静但有冲击力 * 消费建议:让用户一眼看到风险、机会或行动窗口 6. 禁止事项 * 不要默认使用红黑配色 * 不要使用柔和小清新配色,除非文章本身是生活方式、教育、亲子、文艺类主题 * 不要使用低对比配色 * 不要让背景色、标题色和数字色互相打架 * 不要因为品牌色存在,就牺牲可读性 --- 【字体】 * 中文超粗黑体 * 大标题必须极其醒目 * 数字和百分比必须巨大 * 重要数字可以使用描边、阴影、立体效果 * 字体要有新闻冲击感 * 不要使用纤细字体 * 不要使用文艺字体 --- 【背景】 根据文章情绪自动选择背景元素: * 财经/涨跌类:行情图、上涨/下跌箭头、数字网格、金融曲线 * AI/科技类:HUD、芯片纹理、发光线条、数据流 * 游戏/消费电子类:产品光效、速度线、爆炸形状、品牌元素 * 危机/监管类:警示纹理、印章、封条、暗色压迫背景 * 发布/突破类:光束、能量环、未来感渐变、发光粒子 背景不能太空。 但也不能干扰标题和数字阅读。 --- 【排版原则】 * 信息密度高,但层级必须清晰 * 一眼先看标题 * 第二眼看产品 * 第三眼看关键数字 * 第四眼看细节卡片 * 所有文字必须尽量清晰可读 * 中文排版要像专业媒体编辑做的封面 * 不要平均用力 * 不要把所有信息做得一样大 --- 【输出要求】 最终输出一张: * 专业 * 高冲击力 * 媒体级 * 中文科技新闻封面图 * 16:9 横版 * 信息密集但清晰 * 适合作为公众号、视频封面、文章头图使用 --- 【用户文章】 {{ARTICLE}}

译这是一个用于生成中文科技新闻爆款封面图的详细提示词框架。它要求AI扮演顶级视觉设计师,根据输入的文章内容自动提取核心新闻、关键数字、产品及行业情绪等信息。设计需融合中国科技媒体头图、B站爆款缩略图等风格,强调强烈的视觉冲击与高信息密度,确保3秒内传递重点。构图包含顶部新闻区、中央超大标题区、主视觉产品区、数据卡片区和底部总结区,配色、字体、背景均需根据文章行业、品牌和情绪动态调整,最终输出专业的16:9横版媒体级封面图。

Luma@LumaLabsAI · 5月9日19

Your booth is your brand's biggest moment in the room. Make sure it looks the part. Define the identity. Set the aesthetic. Luma Agents build every booth graphic from there. Build it now → http://lumalabs.ai/app

译你的展位是品牌在展会中最瞩目的时刻。 确保它足够出众。 定义品牌标识。 设定美学风格。 Luma Agents 据此构建所有展位视觉设计。 立即创建 → http://lumalabs.ai/app

Chubby♨️@kimmonismus · 5月9日57

It was just a matter of time: Sony and Bandai Namco are launching a collaborative pilot around generative AI, positioning the tech as a way to speed up game development. Sony says AI is already helping with facial animation, QA, payments, visual fidelity, and future recommendation tools. With DLSS and PSSR were just the beginning.

译这只是时间问题:索尼与万代南梦宫正围绕生成式AI启动合作试点,将这项技术定位为加速游戏开发的手段。 索尼表示AI已在面部动画、质量检测、支付处理、视觉保真度以及未来推荐工具方面提供助力。 DLSS和PSSR仅仅是个开始。

向阳乔木@vista8 · 5月9日61

本周日参加朋友组织的Agent Skills黑客松。 希望让分享15分钟,想了半天。 发现最简单做PPT的方式: 1. 设想下分享内容,跟 AI 讨论出大纲。 2. 把大纲发给Youmind或GPT生图。(顺带做些底图模版) 3. 把生成的图粘到Keynote 4. 缺的页面或不需要AI生图的,底图模版加文字手动调整即可

译作者分享利用AI工具高效制作PPT的流程:首先与AI讨论并生成内容大纲,随后使用Youmind或GPT等工具根据大纲生成配图与底图模板。将生成的图像直接粘贴至Keynote中,最后手动补充或调整无需AI生成的页面。该方法结合了AI自动化生成与人工灵活调整,显著提升了演示文稿的制作效率。

歸藏(guizang.ai)@op7418 · 5月8日72

最近抖音上把你的户外照片做成“法天象地”效果的图片非常火。 他们大多是生成的图片,但我试了一下,直接生成视频的效果会更好。 优化了一下提示词,主要是 GPT-Image-2.0 加上 C-Down 3.0。图片的提示词我放在视频后面了。

译抖音近期流行的“法天象地”户外照片特效多基于图片生成,但实际测试表明直接生成视频效果更佳。作者通过优化提示词实现了这一改进,关键采用了 GPT-Image-2.0 与 C-Down 3.0 技术组合,并将优化后的图片提示词附在视频内容后供参考。这一方法提升了特效的动态表现力与视觉冲击力。

-Zho-@ZHO_ZHO_ZHO · 5月8日52

“ 有人认为,只要将某些视觉元素的集合(照片、字体、插图)以赏心悦目的方式进行排布,就能得出好的布局(layout),这是对 平面设计师 职能的错误认识 ” 保罗兰德(Paul Rand)的这段正好能解释/说明 为何 目前 AI 图像生成 还不能达到真正的 设计标准 文:《Paul Rand:A Designer’s Art》

译推文引用设计师保罗·兰德的观点,指出仅将视觉元素进行美观排列不等于好的布局,这是对平面设计师职能的误解。作者借此解释当前AI图像生成技术为何尚未达到真正的设计标准。兰德强调,设计超越表面的视觉组合,涉及更深层的构思与判断,而这正是当前AI所缺乏的核心能力。

Berryxia.AI@berryxia · 5月8日24

当我看到金拱门丑陋的海报后… 你觉得这个提升咋样? 一句话😂搞掂

译用户@berryxia在星巴克活动期间,偶然创作出一个高效的GPT提示词,并在多个案例中验证了其出色的效果,对此感到惊喜。主推文作者在看到麦当劳的海报后,联想到此提示词可能带来的提升效果,并以幽默口吻询问反馈。核心在于分享一个由日常场景激发、经过实践验证的优秀AI工具使用技巧。

向阳乔木@vista8 · 5月8日59

好像是丁师傅分享的网站? 趋势中的HTML模版都好有设计感,可以发给AI参考学习。 不然Claude 和 Codex的默认设计风格,很快就会成为新的AI味。 网址见评论

OpenRouter@OpenRouter · 5月8日56

Live on OpenRouter: @recraftai. Recraft V4 is an image generation model tuned for high aesthetics - art-directed composition, lighting, and color that feels intentional, not stock. Built with artists and designers for branding, conceptual work, and creative exploration. More on V4 and V4 Pro below 🧵

译现已在OpenRouter上线:@recraftai。 Recraft V4是一款为高审美调校的图像生成模型——具备艺术指导的构图、光影与色彩,呈现精心设计感而非素材堆砌。该模型与艺术家和设计师共同打造,适用于品牌塑造、概念创作和创意探索。 更多关于V4和V4 Pro的信息如下 🧵

Orange AI@oran_ge · 5月8日49

GPT image 2.0 这个模型真实深不可测 发布两周了,每天都能发现它的新能力 一个是刷到昨天阑夕分享的文字海报玩法 另一个是 Labnana 社区的群友的认证:GPT 的二次元画风把香蕉按在地上摩擦。。 这个模型甚至都不用给参考图,提到名字 IP 就直接出来了 相比之下,Banana 2 是个不太成功的模型,文字和二次元效果都不如 Pro,Grok 除了尺度大,其他一无是处。 Labnana 现在把 GPT Images 2.0 的免费体验作为一个长期福利,大部分用户只要签到和邀请积分基本就够用了 注册地址 https://labnana.com/

译GPT Image 2.0模型发布后持续展现惊人能力,无需参考图即可根据名称或IP生成高质量内容,尤其在二次元画风上表现卓越,被社区认为远超Banana 2等模型。Labnana社区现已将GPT Image 2.0的免费体验作为长期福利,用户通过签到和邀请获取积分即可基本满足使用需求。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月12日
07:29
Luma@LumaLabsAI
26
最卓越的营销不只展示产品,更让你向往其存在的世界。 设定愿景。定义美学。Luma Agents由此构建所有奢华营销视觉。 树立标准 → http://lumalabs.ai/app
产品更新图像生成视频
04:59
Luma@LumaLabsAI
73
情绪板曾是最精彩的部分。如今它只是起点。 上传你的参考素材。设定方向。Luma Agents 会将其从情绪板转化为完整的广告。 生成广告 → http://lumalabs.ai/app
智能体产品更新图像生成视频
02:59
Luma@LumaLabsAI
59
Luma Agents现已支持通过Kling Omni生成内容。 更多模型。更广范围。相同工作流程。 立即体验 → https://lumalabs.ai/app
产品更新图像生成视频
01:53
PixVerse@PixVerse_
70
用户通过引用推文展示了由GPT Image 2在PixVerse平台上生成的一组高端时尚编辑图像。该图像采用2行4列的网格布局,包含8个独立面板。每个面板均以不同鲜艳纯色或渐变背景呈现一位身着现代街头服饰的年轻男模特,搭配滑板、吉他等道具,并采用简洁的工作室布景。图像整体追求商业广告摄影风格,具有奢侈品品牌广告的美学质感,强调柔和灯光、清晰阴影、逼真皮肤和电影级质感,且不含任何文字或标识。

Cherry 2.O: GPT Image 2 on @PixVerse_ Prompt 👇 Ultra high-end fashion editorial collage in a 2 rows and 4 columns grid layout (tota...

OpenAI图像生成教程/实践
01:23
PixVerse@PixVerse_
57
PixVerse将我古老的144p梗图变成4K杰作。 我的梗图存档刚刚完成华丽升级。🔥
产品更新图像生成视频
5月11日
23:50
向阳乔木@vista8
31
博客集成AI对话侧边栏,辅助内容创作

作者为博客增加了AI对话侧边栏功能,旨在提升内容创作效率。该功能允许用户在写作过程中随时与AI对话,以辅助完成配图、生成标题等任务。例如,用户可指令AI“给第一节配信息图,科普风格”,生成的图片会自动插入文中;对于AI生成的多个标题选项,用户只需说“选第一个”即可自动替换。该功能完善后,将同步至开源版本。

产品更新图像生成开源生态
23:32
凡人小北@frxiaobei
49
Tesla FSD跳过ISP,用原始光子计数重建清晰视觉

Tesla FSD通过跳过图像信号处理器,直接处理传感器记录的原始光子计数数据,而非传统相机处理后的人眼可见RGB图像。光子计数保留了完整的光强信息,神经网络据此重建出细节清晰的场景。这使得FSD在夜间或强眩光等极端视觉条件下,能超越人眼感知,从一片白茫茫中识别出路、树、车辆等关键信息,实现更优的视觉感知能力。

Elon Musk: The human-perceived RGB is image 1 and the Tesla AI photon count reconstruction is image 2. This is why Tesla FSD can se...

图像生成多模态教程/实践
22:48
Berryxia.AI@berryxia
73
兄弟们!这套结构,这个图理解后。GPT-Image-2 生图也就算是入门了吧。

推文介绍了一套提升AI生图质量的结构化提示词框架。其核心是“结构越清晰,输出质量越好”。框架将提示系统分解为几个关键模块:首先定义画幅与用途;其次明确主题与核心主体的位置、占比及情绪价值;接着通过视觉隐喻用具体元素象征抽象概念;然后选择如Apple风格等特定画面风格并强调干净、克制等视觉要求;最后规划包含主副标题、英文短句和关键词的文字系统,并列出应避免的限制元素。

图像生成教程/实践
22:31
Kling AI@Kling_ai
15
棒球赛氛围已锁定。⚾ 看看我们如何在Kling AI中创作它。
其他图像生成视频
20:31
凡人小北@frxiaobei
26
好看啊, 这个就是 AI 时代的审美品味吧。 【引用 @op7418】:http://x.com/i/article/2053655813877870592

歸藏(guizang.ai): http://x.com/i/article/2053655813877870592

其他图像生成
18:39
SenseTime@SenseTime_AI
精选72
SenseNova U1图像生成模型登陆ComfyUI平台

SenseNova U1图像生成模型现已在ComfyUI上可运行,并获得包括REBEL AI在内的评测者高度认可。REBEL AI发布的实践教程展示了该模型的部署工作流,并对其图像生成能力进行了真实场景测试。模型支持8步快速推理,生成速度极快,应用场景涵盖人像、超现实艺术、文字标志和生物设计等。相关资源已在Hugging Face、GitHub和Discord平台开放。

GitHubHugging Face图像生成模型发布

推荐理由:商汤把新模型U1的ComfyUI部署流程完整放出,还有实测视频,想在自己机器上跑国产图像模型的开发者可以直接抄作业了。
17:34
阿绎 AYi@AYi_AInotes
55
森马AI革新服装业,上新周期缩至15天

森马通过AI技术将服装上新周期从6个月压缩至15天,2025年实现数亿元回款并节省数千万元成本。AI作为全链路基础设施,覆盖供应链、库存、直播、运营等400多个场景,重构经营逻辑。AIGC视觉使图像生成效率提升,成本近乎零,支持全款式并行推进。AI不仅替代人工,更挖掘隐性成本,推动传统企业数字化转型。

图像生成教程/实践
16:22
PixVerse@PixVerse_
67
用户分享了一个高效AI视频创作流程。他首先利用ChatGPT,基于预设镜头描述,生成了一个结构严谨、支持多镜头序列的详细视频提示词。该提示词严格指定了品牌元素(如瓶身、包装、Logo及阿拉伯文/英文文本)需通过参考附件精确还原,并描述了超奢华、电影感的视觉风格。随后,他将此提示词输入PixVerse平台,借助其高速生成优势,快速产出了1080p分辨率的视频。此工作流有效结合了GPT的精准指令生成能力与PixVerse的快速视频渲染能力,实现了对品牌视觉的严格把控和高效率内容产出。

AZIZ | AI 🇸🇦: 5️⃣ عجبتني النتيجة وقلت ليه ماستخدم سي دانس ٢ ، ورحت على منصة @PixVerse_ لان احب ان السرعة عندهم عالية جدا لتوليد الفيدي...

图像生成教程/实践视频
15:48
歸藏(guizang.ai)@op7418
75
藏师傅PPT Skill更新第二套主题,集成AI生成与美化功能

藏师傅的PPT Skill工具发布了第二套主题,设计更简洁美观,适用于数据和事实性内容的演示。新主题提供4种颜色和20多种版式选择。其核心功能是集成了Codex内置的GPT-2.0模型,可辅助用户生成演示配图、美化截图,并能自动生成适用于各平台(如公众号)的封面图与配图。相关文章详细介绍了具体使用方法及操作技巧。

歸藏(guizang.ai): http://x.com/i/article/2053655813877870592

OpenAI图像生成教程/实践
14:52
PixVerse@PixVerse_
53
图像生成功能即将登陆PixVerse应用。 输入提示词,添加参考图,选择模型,调整比例和分辨率,即可在应用中直接生成。 图像创作不再是次要工作流。它已成为PixVerse的一部分。 转发+关注+回复=300积分(仅限72小时)
产品更新图像生成
10:48
歸藏(guizang.ai)@op7418
精选78
开源PPT工具"鬼藏PPT技能"迎重大更新,新增瑞士风格与AI配图功能

开源项目“鬼藏PPT技能”迎来重大更新,新增瑞士国际主义视觉风格,提供克莱因蓝等四套主题色。核心升级包括:通过接入GPT-Image 2.0,可根据PPT内容与风格自动生成胶片质感配图、流程图及UI截图美化;支持基于同一内容一键生成公众号、小红书、视频号等多种规格的封面图。更新旨在解决用户对多风格、自动配图及跨平台适配的需求,并通过预设22种版式和严格的视觉规则,确保设计的一致性与专业性。

智能体GitHub产品更新图像生成

推荐理由:藏师傅把做PPT的整条链闭环了,从大纲、配图到多平台封面一个对话走完。瑞士风的设计纪律直接写进skill,做出来的PPT终于甩掉AI模板味。
09:45
Berryxia.AI@berryxia
56
利用开源3D库与工具快速创建3D展示与互动应用

推文讨论了在精度要求不高的3D展示场景下,可直接利用开源3D库快速实现。作者提及Apple Reality Composer及其免费的USDZ/USDC格式官方3D模型库,适用于AR增强现实。对于需要自定义或教学互动的场景,推荐了JigSpace应用。同时,作者分享了使用GitHub上的glTF样本模型快速制作Demo的经验。引用的推文补充了关键应用:结合GPT-image-2和Gemini等AI工具生成3D生物结构,并开发可交互探索的应用,旨在为课堂教学等场景创造趣味互动体验。

Berryxia.AI: 从此告别无聊的课堂教学! 自己开发趣味互动科学应用创意 ~ 现在使用GPT-image-2 + Gemini 尝试生成3D生物结构,并开发了一款能交互探索这些结构的应用!

图像生成开源生态教程/实践
07:30
DogeDesigner@cb_doge
62
用这个 @Grok 提示词为妈妈制作一张精美的母亲节贺卡 ❤️ "将这张照片转化为精美专业的母亲节贺卡,采用宝丽来风格大幅居中设计,周围环绕鲜艳花朵与优雅装饰元素,搭配丰富欢快的色彩和典雅的'母亲节快乐'文字,整体保持温暖、精致、视觉惊艳的效果。"
xAI图像生成教程/实践
04:58
elvis@omarsar0
66
作者受启发复现了一个利用AI工具栈快速生成3D生物结构的工作流。该流程整合了Gemini Nano Pro生成概念、Tripo进行3D生成、Codex组装代码,并通过HTML构件实现交互式查看。作者认为,此类AI应用将指数级加速学习过程,并推动高质量教育的民主化。其灵感来源于@DilumSanjaya展示的利用GPT生成UI、Gemini编写代码来创建交互式科学探索应用的概念。

Dilum Sanjaya: Fun interactive science app ideas | Part 3 Played around with generating 3D biological structures and made an app to exp...

MCP/工具图像生成多模态教程/实践
5月10日
22:33
阿绎 AYi@AYi_AInotes
精选80
教育科技门槛一夜归零:AI助力单人低成本开发3D教学应用

AI工具GPT Images 2和Gemini 3.1 Pro的出现,彻底颠覆了教育应用的开发模式。过去需多人团队、数月时间和高昂成本才能完成的3D教育应用,如今一个具备领域知识(如生物学)的普通人,仅用约48小时和不到10美元即可实现。这消除了对编程、3D建模等技术能力的依赖,使教师、家长等个体也能独立创造高质量互动教学工具。此举有望推动过去仅属于精英机构的教学资源(如虚拟实验室)普及,为缩小教育不平等提供了新的技术路径。

Dilum Sanjaya: Fun interactive science app ideas | Part 3 Played around with generating 3D biological structures and made an app to exp...

GoogleOpenAI图像生成教程/实践

推荐理由:阿易这视频展示了 GPT Images 2 和 Gemini 3.1 Pro 的组合,48 小时从想法到可交互 3D 教学 App,零代码工作流直接可以抄,教育技术门槛真的归零了,做内容的别错过。
22:22
Baidu Inc.@Baidu_Inc
25
我们将几句经典的妈妈语录翻译成它们通常的真实含义。 因为有时"有空打给我"蕴含的意义远不止字面这些。 祝所有庆祝的人#母亲节快乐! 📷 图片由ERNIE-Image生成
图像生成行业动态
10:13
小互@xiaohu
58
兄弟们 这个创意牛P啊 3D 趣味互动科学应用 用GPT生成图像,然后使用Gemini 3.1 Pro生成,可以将任何知识的内容制作成3D可交互的效果展示! 效果炸裂!
GoogleOpenAI图像生成多模态
10:13
小互@xiaohu
53
创建一个售卖机器人的未来网站效果也不错 GPT 生成图像 → Tripo 3D
图像生成多模态教程/实践
09:13
向阳乔木@vista8
60
GPT-Image-2为段落生成视觉解释,提升阅读体验

GPT-Image-2能够根据选中的文章段落直接生成视觉化的解释,极大地改善了阅读体验,使其不再枯燥。这一功能展示了AI在将文本内容转化为直观图像方面的应用潜力,为理解和消化复杂信息提供了新的辅助工具。

OpenAI图像生成多模态教程/实践
07:58
Elon Musk@elonmusk
44
Grok Imagine 【引用 @heavypulp】:万物皆计算机,但计算机并非万物!

Heavy Pulp: Everything is Computer, but Computer isn't Everything!

xAI产品更新图像生成
07:44
Berryxia.AI@berryxia
48
从此告别无聊的课堂教学! 自己开发趣味互动科学应用创意 ~ 现在使用GPT-image-2 + Gemini 尝试生成3D生物结构,并开发了一款能交互探索这些结构的应用!
GoogleOpenAI图像生成多模态
03:30
🚨 AI News | TestingCatalog@testingcatalog
46
从提示词到建筑设计:AI驱动住宅设计自动化

推文提出“从提示词到生产”的流程已成现实,并展望未来能实现“从提示词到房地产”,即由机器人从头建造完整建筑。虽然这仍属未来愿景,但 DraftedAI 已率先自动化了“从提示词到家居设计”这一环节。其工具允许用户免费生成理想房屋的详细渲染图并导出,用户既可混搭探索区的现有设计,也能从零开始,且所有细节均可定制。

产品更新图像生成
00:44
歸藏(guizang.ai)@op7418
31
厌倦了千篇一律的衬线字体和排版? 歸藏的 PPT Skill 新主题预告 【引用 @op7418】:http://x.com/i/article/2047484171258634240

歸藏(guizang.ai): http://x.com/i/article/2047484171258634240

图像生成教程/实践
5月9日
11:36
Berryxia.AI@berryxia
28
AI时代原来我的"嘴"才是核心竞争力!😂 靠"嘴口喷"代码,现在直接"靠嘴搞设计"! 太特么好了,AI时代我也算是吃上细糠了。
图像生成大佬观点
11:25
宝玉@dotey
71
GPT Image 2 Prompt:水墨风格 Slides/PPT

本文介绍一个用于生成水墨风格幻灯片画图提示词的模板。该模板结构清晰,包含标题、关键要点、视觉元素、布局偏好、文字层级和延续性说明,旨在指导AI(如Codex)生成具有统一美学风格的幻灯片图像。视觉元素强调宣纸背景、水墨山水等东方元素,整体风格追求静谧、克制、侘寂或当代东亚奢华。通过应用此模板,用户可以简化AI驱动的设计流程,快速获得视觉一致且富有美感的水墨风格PPT素材。文末提供了一个简短的应用示例。

OpenAI图像生成多模态教程/实践
10:55
宝玉@dotey
精选76
GPT Image 2 Prompt:中文科技新闻爆款封面生成器

这是一个用于生成中文科技新闻爆款封面图的详细提示词框架。它要求AI扮演顶级视觉设计师,根据输入的文章内容自动提取核心新闻、关键数字、产品及行业情绪等信息。设计需融合中国科技媒体头图、B站爆款缩略图等风格,强调强烈的视觉冲击与高信息密度,确保3秒内传递重点。构图包含顶部新闻区、中央超大标题区、主视觉产品区、数据卡片区和底部总结区,配色、字体、背景均需根据文章行业、品牌和情绪动态调整,最终输出专业的16:9横版媒体级封面图。

OpenAI图像生成教程/实践

推荐理由:对做科技自媒体的朋友,这个 prompt 直接把 GPT Image 2 从“能画图”变成了“会做封面”的生产力工具,复制粘贴就能用。
06:52
Luma@LumaLabsAI
19
你的展位是品牌在展会中最瞩目的时刻。 确保它足够出众。 定义品牌标识。 设定美学风格。 Luma Agents 据此构建所有展位视觉设计。 立即创建 → http://lumalabs.ai/app
产品更新图像生成
06:49
Chubby♨️@kimmonismus
57
这只是时间问题:索尼与万代南梦宫正围绕生成式AI启动合作试点,将这项技术定位为加速游戏开发的手段。 索尼表示AI已在面部动画、质量检测、支付处理、视觉保真度以及未来推荐工具方面提供助力。 DLSS和PSSR仅仅是个开始。
图像生成行业动态
01:26
向阳乔木@vista8
61
AI辅助快速制作PPT的实战方法

作者分享利用AI工具高效制作PPT的流程:首先与AI讨论并生成内容大纲,随后使用Youmind或GPT等工具根据大纲生成配图与底图模板。将生成的图像直接粘贴至Keynote中,最后手动补充或调整无需AI生成的页面。该方法结合了AI自动化生成与人工灵活调整,显著提升了演示文稿的制作效率。

图像生成教程/实践
5月8日
23:33
歸藏(guizang.ai)@op7418
72
抖音"法天象地"特效:从图片生成到视频优化的突破

抖音近期流行的“法天象地”户外照片特效多基于图片生成,但实际测试表明直接生成视频效果更佳。作者通过优化提示词实现了这一改进,关键采用了 GPT-Image-2.0 与 C-Down 3.0 技术组合,并将优化后的图片提示词附在视频内容后供参考。这一方法提升了特效的动态表现力与视觉冲击力。

图像生成教程/实践视频
17:26
-Zho-@ZHO_ZHO_ZHO
52
AI图像生成未达设计标准,保罗·兰德阐释设计本质

推文引用设计师保罗·兰德的观点,指出仅将视觉元素进行美观排列不等于好的布局,这是对平面设计师职能的误解。作者借此解释当前AI图像生成技术为何尚未达到真正的设计标准。兰德强调,设计超越表面的视觉组合,涉及更深层的构思与判断,而这正是当前AI所缺乏的核心能力。

图像生成大佬观点
12:21
Berryxia.AI@berryxia
24
用户@berryxia在星巴克活动期间,偶然创作出一个高效的GPT提示词,并在多个案例中验证了其出色的效果,对此感到惊喜。主推文作者在看到麦当劳的海报后,联想到此提示词可能带来的提升效果,并以幽默口吻询问反馈。核心在于分享一个由日常场景激发、经过实践验证的优秀AI工具使用技巧。

Berryxia.AI: 卧槽!GPT每天有惊喜啊! 星巴克领Trae 的咖啡羊毛,顺手搞了个提示词! 发现好用啊!! 搞了几个案例是真的nice哦~ 有喜欢想要的🙋

OpenAI图像生成教程/实践
11:44
向阳乔木@vista8
59
好像是丁师傅分享的网站? 趋势中的HTML模版都好有设计感,可以发给AI参考学习。 不然Claude 和 Codex的默认设计风格,很快就会成为新的AI味。 网址见评论
图像生成教程/实践
07:05
OpenRouter@OpenRouter
56
现已在OpenRouter上线:@recraftai。 Recraft V4是一款为高审美调校的图像生成模型--具备艺术指导的构图、光影与色彩,呈现精心设计感而非素材堆砌。该模型与艺术家和设计师共同打造,适用于品牌塑造、概念创作和创意探索。 更多关于V4和V4 Pro的信息如下 🧵
产品更新图像生成
06:05
Orange AI@oran_ge
49
GPT Image 2.0能力深不可测,Labnana社区提供免费体验

GPT Image 2.0模型发布后持续展现惊人能力,无需参考图即可根据名称或IP生成高质量内容,尤其在二次元画风上表现卓越,被社区认为远超Banana 2等模型。Labnana社区现已将GPT Image 2.0的免费体验作为长期福利,用户通过签到和邀请获取积分即可基本满足使用需求。

OpenAI图像生成评测/基准
‹ 上一页
1…1011121314…18
下一页 ›