全部 AI 动态 · AI HOT

内容

精选全部 AI 动态 AI 日报主题收藏

接入

更多

关于更新日志反馈

内部员工登录

精选全部日报更多

内部员工登录

全部动态

全部一手资讯 X 论文

标签「图像生成」清除

5月13日周三

23:59Chubby♨️42OpenAI将推超高速模式及图像模型更新

23:27PixVerse57韩棒球热席卷Pixverse 模板创作正当时

17:50歸藏(guizang.ai)71利用搜索垫图提升AI绘画准确性与质量

16:44HuggingFace Daily Papers（社区热门论文）60WildRelight：面向单图像重光照的真实世界基准与物理引导自适应方法

13:44HuggingFace Daily Papers（社区热门论文）68L2P：解锁潜在扩散模型在像素生成中的潜力

12:44HuggingFace Daily Papers（社区热门论文）62AlphaGRPO：通过可分解可验证奖励解锁统一多模态模型的自反思生成能力

11:02AI Notkilleveryoneism Memes ⏸️17教材插图竟也出自AI之手

10:44HuggingFace Daily Papers（社区热门论文）50MoCam：通过结构化去噪动态实现统一的新视角合成

10:44HuggingFace Daily Papers（社区热门论文）64图像即语句：用于统一视觉生成的交错指令扩展模型

10:44HuggingFace Daily Papers（社区热门论文）66超越最后一层：用于视觉分词的多层表征融合

08:02Luma46年度营销节点：AI助力视觉素材全搞定

08:00HuggingFace Daily Papers（社区热门论文）67PRISM：基于扩散模型的文本图像超分辨率框架，实现先验校正与不确定性感知的结构建模

05:05🚨 AI News | TestingCatalog63Meta推出Muse Spark驱动的AI语音对话与实时视觉交互功能

03:54StepFun72Step Image Edit 2图像模型发布，性能领先且高效

03:24PixVerse26滑板爱好者惊艳表演引关注

01:31AI Notkilleveryoneism Memes ⏸️52AI冲击好莱坞：Tyler Perry因Sora叫停8亿美元扩建，呼吁行业联合应对

5月12日周二

23:22向阳乔木39谢赛宁DiT论文解读：高难度扩散Transformer模型分析

22:30Krea68精选Krea 2首款基础模型发布

21:29AK56Qwen-Image-2.0技术报告发布

18:33Kling AI63结合GPT与Kling AI生成超写实F1直播截图

16:36IT之家（RSS）53京东 AI 试穿功能上线

15:36IT之家（RSS）45《匹诺曹的谎言》开发商 Neowiz 布局生成式 AI，招聘 AI 创意设计师

12:44HuggingFace Daily Papers（社区热门论文）76精选Qwen-Image-2.0技术报告

12:42SenseTime46SenseNova U1助力儿童福利可视化沟通

11:44HuggingFace Daily Papers（社区热门论文）68Pixal3D：基于图像的像素对齐3D生成

08:00HuggingFace Daily Papers（社区热门论文）45参考引导流匹配

07:29Luma26Luma Agents定义奢华视觉新标准

04:59Luma73Luma Agents：从情绪板到完整广告的自动化创作

02:59Luma59Luma Agents新增Kling Omni模型支持

01:53PixVerse70用户展示PixVerse生成的高端时尚网格图像

01:23PixVerse57低清梗图变身4K杰作

5月11日周一

23:50向阳乔木31博客集成AI对话侧边栏，辅助内容创作

23:32凡人小北49Tesla FSD跳过ISP，用原始光子计数重建清晰视觉

22:48Berryxia.AI73兄弟们！这套结构，这个图理解后。GPT-Image-2 生图也就算是入门了吧。

22:31Kling AI15用Kling AI打造棒球赛氛围

20:31凡人小北26好看啊，这个就是 AI 时代的审美品味吧。【引用 @op7418】：http://x.com/i/article/2053655813877870592

18:39SenseTime72精选SenseNova U1图像生成模型登陆ComfyUI平台

17:34阿绎 AYi55森马AI革新服装业，上新周期缩至15天

16:22PixVerse67高效AI工作流：结合ChatGPT与PixVerse精准生成品牌香水广告

15:48歸藏(guizang.ai)75藏师傅PPT Skill更新第二套主题，集成AI生成与美化功能

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

5月13日

23:59

Chubby♨️@kimmonismus

42

什么情况，OpenAI正在酝酿大动作 - 超高速模式可能本周四上线 - 外加对已足够惊艳的新图像模型的更新 OpenAI近期动作不断，太棒了

Chetaslua: 🚨new openai update mmm...... ahh... am i audible. Two more scoops if you missed them : >one more thing dont forget abou...

OpenAI 产品更新图像生成

23:27

PixVerse@PixVerse_

57

棒球比赛吃热狗被4K镜头捕捉韩国棒球热潮现已登陆Pixverse网页端使用Pixverse的K-Baseball Sprint模板，立即创作你的作品吧！

产品更新图像生成视频

17:50

歸藏(guizang.ai)@op7418

71

利用搜索垫图提升AI绘画准确性与质量

当使用Codex等AI生成涉及生僻事实的配图时，可先让其搜索相关图片作为参考，再基于此生成新图。该方法能确保图像的真实性，同时生成符合比例要求的高清图片。例如，对于云南甲马符这类GPT可能不了解的主题，通过垫图后AI能准确绘制。

歸藏(guizang.ai): http://x.com/i/article/2053655813877870592

OpenAI 图像生成教程/实践

16:44

HuggingFace Daily Papers（社区热门论文）

60

WildRelight：面向单图像重光照的真实世界基准与物理引导自适应方法

本文介绍了首个专为单图像重光照评估设计的真实世界数据集WildRelight，包含多样化高分辨率户外场景，在严格对齐的时序自然光照下采集并配有环境贴图。基准测试揭示了当前基于合成数据训练的先进模型存在严重域偏移。利用该数据集严格对齐的时间结构，研究提出一种物理引导推理框架，将捕获的自然光演变作为自监督约束，通过结合扩散后验采样与时序感知的测试时自适应，成功将棘手的模拟到真实挑战转化为可处理的自监督任务。数据集与代码将公开以推动鲁棒且基于物理的重光照研究。

arXiv 图像生成数据/训练论文/研究

13:44

HuggingFace Daily Papers（社区热门论文）

68

L2P：解锁潜在扩散模型在像素生成中的潜力

本文提出了一种高效的潜在到像素（L2P）迁移范式，能够直接利用预训练潜在扩散模型（LDM）的知识构建像素空间模型。该方法摒弃了VAE，采用大块标记化技术，并冻结源LDM的中间层，仅训练浅层来学习从潜在到像素的转换。通过仅使用LDM生成的合成图像进行训练，L2P能以极低开销（仅需8个GPU）将海量潜在先验迁移至像素空间。实验表明，该方法在DPG-Bench上与源LDM性能相当，在GenEval上达到其93%的性能，同时消除了VAE的内存瓶颈，实现了原生的4K超高清图像生成。

图像生成论文/研究

12:44

HuggingFace Daily Papers（社区热门论文）

62

AlphaGRPO：通过可分解可验证奖励解锁统一多模态模型的自反思生成能力

本文提出AlphaGRPO框架，将分组相对策略优化应用于AR-Diffusion统一多模态模型，无需额外冷启动即可提升多模态生成能力。该框架解锁了模型执行高级推理（如推断用户隐含意图）和自反思优化（自主诊断并修正生成错位）的内在潜力。针对实际监督难题，团队设计了可分解可验证奖励机制，利用大语言模型将复杂请求分解为原子化、可验证的子问题，再通过通用多模态大模型评估，提供可靠且可解释的反馈。实验表明，AlphaGRPO在多个生成与编辑基准上均取得显著性能提升。

图像生成多模态推理论文/研究

11:02

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes

17

笑死原来这张图本身也是AI生成的我们彻底完蛋了

AI Notkilleveryoneism Memes ⏸️: Even textbooks aren't safe

图像生成安全/对齐

10:44

HuggingFace Daily Papers（社区热门论文）

50

MoCam：通过结构化去噪动态实现统一的新视角合成

MoCam 提出了一种基于结构化去噪动态的新视角合成方法，旨在解决几何先验与外观先验在生成过程中的根本矛盾。该方法在扩散过程的早期阶段利用几何先验锚定粗略结构并容忍其不完整性，随后在后期阶段切换至外观先验以主动修正几何错误并细化细节。这种时序解耦设计自然统一了静态与动态视角合成。实验表明，MoCam 在点云存在严重孔洞或畸变时显著优于现有方法，实现了稳健的几何-外观解纠缠。

图像生成多模态论文/研究

10:44

HuggingFace Daily Papers（社区热门论文）

64

图像即语句：用于统一视觉生成的交错指令扩展模型

针对现有方法在处理复杂交错指令时性能下降的问题，研究团队提出了INSET模型。该模型将图像作为原生词汇嵌入文本指令，通过将视觉特征直接定位在对应语义位置，利用Transformer的上下文局部性实现精确对象绑定。团队还开发了可扩展数据引擎，从标准数据集中合成了1500万个高质量交错样本。在InterleaveBench上的评估表明，INSET在多图像一致性和文本对齐上显著优于现有方法，且优势随输入复杂性增加而扩大。此外，该模型能自然扩展到多模态图像编辑领域，实现高度表达性的视觉操控。

图像生成多模态论文/研究

10:44

HuggingFace Daily Papers（社区热门论文）

66

超越最后一层：用于视觉分词的多层表征融合

现有视觉分词方法仅利用预训练编码器最后一层特征，丢弃了中间层的丰富信息。本研究提出DRoRAE，通过一个轻量级融合模块，采用能量约束路由与增量校正自适应聚合所有编码器层，生成与冻结解码器兼容的增强潜在表征。在ImageNet-256上，该方法显著提升了重建与生成质量。研究进一步揭示了融合能力与重建质量之间存在对数线性缩放规律，从而将表征丰富度确立为视觉分词器中一个新的、可预测的扩展维度。

图像生成多模态论文/研究

08:02

Luma@LumaLabsAI

46

有些时刻一年仅有一次。当它们来临时，请确保你的营销活动已准备就绪。定义营销季，设定方向。 Luma Agents 由此构建所有营销视觉素材。主视觉图、社交媒体素材，以及其间的一切。全部保持一致性，全部准时完成。把握关键时刻 → http://lumalabs.ai/app

智能体产品更新图像生成

08:00

HuggingFace Daily Papers（社区热门论文）

67

PRISM：基于扩散模型的文本图像超分辨率框架，实现先验校正与不确定性感知的结构建模

针对严重退化下文本图像超分辨率任务中全局先验不可靠与笔画边界模糊的挑战，本文提出PRISM框架。它通过流匹配先验校正模块，将退化嵌入映射至面向复原的先验空间，提供更准确的全局文本引导；同时利用结构引导的不确定性感知残差编码器，预测结构残差以选择性融合可靠的局部边界线索。该设计在单步扩散过程中同步实现了全局先验校正与局部结构细化。在合成与真实场景基准测试中，PRISM取得了最先进的性能，并保持毫秒级推理速度。相关代码与数据集已开源。

图像生成开源/仓库论文/研究

05:05

🚨 AI News | TestingCatalog@testingcatalog

63

Meta推出Muse Spark驱动的AI语音对话与实时视觉交互功能

Meta宣布推出由Muse Spark驱动的AI语音对话功能，支持自然语言交流、实时生成图像及从Reels、地图等多源获取信息。该功能将整合至Meta AI应用的新语音模式和实时摄像头视图中，用户可通过摄像头对现实世界进行实时问答。购物模式新增了搜索Facebook Marketplace等能力。Muse Spark将逐步在Ray-Ban Meta等智能眼镜上于美加推出，并于今夏登陆Meta Ray-Ban Display，其智能能力也将扩展至WhatsApp、Instagram等全平台的多类场景中。

Meta Newsroom: Today we're introducing Meta AI Voice Conversations powered by Muse Spark that let you talk naturally to Meta AI (interr...

Meta 产品更新图像生成多模态

03:54

StepFun@StepFun_ai

72

Step Image Edit 2图像模型发布，性能领先且高效

Step Image Edit 2模型正式发布。这是一个35亿参数的图像模型，在指令式图像编辑的权威基准KRIS-Bench中，于综合、事实和概念类别均排名第一，性能超越参数量为其5-6倍的模型。其核心能力包括文生图、基于指令的图像编辑、精准的中英双语文字渲染以及保持主体一致性的风格迁移。该模型生成速度快，单次编辑成本低，目前已上线Stepfun开放平台。

图像生成多模态模型发布

03:24

PixVerse@PixVerse_

26

@Kawaiizice 这些滑板者太强了👀

Kawaiizice: Nossa raposinha skatista levou a Clover pra dar um passeio de skate! 🦊🛹🍀 "Rumo aos céus!" (aos céus? sim!) (ꏿ ω ꏿ) ps...

产品更新图像生成视频

01:31

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes

52

电影制作人Tyler Perry在目睹OpenAI的Sora视频生成模型演示后，宣布暂停其价值8亿美元的工作室扩建计划。他指出AI能以极低成本完成原本耗资数千万美元的试播集制作，企业必将选择低成本路径，因此对近未来大规模失业深感忧虑。Perry呼吁好莱坞各工会乃至国会采取统一行动，建立监管框架保护从业人员，强调行业必须联合而非各自为战。此前梦工厂创始人Katzenberg预测AI将在三年内削减90%动画岗位，此事印证了该趋势正在加速。

AI Notkilleveryoneism Memes ⏸️: 4 months ago, Dreamworks founder Katzenberg said AI will cut animated movie jobs by 90% in 3 years It's already happenin...

图像生成现象/趋势视频

5月12日

23:22

向阳乔木@vista8

39

谢赛宁DiT论文解读：高难度扩散Transformer模型分析

推文作者应读者要求，对谢赛宁的DiT（Diffusion Transformers）论文进行了解读。这篇论文难度很高，作者已尽力完成了一万三千字的图文解读，但仍有很多内容难以完全理解。推文引用了@vista8的留言，其核心是邀请读者提出想读但不愿消耗自己Token的论文或书籍，承诺将其解读为图文并茂的文章供共同学习，并以ViT论文解读作为示例。

向阳乔木: 大家想读什么论文或书,但不想消耗自己Token。欢迎留言,我来帮大家跑,解读成图文并茂的文章,一起学习。示例为ViT经典论文解读。 https://blog.qiaomu.ai/vit-vision-transformer-image-...

图像生成论文/研究

22:30

Krea@krea_ai

精选68

这是Krea 2。我们的首个基础模型，完全从零构建，旨在实现美学多样性和风格控制。了解更多并获取早期访问权限👇

图像生成模型发布

推荐理由：Krea 终于自研基础模型了，而且是从零开始做，专门为美学多样性和风格控制优化的，对做视觉内容的人来说多了一个风格自由度的选择，值得试试 early access。

21:29

AK@_akhaliq

56

Qwen-Image-2.0 技术报告

图像生成多模态论文/研究

18:33

Kling AI@Kling_ai

63

用户利用GPT image 2与Kling AI，根据详细提示词生成了一张模拟电视转播视角的超写实F1赛事直播截图。画面聚焦于一位在VIP围场/车队车库中的年轻女性，其身份特征从参考图像中被精确保留。她佩戴专业赛车耳机，神情紧张专注，画面包含"FINAL LAP"横幅、计时塔、直播标识等完整的转播图形元素。作品特别注重广播级细节，如压缩伪影、自然肤质和8K画质，旨在完美呈现如同真实电视截图的视觉效果。

Ciri: Made with GPT image 2 + Kling AI Prompt: Ultra-realistic F1 live TV broadcast screenshot, identity preserved exactly fro...

OpenAI 图像生成多模态教程/实践

16:36

IT之家（RSS）

53

京东 AI 试穿功能上线

京东平台正式上线AI试穿功能。用户上传个人照片后，可在数秒内生成高清试穿效果图，实现一键切换同款不同色服饰进行对比，并可根据系统推荐搭配上下装。该功能基于京东自研算法，能分析消费者身材维度，使服装在试穿中自然垂坠贴合，并对棉质、丝绸、牛仔等多种材质进行高精度渲染，模拟真实质感。目前该功能已接入商品详情主图、“逛”和“AI购”等频道，初期支持男女装及运动服饰，商家仅需配置白底图等素材即可使用。

产品更新图像生成多模态

15:36

IT之家（RSS）

45

《匹诺曹的谎言》开发商 Neowiz 布局生成式 AI，招聘 AI 创意设计师

《匹诺曹的谎言》开发商Neowiz正积极布局生成式AI，旗下Round8工作室新设“AI创意设计师”岗位。该岗位需使用Midjourney、Stable Diffusion等工具进行角色与概念原画创作，并负责训练定制化AI模型。公司旨在将AI深度融入开发流程，搭建高效美术创作流水线以压缩周期，并计划将生成式AI推广为内部美术人员的常规工作方式，由该设计师指导其他员工。当前游戏行业普遍应用AI优化流程，但生成式AI在美术创作领域的应用仍面临玩家接受度挑战。

图像生成行业动态

12:44

HuggingFace Daily Papers（社区热门论文）

精选76

Qwen-Image-2.0技术报告

Qwen-Image-2.0是一个统一高保真生成与精确编辑的全能图像生成基础模型。它采用Qwen3-VL作为条件编码器，结合多模态扩散变换器进行联合建模，并通过大规模数据整理与多阶段训练实现强化。该模型支持长达1K令牌的指令输入，能生成幻灯片、海报等富文本内容，显著提升多语言文本渲染与排版质量。在生成方面，它增强了细节、纹理真实感与光照一致性，并更可靠遵循复杂指令。人工评估表明，其在生成和编辑任务上均大幅超越前代模型。

arXiv 图像生成多模态模型发布

推荐理由：这是 Qwen-Image 系列第一次把多模态理解和生成真正拧到同一框架里，长文本渲染和多语言排版提升肉眼可见，做海报和幻灯片的可以重点关注。

12:42

SenseTime@SenseTime_AI

46

这正是我们打造SenseNova U1的原因。✨ 感谢@feesyiam用它聚焦儿童福利议题。可视化让艰难对话更易进行--这正是AI真正发挥价值的时刻。请持续创作。🥰

Nafees: I gave it a topic. It came back with a full magazine-style infographic. Charts. Layout. Icons. Colour coding. Dense stru...

图像生成开源生态行业动态

11:44

HuggingFace Daily Papers（社区热门论文）

68

Pixal3D：基于图像的像素对齐3D生成

针对现有图像到3D生成中像素级保真度不足的问题，研究团队提出Pixal3D新范式。该方法摒弃在规范空间中生成的常规做法，通过像素回投影条件方案，将多尺度图像特征直接提升为3D特征体积，从而建立明确无歧义的像素到3D对应关系。此举显著提升了生成资产相对于输入图像的保真度，使其接近重建水平。该框架可扩展生成高质量3D资产，并能自然支持多视图生成与高保真、对象分离的3D场景合成。

arXiv 图像生成多模态论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

45

参考引导流匹配

本文提出了一种新的可控图像生成原理，其核心是通过更换“参考集”来引导预训练模型，无需参数更新。该方法基于流匹配框架，通过调整条件端点均值来改变生成流程。具体实现了两种方式：免训练的“参考均值引导”，将参考库的校正量应用于冻结模型，实现对颜色、身份、风格与结构的控制；以及“半参数引导”，通过显式均值锚点和学习残差优化器，达到高质量并支持推理时更换参考集。这一工作指向了生成模型可通过数据而非参数更新来适应新任务的更广泛方向。

图像生成多模态论文/研究

07:29

Luma@LumaLabsAI

26

最卓越的营销不只展示产品，更让你向往其存在的世界。设定愿景。定义美学。Luma Agents由此构建所有奢华营销视觉。树立标准 → http://lumalabs.ai/app

产品更新图像生成视频

04:59

Luma@LumaLabsAI

73

情绪板曾是最精彩的部分。如今它只是起点。上传你的参考素材。设定方向。Luma Agents 会将其从情绪板转化为完整的广告。生成广告 → http://lumalabs.ai/app

智能体产品更新图像生成视频

02:59

Luma@LumaLabsAI

59

Luma Agents现已支持通过Kling Omni生成内容。更多模型。更广范围。相同工作流程。立即体验 → https://lumalabs.ai/app

产品更新图像生成视频

01:53

PixVerse@PixVerse_

70

用户通过引用推文展示了由GPT Image 2在PixVerse平台上生成的一组高端时尚编辑图像。该图像采用2行4列的网格布局，包含8个独立面板。每个面板均以不同鲜艳纯色或渐变背景呈现一位身着现代街头服饰的年轻男模特，搭配滑板、吉他等道具，并采用简洁的工作室布景。图像整体追求商业广告摄影风格，具有奢侈品品牌广告的美学质感，强调柔和灯光、清晰阴影、逼真皮肤和电影级质感，且不含任何文字或标识。

Cherry 2.O: GPT Image 2 on @PixVerse_ Prompt 👇 Ultra high-end fashion editorial collage in a 2 rows and 4 columns grid layout (tota...

OpenAI 图像生成教程/实践

01:23

PixVerse@PixVerse_

57

PixVerse将我古老的144p梗图变成4K杰作。我的梗图存档刚刚完成华丽升级。🔥

产品更新图像生成视频

5月11日

23:50

向阳乔木@vista8

31

博客集成AI对话侧边栏，辅助内容创作

作者为博客增加了AI对话侧边栏功能，旨在提升内容创作效率。该功能允许用户在写作过程中随时与AI对话，以辅助完成配图、生成标题等任务。例如，用户可指令AI“给第一节配信息图，科普风格”，生成的图片会自动插入文中；对于AI生成的多个标题选项，用户只需说“选第一个”即可自动替换。该功能完善后，将同步至开源版本。

产品更新图像生成开源生态

23:32

凡人小北@frxiaobei

49

Tesla FSD跳过ISP，用原始光子计数重建清晰视觉

Tesla FSD通过跳过图像信号处理器，直接处理传感器记录的原始光子计数数据，而非传统相机处理后的人眼可见RGB图像。光子计数保留了完整的光强信息，神经网络据此重建出细节清晰的场景。这使得FSD在夜间或强眩光等极端视觉条件下，能超越人眼感知，从一片白茫茫中识别出路、树、车辆等关键信息，实现更优的视觉感知能力。

Elon Musk: The human-perceived RGB is image 1 and the Tesla AI photon count reconstruction is image 2. This is why Tesla FSD can se...

图像生成多模态教程/实践

22:48

Berryxia.AI@berryxia

73

兄弟们！这套结构，这个图理解后。GPT-Image-2 生图也就算是入门了吧。

推文介绍了一套提升AI生图质量的结构化提示词框架。其核心是“结构越清晰，输出质量越好”。框架将提示系统分解为几个关键模块：首先定义画幅与用途；其次明确主题与核心主体的位置、占比及情绪价值；接着通过视觉隐喻用具体元素象征抽象概念；然后选择如Apple风格等特定画面风格并强调干净、克制等视觉要求；最后规划包含主副标题、英文短句和关键词的文字系统，并列出应避免的限制元素。

图像生成教程/实践

22:31

Kling AI@Kling_ai

15

棒球赛氛围已锁定。⚾ 看看我们如何在Kling AI中创作它。

其他图像生成视频

20:31

凡人小北@frxiaobei

26

好看啊，这个就是 AI 时代的审美品味吧。【引用 @op7418】：http://x.com/i/article/2053655813877870592

歸藏(guizang.ai): http://x.com/i/article/2053655813877870592

其他图像生成

18:39

SenseTime@SenseTime_AI

精选72

SenseNova U1图像生成模型登陆ComfyUI平台

SenseNova U1图像生成模型现已在ComfyUI上可运行，并获得包括REBEL AI在内的评测者高度认可。REBEL AI发布的实践教程展示了该模型的部署工作流，并对其图像生成能力进行了真实场景测试。模型支持8步快速推理，生成速度极快，应用场景涵盖人像、超现实艺术、文字标志和生物设计等。相关资源已在Hugging Face、GitHub和Discord平台开放。

GitHub Hugging Face 图像生成模型发布

推荐理由：商汤把新模型U1的ComfyUI部署流程完整放出，还有实测视频，想在自己机器上跑国产图像模型的开发者可以直接抄作业了。

17:34

阿绎 AYi@AYi_AInotes

55

森马AI革新服装业，上新周期缩至15天

森马通过AI技术将服装上新周期从6个月压缩至15天，2025年实现数亿元回款并节省数千万元成本。AI作为全链路基础设施，覆盖供应链、库存、直播、运营等400多个场景，重构经营逻辑。AIGC视觉使图像生成效率提升，成本近乎零，支持全款式并行推进。AI不仅替代人工，更挖掘隐性成本，推动传统企业数字化转型。

图像生成教程/实践

16:22

PixVerse@PixVerse_

67

用户分享了一个高效AI视频创作流程。他首先利用ChatGPT，基于预设镜头描述，生成了一个结构严谨、支持多镜头序列的详细视频提示词。该提示词严格指定了品牌元素（如瓶身、包装、Logo及阿拉伯文/英文文本）需通过参考附件精确还原，并描述了超奢华、电影感的视觉风格。随后，他将此提示词输入PixVerse平台，借助其高速生成优势，快速产出了1080p分辨率的视频。此工作流有效结合了GPT的精准指令生成能力与PixVerse的快速视频渲染能力，实现了对品牌视觉的严格把控和高效率内容产出。

AZIZ | AI 🇸🇦: 5️⃣ عجبتني النتيجة وقلت ليه ماستخدم سي دانس ٢ ، ورحت على منصة @PixVerse_ لان احب ان السرعة عندهم عالية جدا لتوليد الفيدي...

图像生成教程/实践视频

15:48

歸藏(guizang.ai)@op7418

75

藏师傅PPT Skill更新第二套主题，集成AI生成与美化功能

藏师傅的PPT Skill工具发布了第二套主题，设计更简洁美观，适用于数据和事实性内容的演示。新主题提供4种颜色和20多种版式选择。其核心功能是集成了Codex内置的GPT-2.0模型，可辅助用户生成演示配图、美化截图，并能自动生成适用于各平台（如公众号）的封面图与配图。相关文章详细介绍了具体使用方法及操作技巧。

歸藏(guizang.ai): http://x.com/i/article/2053655813877870592

OpenAI 图像生成教程/实践

1…17 181920 21…30