AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 699 条
全部一手资讯X论文
标签「图像生成」清除
Alibaba Cloud@alibaba_cloud · 6月3日47

Narek Hayrapetyan, Head of Video Product, Picsart Launching HappyHorse and Wan models led to a 72% surge in video generations, with users creating over 1M monthly assets and using 6M+ Picsart credits.

译Narek Hayrapetyan,Picsart视频产品负责人 推出HappyHorse和Wan模型后,视频生成量激增72%,用户每月创建超过100万个资产,并使用超过600万Picsart积分。

Berryxia.AI@berryxia · 6月3日74

老树开新花了,这个老大哥微软今天发布新模型了😄 刷一波存在感哈哈哈,不然都没有人记得了~ Microsoft AI今天直接甩出七个全新MAI模型。 官方说:不是简单迭代,而是从零开始、干净数据血统、零蒸馏训练的一整个家族。 MAI-Thinking-1主推理、MAI-Code-1-Flash主编码、MAI-Image-2.5主图像、MAI-Transcribe-1.5主转录、MAI-Voice-2主语音,还有各自的Flash版本。 最狠的是MAI-Code-1-Flash,直接在SWE-Bench Verified上干到71.6,比Claude Haiku 4.5高5分,Pro榜单高16分,还省60% token,现在已经在Copilot里逐步上线。 MAI-Image-2.5在Arena图像编辑排第二、文本生图排第三,精准保留人脸、logo和细节,已经直接塞进PowerPoint和OneDrive。 MAI-Transcribe-1.5在43种语言上同时拿准度和速度第一,一小时音频15秒搞定。 MAI-Voice-2能控情绪、支持多语言code-switching,长内容说话人身份也稳。 它们不是各自为战,而是设计成一个能无缝协作的家族。Microsoft这次没玩“一个大模型通吃”,而是把每个任务拆开,用干净数据从头训,公开所有技术细节和学习心得。 这其实把行业当前最主流的路径反过来了。 大家都在卷参数规模、卷蒸馏别人家的输出,Microsoft却在说:真正长期有竞争力的,是从零构建、血统干净、任务专精、还能互相配合的模型家族。 实际效果如何,其实还有待大家的测试~~期待看看实际表现!

译微软在Build大会宣布推出七个全新的MAI模型家族。该家族以“干净数据血统”从零开始训练,旨在任务专精并能无缝协作。其中,MAI-Code-1-Flash在SWE-Bench Verified上得分71.6,比Claude Haiku 4.5高出5分,并能节省60% token。MAI-Transcribe-1.5处理一小时音频仅需15秒,在43种语言上实现速度与准度领先。微软此次发布旨在展示其从零构建、专精且能协同工作的模型发展路径。

Berryxia.AI@berryxia · 6月3日64

微软的新模型MAI-Image-2.5 在图像编辑中斩获第二名的位置。 那么可以看出来还是GPT-Image-2 最强,第一! Google 的Nano Banana 模型都已经被微软的MAI超越了…… Google 老大哥能不能整点新活儿出来啊,Pro会员都要到期了…

译微软发布新模型MAI-Image-2.5,并在Image Edit Arena(单图编辑)评测中取得第二名,得分为1401。根据评测数据,该模型分数比Nano Banana 2、Grok Imagine Image Quality和ChatGPT-Image-Latest-High Fidelity高出10分。尽管取得了进步,但评测显示当前的第一名仍是GPT-Image-2模型。该消息来源于X用户@berryxia。

jason@jxnlco · 6月3日46

model 'gpt-image-2' doesn't exist https://chatgpt.com/s/m_6a1f701a74748191b883735fff3b28d7

译模型 'gpt-image-2' 不存在 https://chatgpt.com/s/m_6a1f701a74748191b883735fff3b28d7

DogeDesigner@cb_doge · 6月3日21

Grok Imagine is pretty cool with logos. 🔥

译Grok Imagine 处理 Logo 的效果相当不错。🔥

fofr@fofrAI · 6月3日37

The way K2 handles style reference strength is really nice.

译K2 处理风格参考强度的方式真的很棒。

Chubby♨️@kimmonismus · 6月3日18

„Everyone hates AI slop“ „We are going to decide: is it vibe, is it slop?“ This sounds like a fun event :D

译“大家都讨厌 AI 垃圾内容” “我们将决定:这是氛围感,还是垃圾?” 这听起来是个有趣的活动 :D

fofr@fofrAI · 6月3日29

Playing around a bit with Krea's K2 Large image model. I love how expressive it feels, and the variability you get with each prompt.

译稍微玩了一下 Krea 的 K2 Large 图像模型。我很喜欢它带来的表现力,以及每个提示词产生的多样性。

OpenRouter@OpenRouter · 6月3日68

Three new @MicrosoftAI models now live on OpenRouter! Launching together: MAI-Image-2.5, MAI-Transcribe-1.5, and MAI-Voice-2. More on each below 🧵

译三款新的 @MicrosoftAI 模型现已在 OpenRouter 上线! 同步推出:MAI-Image-2.5、MAI-Transcribe-1.5 和 MAI-Voice-2。详情见下文 🧵

向阳乔木@vista8 · 6月3日70

读了今天Huggingface最热论文,关于如何让AI生成论文图表的Harness框架。 框架会围绕一个共享的结构化规格文档 S。 ① 设计者 D:根据 S 生成可执行的视觉方案 ② 执行者 E:将方案渲染成图像(或代码) ③ 验证者 V:输出带有具体问题定位的诊断报告 ④ 修订者 R:将诊断转化为结构化操作,直接修改 S 中的对应字段 参考并简化,写了一个Skill: 设计者(生图提示词) 执行者(Codex调用GPT-image-2生图) 验收者(审美评判,这个可能不靠谱) 另外整合了抓取Skill,只需要提供URL就能生成配图,哪怕是 X URL。 生成效果如下:

译Hugging Face 上一篇热门论文介绍了名为 Harness 的 AI 论文图表生成框架。该框架围绕一个共享的结构化规格文档 S 运作,包含四个协作角色:设计者生成视觉方案,执行者渲染图像或代码,验证者输出带定位的诊断报告,修订者据此修改规格文档 S。作者参考该框架进行了简化实践,写成一个技能包,其中使用了 GPT-image-2 进行生图,并整合了 URL 抓取功能,可直接生成配图。

Artificial Analysis@ArtificialAnlys · 6月3日62

Krea 2 Medium debuts at #6 on the Artificial Analysis Text to Image Leaderboard, trailing only models from OpenAI, Google, and NVIDIA! Krea 2 is @krea_ai's first image model family trained entirely from scratch (Krea 1 was developed in collaboration with Black Forest Labs). Krea 2 is available in two variants: Krea 2 Medium, and Krea 2 Large, which is more comparable to FLUX.2 [pro] in our arena. Notably, Krea 2 Medium outranks the larger, more expensive Krea 2 Large in our arena. Krea describes Medium as smaller and faster, with extensive post-training that makes its outputs especially stable and consistent across generations. While Large is positioned as the more capable model, our leaderboard results align with Krea's view that Medium "handles the broadest range of use cases reliably." Both models generate at 1K resolution and share a distinct set of generation controls via the API: ➤ Style transfer: Krea can extract the style of up to 10 reference images, with each image being able to be weighted in terms of importance ➤ Creativity Setting: A configurable API parameter (raw, low, medium, high) that sets how closely the model follows the prompt versus reinterpreting it ➤ Moodboards: A collection of images that can be collected in the application to apply a style transfer onto the image (separate from individual style reference images) At $30 per 1k images via Krea's API, Krea 2 Medium is priced below comparable models such as Nano Banana Pro at $134/1k images or grok-imagine-image-quality at $50/1k images. Krea 2 Large is priced at $60 per 1k images, and both models' prices increase with the use of the Style Transfer and Moodboard features. Both models are available in the Krea app, via Krea's API, and on official third-party launch partners. Congratulations to @krea_ai on the launch! See below for comparisons between Krea 2 and other leading models in our Artificial Analysis Image Arena 🧵

译Krea AI自研的文生图模型Krea 2 Medium在Artificial Analysis排行榜上位列第6,仅落后于OpenAI、Google和NVIDIA的模型。值得注意的是,体积更小、速度更快的Medium版本在排名上超过了定位更强大的Large版本。两款模型均支持通过API进行风格迁移和创意控制等操作,生成1K分辨率图像。定价方面,Krea 2 Medium为30美元/千张,Krea 2 Large为60美元/千张。

Krea@krea_ai · 6月3日57

Krea 2 is now on @ArtificialAnlys #1 image model from an independent research lab and #6 globally on text-to-image leaderboard. open-source cooking and coming soon.

译Krea 2 现已上线 @ArtificialAnlys 独立研究实验室排名第一的图像模型,全球文本到图像排行榜第六。 开源版本正在制作中,即将推出。

AK@_akhaliq · 6月2日62

Crafter A Multi-Agent Harness for Editable Scientific Figure Generation from Diverse Inputs

译Crafter 一个用于从多样化输入生成可编辑科学图表的多智能体框架

Kling AI@Kling_ai · 6月2日21

Who’s your favorite World Cup team? Generate a cheering dance video for them! 🎉

译你最喜欢的世界杯球队是哪支?为他们生成一段助威舞蹈视频吧!🎉

SenseTime@SenseTime_AI · 6月2日81

Power smarter AI agents with #𝗦𝗲𝗻𝘀𝗲𝗡𝗼𝘃𝗮-𝗦𝗸𝗶𝗹𝗹𝘀 🚀 𝗔𝗻 𝗼𝗽𝗲𝗻-𝘀𝗼𝘂𝗿𝗰𝗲 𝗔𝗜 𝗼𝗳𝗳𝗶𝗰𝗲 𝘀𝗸𝗶𝗹𝗹 𝘀𝘂𝗶𝘁𝗲 𝗳𝗼𝗿 𝗮𝗻𝘆 𝘀𝗸𝗶𝗹𝗹𝘀-𝗰𝗼𝗺𝗽𝗮𝘁𝗶𝗯𝗹𝗲 𝗮𝗴𝗲𝗻𝘁, 𝗶𝗻𝗰𝗹𝘂𝗱𝗶𝗻𝗴 #𝗢𝗽𝗲𝗻𝗖𝗹𝗮𝘄 𝗮𝗻𝗱 #𝗛𝗲𝗿𝗺𝗲𝘀𝗔𝗴𝗲𝗻𝘁. 🖼️ 𝗜𝗻𝗳𝗼𝗴𝗿𝗮𝗽𝗵𝗶𝗰 𝗚𝗲𝗻𝗲𝗿𝗮𝘁𝗶𝗼𝗻 — image generation & graphic design; mirror visual style from a reference 📊 𝗗𝗮𝘁𝗮 𝗔𝗻𝗮𝗹𝘆𝘀𝗶𝘀 — multi‑sheet parsing, data cleaning, image-based data extraction and visualization 📑 𝗣𝗣𝗧 𝗖𝗿𝗲𝗮𝘁𝗶𝗼𝗻 — outline & content generation, intelligent layout design; outputs editable PPT files 🔍 𝗗𝗲𝗲𝗽 𝗥𝗲𝘀𝗲𝗮𝗿𝗰𝗵 — multi‑source search across academic, tech, social platforms & more; synthesizes insights & generates reports Now fully #OpenSourced. 👉 GitHub https://github.com/OpenSenseNova/SenseNova-Skills ⚡ Quick installation (bundled with Hermes Agent & OpenClaw) https://github.com/OpenSenseNova/SenseNova-Skills/blob/main/INSTALL.md 👾 Discord https://discord.gg/BuTXPHmQub

译商汤开源了AI办公技能套件SenseNova-Skills。这是一个为任何技能兼容智能体(如OpenClaw与HermesAgent)设计的开源技能集合,提供四大核心功能:图像信息图表生成(可镜像参考风格)、数据分析(支持多表解析、清洗与可视化)、PPT创建(生成大纲内容并智能排版,输出可编辑文件)以及深度研究(跨学术、技术、社交等多源搜索并生成报告)。该技能套件现已完全开源。

Krea@krea_ai · 6月2日32

"Reality is so boring" Krea Podcast with @edbyus, @serialcut, and remembering_orion. full interview below 👇

译"现实如此无聊" Krea 播客与 @edbyus、@serialcut,以及 remembering_orion。 完整采访见下方 👇

OpenRouter@OpenRouter · 6月2日53

Rankings of image output models: https://openrouter.ai/rankings#image-output Significant growth in GPT Image 2 last week:

译图像输出模型排行榜:https://openrouter.ai/rankings#image-output GPT Image 2 上周增长显著:

宝玉@dotey · 6月2日67

baoyu-image-gen Skill 支持 Codex-cli 作为 Provider 画图 也就是说你可以在 Claude Code、hermes agent 之类的 Agent 里面用它调用 Codex 出图,而不需要用 Codex,当然前提是安装了 codex cli 并且有订阅。 感谢网友的 PRs: https://github.com/JimLiu/baoyu-skills/pull/158 https://github.com/JimLiu/baoyu-skills/pull/161 Skill 地址:https://github.com/JimLiu/baoyu-skills/tree/main/skills/baoyu-image-gen

SenseTime@SenseTime_AI · 6月2日73

Thanks for using our model to create these complex charts and diagrams. It's great to see challenging information transformed into clear, accurate, and readable visuals. That's what we aim for. 😄

译感谢使用我们的模型来创建这些复杂的图表和图表。 看到具有挑战性的信息被转化为清晰、准确和可读的视觉效果真是太棒了。这就是我们的目标。😄

SenseTime@SenseTime_AI · 6月2日71

Turning complex information into accurate charts and diagrams. That's 𝗦𝗲𝗻𝘀𝗲𝗡𝗼𝘃𝗮‐𝗨𝟭‐𝟴𝗕‐𝗠𝗼𝗧‐𝗜𝗻𝗳𝗼𝗴𝗿𝗮𝗽𝗵𝗶𝗰. Learn more: https://x.com/SenseTime_AI/status/2061465029959209106?s=20

译将复杂信息转化为准确的图表和示意图。这就是 𝗦𝗲𝗻𝘀𝗲𝗡𝗼𝘃𝗮‐𝗨𝟭‐𝟴𝗕‐𝗠𝗼𝗧‐𝗜𝗻𝗳𝗼𝗴𝗿𝗮𝗽𝗵𝗶𝗰。了解更多:https://x.com/SenseTime_AI/status/2061465029959209106?s=20

Berryxia.AI@berryxia · 6月2日51

记得4月我们内部Apple 给大家介绍ComfyUI工作流时,很多人一脸懵逼! 因为他们平时都是玩豆包、DeepSeek 的! 压根没有接触过ComfyUI 这玩意,但是也和客户,以及周围干业务的人接触知道。 其实这玩意在工作流生产环节中使用的频率非常高! 我也发现一个趋势越来越明… 5月他们悄无声息地集成了11个跨图像、3D、音频、视频和多模态的新模型。 最亮眼的几个直接可以把项目效率拉高了一个量级。 Krea 2 把风格优先的图像生成直接拉进来,第一天就以Partner Node形式上线。 它不再只拼画面里有什么,是把整个画面的感觉做到极致。 VOID来自Netflix,能把对象连同它带来的阴影、反射、物理交互全部干净移除,Apache 2.0开源,原生支持。 Tripo 3.1加TripoSplat,则实现了一张图直接出完整3D Gaussian资产,全流程端到端。 此外Gemma 4、Stable Audio 3、BiRefNet、MoGe、Claude、OpenRouter、Luma UNI-1也同步上线。 这些模型以前可能还得单独开云端账号、调API、处理格式兼容。 现在全变成ComfyUI里的节点,随手拖拽就能串成复杂工作流。 这其实戳破了一个共识:AI进步不是靠单一模型越来越大,而是靠本地工具把最新能力快速变成可组合、可重复的生产力。 ComfyUI把前沿研究直接转化成每个人都能本地跑的节点,真正让创作者把控制权握在自己手里。

译ComfyUI在5月集成了11个涵盖图像、3D、音频、视频和多模态的新模型,将前沿AI能力转化为可本地运行的节点。亮点包括:Krea 2以Partner Node形式上线,专注于风格优先的图像生成;来自Netflix的VOID可干净移除对象及其引发的阴影、反射等物理交互;Tripo 3.1与TripoSplat结合,实现单图端到端生成3D Gaussian资产。此外,Gemma 4、Stable Audio 3等模型也已同步上线。用户无需单独调用API或处理兼容性,通过节点拖拽即可构建复杂工作流。

Krea@krea_ai · 6月2日62

Krea 2 LoRAs are now available to everyone. try this one below 👇

译Krea 2 LoRAs 现已向所有人开放。 试试下面这个 👇

Google Gemini@GeminiApp · 6月2日71

Easily add yourself to your video creations in Gemini. Here’s how to create your own digital avatar that looks and sounds like you with Gemini Omni. 🧵

译轻松将自己添加到Gemini的视频创作中。 以下是如何使用Gemini Omni创建一个外观和声音都像你的数字分身。🧵

SenseTime@SenseTime_AI · 6月1日67

𝗚𝗲𝘁𝘁𝗶𝗻𝗴 𝗰𝗵𝗮𝗿𝘁𝘀 𝗮𝗻𝗱 𝗱𝗶𝗮𝗴𝗿𝗮𝗺𝘀 𝗿𝗶𝗴𝗵𝘁 𝘄𝗶𝘁𝗵 #𝗔𝗜 📊 Most AI models still struggle with these data visuals — negatives shown as positives, bar positions off, element relationships scrambled. 𝗦𝗲𝗻𝘀𝗲𝗡𝗼𝘃𝗮‐𝗨𝟭‐𝟴𝗕‐𝗠𝗼𝗧‐𝗜𝗻𝗳𝗼𝗴𝗿𝗮𝗽𝗵𝗶𝗰 breaks through that barrier. Generate accurate visuals, then tweak the design and layout on the fly. See the difference and try it yourself: See the difference and try it yourself: 🤗 https://huggingface.co/sensenova/SenseNova-U1-8B-MoT-Infographic 🖼️ Showcases: https://github.com/OpenSenseNova/SenseNova-U1/blob/main/docs/u1_infographic_showcases.md 👾 Discord: https://discord.gg/BuTXPHmQub@github @huggingface @github

译大多数AI模型在生成图表时存在数值错误(如负值显示为正)、柱状图位置偏移、元素关系混乱等问题。SenseNova-U1-8B-MoT-Infographic(SenseNova-U1)专为解决此类图表生成问题而设计,能够生成准确的图表,并支持实时调整设计和布局。项目在Hugging Face提供了模型,并在GitHub展示了效果案例。

Kling AI@Kling_ai · 6月1日32

What if you could pack a cloud in a bag? ☁️ Here’s how we made it with Kling AI.

译如果你能把云装进袋子里会怎样?☁️ 这是我们用可灵AI实现的方式。

向阳乔木@vista8 · 6月1日68

在 X 上看了不少文章封面,发现普遍都很丑,包括自己的。 我让@xiaoxiaodong01 发了一个他满意的提示词。 在此基础让 ChatGPT优化,把硬性限定词都去掉,给 AI 充分的发挥空间。 以后任意一篇文章丢给ChatGPT或Codex都可以生成类似的 5:2 大字封面。 提示词见评论区

译推文作者指出在社交平台上看到的文章封面普遍不好看,并分享了一个解决方案。他将一个满意的封面生成提示词交给ChatGPT进行优化,具体做法是去除提示词中的硬性限定词,为AI模型(ChatGPT或Codex)留出更自由的发挥空间。经过优化后,形成了一个可复用的提示词(5:2比例),未来只需将任意文章内容提供给AI,即可生成类似风格的大字封面。

Orange AI@oran_ge · 6月1日25

给播客设计封面,我想让 AI 在橘色的背景中放置一把舒适的椅子,但是 AI 试了多次,我始终不满意 我只好去翻找人类设计师做过的经典的椅子 翻了几页,一眼就看上了这把 Ball Chair 星球椅 这把椅子本身就很像一只被刀切开的橘子 世界上怎么会有这么完美地契合「橘座」这个名字的椅子呢? 可惜这把椅子的售价超过一万美金始终买不起 这把椅子的故事是这样的: 设计这张椅子的理由非常明显,我们搬到我们第一个家,我在1962年开始从事自由业工作。 我们有一个家,但是没有合适的大椅子,所以我决定制作一张大椅子并采用全新的设计,完成一部分的草图后,我发现这张椅子的形状已经变成了如此简略,它的形状简略到只是个球形,我把完整尺寸的设计图钉在墙上,为了知道坐进里面时,我的头将会如何移动,我坐进了椅子里面,作为我们之中较高的一个,我坐进去椅子里,我的妻子在设计图上绘出头部的动线,这就是我确认椅子高度的方法,由于我的目标是球形,其他的线条很容易画出,只要记得线条必须符合椅子的开口。 在此之后,我使用内部模具来制作第一个原型椅,内模同样也被用来制作滑翔机的机身及机翼,我用湿纸覆盖着胶合板物体模具,用玻璃纤维覆盖表面、打磨椅身,从椅子里面取出模具,装上软垫以及椅脚,最后我安装了红色电话筒在椅子内壁上,关于椅子的命名非常简单,球椅就这么诞生了。 —埃罗•阿尼奥

译用户在设计播客封面时,用AI生成“橘色背景中的椅子”多次不满意,转而翻阅人类设计师经典作品,最终被埃罗·阿尼奥设计的“Ball Chair星球椅”吸引。该椅子形状酷似被切开的橘子,完美契合“橘座”创意,但售价超过一万美金。推文分享了埃罗·阿尼奥的创作自述:其设计源于为新家寻找一把大椅子,最终简化为球形,并详细描述了从草图、原型制作(使用类似滑翔机机身的内模和玻璃纤维)到安装电话内件和命名的过程。

MiniMax (official)@MiniMax_AI · 6月1日62

I could watch SVG tests all day! Send me more with M3 👀

译我可以整天看SVG测试!快用M3多发点给我 👀

Alibaba Cloud@alibaba_cloud · 6月1日44

Blooming Silent Dreams: Safeguarding Everyday Wonders with AI. Happy Children’s Day! 🎉 As the 1st AI-native project for children with disabilities, Qwen & Wan turn silent sketches from non-verbal kids into animations, ensuring voiceless dreams are heard. Watch👇

译绽放的无声梦想:用AI守护日常奇迹。 儿童节快乐!🎉 作为首个面向残疾儿童的AI原生项目,通义千问与万相将非语言儿童的无声涂鸦转化为动画,确保无声的梦想被听见。 观看👇

PixVerse@PixVerse_ · 6月1日43

Nice shot from @CharaspowerAI ! He gets it. Great read from someone who clearly understands what real VFX control should feel like. That level of control is the shift with PixVerse C1!

译PixVerse C1在文本生成视觉特效(text-to-VFX)方面展示了强大的能力,提供了前所未有的控制力和电影级画质。用户通过一个复杂的提示词(涉及火山喷发、风暴、镜头运动和爆炸效果)生成了专业级VFX片段,其镜头动态、粒子效果和光照被视为真实的专业VFX制作水平。该模型被认为在控制力和质量上达到了一个全新的层次。

Orange AI@oran_ge · 6月1日45

为她做一个游戏 可能是最好的儿童节礼物

译一位开发者使用AI工作流平台ColaOS,在两周时间内为女儿制作了一款哈利波特主题的专属游戏。整个流程涵盖了故事生成、剧本创作、分镜设计、人物与场景图像生成、转场视频、音效及鼠标特效等完整环节。游戏设计了5种结局,包含收集物品解锁成就及开启下一故事彩蛋的机制。

Artificial Analysis@ArtificialAnlys · 6月1日74

HiDream-O1-Image-Dev-2604 debuts as the leading open weights Text to Image model in the Artificial Analysis Image Arena, with the base HiDream-O1-Image and HiDream-O1-Image-Dev also available open weights but landing lower on the leaderboard @HiDream_AI's O1-Image family spans three models: the 8B HiDream-O1-Image, its distilled HiDream-O1-Image-Dev, and HiDream-O1-Image-Dev-2604, a fine-tune of Dev with a prompt-enhancement pipeline, previously listed pseudonymously as Peanut. The base and Dev models accept text plus up to 10 image inputs, spanning generation and instruction-based image editing. On the Artificial Analysis Text to Image Arena, HiDream-O1-Image-Dev-2604 leads all open weights models, delivering quality similar to proprietary models like ByteDance's Seedream 4.0 and Black Forest Labs' FLUX.2 [max]. In Image Editing, HiDream-O1-Image is the second-highest open weights model, behind only Tencent's HunyuanImage 3.0 Instruct. Weights and the full inference pipeline (including HiDream's prompt refiner used during evaluation for HiDream-O1-Image-Dev-2604) are open-source on Hugging Face and GitHub under the MIT license. HiDream-O1-Image and HiDream-O1-Image-Dev are also available across third-party API providers including Fal, priced on Fal at $10/1k images and $5/1k images respectively. Congratulations to @HiDream_ai on the releases! See below for comparisons between the HiDream-O1-Image family and other leading models in the Artificial Analysis Image Arena 🧵

译HiDream发布O1-Image系列文生图模型,包含8B参数的HiDream-O1-Image、其蒸馏版本HiDream-O1-Image-Dev,以及基于Dev微调并集成提示增强管线的HiDream-O1-Image-Dev-2604。在Artificial Analysis Text to Image Arena榜单上,Dev-2604版本在所有开源权重模型中排名第一,生成质量接近Seedream 4.0和FLUX.2 [max]等闭源模型。在图像编辑任务中,HiDream-O1-Image是排名第二高的开源模型,仅次于腾讯的HunyuanImage 3.0 Instruct。所有模型的权重及完整推理管线均以MIT许可证开源。HiDream-O1-Image与HiDream-O1-Image-Dev也通过Fal等第三方API提供,价格分别为$10/1k images和$5/1k images。

PixVerse@PixVerse_ · 5月31日59

PixVerse is now available in 🦞OpenClaw. Create videos with text-to-video and image-to-video directly inside OpenClaw. Huge thanks to @vincent_koc and the @openclaw team for the collaboration. https://docs.openclaw.ai/providers/pixverse

译PixVerse现已在🦞OpenClaw中可用。 可直接在OpenClaw内使用文本生成视频和图像生成功能。 特别感谢@vincent_koc和@openclaw团队的合作。 https://docs.openclaw.ai/providers/pixverse

小互@xiaohu · 5月31日73

效果不错,已经安装了 回头改造下

译用户开发的“中文小黑怪诞”正文配图生成 Skill,在 GitHub 周榜上位列第二。该项目原本是为自己 Notion 文档生成配图而开发,特点是 16:9 比例、白底手绘风格,并带少量红、橙、蓝三色批注。用户发现该项目意外上榜后,表达了对排名的惊喜与再接再厉的心情。

🚨 AI News | TestingCatalog@testingcatalog · 5月31日62

BUILD 🔥: Microsoft is preparing new image and voice models for the announcement on June 2. > MAI Voice 2, a multilingual model supporting 15 news languages and a wider range of emotional spectrum (check voice samples in the article) > MAI Transcribe 1.5, a new model for speech-to-text use cases. > MAI Image 2.5, already announced last week, is now available on LM Arena in preview. Compared to MAI Image 2, it supports file uploads and can be used for image editing.

译BUILD 🔥: 微软正为 6 月 2 日的发布会准备新的图像和语音模型。 > MAI Voice 2,一个支持 15 种新闻语言和更广泛情感光谱的多语言模型(请在文章中查看语音样本) > MAI Transcribe 1.5,一个用于语音转文本用例的新模型。 > MAI Image 2.5,已于上周公布,现已在 LM Arena 上以预览版形式提供。与 MAI Image 2 相比,它支持文件上传,并可用于图像编辑。

🚨 AI News | TestingCatalog@testingcatalog · 5月31日16

Which image do you like the most? One of them is from the unreleased model, one is Nano Banana Pro and one is GPT Image 2. Prompt below. Model reveal later today.

译你最喜欢哪张图片? 其中一张来自未发布的模型,一张来自 Nano Banana Pro,一张来自 GPT Image 2。 提示词如下。 模型将于今天晚些时候揭晓。

Google AI Developers@googleaidevs · 5月30日71

ICYMI: Nano Banana Pro [gemini-3-pro-image] and Nano Banana 2 [gemini-3.1-flash-image] are now GA and ready for production via the Gemini API. Check out these great community examples to see the capabilities of both models in action 🧵

译ICYMI:Nano Banana Pro [gemini-3-pro-image] 和 Nano Banana 2 [gemini-3.1-flash-image] 现已正式发布,可通过 Gemini API 投入生产使用。 查看这些优秀的社区示例,了解两个模型的实际能力 🧵

AYi@AYi_AInotes · 5月30日43

Damn,这个是我最近看到的最好的AI视频之一,看的窝鼻子酸酸的😭 也许这就是AI的意义之一吧,把影视作品里我们想看没有拍出来的做出来。 讲的是《黑袍纠察队》里的祖国人、士兵,还有那个孩子,一家三代一起去中国旅行的故事。 看过原片的人应该会挺触动的,这三个人在剧里势同水火,论血缘又是实打实的爷孙三代,但是他们从没好好当过一家人,更不会有这样一个一起出门的清晨。 想起我小时候看完一部喜欢的电影,会趴在桌上接着画后面的剧情,给角色补一个片子里没拍的结局, 那时候只能画在纸上,自己看,谁能想到今天现AI 能让它真的动起来😭 电影拍的是发生过的, AI 拍的是我们希望发生的,或者是哪些意难平的。 今天在B站刷到这个视频,好几个up主都在上传,不知道原作者是谁,但做的真的好啊,作者看到的话来认领下呀

译推文通过《黑袍纠察队》AI视频案例,点明AI意义在于呈现“希望发生的”剧情。核心讨论了AI工具的两条发展路径:以Claude Code为代表的“AI智能体型”(自主运行)与以Cursor为代表的“实习生型”(需人类监督判断)。作者认为后者是“以术入道”培养判断力的过程,但受限于必须人在场。为此推荐使用免费的UU远程配合Cursor,实现手机远程控制电脑,消除物理距离限制,从而随时随地磨练使用者自身,成为优秀的提问者。

Chubby♨️@kimmonismus · 5月30日56

A 95-minute AI-generated action movie just screened at Cannes’ Marché du Film. It was made in just two weeks for around $500,000, with most of the budget going into compute, proving that AI filmmaking is moving from demo clips to full-length productions. And that's special. They managed to produce the film's length (the clips created are usually very short) while staying within a very low budget.

译一部95分钟的AI生成动作片刚刚在戛纳电影市场放映。 它仅用两周时间、约50万美元预算制作完成,大部分预算用于算力,证明AI电影制作正从演示片段转向完整长片。 这很特别。他们设法制作了电影长度的作品(通常生成的片段非常短),同时保持了极低的预算。

向阳乔木@vista8 · 5月30日52

Codex 制作的 Suno MTV,任意一首Suno歌曲自动转成带LRC歌词同步显示的 MV。 图片由Codex根据歌词内容自动生成,还挺符合意境。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月3日
13:39
Alibaba Cloud@alibaba_cloud
47
Narek Hayrapetyan,Picsart视频产品负责人 推出HappyHorse和Wan模型后,视频生成量激增72%,用户每月创建超过100万个资产,并使用超过600万Picsart积分。
图像生成行业动态视频
09:48
Berryxia.AI@berryxia
74
微软在Build大会发布七款MAI新模型

微软在Build大会宣布推出七个全新的MAI模型家族。该家族以“干净数据血统”从零开始训练,旨在任务专精并能无缝协作。其中,MAI-Code-1-Flash在SWE-Bench Verified上得分71.6,比Claude Haiku 4.5高出5分,并能节省60% token。MAI-Transcribe-1.5处理一小时音频仅需15秒,在43种语言上实现速度与准度领先。微软此次发布旨在展示其从零构建、专精且能协同工作的模型发展路径。

Microsoft AI: Seven new models launching at Build: let's go! Reasoning. Code. Image. Transcribe. Voice. Built from scratch on a clean ...

Microsoft图像生成模型发布编码
09:48
Berryxia.AI@berryxia
64
微软MAI-Image-2.5在图像编辑评测中位列第二

微软发布新模型MAI-Image-2.5,并在Image Edit Arena(单图编辑)评测中取得第二名,得分为1401。根据评测数据,该模型分数比Nano Banana 2、Grok Imagine Image Quality和ChatGPT-Image-Latest-High Fidelity高出10分。尽管取得了进步,但评测显示当前的第一名仍是GPT-Image-2模型。该消息来源于X用户@berryxia。

Arena.ai: MAI-Image-2.5 has officially released from @MicrosoftAI landing at #2 in the Image Edit Arena (Single-Image-Edit) with a...

Microsoft图像生成模型发布
08:30
jason@jxnlco
46
模型 'gpt-image-2' 不存在 https://chatgpt.com/s/m_6a1f701a74748191b883735fff3b28d7
OpenAI产品更新图像生成
08:26
DogeDesigner@cb_doge
21
Grok Imagine 处理 Logo 的效果相当不错。🔥
xAI图像生成评测/基准
06:29
fofr@fofrAI
37
K2 处理风格参考强度的方式真的很棒。

fofr: Playing around a bit with Krea's K2 Large image model. I love how expressive it feels, and the variability you get with ...

图像生成评测/基准
04:47
Chubby♨️@kimmonismus
18
"大家都讨厌 AI 垃圾内容" "我们将决定:这是氛围感,还是垃圾?" 这听起来是个有趣的活动 :D
图像生成现象/趋势
04:29
fofr@fofrAI
29
稍微玩了一下 Krea 的 K2 Large 图像模型。我很喜欢它带来的表现力,以及每个提示词产生的多样性。
其他图像生成
03:59
OpenRouter@OpenRouter
精选68
三款新的 @MicrosoftAI 模型现已在 OpenRouter 上线! 同步推出:MAI-Image-2.5、MAI-Transcribe-1.5 和 MAI-Voice-2。详情见下文 🧵
Microsoft产品更新图像生成多模态

推荐理由:微软三个多模态模型一口气上架 OpenRouter,图像、转录、语音全齐了,开发者直接调 API 就能用,做产品的可以试试效果。
03:06
向阳乔木@vista8
70
论文图表生成框架Harness的架构与实践

Hugging Face 上一篇热门论文介绍了名为 Harness 的 AI 论文图表生成框架。该框架围绕一个共享的结构化规格文档 S 运作,包含四个协作角色:设计者生成视觉方案,执行者渲染图像或代码,验证者输出带定位的诊断报告,修订者据此修改规格文档 S。作者参考该框架进行了简化实践,写成一个技能包,其中使用了 GPT-image-2 进行生图,并整合了 URL 抓取功能,可直接生成配图。

Hugging Face图像生成多模态教程/实践
01:17
Artificial Analysis@ArtificialAnlys
62
Krea 2 Medium在AI文生图排行榜位列第6,性能与定价引发关注

Krea AI自研的文生图模型Krea 2 Medium在Artificial Analysis排行榜上位列第6,仅落后于OpenAI、Google和NVIDIA的模型。值得注意的是,体积更小、速度更快的Medium版本在排名上超过了定位更强大的Large版本。两款模型均支持通过API进行风格迁移和创意控制等操作,生成1K分辨率图像。定价方面,Krea 2 Medium为30美元/千张,Krea 2 Large为60美元/千张。

图像生成模型发布评测/基准
01:14
Krea@krea_ai
57
Krea 2 现已上线 @ArtificialAnlys 独立研究实验室排名第一的图像模型,全球文本到图像排行榜第六。 开源版本正在制作中,即将推出。
图像生成开源生态评测/基准
6月2日
23:45
AK@_akhaliq
62
Crafter 一个用于从多样化输入生成可编辑科学图表的多智能体框架
图像生成论文/研究
23:22
Kling AI@Kling_ai
21
你最喜欢的世界杯球队是哪支?为他们生成一段助威舞蹈视频吧!🎉
产品更新图像生成视频
23:05
SenseTime@SenseTime_AI
精选81
商汤开源SenseNova-Skills AI办公技能套件

商汤开源了AI办公技能套件SenseNova-Skills。这是一个为任何技能兼容智能体(如OpenClaw与HermesAgent)设计的开源技能集合,提供四大核心功能:图像信息图表生成(可镜像参考风格)、数据分析(支持多表解析、清洗与可视化)、PPT创建(生成大纲内容并智能排版,输出可编辑文件)以及深度研究(跨学术、技术、社交等多源搜索并生成报告)。该技能套件现已完全开源。

智能体图像生成开源/仓库

推荐理由:商汤掏出了一套开箱即用的 agent 技能包,从做图到写报告都能一键接,而且代码全在 GitHub 上。想做 agent 产品的可以直接 fork 当乐高用,比等 API 发布快多了。
22:43
Krea@krea_ai
32
"现实如此无聊" Krea 播客与 @edbyus、@serialcut,以及 remembering_orion。 完整采访见下方 👇
图像生成行业动态
21:29
OpenRouter@OpenRouter
53
图像输出模型排行榜:https://openrouter.ai/rankings#image-output GPT Image 2 上周增长显著:
OpenAI产品更新图像生成
14:32
宝玉@dotey
67
baoyu-image-gen Skill 支持 Codex-cli 作为 Provider 画图 也就是说你可以在 Claude Code、hermes agent 之类的 Agent 里面用它调用 Codex 出图,而不需要用 Codex,当然前提是安装了 codex cli 并且有订阅。 感谢网友的 PRs: https://github.com/JimLiu/baoyu-skills/pull/158 https://github.com/JimLiu/baoyu-skills/pull/161 Skill 地址:https://github.com/JimLiu/baoyu-skills/tree/main/skills/baoyu-image-gen
GitHubMCP/工具图像生成开源/仓库
12:35
SenseTime@SenseTime_AI
同事件精选73
感谢使用我们的模型来创建这些复杂的图表和图表。 看到具有挑战性的信息被转化为清晰、准确和可读的视觉效果真是太棒了。这就是我们的目标。😄

The AI Colony: SenseNova U1 just released an infographic-specialized version and +18.2 on IGenBench Q-ACC isn't a rounding error. It me...

Hugging Face图像生成开源生态模型发布
同一事件,精选展示《商汤发布信息图生成模型升级,增强多项核心能力》
推荐理由:SenseNova U1 这波信息图特化不是刷分,+18.2 Q-ACC 证明模型真的懂了排版,做汇报、做图表的可以直接上 Hugging Face 扒下来用。
12:35
SenseTime@SenseTime_AI
71
将复杂信息转化为准确的图表和示意图。这就是 SenseNova-U1-8B-MoT-Infographic。了解更多:https://x.com/SenseTime_AI/status/2061465029959209106?s=20

Future Stacked: AI-generated infographics with garbled text have been a running joke. SenseNova U1's new infographic-enhanced model fina...

Hugging Face图像生成多模态模型发布
关联讨论 1 条X:商汤 SenseTime (@SenseTime_AI)
08:47
Berryxia.AI@berryxia
51
ComfyUI 5月工作流更新:集成11个新模型

ComfyUI在5月集成了11个涵盖图像、3D、音频、视频和多模态的新模型,将前沿AI能力转化为可本地运行的节点。亮点包括:Krea 2以Partner Node形式上线,专注于风格优先的图像生成;来自Netflix的VOID可干净移除对象及其引发的阴影、反射等物理交互;Tripo 3.1与TripoSplat结合,实现单图端到端生成3D Gaussian资产。此外,Gemma 4、Stable Audio 3等模型也已同步上线。用户无需单独调用API或处理兼容性,通过节点拖拽即可构建复杂工作流。

ComfyUI: In May, we integrated 11 new models spanning image, 3D, audio, video, and multimodal. The highlights: → Krea 2 - style-f...

产品更新图像生成多模态开源生态
05:08
Krea@krea_ai
62
Krea 2 LoRAs 现已向所有人开放。 试试下面这个 👇
产品更新图像生成
00:26
Google Gemini@GeminiApp
精选71
轻松将自己添加到Gemini的视频创作中。 以下是如何使用Gemini Omni创建一个外观和声音都像你的数字分身。🧵
Google图像生成教程/实践视频
关联讨论 1 条X:Berry Xia (@berryxia)
推荐理由:官方给了个傻瓜教程,看一遍就能在视频里塞进自己的数字分身,做短视频和教学的可以省掉真人出镜的麻烦。
6月1日
23:34
SenseTime@SenseTime_AI
同事件精选67
SenseNova新模型解决AI图表生成难题

大多数AI模型在生成图表时存在数值错误(如负值显示为正)、柱状图位置偏移、元素关系混乱等问题。SenseNova-U1-8B-MoT-Infographic(SenseNova-U1)专为解决此类图表生成问题而设计,能够生成准确的图表,并支持实时调整设计和布局。项目在Hugging Face提供了模型,并在GitHub展示了效果案例。

GitHubHugging Face图像生成模型发布
同一事件,精选展示《商汤发布信息图生成模型升级,增强多项核心能力》
推荐理由:大部分AI生成的图表都有标注错误或比例失调,商汤这个模型专攻信息图准确性,对常做图表的产品人和分析师来说值得一试。
23:13
Kling AI@Kling_ai
32
如果你能把云装进袋子里会怎样?☁️ 这是我们用可灵AI实现的方式。
图像生成教程/实践视频
23:04
向阳乔木@vista8
68
分享一个用ChatGPT优化提示词生成文章封面的方法

推文作者指出在社交平台上看到的文章封面普遍不好看,并分享了一个解决方案。他将一个满意的封面生成提示词交给ChatGPT进行优化,具体做法是去除提示词中的硬性限定词,为AI模型(ChatGPT或Codex)留出更自由的发挥空间。经过优化后,形成了一个可复用的提示词(5:2比例),未来只需将任意文章内容提供给AI,即可生成类似风格的大字封面。

图像生成教程/实践
21:52
Orange AI@oran_ge
25
AI生成封面不如经典设计,一把"橘座"星球椅的启示

用户在设计播客封面时,用AI生成“橘色背景中的椅子”多次不满意,转而翻阅人类设计师经典作品,最终被埃罗·阿尼奥设计的“Ball Chair星球椅”吸引。该椅子形状酷似被切开的橘子,完美契合“橘座”创意,但售价超过一万美金。推文分享了埃罗·阿尼奥的创作自述:其设计源于为新家寻找一把大椅子,最终简化为球形,并详细描述了从草图、原型制作(使用类似滑翔机机身的内模和玻璃纤维)到安装电话内件和命名的过程。

其他图像生成
19:17
MiniMax (official)@MiniMax_AI
62
我可以整天看SVG测试!快用M3多发点给我 👀

WorldofAI: Minimax M3 is excellent at SVG generation, reaching close to Gemini 3.5 Flash levels and beating Opus 4.7 on SVG-Bench. ...

图像生成开源生态评测/基准
12:32
Alibaba Cloud@alibaba_cloud
44
绽放的无声梦想:用AI守护日常奇迹。 儿童节快乐!🎉 作为首个面向残疾儿童的AI原生项目,通义千问与万相将非语言儿童的无声涂鸦转化为动画,确保无声的梦想被听见。 观看👇
图像生成行业动态
11:04
PixVerse@PixVerse_
43
PixVerse C1在文本生成视觉特效(text-to-VFX)方面展示了强大的能力,提供了前所未有的控制力和电影级画质。用户通过一个复杂的提示词(涉及火山喷发、风暴、镜头运动和爆炸效果)生成了专业级VFX片段,其镜头动态、粒子效果和光照被视为真实的专业VFX制作水平。该模型被认为在控制力和质量上达到了一个全新的层次。

Pierrick Chevallier | IA: It's actually crazy how few people are talking about how powerful Pixverse C1 is for text-to-VFX.We're on a completely d...

图像生成教程/实践视频
10:50
Orange AI@oran_ge
45
一位开发者使用AI工作流平台ColaOS,在两周时间内为女儿制作了一款哈利波特主题的专属游戏。整个流程涵盖了故事生成、剧本创作、分镜设计、人物与场景图像生成、转场视频、音效及鼠标特效等完整环节。游戏设计了5种结局,包含收集物品解锁成就及开启下一故事彩蛋的机制。

Percival: 女儿想要哈利波特的魔法世界,我用 ColaOS 在两周内给她造了一个专属游戏 从故事→剧本→分镜→人物/场景剧照→转场视频→音效→鼠标特效,一共设计了 5 种结局。收集物品解锁成就,最终打开下一个故事的彩蛋。 但看到她认真玩进去的那一刻--...

其他图像生成多模态视频
04:55
Artificial Analysis@ArtificialAnlys
74
HiDream发布O1-Image系列文生图模型

HiDream发布O1-Image系列文生图模型,包含8B参数的HiDream-O1-Image、其蒸馏版本HiDream-O1-Image-Dev,以及基于Dev微调并集成提示增强管线的HiDream-O1-Image-Dev-2604。在Artificial Analysis Text to Image Arena榜单上,Dev-2604版本在所有开源权重模型中排名第一,生成质量接近Seedream 4.0和FLUX.2 [max]等闭源模型。在图像编辑任务中,HiDream-O1-Image是排名第二高的开源模型,仅次于腾讯的HunyuanImage 3.0 Instruct。所有模型的权重及完整推理管线均以MIT许可证开源。HiDream-O1-Image与HiDream-O1-Image-Dev也通过Fal等第三方API提供,价格分别为$10/1k images和$5/1k images。

Hugging Face图像生成开源生态模型发布
5月31日
15:47
PixVerse@PixVerse_
59
PixVerse现已在🦞OpenClaw中可用。 可直接在OpenClaw内使用文本生成视频和图像生成功能。 特别感谢@vincent_koc和@openclaw团队的合作。 https://docs.openclaw.ai/providers/pixverse
产品更新图像生成视频
09:45
小互@xiaohu
73
用户开发的"中文小黑怪诞"正文配图生成 Skill,在 GitHub 周榜上位列第二。该项目原本是为自己 Notion 文档生成配图而开发,特点是 16:9 比例、白底手绘风格,并带少量红、橙、蓝三色批注。用户发现该项目意外上榜后,表达了对排名的惊喜与再接再厉的心情。

Ian (伊恩): 我的天!我的 Skill 在 GitHub 本周排第二啦! 刚刷到藏师傅项目冲到第一,我点进去一看,笑死,我这个也在榜上,排第二 就是这个中文小黑怪诞正文配图生成 Skill: http://github.com/helloianneo/i...

GitHub图像生成开源/仓库
06:53
🚨 AI News | TestingCatalog@testingcatalog
62
BUILD 🔥: 微软正为 6 月 2 日的发布会准备新的图像和语音模型。 > MAI Voice 2,一个支持 15 种新闻语言和更广泛情感光谱的多语言模型(请在文章中查看语音样本) > MAI Transcribe 1.5,一个用于语音转文本用例的新模型。 > MAI Image 2.5,已于上周公布,现已在 LM Arena 上以预览版形式提供。与 MAI Image 2 相比,它支持文件上传,并可用于图像编辑。
Microsoft图像生成多模态模型发布
04:53
🚨 AI News | TestingCatalog@testingcatalog
16
你最喜欢哪张图片? 其中一张来自未发布的模型,一张来自 Nano Banana Pro,一张来自 GPT Image 2。 提示词如下。 模型将于今天晚些时候揭晓。
OpenAI图像生成行业动态
5月30日
19:45
Google AI Developers@googleaidevs
精选71
ICYMI:Nano Banana Pro 【gemini-3-pro-image】 和 Nano Banana 2 【gemini-3.1-flash-image】 现已正式发布,可通过 Gemini API 投入生产使用。 查看这些优秀的社区示例,了解两个模型的实际能力 🧵
Google图像生成模型发布

推荐理由:Gemini 图像模型 GA 了,生成式视觉正式进入 Google 时间,做设计工具和内容生成的开发者可以直接接入测试,看看能不能成为下一个 Midjourney。
17:34
AYi@AYi_AInotes
43
以术入道,用远程工具连接你的AI实习生

推文通过《黑袍纠察队》AI视频案例,点明AI意义在于呈现“希望发生的”剧情。核心讨论了AI工具的两条发展路径:以Claude Code为代表的“AI智能体型”(自主运行)与以Cursor为代表的“实习生型”(需人类监督判断)。作者认为后者是“以术入道”培养判断力的过程,但受限于必须人在场。为此推荐使用免费的UU远程配合Cursor,实现手机远程控制电脑,消除物理距离限制,从而随时随地磨练使用者自身,成为优秀的提问者。

AYi: 今天,把一件关于 AI 很底层的事,彻底想透了。 使用 AI 的最佳方式是以道御术,但前提是你得先以术入道。 就像黄仁勋说的--真正会用 AI 的人,都是极高认知的提问者,带着自己的认知去提问,让 AI 帮你叩开未知的边界,而不是让它替你思...

图像生成现象/趋势视频
16:16
Chubby♨️@kimmonismus
56
一部95分钟的AI生成动作片刚刚在戛纳电影市场放映。 它仅用两周时间、约50万美元预算制作完成,大部分预算用于算力,证明AI电影制作正从演示片段转向完整长片。 这很特别。他们设法制作了电影长度的作品(通常生成的片段非常短),同时保持了极低的预算。
图像生成现象/趋势视频
12:11
向阳乔木@vista8
52
Codex 制作的 Suno MTV,任意一首Suno歌曲自动转成带LRC歌词同步显示的 MV。 图片由Codex根据歌词内容自动生成,还挺符合意境。
图像生成多模态教程/实践
‹ 上一页
1…56789…18
下一页 ›