AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 699 条
全部一手资讯X论文
标签「图像生成」清除
fofr@fofrAI · 6月7日65

Start with an image of a building and prompt for a projection mapping with Omni.

译从一张建筑图像开始,并使用 Omni 提示生成投影映射。

fofr@fofrAI · 6月6日67

Same prompt with Reve. I love how differently it's interpreted.

译与 Reve 使用相同的提示词。我喜欢它截然不同的解读方式。

fofr@fofrAI · 6月6日63

> Make it spray paint

译把它变成喷漆画。 Omni:把它变成湿黏土中写字的棍子。

fofr@fofrAI · 6月6日44

Trying Omni image-to-video with this Krea K2 output to try making an anime intro sequence.

译尝试将这张Krea K2的输出用于Omni图像转视频,试图制作一段动漫开场序列。

OpenRouter@OpenRouter · 6月6日71

Live on OpenRouter: Riverflow 2.5 from @riverflow_ai The first image model with an independent scoring rubric you control to guide its thinking and editing, with controllable reasoning effort to trade speed for quality. Free until Tuesday June 9. Fast and Pro below 🧵

译Live on OpenRouter: Riverflow 2.5 来自 @riverflow_ai 首个拥有独立评分标准的图像模型,你可以控制该标准来引导其思考与编辑,并可通过调节推理投入在速度与质量之间权衡。 免费至6月9日周二。Fast 与 Pro 见下方🧵

OpenRouter@OpenRouter · 6月6日60

Live on OpenRouter: Riverflow 2.5 from @Sourceful. The first image model with an independent scoring rubric you control to guide its thinking and editing, with controllable reasoning effort to trade speed for quality. Free until Tuesday June 9. Fast and Pro below 🧵

译在OpenRouter上线:来自@Sourceful的Riverflow 2.5。 首个具有独立评分标准的图像模型,你可控制该标准以引导其思维和编辑,并具备可控的推理努力,可在速度与质量之间进行权衡。 免费至6月9日(周二)。Fast和Pro见下方🧵。

Replit ⠕@Replit · 6月6日68

Have you tried the new Replit Canvas? - Create beautiful UI designs with AI - Generate assets with GPT-Image 2 & Seedance - Turn your designs into launch-ready apps in minutes

译你试过新的 Replit Canvas 了吗? - 用 AI 创建美观的 UI 设计 - 使用 GPT-Image 2 & Seedance 生成素材 - 几分钟内将你的设计转化为可发布的应用

Google Gemini@GeminiApp · 6月6日81

You can now create and edit images directly in Gemini Live. Whether testing out room decor, getting help with math, or creating shareable memes, it all happens in real-time. Just open the Gemini app, tap the Live button, share your camera, and tell Gemini what you want to see.

译你现可直接在 Gemini Live 中创建和编辑图像。 无论是测试房间装饰、解决数学问题,还是制作可分享的梗图,所有操作都实时完成。 只需打开 Gemini 应用,点击 Live 按钮,共享摄像头,告诉 Gemini 你想看到的。

Krea@krea_ai · 6月5日48

we’re looking for creatives to join our growing team. apply below 👇

译我们正在寻找创意人才加入我们不断壮大的团队。 下方申请👇

PixVerse@PixVerse_ · 6月5日46

A derelict luxury star-liner. Five Gen-Z scavengers. One AI that just woke up. Space Urbex — PixVerse Originals S1. Neon Salvage Gothic. @michaelheina (PixVerse day-one partner) built a five-person ensemble on PixVerse V6. Match-cut action. Locked character consistency across every shot. RT+Follow+Reply "Originals" = 150 Creds & Full Film in DMs (72H ONLY)

译一艘废弃的豪华星级客轮。 五位 Z 世代拾荒者。一个刚苏醒的 AI。太空废墟探险——PixVerse Originals 第一季。霓虹废土哥特风。 @michaelheina(PixVerse 首日合作伙伴)使用 PixVerse V6 打造了一个五人团体。 匹配剪辑动作。每帧角色一致性锁定。 转发+关注+回复“Originals”= 150 Credits 及私信完整影片(仅限 72 小时)

fofr@fofrAI · 6月5日68

> Amateur vertical phone video, 9:16 aspect ratio. Continuous, unbroken handheld shot of a fluffy tabby cat sitting on a sunny windowsill, looking out into a leafy garden. The cat's tail twitches slowly, and its ears rotate slightly toward ambient noises. Sunbeams illuminate dust motes in the air. Sound design: Gentle breeze, distant bird chirps, quiet mechanical purring. No dialogue.

译> 业余竖屏手机视频,9:16 比例。连续不中断的手持镜头,一只毛茸茸的虎斑猫坐在阳光明媚的窗台上,望向枝叶繁茂的花园。猫的尾巴缓慢抽动,耳朵微微朝向环境噪音转动。阳光照亮空气中的尘埃。声音设计:微风轻拂、远处鸟鸣、安静的机械呼噜声。无对话。

DogeDesigner@cb_doge · 6月5日31

ChatGPT vs Grok Asked both to turn this pixelated logo into a high-resolution image. ChatGPT failed badly while Grok delivered a clean, sharp, high resolution image. Grok is the clear winner.

译ChatGPT vs Grok 让两者将这个像素化的logo转化为高分辨率图像。 ChatGPT严重失败,而Grok提供了干净、清晰的高分辨率图像。 Grok是明显的赢家。

Rohan Paul@rohanpaul_ai · 6月5日57

I tried the newly launched Image-to-3D model, Rodin Gen-2.5, and the biggest improvement is control. It offers five different generation modes to fit a wide range of creative needs. You can generate a million-polygon model in as little as 4 seconds, with support for up to 10 million polygons for highly detailed outputs. Best of all, it comes with native 3D PBR materials, so your models look polished and production-ready right from the start. If you're creating assets at scale, Hyper 3D (@DeemosTech) also supports parallel batch generation, making it easy to speed up your workflow. On top of that, it features Break to Parts for instantly separating model components, as well as local editing capabilities, so you can modify specific areas without regenerating the entire model. From generation speed and model quality to flexible post-editing tools, Hyper 3D covers nearly every stage of the 3D creation pipeline that creators care about.

译Rohan Paul 实测新推出的图像转 3D 模型 Rodin Gen-2.5,最大改进是控制力。提供五种生成模式,最快 4 秒生成百万多边形模型,支持最高 1000 万多边形输出。原生 3D PBR 材质,模型开箱即用。Hyper 3D 还支持并行批量生成、Break to Parts 部件分离和局部编辑,无需重新生成整个模型,覆盖 3D 创作全流程。

歸藏(guizang.ai)@op7418 · 6月5日42

说一下 guizang PPT Skills 还会继续更新啊。 得益于最近的几个赞助,可以找时间去更新第三套主题了,依旧非常惊艳。 同时,在小红书那个图文卡片部分积累的好经验,也会用到 PPT Skills 的新版里面。

译归藏宣布其 PPT Skills 项目将继续更新。得益于近期的赞助,计划开发第三套主题,且会把在小红书图文卡片部分积累的好经验用于新版中。

SenseTime@SenseTime_AI · 6月4日69

"𝗦𝗲𝗿𝗶𝗼𝘂𝘀𝗹𝘆 𝗶𝗺𝗽𝗿𝗲𝘀𝘀𝗶𝘃𝗲 𝘀𝘁𝘂𝗳𝗳". Thanks for the kind words, @gurru_tech — that's 𝗦𝗲𝗻𝘀𝗲𝗡𝗼𝘃𝗮 𝗨𝟭 turning prompts into professional infographics. Unified model that natively understands and generates text and images. Open-sourced. Run it yourself. 🎥Watch the video: https://youtu.be/HKz2e3STUwg 🎛️ SenseNova Studio: https://unify.light-ai.top/ (Try infographics; also join Discord for text-image interleaved gen) 🤗 https://huggingface.co/collections/sensenova/sensenova-u1 🛠️ https://github.com/OpenSenseNova/SenseNova-U1 👾 Discord: https://discord.com/invite/BuTXPHmQub @huggingface @github

译商汤SenseTime发布SenseNova U1,一个原生理解和生成文本与图像的统一模型。该模型已开源,用户可自行运行。被@gurru_tech称赞“令人印象深刻”。提供在线演示平台SenseNova Studio、HuggingFace模型、GitHub代码及Discord社区。

Krea@krea_ai · 6月4日73

introducing Krea 2 Turbo. generate high-quality images in just 2s; compatible with style references, moodboards, and LoRAs. try it for free at krea . ai

译推出 Krea 2 Turbo。 仅需2秒即可生成高质量图像;兼容风格参考、情绪板和 LoRA。 在 krea . ai 免费试用。

SenseTime@SenseTime_AI · 6月4日69

"𝗦𝗲𝗿𝗶𝗼𝘂𝘀𝗹𝘆 𝗶𝗺𝗽𝗿𝗲𝘀𝘀𝗶𝘃𝗲 𝘀𝘁𝘂𝗳𝗳". Thanks for the kind words, @gurru_tech — that's 𝗦𝗲𝗻𝘀𝗲𝗡𝗼𝘃𝗮 𝗨𝟭 turning prompts into professional infographics. Unified model that natively understands and generates text and images. Open-sourced. Run it yourself. 🎥Watch the video: https://youtu.be/HKz2e3STUwg 🎛️ SenseNova Studio: https://unify.light-ai.top/ (Try infographics; also join Discord for text-image interleaved gen) 🤗 https://huggingface.co/collections/sensenova/sensenova-u1 🛠️ https://github.com/OpenSenseNova/SenseNova-U1 👾 Discord: https://discord.com/invite/BuTXPHmQub

译商汤 SenseTime 推出 SenseNova U1 开源多模态模型,实现原生理解与生成文本和图像,可一键将提示词转化为专业信息图。该模型被开发者 @gurru_tech 评价为“非常令人印象深刻”。项目已开源,提供 SenseNova Studio 在线试用,并公开 HuggingFace 模型集合、GitHub 源码仓库及 Discord 社区入口。

Runway@runwayml · 6月4日81

The edits you need, made easy. Aleph 2.0 changes just what you want edited, leaving the rest of your shot untouched. Try it in our new Edit Studio. Get started at the link below.

译你需要的编辑,变得简单。Aleph 2.0 只更改你想要编辑的部分,保持画面的其余部分不变。在我们的新 Edit Studio 中试试。 通过下方链接开始使用。

fofr@fofrAI · 6月4日54

Here's some early tests of Reve 2 with the prompt: > an amateur photo of fantastical realism Two excellent new image models on the same day. What a treat.

译这是 Reve 2 的一些早期测试,提示词为: > an amateur photo of fantastical realism 同日两款优秀的全新图像模型。真是享受。

fofr@fofrAI · 6月4日61

My latest goto negative prompt: "no embellishments" For when a model is trying to be creative in a way you don't like.

译我的最新常用负面提示词: "no embellishments" 当模型试图以你不喜欢的方式发挥创意时使用。

swyx@swyx · 6月4日44

you guys know where this is going right

译引用推文高度评价 Reve 2.0 发布文案。Reve 2.0 的核心理念:可控图像生成与编辑的关键不是更密集的提示词,而是以代码形式呈现的高度详细、可操作的中间表示。指出当前图像生成模型通过渐进退化惩罚迭代,而创造力本质上不是一次性工作流。引用 Alan Kay "做软件应自造硬件" 类比,Reve 认为真正严肃的创意工具公司应训练自己的模型。

AK@_akhaliq · 6月4日62

dMoE dLLMs with Learnable Block Experts

译dMoE 具有可学习块专家的dLLM

歸藏(guizang.ai)@op7418 · 6月4日61

Reve 2.0 这个图像模型强啊 原生 4K 输出,主要是它支持类似于你在 PS 里用到的图像分层之后的编辑能力就。 图像中的每一个部分,你点它就能选中。而且这个不需要中间的处理,他给你处理好了。就是你想要编辑哪个部分,就点哪个部分

译Reve 2.0 图像模型支持原生4K输出,核心亮点在于类似 Photoshop 的图像分层编辑能力。用户点击图像中的任意部分即可选中该区域,无需复杂的中间处理步骤,直接进行针对性编辑。该功能大幅简化了图像局部修改的工作流。

AK@_akhaliq · 6月4日46

Bootstrap Your Generator Unpaired Visual Editing with Flow Matching

译自举你的生成器 非配对视觉编辑与流匹配

DogeDesigner@cb_doge · 6月4日39

Grok Imagine 1.5 video quality is seriously impressive. 🔥

译Grok Imagine 1.5 视频质量确实令人印象深刻。🔥

小互@xiaohu · 6月4日73

Ideogram 发布首个开源AI图像模型:Ideogram 4.0 宣称文字渲染和版面控制拉到了开源天花板 传统文生图只能写一段 prompt 然后祈祷模型把东西放对位置 Ideogram 4.0 引入了 bounding box(边界框)控制:你可以用坐标精确指定每个元素放在画面的哪个区域。 结构化 JSON 提示词:Ideogram 4.0 不只接受纯文本 prompt,还支持一套结构化 JSON 提示词格式。 多语言文字渲染:英文 OCR 准确率达到 0.97(X-Omni 基准测试),并支持跨语言的密集文字渲染,支持(中日韩等非拉丁文字)

译Ideogram 发布首个开源 AI 图像模型 Ideogram 4.0,主推文字渲染与版面控制。模型引入 bounding box(边界框)控制,允许用坐标精确指定元素位置;支持结构化 JSON 提示词格式,不再仅限纯文本;英文 OCR 准确率达 0.97(X-Omni 基准),支持跨语言密集文字渲染,涵盖中日韩等非拉丁文字。

Elon Musk@elonmusk · 6月4日72

Grok Imagine on Vercel

译Vercel 的 AI Gateway 上现已推出 Grok Imagine Video 1.5。该服务支持图生视频并同步音频,一次性完成。示例代码: `await generateVideo({ model: 'xai/grok-imagine-video-1.5-preview', prompt: 'a rabbit sprinting through nyc' });`

宝玉@dotey · 6月4日54

让 Claude Design 设计个 Icon,用 SVG 给我直接画,看着还行,好歹是矢量的

🚨 AI News | TestingCatalog@testingcatalog · 6月4日53

Reve 2.0 is now available, and it landed in second place in the text-to-image arena, outranking Nano Banana 2. > We invented a new way to generate and edit any image using precise layouts. For the first time, it’s possible to create images you can touch. > Images are represented as code, so every part of an image becomes addressable, editable, and manipulable. > Every image in Reve is segmented and labeled, giving you precise control over every region and element.

译新模型 Reve 2.0 上线,在 Text-to-Image 竞技场中排名第二,超越 Nano Banana 2 和 GPT-Image-1.5。该模型采用全新图像生成与编辑方式,利用精确布局实现可交互的图像创作:图像被表示为代码,每个区域均可寻址、编辑和操控;图像被自动分割并标注,用户可对每一元素进行精细化控制。

fofr@fofrAI · 6月4日61

Ideogram v4 > a scan of a page from my high school A3 art pad, highly original niche pencil piece working on the aura of unusual cross sections and fluidity of otherwise solid surfaces in human portraiture with offset recursion, not anatomical, the cross sections reveal something else, very detailed and complex, no other anatomy, no embellishments, no pencil shavings, no tea stains, clean white paper

译Ideogram v4 表现出色,开放权重。图像清晰,感觉焕然一新。

fofr@fofrAI · 6月4日69

Ideogram v4 is really good, and open weights. Images are crisp and feel fresh.

译Ideogram v4 真的很好,而且开源权重。图像清新锐利,令人耳目一新。

DogeDesigner@cb_doge · 6月4日78

SpaceXAI is cooking.

译Grok Imagine 1.5 预览版已发布,即日起可在 API 中体验。SpaceXAI 正在发力。

AYi@AYi_AInotes · 6月4日70

世界最好的开源图像模型, 仅次于GPT-image-2和Nanobanana2

Krea@krea_ai · 6月4日74

introducing Ideogram v4.0. 2k native resolution, excellent text rendering, and support for JSON prompts. try it now in Krea.

译介绍 Ideogram v4.0。 原生 2K 分辨率,出色的文字渲染,支持 JSON 提示词。 立即在 Krea 中体验。

🚨 AI News | TestingCatalog@testingcatalog · 6月4日74

Ideogram announced Ideogram 4.0, a new SOTA open image generation model! > Ideogram 4.0 lands in the 8th spot on LM Arena and the 5th spot on Design Arena in the text-to-image category, and is getting close to Nano Banana Pro's performance. > Ideogram 4.0 features dense, accurate text rendering, native 2K resolution, active background transparency, and precise layout control.

译Ideogram 4.0 开源图像生成模型发布,在 LM Arena 文生图类别排名第 8,Design Arena 第 5,评分 1204,成为该领域排名最高的开放模型,性能接近 Nano Banana Pro。主要特性包括密集准确的文本渲染、原生 2K 分辨率、活动背景透明度及精确布局控制。

fofr@fofrAI · 6月3日18

That feeling of being trapped in latent space

译用户指令要求修改屏幕,使其显示为正在打FaceTime电话。主推文感叹:被困在潜在空间中的那种感觉。

SenseTime@SenseTime_AI · 6月3日73

A plain sneaker image went in. Marketing visuals came out. #SenseNova U1 — see, think, create — all in one model. #OpenSourced. This is the architecture shift people keep talking about. Shoutout @AiLockup for the demo 🔥 🎥Watch the video: https://youtu.be/9IFgPqMWBGg Try it today: 🎛️ SenseNova Studio: https://unify.light-ai.top/ (Try infographics; also join Discord for text-image interleaved gen) 🤗 https://huggingface.co/collections/sensenova/sensenova-u1 🛠️ https://github.com/OpenSenseNova/SenseNova-U1 👾 Discord: https://discord.com/invite/BuTXPHmQub @huggingface @github

译商汤(SenseTime)开源SenseNova U1模型,宣称实现“看、思考、创作”一体——从一张普通运动鞋图片直接生成营销视觉效果。该模型代表了架构上的范式转变。用户可通过SenseNova Studio、HuggingFace和GitHub尝试使用。

DogeDesigner@cb_doge · 6月3日49

Grok Imagine is pretty cool for product marketing. Turn a quick phone photo into a professional ad in seconds.

译Grok Imagine 在产品营销方面相当不错。 将手机随手拍的照片在几秒钟内变成专业广告。

fofr@fofrAI · 6月3日55

> Change the screen so it shows that she's on a facetime call

译更改屏幕,使其显示她在FaceTime通话中。

宝玉@dotey · 6月3日72

可以以假乱真了

译推文展示 GPT Image Gen V2 根据详细提示词生成的图像效果,被评价为“可以以假乱真”。生成的图像模拟了短视频应用的手机自拍截图,具备特定视觉特征:包括低分辨率帧、美颜滤镜平滑、压缩模糊、柔焦及动态模糊。画面主体为一位动漫cosplay风格的女性,外貌、发型、服装和普通卧室背景均有细致描述,并包含了应用界面UI元素,整体风格追求真实手机拍摄的质感。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月7日
02:46
fofr@fofrAI
65
从一张建筑图像开始,并使用 Omni 提示生成投影映射。
图像生成教程/实践视频
6月6日
05:42
fofr@fofrAI
67
与 Reve 使用相同的提示词。我喜欢它截然不同的解读方式。

fofr: Ideogram v4 > a scan of a page from my high school A3 art pad, highly original niche pencil piece working on the aura of...

图像生成教程/实践
05:42
fofr@fofrAI
63
把它变成喷漆画。 Omni:把它变成湿黏土中写字的棍子。

fofr: Omni: > Make it a stick writing in wet clay

图像生成教程/实践
04:12
fofr@fofrAI
44
尝试将这张Krea K2的输出用于Omni图像转视频,试图制作一段动漫开场序列。
图像生成教程/实践视频
01:42
OpenRouter@OpenRouter
71
Live on OpenRouter: Riverflow 2.5 来自 @riverflow_ai 首个拥有独立评分标准的图像模型,你可以控制该标准来引导其思考与编辑,并可通过调节推理投入在速度与质量之间权衡。 免费至6月9日周二。Fast 与 Pro 见下方🧵
产品更新图像生成
01:11
OpenRouter@OpenRouter
60
在OpenRouter上线:来自@Sourceful的Riverflow 2.5。 首个具有独立评分标准的图像模型,你可控制该标准以引导其思维和编辑,并具备可控的推理努力,可在速度与质量之间进行权衡。 免费至6月9日(周二)。Fast和Pro见下方🧵。
图像生成模型发布
01:10
Replit ⠕@Replit
同事件精选68
你试过新的 Replit Canvas 了吗? - 用 AI 创建美观的 UI 设计 - 使用 GPT-Image 2 & Seedance 生成素材 - 几分钟内将你的设计转化为可发布的应用
OpenAI产品更新图像生成部署/工程
同一事件,精选展示《Replit Canvas:智能体设计工具发布》
推荐理由:Replit Canvas 把 GPT-Image 2 和 Seedance 直接嵌进 UI 设计流程,让不会画图的开发者也能几分钟出一个看得过去的 App 原型,对非设计师的独立开发者是实打实的效率提升。
00:41
Google Gemini@GeminiApp
精选81
你现可直接在 Gemini Live 中创建和编辑图像。 无论是测试房间装饰、解决数学问题,还是制作可分享的梗图,所有操作都实时完成。 只需打开 Gemini 应用,点击 Live 按钮,共享摄像头,告诉 Gemini 你想看到的。
Google产品更新图像生成多模态

推荐理由:Gemini Live 终于能用嘴改图了,实时对话+图像生成让装修试色、数学解题变成「聊着天就把活干了」,产品人和普通用户都该试试这个新交互。
6月5日
22:29
Krea@krea_ai
48
我们正在寻找创意人才加入我们不断壮大的团队。 下方申请👇
图像生成行业动态
20:56
PixVerse@PixVerse_
46
一艘废弃的豪华星级客轮。 五位 Z 世代拾荒者。一个刚苏醒的 AI。太空废墟探险--PixVerse Originals 第一季。霓虹废土哥特风。 @michaelheina(PixVerse 首日合作伙伴)使用 PixVerse V6 打造了一个五人团体。 匹配剪辑动作。每帧角色一致性锁定。 转发+关注+回复"Originals"= 150 Credits 及私信完整影片(仅限 72 小时)
产品更新图像生成视频
07:06
fofr@fofrAI
68
> 业余竖屏手机视频,9:16 比例。连续不中断的手持镜头,一只毛茸茸的虎斑猫坐在阳光明媚的窗台上,望向枝叶繁茂的花园。猫的尾巴缓慢抽动,耳朵微微朝向环境噪音转动。阳光照亮空气中的尘埃。声音设计:微风轻拂、远处鸟鸣、安静的机械呼噜声。无对话。
图像生成教程/实践视频
04:34
DogeDesigner@cb_doge
31
ChatGPT vs Grok 让两者将这个像素化的logo转化为高分辨率图像。 ChatGPT严重失败,而Grok提供了干净、清晰的高分辨率图像。 Grok是明显的赢家。
OpenAIxAI图像生成评测/基准
03:54
Rohan Paul@rohanpaul_ai
57
Hyper 3D Rodin Gen-2.5 图像转 3D:4 秒生成百万多边形

Rohan Paul 实测新推出的图像转 3D 模型 Rodin Gen-2.5,最大改进是控制力。提供五种生成模式,最快 4 秒生成百万多边形模型,支持最高 1000 万多边形输出。原生 3D PBR 材质,模型开箱即用。Hyper 3D 还支持并行批量生成、Break to Parts 部件分离和局部编辑,无需重新生成整个模型,覆盖 3D 创作全流程。

图像生成多模态模型发布
00:03
歸藏(guizang.ai)@op7418
42
归藏PPT Skills 将更新第三套主题

归藏宣布其 PPT Skills 项目将继续更新。得益于近期的赞助,计划开发第三套主题,且会把在小红书图文卡片部分积累的好经验用于新版中。

歸藏(guizang.ai): http://x.com/i/article/2053655813877870592

图像生成教程/实践
6月4日
23:16
SenseTime@SenseTime_AI
69
商汤SenseNova U1开源统一文本图像模型

商汤SenseTime发布SenseNova U1,一个原生理解和生成文本与图像的统一模型。该模型已开源,用户可自行运行。被@gurru_tech称赞“令人印象深刻”。提供在线演示平台SenseNova Studio、HuggingFace模型、GitHub代码及Discord社区。

Hugging Face图像生成多模态模型发布
关联讨论 1 条X:商汤 SenseTime (@SenseTime_AI)
22:53
Krea@krea_ai
同事件精选73
推出 Krea 2 Turbo。 仅需2秒即可生成高质量图像;兼容风格参考、情绪板和 LoRA。 在 krea . ai 免费试用。
产品更新图像生成
同一事件,精选展示《Krea 2图像模型现已登陆ComfyUI》
推荐理由:2秒出图不算新概念,但Krea 2 Turbo把风格参考和LoRA都揉进实时生成里,做设计的可以试试能不能省掉Midjourney的等待时间。
22:46
SenseTime@SenseTime_AI
同事件精选69
SenseNova U1 开源统一模型:原生图文生成

商汤 SenseTime 推出 SenseNova U1 开源多模态模型,实现原生理解与生成文本和图像,可一键将提示词转化为专业信息图。该模型被开发者 @gurru_tech 评价为“非常令人印象深刻”。项目已开源,提供 SenseNova Studio 在线试用,并公开 HuggingFace 模型集合、GitHub 源码仓库及 Discord 社区入口。

图像生成多模态开源生态模型发布
同一事件,精选展示《商汤发布信息图生成模型升级,增强多项核心能力》
推荐理由:商汤这回把图文统一模型开源了,SenseNova U1的infographic功能比市面上大多数文生图工具更懂文字和布局,做内容的朋友可以上手试试。
22:46
Runway@runwayml
同事件精选81
你需要的编辑,变得简单。Aleph 2.0 只更改你想要编辑的部分,保持画面的其余部分不变。在我们的新 Edit Studio 中试试。 通过下方链接开始使用。
产品更新图像生成视频
同一事件,精选展示《Aleph 2.0 与 Edit Studio》
推荐理由:Runway 终于把 AI 视频编辑的精度问题解决了,Aleph 2.0 只改你选定的部分,其余画面纹丝不动,做视频的可以立刻去 Edit Studio 试试手。
19:32
fofr@fofrAI
54
这是 Reve 2 的一些早期测试,提示词为: > an amateur photo of fantastical realism 同日两款优秀的全新图像模型。真是享受。

Reve: Today, we're launching Reve 2.0, the best 4K image model in the world. We invented a new way to generate and edit any im...

产品更新图像生成
19:02
fofr@fofrAI
61
我的最新常用负面提示词: "no embellishments" 当模型试图以你不喜欢的方式发挥创意时使用。
图像生成教程/实践
11:39
swyx@swyx
44
引用推文高度评价 Reve 2.0 发布文案。Reve 2.0 的核心理念:可控图像生成与编辑的关键不是更密集的提示词,而是以代码形式呈现的高度详细、可操作的中间表示。指出当前图像生成模型通过渐进退化惩罚迭代,而创造力本质上不是一次性工作流。引用 Alan Kay "做软件应自造硬件" 类比,Reve 认为真正严肃的创意工具公司应训练自己的模型。

Hasan: wow this @reve 2.0 launch copy is supurb. "it is now clear that the key to both controllable image generation and editin...

图像生成大佬观点
11:21
AK@_akhaliq
62
dMoE 具有可学习块专家的dLLM
图像生成数据/训练论文/研究
11:00
歸藏(guizang.ai)@op7418
61
Reve 2.0 图像模型:原生4K输出与分层编辑能力

Reve 2.0 图像模型支持原生4K输出,核心亮点在于类似 Photoshop 的图像分层编辑能力。用户点击图像中的任意部分即可选中该区域,无需复杂的中间处理步骤,直接进行针对性编辑。该功能大幅简化了图像局部修改的工作流。

图像生成模型发布
10:51
AK@_akhaliq
46
自举你的生成器 非配对视觉编辑与流匹配
图像生成论文/研究
10:29
DogeDesigner@cb_doge
39
Grok Imagine 1.5 视频质量确实令人印象深刻。🔥
xAI图像生成大佬观点视频
09:40
小互@xiaohu
73
Ideogram 4.0 开源:边界框控制+多语言文字渲染

Ideogram 发布首个开源 AI 图像模型 Ideogram 4.0,主推文字渲染与版面控制。模型引入 bounding box(边界框)控制,允许用坐标精确指定元素位置;支持结构化 JSON 提示词格式,不再仅限纯文本;英文 OCR 准确率达 0.97(X-Omni 基准),支持跨语言密集文字渲染,涵盖中日韩等非拉丁文字。

图像生成开源生态模型发布
09:06
Elon Musk@elonmusk
同事件精选72
Vercel 的 AI Gateway 上现已推出 Grok Imagine Video 1.5。该服务支持图生视频并同步音频,一次性完成。示例代码: `await generateVideo({ model: 'xai/grok-imagine-video-1.5-preview', prompt: 'a rabbit sprinting through nyc' });`

Vercel Developers: Grok Imagine Video 1.5 on AI Gateway. Image-to-video generation with synced audio in one pass. await generateVideo({ mod...

xAI图像生成模型发布视频
同一事件,精选展示《xAI 发布 Grok Imagine 1.5 预览版(图像转视频模型)》
推荐理由:Grok Imagine Video 1.5 把同步音频塞进了图生视频,一条 prompt 直接出带声短片,做短视频和创意的可以换上这条流水线了。
08:39
宝玉@dotey
54
让 Claude Design 设计个 Icon,用 SVG 给我直接画,看着还行,好歹是矢量的。
Anthropic图像生成教程/实践
05:57
🚨 AI News | TestingCatalog@testingcatalog
53
新模型 Reve 2.0 上线,在 Text-to-Image 竞技场中排名第二,超越 Nano Banana 2 和 GPT-Image-1.5。该模型采用全新图像生成与编辑方式,利用精确布局实现可交互的图像创作:图像被表示为代码,每个区域均可寻址、编辑和操控;图像被自动分割并标注,用户可对每一元素进行精细化控制。

Reve: Our independent research lab ranks top 2 on @arena Text-to-Image, ahead of Nano Banana 2 and GPT-Image-1.5.

图像生成模型发布
04:31
fofr@fofrAI
61
Ideogram v4 表现出色,开放权重。图像清晰,感觉焕然一新。

fofr: Ideogram v4 is really good, and open weights. Images are crisp and feel fresh.

图像生成开源生态模型发布
03:31
fofr@fofrAI
69
Ideogram v4 真的很好,而且开源权重。图像清新锐利,令人耳目一新。

Ideogram: Introducing Ideogram 4.0: the best open image model in the world. Think it. Make it. Own it. Download the weights, fine-...

图像生成多模态开源/仓库模型发布
02:58
DogeDesigner@cb_doge
78
Grok Imagine 1.5 预览版已发布,即日起可在 API 中体验。SpaceXAI 正在发力。

Grok: Grok @Imagine 1.5 Preview is here Try it today in the API: http://x.ai/api/imagine

xAI图像生成模型发布
关联讨论 3 条xAI:News(网页)X:Elon Musk (@elonmusk, xAI)X:阿易 AI Notes (@AYi_AInotes)
02:16
AYi@AYi_AInotes
70
世界最好的开源图像模型, 仅次于GPT-image-2和Nanobanana2

Ideogram: Introducing Ideogram 4.0: the best open image model in the world. Think it. Make it. Own it. Download the weights, fine-...

图像生成开源生态模型发布
01:49
Krea@krea_ai
精选74
介绍 Ideogram v4.0。 原生 2K 分辨率,出色的文字渲染,支持 JSON 提示词。 立即在 Krea 中体验。
图像生成模型发布
关联讨论 1 条IT之家(RSS)
推荐理由:图像生成模型的军备竞赛又添一员,Ideogram v4.0的2k原生分辨率和JSON prompt对接工作流,做设计生成的同学可以直接上手试试。
00:55
🚨 AI News | TestingCatalog@testingcatalog
74
Ideogram 4.0 开源图像生成模型发布,在 LM Arena 文生图类别排名第 8,Design Arena 第 5,评分 1204,成为该领域排名最高的开放模型,性能接近 Nano Banana Pro。主要特性包括密集准确的文本渲染、原生 2K 分辨率、活动背景透明度及精确布局控制。

Arena.ai: New open model Ideogram-4.0-Quality has landed at #8 in the Text-to-Image Arena. This makes the new model by @ideogram_a...

图像生成开源生态模型发布
6月3日
23:01
fofr@fofrAI
18
用户指令要求修改屏幕,使其显示为正在打FaceTime电话。主推文感叹:被困在潜在空间中的那种感觉。

fofr: > Change the screen so it shows that she's on a facetime call

图像生成教程/实践
22:39
SenseTime@SenseTime_AI
同事件精选73
商汤开源SenseNova U1:视觉理解推理生成一体模型

商汤(SenseTime)开源SenseNova U1模型,宣称实现“看、思考、创作”一体——从一张普通运动鞋图片直接生成营销视觉效果。该模型代表了架构上的范式转变。用户可通过SenseNova Studio、HuggingFace和GitHub尝试使用。

GitHubHugging Face图像生成多模态
同一事件,精选展示《商汤发布信息图生成模型升级,增强多项核心能力》
推荐理由:商汤把理解、推理、创作塞进一个模型,而且直接开源,做视觉营销的可以不用再拼凑工具链了。
22:27
DogeDesigner@cb_doge
49
Grok Imagine 在产品营销方面相当不错。 将手机随手拍的照片在几秒钟内变成专业广告。
xAI图像生成教程/实践
21:31
fofr@fofrAI
55
更改屏幕,使其显示她在FaceTime通话中。
图像生成教程/实践视频
14:05
宝玉@dotey
72
推文展示 GPT Image Gen V2 根据详细提示词生成的图像效果,被评价为"可以以假乱真"。生成的图像模拟了短视频应用的手机自拍截图,具备特定视觉特征:包括低分辨率帧、美颜滤镜平滑、压缩模糊、柔焦及动态模糊。画面主体为一位动漫cosplay风格的女性,外貌、发型、服装和普通卧室背景均有细致描述,并包含了应用界面UI元素,整体风格追求真实手机拍摄的质感。

Emily: Exploring the possibilities GPT Image Gen V2 Vertical smartphone screenshot from a Chinese short-video app. Front phone ...

OpenAI图像生成教程/实践
‹ 上一页
1…45678…18
下一页 ›