AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 699 条
全部一手资讯X论文
标签「图像生成」清除
Sam Altman@sama · 5月18日50

ChatGPT Images 2.0 💚 India. Already more than 1 billion images created there; awesome to see.

译ChatGPT Images 2.0 💚 印度。 已在该地生成超过10亿张图像;令人惊叹。

AYi@AYi_AInotes · 5月18日66

Kimi做网站设计这么牛逼吗? 这个视频分享了怎么用Kimi 2.6做获奖10美元的网站, 教程讲的特别细, 需要字幕学习的可以评论区留言告诉我!

AYi@AYi_AInotes · 5月17日49

这绝对是是今年最典型的认知战样本, 国宴上穿红旗袍的女孩一没戴耳机,二没做记录,三没有任何异常动作, 人家只是是眼神太专注,站得太直, 就被这个日本账号配上碟中谍的配乐,暗示说是间谍在偷听,然后英推很多推友就疯了🤣 有意思的是我准备把碟中谍音乐换成特朗普的专属音乐的时候,发现日本账号用的照片是@Gemini 生成的🤣🤣🤣 真的忍不住跟大家科普下,首先中国不会蠢到用顶级外事人才站旁边竖耳朵偷听, 这就相当于让航天工程师去送外卖,真正的情报机构也绝对不会这么蠢,中国更不会, 那问题就变成了,为什么这么多人看到同样一段视频,第一反应不是服务员很专业,而是间谍, 首先CIA自己就是这么招人的, 美国情报史上有大量招募酒店、餐饮、清洁人员做线人的记录,所以他们天然假设对方也会这么干, 典型的镜像偏见,用自己的剧本,编对方的故事, 中国高端外事服务业的基因是零失误、零情绪外露、极致专注,周恩来时代定下的规矩至今没变, 结果极致的专业被镜头语言把严肃专注自动翻译成了冷酷监听,服务文化差异被剪辑成了威胁信号,就挺荒诞的😅

译一日本账号将中国国宴上神情专注、站姿端正的女性服务员,通过配乐和AI生成图片暗示为“间谍”,引发英文推特热议。分析指出,这种指控源于典型的“镜像偏见”——美国情报机构历史上常招募服务行业人员为线人,因而推定他国行为模式相同。实际上,中国高端外事服务秉承零失误、极致专注的专业传统,却被曲解为“监听”。事件揭示认知战中,文化差异与预设剧本如何将专业行为扭曲为威胁信号。

Kling AI@Kling_ai · 5月17日15

Caught this little cutie looking right at the camera.📸

译抓拍到这个小可爱正对着镜头看。📸

Elon Musk@elonmusk · 5月17日84

Grok Imagine

译Grok Imagine 现已正式发布 所有人都可使用 基于我们最新的文本到图像模型 能够生成逼真、高质量的图像 支持多种宽高比 现在可在 X 上使用

AYi@AYi_AInotes · 5月17日67

说个所有AI创业者都不愿意承认的事实: 现在做一个AI工具的门槛已经降到了地板, 普通人做一个AI工具都只需要一天, 但学会用它干成一件事,却至少得一个月, 感觉像是AI时代的一个悖论😅 5.7M 阅读 23 万点赞的这条推,表面看是游戏圈在自嘲, 视频展示的是一颗树莓 237 万个高斯点,做一筐扔进游戏直接 2 FPS, 但如果把游戏开发四个字去掉,你会发现这是 2026 年所有 AI 工具用户的共同故事。 我先先把这个梗讲透: 原推作者 @DanyBittel 用 90 组焦点堆栈、每组 68 张照片,重建出来这颗树莓,总共 237 万个高斯点, 这是一种叫 3D Gaussian Splatting 的新型 AI 重建技术,简称 3DGS, 视觉效果有多吓人呢? 每一颗小果粒的绒毛、表面光泽、半透明的果肉质感全都纤毫毕现,在 RTX 3060 Ti 这种中端显卡上还能跑 100+ FPS,前提是只有这一颗🙃 @nazbowling102 的笑点在这里,老哥迫不及待想看哪个独立游戏开发者一激动,把一整筐这种树莓当道具扔进游戏里,然后纳闷为啥游戏跑 2 FPS🤣 我觉得这个吐槽之所以 5.7M 阅读,是因为它戳中了游戏圈的集体回忆—— Monster Hunter Wilds 一颗八角茴香用了 2048 乘 4096 的纹理直接卡帧,Cities Skylines 2 给行人建了高精度牙齿模型,全都是一个小道具毁全局的真实事故。 但这条推真正让我深入研究的还不是游戏开发的事,虽然我是个游戏爱好者,但对于游戏开发是个小白。 ayi干货输出开始! 咱们把游戏开发四个字去掉,这个故事正在所有 AI 工具领域都能同步上演, AI 生成的图,单张精美绝伦,但批量做长素材时质量瞬间崩溃, AI 生成的视频,10 秒钟惊艳,1 小时长片的管线一团乱, AI 生成的代码,单个函数完美,扔进项目跑起来一堆隐藏依赖, 共性是同一条规律: 新工具让做出来这件事的门槛降了 100 倍, 但用得动、跑得稳、能交付这件事的门槛反而升高了 10 倍。 过去做不出来是因为没人能做,现在做出来是因为工具太好用, 但优化、压缩、整合、降本的脏活累活没人帮你干,AI 工具时代真正稀缺的不再是创造力,而是生产工程能力。 所以我觉得这条树莓推真正的价值,不是教育游戏开发者怎么做 LOD, 是给所有正在被新工具喂得满嘴流油的人一个提醒: demo 级和生产级永远隔着一条河, AI 让前者变得免费, 后者还是要你自己游过去的!

译一条关于游戏开发的推文引发广泛共鸣:利用3D Gaussian Splatting技术生成的单颗树莓模型精度极高且运行流畅,但若将一整筐此类高精度模型放入游戏,帧率会骤降至2 FPS。这现象揭示了AI工具领域的普遍困境:生成单张图像、短视频或代码片段时效果出色,一旦进行批量生产或系统集成,就会出现质量崩溃、性能低下或依赖混乱等问题。其核心在于,新工具极大降低了创意demo的制作门槛,但将其转化为稳定、可交付的生产级应用,所需的工程优化与整合能力反而变得更加稀缺和关键。AI让创意唾手可得,但跨越demo到生产的鸿沟,仍需扎实的工程能力。

Luma@LumaLabsAI · 5月16日27

Your website banner is the first thing they see. Make it count. Define the message. Set the aesthetic. Luma Agents build every banner visual from there. Make it count → http://lumalabs.ai/app

译您的网站横幅是访客的第一印象。务必使其出彩。 明确传达信息。设定美学风格。Luma Agents据此构建所有横幅视觉。 使其出彩 → http://lumalabs.ai/app

Krea@krea_ai · 5月16日77

starting today Krea 2 goes live for Pro users.

译从今天起,Krea 2 正式为 Pro 用户上线。

Runway@runwayml · 5月16日78

Runway Agent lets you go from a product shot and an idea to a fully finished ad in a single session. Get started today at the link below.

译Runway Agent 让你仅需一次会话,就能从产品照片和想法转变为完全制作完成的广告。 立即通过下方链接开始体验。

Luma@LumaLabsAI · 5月16日47

Nobody clicks a thumbnail they scroll past. Make yours impossible to miss. Define the message. Set the aesthetic. Luma Agents handle every thumbnail ad from there. Make it unmissable → http://lumalabs.ai/app

译没人会点击他们滑过的缩略图。让你的缩略图不容错过。 定义信息。设定美学。Luma Agents从此处理每个缩略图广告。 让它不容错过 → http://lumalabs.ai/app

SenseTime@SenseTime_AI · 5月16日62

📢📢 𝗜𝗻𝘁𝗿𝗼𝗱𝘂𝗰𝗶𝗻𝗴 𝗮𝗻 𝗲𝗻𝗵𝗮𝗻𝗰𝗲𝗱 𝗺𝗼𝗱𝗲𝗹 𝗳𝗼𝗿 𝗶𝗻𝗳𝗼𝗴𝗿𝗮𝗽𝗵𝗶𝗰 𝗴𝗲𝗻𝗲𝗿𝗮𝘁𝗶𝗼𝗻! 📊 Posters, charts, recipe cards, postcards — even arXiv-style pages — all from 𝗦𝗲𝗻𝘀𝗲𝗡𝗼𝘃𝗮-𝗨𝟭-𝟴𝗕-𝗠𝗼𝗧-𝗜𝗻𝗳𝗼𝗴𝗿𝗮𝗽𝗵𝗶𝗰. 🚀 +6.8 / +18.2 on BizGenEval (hard) / IGenBench (Q-ACC) over base U1, plus 100+ diverse showcases. 🤗 http://huggingface.co/sensenova/SenseNova-U1-8B-MoT-Infographic 🖼️Showcases: https://github.com/OpenSenseNova/SenseNova-U1/blob/main/docs/u1_infographic_showcases.md Try it out — we'd love to see what you build! @huggingface

译SenseNova近日推出专为信息图表生成设计的增强模型SenseNova-U1-8B-MoT-Infographic。该模型能够根据指令生成多种视觉格式内容,包括海报、图表、食谱卡、明信片以及学术风格的arXiv页面等。在性能方面,模型在BizGenEval(困难版)和IGenBench(Q-ACC)两项基准测试上表现突出,相比其基础U1模型分别提升了6.8分和18.2分。目前,该模型已在Hugging Face平台开源,并提供了超过100个多样化的生成示例,供开发者和研究者参考与试用。

Berryxia.AI@berryxia · 5月15日66

兄弟们,GPT做OOTD简直不要太简单了啊! 这不马斯克这几天带着 𝕏 去北京参加会议的同时,也不忘遛娃。 全网爆火的他儿子 𝕏 的穿搭也迅速走红网络,据说那个虎头的包包都卖断货。 我直接顺手使用GPT-image -2 做了一套 OOTD 穿搭拆解提示词,直接上传图片就可以自动拆解和标注。(如图1) 图二黄总吃炸酱面😄 图三志林姐姐还是依旧能打的! 提示词我放评论区了,记得交作业啊!!😄

译推文展示了利用GPT-2的图像功能,通过上传图片即可自动拆解和标注OOTD(每日穿搭)的提示词方法。作者以近期因马斯克携带参会而走红的其子𝕏的穿搭为例,说明该提示词能快速分析网红造型。提示词已分享至评论区,供读者尝试使用。

Yuchen Jin@Yuchenj_UW · 5月15日16

Made by Claude Monet. haters will say it's AI.

译莫奈所作。 讨厌的人会说是AI画的。

PixVerse@PixVerse_ · 5月15日49

This is what happens when PixVerse gets a press pass

译当PixVerse拿到媒体通行证时会发生什么 这些病毒式传播的球场镜头最有趣之处在于,它们有种随机的标志性感觉。 所以我用@PixVerse_重现了巴西对英格兰的SuperSport风格直播时刻,真实感简直离谱🔥 同一个世界,同一个目标。由PixVerse创作。⚽✨ #WEARE26 #PixVerseChallenge #FIFAWorldCup 📌查看下方提示👇🏾

Luma@LumaLabsAI · 5月15日75

More products. More markets. More formats. No more bottlenecks. Define the brief. Set the aesthetic. Luma Agents handle every e-commerce campaign asset from there. Scale it now → http://lumalabs.ai/app

译更多产品。更多市场。更多格式。再无瓶颈。 定义需求。设定风格。Luma Agents 从此处理所有电商活动素材。 立即扩展 → http://lumalabs.ai/app

Chubby♨️@kimmonismus · 5月15日58

Until now, building a convincing AI human required video footage of a real person. @tavus just removed that constraint! Image-to-Replica takes a single image, a logo mascot, an AI-generated character, a sketch, and runs it through the same Phoenix-4 pipeline that powers their video-trained replicas. Now we can talk about real AI avatars.

译Tavus的Image-to-Replica技术突破了创建逼真AI虚拟人需依赖视频素材的限制。该技术仅需单张图像,如logo吉祥物、AI生成角色或草图,即可通过Phoenix-4管道处理,生成能进行真实对话的AI虚拟人。这意味着任何以单图像形式存在的面孔,包括品牌吉祥物、历史人物或AI设计角色,现在都能以虚拟形象实现互动,推动了AI虚拟人技术的实用化发展。

OpenRouter@OpenRouter · 5月15日68

Live on OpenRouter: @recraftai V4.1! Six new image generation models: V4.1 and V4.1 Pro for high aesthetics, V4.1 Vector and V4.1 Pro Vector for SVG illustration, and V4.1 Utility and V4.1 Utility Pro for restraint-first product imagery. Photorealism is more natural, gradients are smoother, and short prompts hit the mark with less hand-holding.

译现已在 OpenRouter 上线:@recraftai V4.1! 包含六款新图像生成模型:追求高美学的 V4.1 和 V4.1 Pro,用于 SVG 插画的 V4.1 Vector 和 V4.1 Pro Vector,以及优先考虑克制风格的产品图像的 V4.1 Utility 和 V4.1 Utility Pro。 照片级真实感更自然,渐变更平滑,简短提示词能更准确地命中目标,无需过多手动调整。

PixVerse@PixVerse_ · 5月14日63

Nobody should miss the PitCrewMoment trend. Turn any portrait into an F1 live TV pit crew moment in one click. Try it now on PixVerse web!

译不容错过PitCrewMoment潮流。 一键将任何肖像转化为F1直播电视进站时刻。 立即在PixVerse网页端尝试!

Alibaba Cloud@alibaba_cloud · 5月14日36

HappyHorse Promotion is LIVE! 🐎✨ Our official promotion page is now live. Get 20% OFF for a limited time! Create cinematic AI visuals with synced audio—optimized for ads, e-commerce, and social media. 🚀 Join the promotion: https://int.alibabacloud.com/m/1000412936/

译HappyHorse 促销活动现已上线!🐎✨ 我们的官方促销页面已正式开放。 限时享受八折优惠! 创建带同步音频的电影级AI视觉效果——专为广告、电商和社交媒体优化。 🚀 加入促销活动:https://int.alibabacloud.com/m/1000412936/

SenseTime@SenseTime_AI · 5月14日40

🚀 Huge thanks to Bijan Bowany for his strong recognition of 𝗦𝗲𝗻𝘀𝗲𝗡𝗼𝘃𝗮 𝗨𝟭’s strengths, proven through hands‑on testing on 𝗖𝗼𝗺𝗳𝘆𝗨𝗜. ✅ 𝗜𝗻𝗳𝗼𝗴𝗿𝗮𝗽𝗵𝗶𝗰: “𝘉𝘪𝘤𝘦𝘱 𝘤𝘶𝘳𝘭 𝘱𝘰𝘸𝘦𝘳𝘦𝘥 𝘤𝘰𝘮𝘱𝘶𝘵𝘦𝘳” → 𝗰𝗼𝗺𝗽𝗹𝗲𝘅 𝗶𝗱𝗲𝗮, 𝗰𝗹𝗲𝗮𝗻 𝘃𝗶𝘀𝘂𝗮𝗹𝘀 ✅ 𝗜𝗻𝘁𝗲𝗿𝗹𝗲𝗮𝘃𝗲𝗱 𝘁𝗲𝘅𝘁 𝗶𝗺𝗮𝗴𝗲: 𝘉𝘢𝘤𝘬 𝘵𝘰 𝘵𝘩𝘦 𝘍𝘶𝘵𝘶𝘳𝘦 𝘵𝘦𝘤𝘩 𝘳𝘦𝘷𝘪𝘦𝘸 → 𝗹𝗼𝗴𝗶𝗰𝗮𝗹 𝗰𝗼𝗵𝗲𝗿𝗲𝗻𝗰𝗲 + 𝘀𝗲𝗹𝗳 𝗿𝗲𝗳𝗹𝗲𝗰𝘁𝗶𝗼𝗻 ✅ 𝗖𝗼𝗺𝗶𝗰: “𝘏𝘶𝘮𝘢𝘯 𝘵𝘶𝘳𝘯𝘴 𝘪𝘯𝘵𝘰 𝘩𝘦𝘭𝘪𝘤𝘰𝘱𝘵𝘦𝘳” → 𝘄𝗶𝗹𝗱 𝗽𝗿𝗼𝗺𝗽𝘁𝘀 𝗵𝗮𝗻𝗱𝗹𝗲𝗱 𝘄𝗶𝘁𝗵 𝗲𝗮𝘀𝗲 🎥 Watch the video https://www.youtube.com/watch?v=-jFXywLgKwo 👉 Try it: Hugging Face / GitHub

译SenseNova U1 在 ComfyUI 上的实际测试获得了 Bijan Bowany 的强烈认可,证明了其处理复杂任务的能力。测试显示,模型能清晰呈现复杂概念的视觉内容,在交织文本图像中保持逻辑连贯和自我反思,并能轻松应对如人类变直升机等疯狂提示。视频演示和试用资源可通过 Hugging Face 和 GitHub 获取。

Krea@krea_ai · 5月14日73

sharing more Krea 2 access codes! K2-NF55KA / K2 TCA7ZX / TMYVGV – each one will work for 80 users. link for redeeming them below 👇

译分享更多 Krea 2 内测码! K2-NF55KA / K2 TCA7ZX / TMYVGV – 每个码可供80位用户使用。 兑换链接如下 👇 [引用 @krea_ai]:this is Krea 2.

Luma@LumaLabsAI · 5月14日55

The packaging tells the story. Now let the product show it. Upload your design, apply it to the product, and let Luma Agents build every promo image from there. From concept to campaign ready in minutes. Take it further → http://lumalabs.ai/app

译包装讲述故事,现在让产品展示它。 上传您的设计,应用到产品上,然后让Luma Agents构建所有宣传图片。从概念到活动就绪,只需几分钟。 进一步了解 → http://lumalabs.ai/app

Krea@krea_ai · 5月14日61

introducing moodboard sharing. you can now share Krea 2 moodboards with others. a few you can try below 👇

译推出情绪板分享功能。 现在你可以与他人分享 Krea 2 情绪板。 下方有几个可供尝试的示例 👇

Krea@krea_ai · 5月14日61

great moodboards tutorial!

译很棒的情绪板制作教程! [引用 @goo_vision]:使用Krea 2进行创作 🧵 第一步:建立情绪板。 不必强求填满全部250个图片位。 即使只有10-20张优质参考图,也足以确立坚实的视觉方向并产出优秀成果。

Krea@krea_ai · 5月14日73

Krea 2 access code drop! K2-PRFUF8 / K2-NRWW9E / K2-CAP48S – each one has 50 uses. access link below 👇

译Krea 2 访问码发放! K2-PRFUF8 / K2-NRWW9E / K2-CAP48S – 每个码可使用50次。 访问链接如下 👇 [引用 @krea_ai]:this is Krea 2. our first foundation model, built completely from scratch for aesthetic diversity and stylistic control. learn more and get early access 👇

-Zho-@ZHO_ZHO_ZHO · 5月14日34

“ 一种思想向一种艺术语言的转换会如何影响这一思想? 每种特定艺术语言的思想形式是什么? ” James Monaco 的问题叩响 AI 时代新的心跳🫀 图文:How to Read a Film|James Monaco

译推文引用了James Monaco在《How to Read a Film》中提出的核心问题:一种思想在转换为特定艺术语言时,其本身会受到何种影响?以及每种艺术语言承载思想的独特形式是什么?作者认为,这些关于媒介与思想表达关系的经典追问,在AI时代被重新激活,具有了新的相关性。它促使人们思考,当思想通过AI(如LLM)生成或转换时,其本质与形式将如何被这一新的“艺术语言”或媒介所塑造和改变。

Chubby♨️@kimmonismus · 5月13日42

what the heck, openai is cooking - ultrafast mode incoming probably this thursday - + an update to the new image model thats already freaking good openai has such a run lately, love it

译什么情况,OpenAI正在酝酿大动作 - 超高速模式可能本周四上线 - 外加对已足够惊艳的新图像模型的更新 OpenAI近期动作不断,太棒了

PixVerse@PixVerse_ · 5月13日57

Caught in 4K eating a hot dog at the baseball game The Korean baseball trend is now on Pixverse web Use the Pixverse K-Baseball Sprint template and make yours now!

译棒球比赛吃热狗被4K镜头捕捉 韩国棒球热潮现已登陆Pixverse网页端 使用Pixverse的K-Baseball Sprint模板,立即创作你的作品吧!

歸藏(guizang.ai)@op7418 · 5月13日71

用藏师傅的 PPT Skill 让 Codex 配图的技巧 涉及到一些非常生僻的事实你怕 Codex 画的图有问题的时候,可以让他搜索相关图片,然后基于搜索的图片生成新的图片 这样既可以保证真实性,又可以生成符合比例要求和高清的图片 比如云南这种甲马符 GPT 肯定是不知道长啥样的,但是垫图之后他能画的很好。

译当使用Codex等AI生成涉及生僻事实的配图时,可先让其搜索相关图片作为参考,再基于此生成新图。该方法能确保图像的真实性,同时生成符合比例要求的高清图片。例如,对于云南甲马符这类GPT可能不了解的主题,通过垫图后AI能准确绘制。

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes · 5月13日17

Lmao apparently this image itself was also AI. We're so fucking cooked

译笑死 原来这张图本身也是AI生成的 我们彻底完蛋了

Luma@LumaLabsAI · 5月13日46

Some moments only come once a year. Make sure your campaign is ready when they do. Define the season. Set the direction. Luma Agents build every campaign visual from there. Hero imagery, social assets, and everything in between. All consistent, all on time. Own the moment → http://lumalabs.ai/app

译有些时刻一年仅有一次。 当它们来临时,请确保你的营销活动已准备就绪。 定义营销季,设定方向。 Luma Agents 由此构建所有营销视觉素材。 主视觉图、社交媒体素材,以及其间的一切。 全部保持一致性,全部准时完成。 把握关键时刻 → http://lumalabs.ai/app

🚨 AI News | TestingCatalog@testingcatalog · 5月13日63

META 🔥: Muse Spark will be available within a new Voice Mode and a Live Camera view on the Meta AI app. There, it can generate images, show places on the map, pull data from Reels, and more. Additionally, new features were added to Shopping Mode, including the ability to search Facebook Marketplace. > Muse Spark is starting to gradually roll out on Ray-Ban Meta and Oakley Meta glasses in the US and Canada over the next few weeks, and on Meta Ray-Ban Display this summer. > Muse Spark is starting to bring the same intelligence to Meta AI across WhatsApp, Instagram, Facebook, Messenger, and Threads — in places like search bars, group chats, posts, and more.

译Meta宣布推出由Muse Spark驱动的AI语音对话功能,支持自然语言交流、实时生成图像及从Reels、地图等多源获取信息。该功能将整合至Meta AI应用的新语音模式和实时摄像头视图中,用户可通过摄像头对现实世界进行实时问答。购物模式新增了搜索Facebook Marketplace等能力。Muse Spark将逐步在Ray-Ban Meta等智能眼镜上于美加推出,并于今夏登陆Meta Ray-Ban Display,其智能能力也将扩展至WhatsApp、Instagram等全平台的多类场景中。

StepFun@StepFun_ai · 5月13日72

🚀 Step Image Edit 2 is live!! A 3.5B-parameter image model that ranks #1 on KRIS-Bench —the leading benchmark for instruction-based image editing —across overall, factual, and conceptual categories. It outperforms models at 5–6x the parameter count. Performance - 0.7s text-to-image - 1.6s per edit - $0.003 per image Capabilities → Text-to-image generation → Instruction-based image editing → Bilingual text rendering (accurate Chinese + English characters) → Style transfer with subject consistency Get started Model ID: `step-image-edit-2` Available now on the Stepfun open platform. docs→https://platform.stepfun.ai/docs/en/guides/models/step-image-edit-2

译Step Image Edit 2模型正式发布。这是一个35亿参数的图像模型,在指令式图像编辑的权威基准KRIS-Bench中,于综合、事实和概念类别均排名第一,性能超越参数量为其5-6倍的模型。其核心能力包括文生图、基于指令的图像编辑、精准的中英双语文字渲染以及保持主体一致性的风格迁移。该模型生成速度快,单次编辑成本低,目前已上线Stepfun开放平台。

PixVerse@PixVerse_ · 5月13日26

@Kawaiizice these skaters ate so hard 👀

译@Kawaiizice 这些滑板者太强了👀

AI Notkilleveryoneism Memes ⏸️@AISafetyMemes · 5月13日52

This is Pixar-level quality How can artists in Hollywood not see the writing on the wall? You think the suits are gonna pay you $100,000 a year to slowly do this shit by hand?

译电影制作人Tyler Perry在目睹OpenAI的Sora视频生成模型演示后,宣布暂停其价值8亿美元的工作室扩建计划。他指出AI能以极低成本完成原本耗资数千万美元的试播集制作,企业必将选择低成本路径,因此对近未来大规模失业深感忧虑。Perry呼吁好莱坞各工会乃至国会采取统一行动,建立监管框架保护从业人员,强调行业必须联合而非各自为战。此前梦工厂创始人Katzenberg预测AI将在三年内削减90%动画岗位,此事印证了该趋势正在加速。

向阳乔木@vista8 · 5月12日39

应留言解读的关于DiT的论文,看作者才知道。 就是张小珺前段时间访谈的大神谢赛宁,好强。 不过这篇论文读起来难度很高,已经尽力了,一万三千字的解读,但还是很多看不懂。 https://blog.qiaomu.ai/dit-diffusion-transformers-scalable

译推文作者应读者要求,对谢赛宁的DiT(Diffusion Transformers)论文进行了解读。这篇论文难度很高,作者已尽力完成了一万三千字的图文解读,但仍有很多内容难以完全理解。推文引用了@vista8的留言,其核心是邀请读者提出想读但不愿消耗自己Token的论文或书籍,承诺将其解读为图文并茂的文章供共同学习,并以ViT论文解读作为示例。

Krea@krea_ai · 5月12日68

this is Krea 2. our first foundation model, built completely from scratch for aesthetic diversity and stylistic control. learn more and get early access 👇

译这是Krea 2。 我们的首个基础模型,完全从零构建,旨在实现美学多样性和风格控制。 了解更多并获取早期访问权限👇

AK@_akhaliq · 5月12日56

Qwen-Image-2.0 Technical Report

译Qwen-Image-2.0 技术报告

Kling AI@Kling_ai · 5月12日63

Imagine what you could create, templates ready in Kling AI! 🟢

译用户利用GPT image 2与Kling AI,根据详细提示词生成了一张模拟电视转播视角的超写实F1赛事直播截图。画面聚焦于一位在VIP围场/车队车库中的年轻女性,其身份特征从参考图像中被精确保留。她佩戴专业赛车耳机,神情紧张专注,画面包含“FINAL LAP”横幅、计时塔、直播标识等完整的转播图形元素。作品特别注重广播级细节,如压缩伪影、自然肤质和8K画质,旨在完美呈现如同真实电视截图的视觉效果。

SenseTime@SenseTime_AI · 5月12日46

This is why we built SenseNova U1. ✨ Thank you @feesyiam for using it to spotlight what matters for child welfare. Visuals make hard conversations more accessible — and that's when AI truly matters. Keep creating. 🥰

译这正是我们打造SenseNova U1的原因。✨ 感谢@feesyiam用它聚焦儿童福利议题。可视化让艰难对话更易进行——这正是AI真正发挥价值的时刻。 请持续创作。🥰

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月18日
08:21
Sam Altman@sama
50
ChatGPT Images 2.0 💚 印度。 已在该地生成超过10亿张图像;令人惊叹。
OpenAI图像生成行业动态
02:44
AYi@AYi_AInotes
66
Kimi做网站设计这么牛逼吗? 这个视频分享了怎么用Kimi 2.6做获奖10美元的网站, 教程讲的特别细, 需要字幕学习的可以评论区留言告诉我!
图像生成教程/实践编码
5月17日
23:44
AYi@AYi_AInotes
49
国宴服务员被日账号AI图诬为间谍,暴露认知战中的镜像偏见

一日本账号将中国国宴上神情专注、站姿端正的女性服务员,通过配乐和AI生成图片暗示为“间谍”,引发英文推特热议。分析指出,这种指控源于典型的“镜像偏见”——美国情报机构历史上常招募服务行业人员为线人,因而推定他国行为模式相同。实际上,中国高端外事服务秉承零失误、极致专注的专业传统,却被曲解为“监听”。事件揭示认知战中,文化差异与预设剧本如何将专业行为扭曲为威胁信号。

TotalNewsWorld: 中国の女性給仕係にスパイ疑惑ーー米ネットで話題に 国賓晩餐会で、中国の給仕係の女性がスティーブン・ミラー副首席補佐官のすぐ横に立ち、聞き耳を立てるような姿勢で写っている。別カットでは要人たちの様子をじっと観察するような表情も。 「中国ならや...

Google图像生成安全/对齐现象/趋势
16:12
Kling AI@Kling_ai
15
抓拍到这个小可爱正对着镜头看。📸
其他图像生成
15:47
Elon Musk@elonmusk
精选84
Grok Imagine 现已正式发布 所有人都可使用 基于我们最新的文本到图像模型 能够生成逼真、高质量的图像 支持多种宽高比 现在可在 X 上使用
xAI产品更新图像生成

推荐理由:这是 Grok 补齐多模态的关键一步,从视频看生成质量不输 Midjourney,而且直接在 X 里就能用,零门槛对创作者是实打实的吸引力。
13:44
AYi@AYi_AInotes
67
AI工具时代的生产悖论:demo易得,工程难行

一条关于游戏开发的推文引发广泛共鸣:利用3D Gaussian Splatting技术生成的单颗树莓模型精度极高且运行流畅,但若将一整筐此类高精度模型放入游戏,帧率会骤降至2 FPS。这现象揭示了AI工具领域的普遍困境:生成单张图像、短视频或代码片段时效果出色,一旦进行批量生产或系统集成,就会出现质量崩溃、性能低下或依赖混乱等问题。其核心在于,新工具极大降低了创意demo的制作门槛,但将其转化为稳定、可交付的生产级应用,所需的工程优化与整合能力反而变得更加稀缺和关键。AI让创意唾手可得,但跨越demo到生产的鸿沟,仍需扎实的工程能力。

Naz: Cant wait for an indie dev to accidentally put a carton of these in his game as a prop and wonder why his game runs at 2...

图像生成现象/趋势部署/工程
5月16日
05:06
Luma@LumaLabsAI
27
您的网站横幅是访客的第一印象。务必使其出彩。 明确传达信息。设定美学风格。Luma Agents据此构建所有横幅视觉。 使其出彩 → http://lumalabs.ai/app
产品更新图像生成
04:05
Krea@krea_ai
精选77
从今天起,Krea 2 正式为 Pro 用户上线。
产品更新图像生成

推荐理由:Krea 2 终于向 Pro 用户开放,虽然更新细节暂未披露,但版本号的跃迁加上 Krea 一贯的实时生成野心,做图像视频的值得第一时间上手试试。
03:28
Runway@runwayml
精选78
Runway Agent 让你仅需一次会话,就能从产品照片和想法转变为完全制作完成的广告。 立即通过下方链接开始体验。
产品更新图像生成视频

推荐理由:Runway Agent把广告制作压到一张产品图加一句话的极简流程,做电商和创意的值得上手测一下是不是真省时间。
02:35
Luma@LumaLabsAI
47
没人会点击他们滑过的缩略图。让你的缩略图不容错过。 定义信息。设定美学。Luma Agents从此处理每个缩略图广告。 让它不容错过 → http://lumalabs.ai/app
智能体产品更新图像生成
00:22
SenseTime@SenseTime_AI
62
SenseNova发布增强版信息图表生成模型SenseNova-U1-8B-MoT-Infographic

SenseNova近日推出专为信息图表生成设计的增强模型SenseNova-U1-8B-MoT-Infographic。该模型能够根据指令生成多种视觉格式内容,包括海报、图表、食谱卡、明信片以及学术风格的arXiv页面等。在性能方面,模型在BizGenEval(困难版)和IGenBench(Q-ACC)两项基准测试上表现突出,相比其基础U1模型分别提升了6.8分和18.2分。目前,该模型已在Hugging Face平台开源,并提供了超过100个多样化的生成示例,供开发者和研究者参考与试用。

Hugging Face图像生成模型发布
5月15日
17:54
Berryxia.AI@berryxia
66
用GPT-2图像功能一键拆解网红OOTD穿搭

推文展示了利用GPT-2的图像功能,通过上传图片即可自动拆解和标注OOTD(每日穿搭)的提示词方法。作者以近期因马斯克携带参会而走红的其子𝕏的穿搭为例,说明该提示词能快速分析网红造型。提示词已分享至评论区,供读者尝试使用。

OpenAI图像生成教程/实践
12:57
Yuchen Jin@Yuchenj_UW
16
莫奈所作。 讨厌的人会说是AI画的。
其他图像生成
11:28
PixVerse@PixVerse_
49
当PixVerse拿到媒体通行证时会发生什么 这些病毒式传播的球场镜头最有趣之处在于,它们有种随机的标志性感觉。 所以我用@PixVerse_重现了巴西对英格兰的SuperSport风格直播时刻,真实感简直离谱🔥 同一个世界,同一个目标。由PixVerse创作。⚽✨ #WEARE26 #PixVerseChallenge #FIFAWorldCup 📌查看下方提示👇🏾

Gilbert Odera | Your AI Plug🇰🇪: POV: The SuperSport cameraman finds the main character 😭⚽ The funniest part about these viral stadium cams is how RANDO...

图像生成教程/实践视频
06:35
Luma@LumaLabsAI
精选75
更多产品。更多市场。更多格式。再无瓶颈。 定义需求。设定风格。Luma Agents 从此处理所有电商活动素材。 立即扩展 → http://lumalabs.ai/app
智能体产品更新图像生成视频

推荐理由:Luma把AI生成能力打包成电商专用的Agent,直接省掉多格式物料制作的环节,做电商内容的同行可以看看实际效果是不是真有宣传的那么丝滑。
06:32
Chubby♨️@kimmonismus
58
Tavus的Image-to-Replica技术突破了创建逼真AI虚拟人需依赖视频素材的限制。该技术仅需单张图像,如logo吉祥物、AI生成角色或草图,即可通过Phoenix-4管道处理,生成能进行真实对话的AI虚拟人。这意味着任何以单图像形式存在的面孔,包括品牌吉祥物、历史人物或AI设计角色,现在都能以虚拟形象实现互动,推动了AI虚拟人技术的实用化发展。

Tavus: Introducing Image-to-Replica. Any face that can exist as a single image, whether it's a brand mascot that has lived in a...

产品更新图像生成多模态
00:36
OpenRouter@OpenRouter
精选68
现已在 OpenRouter 上线:@recraftai V4.1! 包含六款新图像生成模型:追求高美学的 V4.1 和 V4.1 Pro,用于 SVG 插画的 V4.1 Vector 和 V4.1 Pro Vector,以及优先考虑克制风格的产品图像的 V4.1 Utility 和 V4.1 Utility Pro。 照片级真实感更自然,渐变更平滑,简短提示词能更准确地命中目标,无需过多手动调整。
产品更新图像生成

推荐理由:Recraft V4.1 把图像生成从「能看」推到「好用」,六个变体覆盖从电商图到 SVG 的细分需求,短提示就能出好图,做设计的应该当天就用上。
5月14日
23:28
PixVerse@PixVerse_
63
不容错过PitCrewMoment潮流。 一键将任何肖像转化为F1直播电视进站时刻。 立即在PixVerse网页端尝试!
产品更新图像生成视频
19:02
Alibaba Cloud@alibaba_cloud
36
HappyHorse 促销活动现已上线!🐎✨ 我们的官方促销页面已正式开放。 限时享受八折优惠! 创建带同步音频的电影级AI视觉效果--专为广告、电商和社交媒体优化。 🚀 加入促销活动:https://int.alibabacloud.com/m/1000412936/
产品更新图像生成多模态
13:44
SenseTime@SenseTime_AI
40
SenseNova U1 在ComfyUI测试中获Bijan Bowany高度认可

SenseNova U1 在 ComfyUI 上的实际测试获得了 Bijan Bowany 的强烈认可,证明了其处理复杂任务的能力。测试显示,模型能清晰呈现复杂概念的视觉内容,在交织文本图像中保持逻辑连贯和自我反思,并能轻松应对如人类变直升机等疯狂提示。视频演示和试用资源可通过 Hugging Face 和 GitHub 获取。

图像生成多模态行业动态
13:32
Krea@krea_ai
73
分享更多 Krea 2 内测码! K2-NF55KA / K2 TCA7ZX / TMYVGV - 每个码可供80位用户使用。 兑换链接如下 👇 【引用 @krea_ai】:this is Krea 2.

Krea: this is Krea 2. our first foundation model, built completely from scratch for aesthetic diversity and stylistic control....

图像生成模型发布
03:04
Luma@LumaLabsAI
55
包装讲述故事,现在让产品展示它。 上传您的设计,应用到产品上,然后让Luma Agents构建所有宣传图片。从概念到活动就绪,只需几分钟。 进一步了解 → http://lumalabs.ai/app
智能体图像生成教程/实践
02:31
Krea@krea_ai
61
推出情绪板分享功能。 现在你可以与他人分享 Krea 2 情绪板。 下方有几个可供尝试的示例 👇
产品更新图像生成
01:31
Krea@krea_ai
61
很棒的情绪板制作教程! 【引用 @goo_vision】:使用Krea 2进行创作 🧵 第一步:建立情绪板。 不必强求填满全部250个图片位。 即使只有10-20张优质参考图,也足以确立坚实的视觉方向并产出优秀成果。

goo.vision: Creating with Krea 2 🧵 First step: building a moodboard. Don't stress about filling all 250 image slots. Even 10-20 str...

图像生成教程/实践
01:31
Krea@krea_ai
精选73
Krea 2 访问码发放! K2-PRFUF8 / K2-NRWW9E / K2-CAP48S - 每个码可使用50次。 访问链接如下 👇 【引用 @krea_ai】:this is Krea 2. our first foundation model, built completely from scratch for aesthetic diversity and stylistic control. learn more and get early access 👇

Krea: this is Krea 2. our first foundation model, built completely from scratch for aesthetic diversity and stylistic control....

图像生成模型发布

推荐理由:Krea 从套壳到自研模型这一步走得关键,专攻美学多样性和风格控制,对设计师来说是个值得立刻上手试的新选择。
00:44
-Zho-@ZHO_ZHO_ZHO
34
艺术语言如何重塑思想?AI时代的新叩问

推文引用了James Monaco在《How to Read a Film》中提出的核心问题:一种思想在转换为特定艺术语言时,其本身会受到何种影响?以及每种艺术语言承载思想的独特形式是什么?作者认为,这些关于媒介与思想表达关系的经典追问,在AI时代被重新激活,具有了新的相关性。它促使人们思考,当思想通过AI(如LLM)生成或转换时,其本质与形式将如何被这一新的“艺术语言”或媒介所塑造和改变。

图像生成现象/趋势
5月13日
23:59
Chubby♨️@kimmonismus
42
什么情况,OpenAI正在酝酿大动作 - 超高速模式可能本周四上线 - 外加对已足够惊艳的新图像模型的更新 OpenAI近期动作不断,太棒了

Chetaslua: 🚨new openai update mmm...... ahh... am i audible. Two more scoops if you missed them : >one more thing dont forget abou...

OpenAI产品更新图像生成
23:27
PixVerse@PixVerse_
57
棒球比赛吃热狗被4K镜头捕捉 韩国棒球热潮现已登陆Pixverse网页端 使用Pixverse的K-Baseball Sprint模板,立即创作你的作品吧!
产品更新图像生成视频
17:50
歸藏(guizang.ai)@op7418
71
利用搜索垫图提升AI绘画准确性与质量

当使用Codex等AI生成涉及生僻事实的配图时,可先让其搜索相关图片作为参考,再基于此生成新图。该方法能确保图像的真实性,同时生成符合比例要求的高清图片。例如,对于云南甲马符这类GPT可能不了解的主题,通过垫图后AI能准确绘制。

歸藏(guizang.ai): http://x.com/i/article/2053655813877870592

OpenAI图像生成教程/实践
11:02
AI Notkilleveryoneism Memes ⏸️@AISafetyMemes
17
笑死 原来这张图本身也是AI生成的 我们彻底完蛋了

AI Notkilleveryoneism Memes ⏸️: Even textbooks aren't safe

图像生成安全/对齐
08:02
Luma@LumaLabsAI
46
有些时刻一年仅有一次。 当它们来临时,请确保你的营销活动已准备就绪。 定义营销季,设定方向。 Luma Agents 由此构建所有营销视觉素材。 主视觉图、社交媒体素材,以及其间的一切。 全部保持一致性,全部准时完成。 把握关键时刻 → http://lumalabs.ai/app
智能体产品更新图像生成
05:05
🚨 AI News | TestingCatalog@testingcatalog
63
Meta推出Muse Spark驱动的AI语音对话与实时视觉交互功能

Meta宣布推出由Muse Spark驱动的AI语音对话功能,支持自然语言交流、实时生成图像及从Reels、地图等多源获取信息。该功能将整合至Meta AI应用的新语音模式和实时摄像头视图中,用户可通过摄像头对现实世界进行实时问答。购物模式新增了搜索Facebook Marketplace等能力。Muse Spark将逐步在Ray-Ban Meta等智能眼镜上于美加推出,并于今夏登陆Meta Ray-Ban Display,其智能能力也将扩展至WhatsApp、Instagram等全平台的多类场景中。

Meta Newsroom: Today we're introducing Meta AI Voice Conversations powered by Muse Spark that let you talk naturally to Meta AI (interr...

Meta产品更新图像生成多模态
03:54
StepFun@StepFun_ai
72
Step Image Edit 2图像模型发布,性能领先且高效

Step Image Edit 2模型正式发布。这是一个35亿参数的图像模型,在指令式图像编辑的权威基准KRIS-Bench中,于综合、事实和概念类别均排名第一,性能超越参数量为其5-6倍的模型。其核心能力包括文生图、基于指令的图像编辑、精准的中英双语文字渲染以及保持主体一致性的风格迁移。该模型生成速度快,单次编辑成本低,目前已上线Stepfun开放平台。

图像生成多模态模型发布
03:24
PixVerse@PixVerse_
26
@Kawaiizice 这些滑板者太强了👀

Kawaiizice: Nossa raposinha skatista levou a Clover pra dar um passeio de skate! 🦊🛹🍀 "Rumo aos céus!" (aos céus? sim!) (ꏿ ω ꏿ) ps...

产品更新图像生成视频
01:31
AI Notkilleveryoneism Memes ⏸️@AISafetyMemes
52
电影制作人Tyler Perry在目睹OpenAI的Sora视频生成模型演示后,宣布暂停其价值8亿美元的工作室扩建计划。他指出AI能以极低成本完成原本耗资数千万美元的试播集制作,企业必将选择低成本路径,因此对近未来大规模失业深感忧虑。Perry呼吁好莱坞各工会乃至国会采取统一行动,建立监管框架保护从业人员,强调行业必须联合而非各自为战。此前梦工厂创始人Katzenberg预测AI将在三年内削减90%动画岗位,此事印证了该趋势正在加速。

AI Notkilleveryoneism Memes ⏸️: 4 months ago, Dreamworks founder Katzenberg said AI will cut animated movie jobs by 90% in 3 years It's already happenin...

图像生成现象/趋势视频
5月12日
23:22
向阳乔木@vista8
39
谢赛宁DiT论文解读:高难度扩散Transformer模型分析

推文作者应读者要求,对谢赛宁的DiT(Diffusion Transformers)论文进行了解读。这篇论文难度很高,作者已尽力完成了一万三千字的图文解读,但仍有很多内容难以完全理解。推文引用了@vista8的留言,其核心是邀请读者提出想读但不愿消耗自己Token的论文或书籍,承诺将其解读为图文并茂的文章供共同学习,并以ViT论文解读作为示例。

向阳乔木: 大家想读什么论文或书,但不想消耗自己Token。 欢迎留言,我来帮大家跑,解读成图文并茂的文章,一起学习。 示例为ViT经典论文解读。 https://blog.qiaomu.ai/vit-vision-transformer-image-...

图像生成论文/研究
22:30
Krea@krea_ai
精选68
这是Krea 2。 我们的首个基础模型,完全从零构建,旨在实现美学多样性和风格控制。 了解更多并获取早期访问权限👇
图像生成模型发布

推荐理由:Krea 终于自研基础模型了,而且是从零开始做,专门为美学多样性和风格控制优化的,对做视觉内容的人来说多了一个风格自由度的选择,值得试试 early access。
21:29
AK@_akhaliq
56
Qwen-Image-2.0 技术报告
图像生成多模态论文/研究
18:33
Kling AI@Kling_ai
63
用户利用GPT image 2与Kling AI,根据详细提示词生成了一张模拟电视转播视角的超写实F1赛事直播截图。画面聚焦于一位在VIP围场/车队车库中的年轻女性,其身份特征从参考图像中被精确保留。她佩戴专业赛车耳机,神情紧张专注,画面包含"FINAL LAP"横幅、计时塔、直播标识等完整的转播图形元素。作品特别注重广播级细节,如压缩伪影、自然肤质和8K画质,旨在完美呈现如同真实电视截图的视觉效果。

Ciri: Made with GPT image 2 + Kling AI Prompt: Ultra-realistic F1 live TV broadcast screenshot, identity preserved exactly fro...

OpenAI图像生成多模态教程/实践
12:42
SenseTime@SenseTime_AI
46
这正是我们打造SenseNova U1的原因。✨ 感谢@feesyiam用它聚焦儿童福利议题。可视化让艰难对话更易进行--这正是AI真正发挥价值的时刻。 请持续创作。🥰

Nafees: I gave it a topic. It came back with a full magazine-style infographic. Charts. Layout. Icons. Colour coding. Dense stru...

图像生成开源生态行业动态
‹ 上一页
1…910111213…18
下一页 ›