AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态X · 699 条
全部一手资讯X论文
标签「图像生成」清除
Berryxia.AI@berryxia · 6月12日36

终于迎来了YouMind 1.0 正式版本,从0.x开始迭代,一路不断打磨更新。 也一路见证了起成长,我当时的香蕉爆款图片多半出自YouMind 。 也是最懂生图,调优化Agent做的最好的。 祝贺YouMind 越来越牛逼~

译YouMind 1.0 正式版本发布。从 0.x 开始迭代,官方强调其代表“Create bolder”理念。用户 Berry Xia 发文祝贺,称 YouMind 是最懂生图、调优化 Agent 做得最好的工具,其之前的爆款图片多出自 YouMind,一路见证了该产品的成长。

Alibaba Cloud@alibaba_cloud · 6月12日64

New feature alert on Wan! 🚀 Meet Character X: Create a unique face instantly. Try it now 🔗: https://int.alibabacloud.com/m/1000413253/ Whether you need a custom avatar, a brand new character, or a completely unique identity, Character X brings your vision to life with ease.

译Wan 新功能上线!🚀 认识一下 Character X:即时创建独一无二的面孔。 立即尝试 🔗: https://int.alibabacloud.com/m/1000413253/ 无论你需要自定义头像、全新角色,还是完全独特的身份,Character X 都能轻松将你的构想变为现实。

Alibaba Cloud@alibaba_cloud · 6月12日26

Thailand | Where Ancient Spirit Meets Digital Pulse, Reimagined by AI From the sacred curves of Naga serpents carved in stone to the thunderous rhythm of Muay Thai fists meeting sandbags—from the fragrant explosion of lemongrass and kaffir lime in a simmering tom yum to the golden glow of Ayutthaya’s ruins rising through morning mist—this video, created by Qwen and Wan, uses AI to weave Thailand’s soul into a digital tapestry. Ready to turn your vision into reality? Unleash the creative power of our models on Model Studio and start building tomorrow, today. 🔗 https://int.alibabacloud.com/m/1000414396/ #AlibabaCloud #Wan #Qwen #ModelStudio #Thailand #Bangkok #MuayThai #ThaiHeritage #CreativeAI #AInnovation #TechForGood

译阿里云发布由 Qwen 和 Wan 模型生成的泰国主题 AI 视频,融合娜迦蛇雕、泰拳、冬阴功、大城府朝雾等泰国文化元素。视频旨在展示模型创意能力,并推广 Model Studio 平台,鼓励用户利用该平台将创意转化为现实。推文未提供模型版本号、参数规模、benchmark分数等具体数字。

小互@xiaohu · 6月12日75

升级了下公众号排版技能 晚一点发布,还需要优化下 增加了一些主题和优化了预览和浏览页面的阅读体验

译小互(@xiaohu)升级了公众号排版技能组合,实现一句话完成排版、封面生成并一键发送到公众号草稿箱。该工具已开源,提供20种主题颜色可选,可自动分析内容进行排版,支持非Markdown文件。用户只需在Claude Code、Codex或OpenClaw中提供文章链接或文档位置,即可获得可视化预览界面进行选择,全程无需手动操作。

Ethan Mollick@emollick · 6月12日55

Since I am on an AI & poetry kick, here is what Fable did with "the Duino Elegies as a game. get the mood right" It made a beautiful little art game, including translating Rilke (though I insisted on bits from A. S. Kline's excellent translation as well) https://duino-elegies.netlify.app/

译由于我最近迷上了AI与诗歌,来看看Fable如何将《杜伊诺哀歌》做成游戏——“把握情绪”。 它制作了一个漂亮的小型艺术游戏,包括翻译里尔克(不过我也坚持加入了一些A. S. Kline优秀译作的片段)。https://duino-elegies.netlify.app/

向阳乔木@vista8 · 6月12日70

想到一个特别有雄心的Claude Fable 5 任务! 做一个在线版Photoshop。 需求文档 AI 写好了,感兴趣的可以发过去试试。 PRD见评论

Artificial Analysis@ArtificialAnlys · 6月12日52

Ideogram 4.0 is Ideogram’s first open weights release and debuts at #8 on our Open Weights Text to Image Leaderboard Ideogram 4.0 is the latest release from @ideogram_ai. Alongside their first party API, Ideogram is releasing 4.0 with open weights and a commercial license. The model generates 2K x 2K outputs (~4MP), with strong text rendering across languages, bounding box layout control, and transparent backgrounds. Ideogram 4.0 uses structured JSON prompts that specify composition and individual scene elements, with a prompt enhancer that expands natural language prompts into this structured format. Note that the prompt enhancer is only available via the Ideogram proprietary API, though it is free to use. We benchmarked the Quality tier of the model served via Ideogram's API, where it ranks #8 in Open Weights Text to Image, and #31 in Text to Image. It places ahead of closed source models including Seedream 3.0 and Luma UNI 1. While Ideogram 4.0 places near the top of our design, layout, and text rendering categories, it ranks further down overall on a balanced benchmark across all use cases including cartoon, anime, and photorealism. The model also has a more stylized look, which typically means it performs less favorably on our benchmarks. Ideogram states the open weights model accessible to the public is essentially the same model with additional safety training and quantization, so we expect a small quality difference. Ideogram 4.0 is available across three API tiers: Turbo at $30/1k images, Default at $60/1k images, and Quality at $100/1k images. The weights are free to download for evaluation and non-commercial use, with commercial self-hosting requiring a separate license. Congratulations to @ideogram_ai on the launch! See below for example generations and a link to vote on Ideogram 4.0 for yourself in the Artificial Analysis Image Arena 🧵

译Ideogram 4.0 是 Ideogram 首个开源权重模型,生成 2K×2K 输出,支持多语言文本渲染、边界框布局控制和透明背景。采用结构化 JSON 提示,提示增强器仅限 Ideogram 专有 API。在 Artificial Analysis 开放权重排行榜排名第8,整体第31,领先 Seedream 3.0 等闭源模型。API 三档:Turbo $30/千张、Default $60/千张、Quality $100/千张。开源权重免费用于评估和非商业用途,商业自部署需单独许可。

Baidu Inc.@Baidu_Inc · 6月12日5

Boots laced, nets up, clocks set to zero — all the small preparations adding up to football's biggest summer. Ready for kickoff? - Images created with ERNIE-Image

译靴子系好,球网架起,时钟归零——所有的小准备汇聚成足球最大的夏天。 准备好开球了吗? - 图像由 ERNIE-Image 创建

🚨 AI News | TestingCatalog@testingcatalog · 6月12日50

Maket has enabled floor plan upload, letting users bring their existing plans into the platform and have them recognized and editable within minutes. Users can upload a sketch, a listing PDF, or an old design file, which will automatically be traced for walls, doors, windows, and furniture, and then made available on a live canvas, ready to edit and view in 3D.

译Maket 推出了用户最常请求的功能:支持上传平面图(包括草图、PDF 或旧设计文件),系统自动识别墙、门、窗和家具,几分钟内即可在平台上生成可编辑的 3D 画布,用户可直接修改和查看。这是该平台最受期待的功能之一。

Logan Kilpatrick@OfficialLoganK · 6月12日81

Gemini Omni Flash is SOTA at image to video, text to video, and video editing : ) Excited to get this to developers in the API soon!

译Gemini Omni Flash 在图像到视频、文本到视频和视频编辑方面达到了 SATA : ) 很高兴很快能将这一能力通过 API 提供给开发者!

Krea@krea_ai · 6月11日73

introducing Generative Sliders. now you can control the intensity, complexity, and movement of any image you generate with Krea 2. what new controls would you like to see? 👇

译推出生成式滑块。 现在您可以控制使用 Krea 2 生成的任何图像的强度、复杂度和运动。 你希望看到哪些新控制?👇

fofr@fofrAI · 6月11日22

How can I prompt this?

译我该如何提示这个?

Alibaba Cloud@alibaba_cloud · 6月11日21

UAE | The Fusion of Heritage and Innovation, Reimagined by AI From the endless desert horizons and the flowing artistry of Arabic calligraphy to the timeless warmth of traditional hospitality and the glowing modern skyline of Dubai, this video—created by Qwen and Wan—uses AI to connect these iconic symbols. We trace the journey from ancient astronomical wisdom and cultural landmarks to the futuristic possibilities of tomorrow, showcasing how the UAE balances its rich traditions with boundless innovation. Ready to bring your own ideas to life? Explore the power of our models on Model Studio and start creating today. 🔗 https://int.alibabacloud.com/m/1000414322/ #AlibabaCloud #Wan #Qwen #ModelStudio #UAE #Dubai #TechForGood #CreativeAI #ArabicCulture #AInnovation

译阿里云发布AI生成视频,由通义千问(Qwen)和万相(Wan)模型共同创作。视频以阿联酋为主题,融合沙漠、阿拉伯书法、传统待客之道与迪拜现代天际线等元素,从古代天文智慧到未来科技,展现文化遗产与创新的平衡。官方推荐使用Model Studio平台调用模型进行创作。

Alibaba Cloud@alibaba_cloud · 6月11日31

Day 2 from the Singapore 🇸🇬 Three things at #SuperAI2026 today: 👜 AI totebag printing at the Alibaba_Cloud x #Qwen booth 🛠️ Alibaba Cloud hands-on workshops 🎤 Catch Andy (Regional GM ASEAN) on the 11:50 AM main stage discussing "The Visual AI Stack." See you there!

译来自新加坡的第2天 🇸🇬 今天在#SuperAI2026的三件事: 👜 在阿里云 x #Qwen 展台打印AI帆布袋 🛠️ 阿里云动手实践工作坊 🎤 上午11:50在主舞台听Andy(东盟区域总经理)探讨“视觉AI堆栈”。 到时候见!

Midjourney@midjourney · 6月11日84

We've made V8.1 the new default model for all users on Midjourney. V8 will now be deprecated in 2 weeks. V8.2 will start testing extremely soon.

译我们已将 V8.1 设为 Midjourney 所有用户的新默认模型。V8 将在两周后弃用。V8.2 即将开始测试。

Orange AI@oran_ge · 6月11日76

在写完这篇文章后 我把配图过程蒸馏成了一个「橙线插画」Skill 免费开源 安装地址: https://github.com/orange2ai/orange-line-illustration

译在写完这篇文章后 我把配图过程蒸馏成了一个「橙线插画」Skill 免费开源 安装地址: https://github.com/orange2ai/orange-line-illustration [引用 @oran_ge]:http://x.com/i/article/2064857003743391744

AYi@AYi_AInotes · 6月11日43

Damn,AGI到来之后,品味和审美一定是一个人最核心的竞争力和最强的护城河, Claude Fable 5遇到审美和品味高的,输出质量高到爆炸,这效果真的绝了😭

译天哪,AGI到来之后,品味和审美一定是一个人最核心的竞争力和最强的护城河, Claude Fable 5遇到审美和品味高的,输出质量高到爆炸,这效果真的绝了😭

ChatGPT@ChatGPTapp · 6月10日69

Go #MessiMode Upload a photo of yourself and try this prompt: “Make my hair the colors of my country flag but keep it natural-looking. If no country or image is provided, ask."

译Go #MessiMode 上传一张你的照片并尝试这个提示词:“将我的头发变成本国国旗的颜色,但要看起来自然。如果没有提供国家或图片,请询问。”

AYi@AYi_AInotes · 6月10日68

一个 10 万粉的小红书 AIGC 博主, 不带货,不卖课,不引流私域,她是靠什么挣钱的? 我拆了7 篇爆款(赞≥5000),规律全在这, 这篇请收藏起来,你一定会用到! 1️⃣封面:7 篇有 5 篇零文字,纯靠画面。"封面要大字+痛点"在 AIGC 赛道是错的——唯二带大字的两条都是品牌广,大字=广告语 2️⃣广告:7 篇里 5 篇是品牌合作(兰蔻、李锦记、华为、脉动),但没一条像硬广,产品全包进"猫咪 meme""穿进古画当厨子"的剧情里 3️⃣选题天花板:萌宠拟人化。一条 AI 跳舞猫 7.9 万赞、4.2 万藏,干翻所有奢品大片 4️⃣标题:强动词造戏剧感——闯进 / 穿进 / 征服 > 分享 / 介绍,再配疑问感叹 + emoji 5️⃣开头:第一句直接说出用户心里话("也太治愈了吧"),或具体场景代入 6️⃣形式:100% 视频,0 图文 能抄的就这 6 条, 十几分钟扒完 7 篇的封面/标题/钩子/数据 + 我用的提示词,都在下面这篇干货满满的文章里 👇

译一位10万粉小红书AIGC博主,不带货、不卖课、不引流私域。拆解7篇赞≥5000爆款:封面5篇零文字靠画面,唯二带大字的为品牌广;7篇中5篇品牌合作(兰蔻、李锦记、华为、脉动),产品嵌入“猫咪meme”“穿进古画当厨子”剧情;选题萌宠拟人化,一条AI跳舞猫获7.9万赞、4.2万藏;标题用强动词如“闯进/穿进/征服”+疑问感叹;开头直说用户心里话或具体场景;全部视频、0图文。详细提示词见原文。

AYi@AYi_AInotes · 6月10日59

说个暴论,大多数普通人能抓到的AI红利就是自媒体, 给大家分享下最近拆解的小红书博主, 说实话,这是我见过最离谱的 一个小红书AIGC 博主, 10 万粉,不带货,不卖课,不引流私域, 那他是那么变现和赚钱的呢? 我用 AllyHub 把它的收入拆了个底朝天,结果直接把我干懵了: 80% 的钱,全来自蒲公英接品牌广告, 李锦记、兰蔻、华为、宝格丽都投过它, 10 万粉这个量级,一条广估算报价至少 8000 到 2 万。 更狠的是它的隐藏变现: 账号本身就是一份活的作品集, 品牌看到它能用 AI 做出兰蔻大片级别的效果, 会直接私信谈全案,绕过平台、报更高的价。 这是我最近最颠覆的一条认知,就是: 爆款从来不是用来直接赚钱的,是用来抬价的, 一条 7000 赞的爆款,能把接广报价从 2000 拉到 4000,品牌主动找上门的概率还翻倍。 顺着这个逻辑想你就懂了: 以前普通人根本接不到品牌广告—— 没团队,没设备,没预算,连相机都买不起, 现在 AI 几乎把这些门槛碾平了, 一个人,一台电脑,就能做出接近专业团队的内容。 你的账号,就是一份 24 小时挂在网上的简历。 这才是 AI 给普通人最被低估的红利, 它不是替你写笔记凑字数, 是把过去只有广告公司才握得住的创意能力, 塞到了你手里。 哪怕你只做到 3 万粉,按行业水平估算,月入也有机会落在 8k 到 2 万(旺季更高、淡季会缩水,别当稳赚)。 不用囤货,不用售后,把内容做好,让品牌自己来找你。 完整变现拆解 + 我用 AllyHub 拆账号的提示词,都在下面这篇 👇

译一个10万粉小红书AIGC博主,不带货、不卖课,80%收入来自蒲公英品牌广告(李锦记、兰蔻、华为、宝格丽均投过),单条推广报价8000-2万。隐藏变现是将账号作为活作品集,品牌看到AI制作的兰蔻级别效果后,绕过平台直接谈全案。一条7000赞爆款可将报价从2000拉至4000,并提升主动邀约率。AI碾平了门槛——一人一电脑能做出接近专业团队的内容,账号就是24小时在线简历。按行业估算,3万粉账号月入可达8000-2万。

Deedy@deedydas · 6月10日66

Claude Fable’s ability to create rich docs, slides, sheets, websites in specific styles pixel perfectly is the biggest step change in AI model quality since o3. Here’s another compilation of 8 amazing things it can do, many of which took >2hrs of thinking! – Perfectly designed McKinsey style report – Near identical SpaceX S-1 IPO draft – Pixel-perfect recreation of Pokemon, the game – 3D design of a controllable humanoid robot – Apple Liquid Glass UI with just CSS – 3D world rendering of Yosemite (!!) – Upgraded website design – Rich, beautiful email marketing templates

译Claude Fable 在创建文档、幻灯片、表格、网站等方面实现了像素级精准,被认为是自 o3 以来 AI 模型质量的最大飞跃。其能力包括:完美复现 McKinsey 风格报告、近乎一致的 SpaceX S-1 IPO 草案、像素级还原宝可梦游戏、可控人形机器人 3D 设计、仅用 CSS 实现 Apple Liquid Glass UI、优胜美地 3D 世界渲染、网站设计升级以及精美的邮件营销模板。其中许多任务需要超过 2 小时的深度思考。

Deedy@deedydas · 6月10日69

Claude Fable 5 is by far the most ridiculous model that makes me genuinely afraid for the future of software engineering. I compiled the top 10 most unbelievable things I've seen Claude Fable 5 do today: — Migrate a 50M line codebase from Stripe in a day (humans take 2mos) — Draw amazing 3D graphics a) Boeing 747 b) space simulations with >5000 objects c) Minecraft roller coasters d) full photorealistic forest scenes e) NYC skyline f) stormy clouds) — One-shot Pokemon FireRed the game — Optimize a real world proprietary interaction net evaluator 10x more than the next best model, gpt5.5 AND it's about the same price as GPT 5.5 ($10/M input, $45/M output) vs Fable 5 ($10/M input, $50/M output) and 6x cheaper than GPT 5.5 Pro.

译Claude Fable 5 一天内迁移 Stripe 5000 万行代码库(人类需 2 个月);绘制逼真 3D 图形(波音 747、超 5000 个对象太空模拟、Minecraft 过山车、写实森林、纽约天际线、暴风云);一次性通关宝可梦火红版;优化实际交互网络求值器,效果比 GPT 5.5 好 10 倍。价格相近:输入 $10/M,输出 $50/M(Fable 5)vs $45/M(GPT 5.5),且比 GPT 5.5 Pro 便宜 6 倍。

Artificial Analysis@ArtificialAnlys · 6月10日67

HiDream-O1-Image-1.5 lands at #3 on the Artificial Analysis Text to Image Leaderboard, surpassing Google’s Nano Banana 2! HiDream’s latest addition to the O1 Image model series is a closed-source model capable of generating images up to 2K resolution from text prompts. The O1 Image family is built on HiDream's Unified Transformer (UiT), which encodes raw pixels, text, and task conditions in a single shared token space rather than splitting the task across a separate text encoder, a VAE, and an image model. On the Artificial Analysis Text to Image Arena, HiDream-O1-Image-1.5 places second only to OpenAI’s image models, delivering quality similar to GPT Image 1.5 (high), Nano Banana 2 (Gemini 3.1 Flash Image Preview), and Cosmos3-Super-Text2Image. HiDream-O1-Image-1.5 is priced at $80/1k images and is currently available on HiDream’s HiHarness platform (accessible via their website), as well as on the Vivago platform. Congratulations to @HiDream_ai and @vivago_ai on the release! See below for comparisons between HiDream-O1-Image-1.5 and other leading models in the Artificial Analysis Image Arena 🧵

译HiDream 发布 O1-Image-1.5,在 Artificial Analysis 文生图排行榜中位列第三,超越 Google Nano Banana 2。该闭源模型可生成高达 2K 分辨率图像,基于自研 Unified Transformer(UiT)架构,将原始像素、文本和任务条件编码到统一 token 空间。质量仅次于 OpenAI,与 GPT Image 1.5 (high)、Nano Banana 2(Gemini 3.1 Flash Image Preview)及 Cosmos3-Super-Text2Image 相当。定价 $80/千张,现可通过 HiHarness 及 Vivago 平台使用。

Fei-Fei Li@drfeifei · 6月10日78

The creativity and imagination is out of the world! So grateful that @theworldlabs got to partner with the amazing talents @withloreco to translate their incredible ideas into an interactive experiences for users to enjoy!🤩

译创意和想象力无与伦比!非常感谢@theworldlabs能与@withloreco的优秀人才合作,将他们不可思议的想法转化为用户可以享受的互动体验!🤩

🚨 AI News | TestingCatalog@testingcatalog · 6月9日55

Maket has released Auto-Complete, a feature that can take a partial floor plan and generate the rest of the layout while keeping the rooms already placed exactly as they are. > You can start with as little as a rough sketch, a few walls, or even one bedroom roughly positioned. > It's enough to get a complete, well-dimensioned plan back in minutes.

译Maket 推出 Auto-Complete 功能,用户只需输入部分平面图(如粗略草图、几面墙或一个大致定位的卧室),系统即可自动生成剩余布局,同时保持已放置房间完全不变。用户可画出任意平面图形状并添加确定的房间,Maket 会在几分钟内返回一份完整且尺寸合理的平面图,实现从局部到整体的快速设计。

Krea@krea_ai · 6月9日58

AI in architecture studios – Krea Podcast with Nitsan Bartov full interview below 👇

译AI 在建筑工作室——Krea 播客与 Nitsan Bartov 完整采访见下方 👇

🚨 AI News | TestingCatalog@testingcatalog · 6月9日55

A new image Playground on iOS 27 Beta says that image model behind the scenes is from Google. However, on test prompts results look quite different from Nano Banana and Imagen. This Liquid Glass bubble is cool 👀

译iOS 27 Beta 中的一个新图片游乐场显示,其背后的图像模型来自 Google。 然而,在测试提示下,结果与 Nano Banana 和 Imagen 相比截然不同。 这个液态玻璃泡泡很酷 👀

🚨 AI News | TestingCatalog@testingcatalog · 6月9日69

WWDC 🔥: A new Apple Intelligence powered by Gemini, conversational Siri AI, updated image editing, and loads of AI features across many Apple apps. Siri AI will launch in beta later this year. Initially, Siri AI won't be available in the EU.

译WWDC 🔥:全新Apple Intelligence由Gemini驱动,对话式Siri AI,更新的图像编辑,以及众多苹果应用中的大量AI功能。 Siri AI将于今年晚些时候以测试版形式推出。初期,Siri AI将不会在欧盟上线。

-Zho-@ZHO_ZHO_ZHO · 6月9日33

Siri AI + 空间智能生成 一顿智能后,这构图和效果还不如原图呢,这是来搞笑的???

Runway@runwayml · 6月9日79

One video, now made for every feed and format. Upload your existing video, choose your desired aspect ratio and watch our editing model, Aleph 2.0, fill in the rest of the scene as if you made it that way from the start. Try it on our desktop web app at the link below.

译一个视频,现在可以为每个信息流和格式制作。上传你现有的视频,选择你想要的宽高比,然后观看我们的编辑模型 Aleph 2.0,填充场景的其余部分,就像你从一开始就这样制作一样。 在我们的桌面 Web 应用上尝试,链接如下。

SenseTime@SenseTime_AI · 6月8日56

🙌 Shoutout to @FahdMirza for demoing 𝗦𝗲𝗻𝘀𝗲𝗡𝗼𝘃𝗮 𝗨𝟭’𝘀 𝘁𝗲𝘅𝘁-𝗶𝗺𝗮𝗴𝗲 𝗶𝗻𝘁𝗲𝗿𝗹𝗲𝗮𝘃𝗲𝗱 𝗴𝗲𝗻𝗲𝗿𝗮𝘁𝗶𝗼𝗻 — showing the step-by-step process of formulating a custom perfume 🧴✨ It doesn't just see images. It thinks in them — and outputs in vivid visuals 🎥 https://youtu.be/-uedweS3_w0 Explore prompt examples in SenseTime Studio's Gallery and build your own 👇 🎛️ SenseNova Studio: https://unify.light-ai.top/ (Try infographics; also join Discord for text-image interleaved gen) 🤗 https://huggingface.co/collections/sensenova/sensenova-u1 🛠️ https://github.com/OpenSenseNova/SenseNova-U1 👾 Discord: https://discord.com/invite/BuTXPHmQub

译商汤 SenseTime 展示 SenseNova U1 的文图交错生成能力,通过定制香水逐步演示,证明模型不仅能识别图像,还能以图像为思考单元输出生动视觉内容。相关示例、Gallery、HuggingFace 模型、GitHub 代码及 Discord 社区链接已同步开放。

🚨 AI News | TestingCatalog@testingcatalog · 6月8日56

Thanks to Ideogram for sending this ❤️ Ideogram 4.0 was one of the biggest releases last week! Especially for the open source community. Tested it 👀

译感谢 Ideogram 发送了这个 ❤️ Ideogram 4.0 是上周最大的发布之一!尤其对开源社区而言。 测试了一下 👀

歸藏(guizang.ai)@op7418 · 6月8日53

藏师傅的社交媒体卡片 Skill,即将迎来一个非常重磅的升级。 可以帮大家解决小红书 Live Photo 的制作问题,同时会帮你制作动态的带文字排版的 Live Photo 这样你可以在发布一些必须的动态内容的时候,依然以图文的形式发布,而不至于做非常重的视频。

译藏师傅的社交媒体卡片 Skill 即将迎来重大升级,新增对小红书 Live Photo 的支持。该功能可帮助用户制作带文字排版的动态 Live Photo,使发布动态内容时仍能以图文形式呈现,无需制作完整视频。具体细节尚未公布,但用户可期待更便捷的社交媒体内容创作体验。

歸藏(guizang.ai)@op7418 · 6月8日55

试了一下,公众号图文卡片也是支持 Live Photo 的。 只不过要从 iPhone 上上传,这下爽了呀!

译藏师傅的社交媒体卡片 Skill 即将重磅升级,可制作小红书动态带文字排版的 Live Photo,方便以图文形式发布动态内容。随后实测发现公众号图文卡片同样支持 Live Photo,但需通过 iPhone 上传。

Deedy@deedydas · 6月8日70

This is the best scene in Hell Grind, an entirely AI-made movie, the flashback. Watch it and read this analysis on where we are with AI movies today: time, cost, quality. Overall: Phenomenal technical demo by Higgsfield. Mediocre movie. Good graphics, hints of emotion, but superhero movie level quality in certain scenes at best. Too many cuts. That said, 660x fewer man hours, 50x faster and 36x cheaper than the median US film. Time: The 95 min film took 15 people 14 days. The median US theatrical production takes ~200 people ~2yrs. That’s a 660x improvement in man-hours and 50x in calendar time. Economics: It took $500k, 80% of which was compute. The final footage was cut from ~100hrs of footage generated from text to video / image to video models like Bytedance’s Seedance: a 64:1 “curation” ratio. The median US movie takes ~$18M, with even indie films costing $1-5M. Thats 36x cheaper than median. Quality: Average watch *at best*. Way too many cuts between shots, several characters change accents and have “AI” synthetic voices and characters feel like it’s AI too. Movement, editing and blocking feel artificial too. On the plus side, we’ve more or less solved character consistency, camera angles and realism. The reason the movie wasn’t amazing was more about poor directorial choices than innately unusable video models. Hard to put a number on it but maybe we’re at ~90% on quality that is technically achievable. If Scorsese made an AI movie, I reckon it would be quite good. I know the visceral reaction to anything AI is real and well-studied. But I think it’s folly to fight the inevitability of AI film. It’s too cheap and quick to ignore and almost there on quality. Creators with distribution *will* make AI films and shows and just put them on YouTube. This is the worst quality, slowest and most expensive it will ever be. In the end, good content beats “real” content.

译95分钟AI电影《Hell Grind》由15人14天完成,成本50万美元(80%为算力)。相比中位数美国电影(约200人2年、1800万美元),实现660倍人时、50倍时间、36倍成本改善。影片从约100小时AI生成素材(使用字节跳动Seedance等模型)中按64:1比率剪辑。质量方面,角色一致性、摄像机角度和写实感基本解决,但剪辑过多、角色口音多变、AI合成声音明显,动作和编排生硬——整体平庸,主因是导演选择而非模型限制。作者认为这是AI电影最差、最慢、最贵的时刻,未来创作者将直接投放YouTube。

karminski-牙医@karminski3 · 6月8日58

ideogram-4 实测! Z-Image 的竞争对手来了? ideogram 刚刚发布了Ideogram 4文生图模型, 划重点, 这是个开放权重模型, 大小只有9.3B, 并且支持原生2K分辨率图片生成! 目前 reddit 上全都是 ideogram 4 的生成效果图, 于是我赶紧测了一波. 直接给大家带来我觉得跟这个模型风格最像的通义 Z-image-Turbo生成效果对比. 我的结论: #ideogram #ideogram4 #Nanobanana #文生图大模型

译ideogram发布Ideogram 4文生图模型,开放权重,仅9.3B参数,支持原生2K分辨率生成。作者将其与通义Z-image-Turbo生成效果对比,认为两者风格相似。

Chubby♨️@kimmonismus · 6月7日64

OpenAI’s ChatGPT "superapp" overhaul could start rolling out in the coming weeks. The first wave likely won’t be one big launch, but a phased redesign pushing users toward Codex, agents, image generation, and partner apps. As one OpenAI employee told the FT: "Chat is dead", the new goal is a single AI assistant that can act across your work and personal life.

译OpenAI 的 ChatGPT “超级应用”改造可能在未来几周开始推出。 第一波可能不是一次大发布,而是分阶段重新设计,将用户推向 Codex、AI 智能体、图像生成和合作伙伴应用。 正如一位 OpenAI 员工告诉《金融时报》:“聊天已死”,新目标是打造一个能在你的工作和个人生活中行动的单一 AI 助手。

宝玉@dotey · 6月7日76

对比一下 GPT-5.5 的设计效果和 Opus 4.8 的设计效果 我真不是尬黑 GPT-5.5,我这种审美水平都能看出来差距 使用 Skill:https://github.com/JimLiu/baoyu-design ---- 提示词 ---- /baoyu-design 帮我开发一款Reader Mac App,帮助我更好的阅读和收藏文章。数据都在本地。 ## 信息采集 1. 主动添加 可以手动添加不同类型的信息: - URL:输入 URL,自动抓取内容和图片 - 附件:上传PDF、视频、图片 - Markdown 编辑:类似于发布博客,输入标题、内容、发布图片 - 其他 2. 自动订阅 - RSS 订阅 - 社交媒体账号:X、微博、YouTube - 其他 ## 信息编辑和分类 1. 标签 每条内容都可以打标签 2. 分类、目录 可以创建树形目录,可以把内容放到不同的分类 3. 收藏 可以点击收藏 4. 编辑 每一条内容都可以编辑,有个内置的Markdown编辑 ## AI 辅助 ### 功能 1. 自动翻译 可以支持不同语言的翻译 2. 总结和摘要 可以去对抓取了的内容进行摘要 3. 二次创作 可以基于一条或者多条内容进行二次创作 ### 交互 1. CMD + K 随时唤出菜单 2. 集成 AI Chat Sidebar 可以显示 Chat Sidebar 通过 AI Chat 去调用 AI Agent 辅助对内容进行处理 3. 选中操作 选中内容文字,可以进行处理,比如翻译、润色、修改之类

译宝玉对比了GPT-5.5与Opus 4.8的设计能力,认为Opus 4.8效果远优于GPT-5.5。他使用了基于Cursor浏览器和元素标注的baoyu-design Skill,该Skill通过npx skills add JimLiu/baoyu-design安装,可在本地运行:描述屏幕需求即可生成精良HTML,点击预览中任意元素即可发出修改指令。官方推荐搭配Opus 4.8以获得最佳效果。工具GitHub仓库:https://github.com/JimLiu/baoyu-design。

jason@jxnlco · 6月7日18

Ok can llms onshot Gaussian splats

译LLM 能否一次性生成高斯溅射?

fofr@fofrAI · 6月7日53

Make the building dance to music

译从一张建筑图片开始,用提示词在Omni中生成投影映射。主推文:让建筑随音乐舞动。

全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月12日
20:11
Berryxia.AI@berryxia
36
YouMind 1.0 正式版发布,用户盛赞其生图与Agent优化

YouMind 1.0 正式版本发布。从 0.x 开始迭代,官方强调其代表“Create bolder”理念。用户 Berry Xia 发文祝贺,称 YouMind 是最懂生图、调优化 Agent 做得最好的工具,其之前的爆款图片多出自 YouMind,一路见证了该产品的成长。

YouMind: YouMind 1.0 is officially here. The loudest story about creating is a heavy one. More discipline. More originality. More...

智能体产品更新图像生成
17:10
Alibaba Cloud@alibaba_cloud
64
Wan 新功能上线!🚀 认识一下 Character X:即时创建独一无二的面孔。 立即尝试 🔗: https://int.alibabacloud.com/m/1000413253/ 无论你需要自定义头像、全新角色,还是完全独特的身份,Character X 都能轻松将你的构想变为现实。
产品更新图像生成
15:08
Alibaba Cloud@alibaba_cloud
26
阿里云Qwen与Wan用AI创作泰国风情视频

阿里云发布由 Qwen 和 Wan 模型生成的泰国主题 AI 视频,融合娜迦蛇雕、泰拳、冬阴功、大城府朝雾等泰国文化元素。视频旨在展示模型创意能力,并推广 Model Studio 平台,鼓励用户利用该平台将创意转化为现实。推文未提供模型版本号、参数规模、benchmark分数等具体数字。

图像生成多模态行业动态
11:54
小互@xiaohu
精选75
小互(@xiaohu)升级了公众号排版技能组合,实现一句话完成排版、封面生成并一键发送到公众号草稿箱。该工具已开源,提供20种主题颜色可选,可自动分析内容进行排版,支持非Markdown文件。用户只需在Claude Code、Codex或OpenClaw中提供文章链接或文档位置,即可获得可视化预览界面进行选择,全程无需手动操作。

小互: 一句话搞定公众号排版、封面生成、发布 我做了个技能组合,可以一句话搞定公众号排版、封面生成,和一键发送到公众号草稿箱,你只需点下发布即可。 已经开源了 有20种主题颜色可选 最重要的是它会自动分析你的内容,进行自动排版,不是Markdown...

Anthropic图像生成开源/仓库教程/实践

推荐理由:小互把公众号排版全流程做成一个开源技能,一句话就能从内容生成到草稿箱,做公众号的可以直接用,这种自动化程度很少见。
09:30
Ethan Mollick@emollick
55
由于我最近迷上了AI与诗歌,来看看Fable如何将《杜伊诺哀歌》做成游戏--"把握情绪"。 它制作了一个漂亮的小型艺术游戏,包括翻译里尔克(不过我也坚持加入了一些A. S. Kline优秀译作的片段)。https://duino-elegies.netlify.app/
图像生成大佬观点
03:58
向阳乔木@vista8
70
想到一个特别有雄心的Claude Fable 5 任务! 做一个在线版Photoshop。 需求文档 AI 写好了,感兴趣的可以发过去试试。 PRD见评论
Anthropic图像生成教程/实践
02:32
Artificial Analysis@ArtificialAnlys
52
Ideogram 4.0 开源权重文生图模型发布

Ideogram 4.0 是 Ideogram 首个开源权重模型,生成 2K×2K 输出,支持多语言文本渲染、边界框布局控制和透明背景。采用结构化 JSON 提示,提示增强器仅限 Ideogram 专有 API。在 Artificial Analysis 开放权重排行榜排名第8,整体第31,领先 Seedream 3.0 等闭源模型。API 三档:Turbo $30/千张、Default $60/千张、Quality $100/千张。开源权重免费用于评估和非商业用途,商业自部署需单独许可。

图像生成开源生态模型发布
02:26
Baidu Inc.@Baidu_Inc
5
靴子系好,球网架起,时钟归零--所有的小准备汇聚成足球最大的夏天。 准备好开球了吗? - 图像由 ERNIE-Image 创建
产品更新图像生成
01:38
🚨 AI News | TestingCatalog@testingcatalog
50
Maket 推出了用户最常请求的功能:支持上传平面图(包括草图、PDF 或旧设计文件),系统自动识别墙、门、窗和家具,几分钟内即可在平台上生成可编辑的 3D 画布,用户可直接修改和查看。这是该平台最受期待的功能之一。

Maket: UPLOAD YOUR OWN FLOOR PLAN TO MAKET HAVE IT RECOGNIZED AND EDITABLE IN MINUTES One of the most requested features weʼve ...

产品更新图像生成
01:20
Logan Kilpatrick@OfficialLoganK
同事件精选81
Gemini Omni Flash 在图像到视频、文本到视频和视频编辑方面达到了 SATA : ) 很高兴很快能将这一能力通过 API 提供给开发者!
Google图像生成多模态模型发布
同一事件,精选展示《Gemini 3.5:具备行动能力的前沿智能》
推荐理由:视频生成正式进入全模态一体时代,Gemini Omni Flash 把图生视频、文生视频和剪辑整合在一个模型里,API 很快上线,做视频工具的可以提前琢磨对手在哪了。
6月11日
23:07
Krea@krea_ai
精选73
推出生成式滑块。 现在您可以控制使用 Krea 2 生成的任何图像的强度、复杂度和运动。 你希望看到哪些新控制?👇
产品更新图像生成

推荐理由:Krea 2 终于加上了控制强度、复杂度和运动轨迹的滑块,以前调参靠抽卡,现在能精准控制了,做图的人应该会喜欢。
18:44
fofr@fofrAI
22
我该如何提示这个?

돌아온평직 (돌평): 롤러코스터를 타고 줌회의를 하면 눈치 챌까? 진짜 미친 콘텐츠넼ᄏᄏ

其他图像生成视频
14:04
Alibaba Cloud@alibaba_cloud
21
阿里云用Qwen与Wan创作阿联酋AI视频

阿里云发布AI生成视频,由通义千问(Qwen)和万相(Wan)模型共同创作。视频以阿联酋为主题,融合沙漠、阿拉伯书法、传统待客之道与迪拜现代天际线等元素,从古代天文智慧到未来科技,展现文化遗产与创新的平衡。官方推荐使用Model Studio平台调用模型进行创作。

图像生成行业动态视频
12:34
Alibaba Cloud@alibaba_cloud
31
来自新加坡的第2天 🇸🇬 今天在#SuperAI2026的三件事: 👜 在阿里云 x #Qwen 展台打印AI帆布袋 🛠️ 阿里云动手实践工作坊 🎤 上午11:50在主舞台听Andy(东盟区域总经理)探讨"视觉AI堆栈"。 到时候见!
图像生成行业动态
12:18
Midjourney@midjourney
84
我们已将 V8.1 设为 Midjourney 所有用户的新默认模型。V8 将在两周后弃用。V8.2 即将开始测试。

Midjourney: V8.1 is live! Our iconic aesthetics are back w native 2K HD rendering - 3x faster and 3x cheaper vs V8. Full quality V8....

图像生成模型发布
关联讨论 2 条X:Midjourney (@midjourney)Midjourney:Updates(RSS)
08:11
Orange AI@oran_ge
精选76
在写完这篇文章后 我把配图过程蒸馏成了一个「橙线插画」Skill 免费开源 安装地址: https://github.com/orange2ai/orange-line-illustration 【引用 @oran_ge】:http://x.com/i/article/2064857003743391744

Orange AI: http://x.com/i/article/2064857003743391744

图像生成开源生态教程/实践

推荐理由:橘子把自己写文章时的插画流程封装成了免费Skill,一次安装,以后配图风格统一还不用动脑子,做内容的人值得收藏。
00:34
AYi@AYi_AInotes
43
天哪,AGI到来之后,品味和审美一定是一个人最核心的竞争力和最强的护城河, Claude Fable 5遇到审美和品味高的,输出质量高到爆炸,这效果真的绝了😭

ハヤシモン|AI × 個人開発: Claude Fable 5でどこまで表現できるのか、あえて難しいお題を投げてみた。 インクが流体みたいに溶け合う演出。 これは厳しいかなと思って限界を見にいったんだけど、普通に形になってしまった。 デザイン表現力もかなりすごい。 実際にこ...

Anthropic图像生成多模态大佬观点
6月10日
23:41
ChatGPT@ChatGPTapp
精选69
Go #MessiMode 上传一张你的照片并尝试这个提示词:"将我的头发变成本国国旗的颜色,但要看起来自然。如果没有提供国家或图片,请询问。"
OpenAI图像生成教程/实践

推荐理由:一个官方给出的趣味 prompt,让你把头发染成国旗色,虽然不是什么大更新,但胜在简单好玩,普通人也能立刻上手玩一下。
21:34
AYi@AYi_AInotes
68
10万粉小红书AIGC博主爆款拆解:封面靠画面、选题萌宠拟人化、5/7为品牌合作

一位10万粉小红书AIGC博主,不带货、不卖课、不引流私域。拆解7篇赞≥5000爆款:封面5篇零文字靠画面,唯二带大字的为品牌广;7篇中5篇品牌合作(兰蔻、李锦记、华为、脉动),产品嵌入“猫咪meme”“穿进古画当厨子”剧情;选题萌宠拟人化,一条AI跳舞猫获7.9万赞、4.2万藏;标题用强动词如“闯进/穿进/征服”+疑问感叹;开头直说用户心里话或具体场景;全部视频、0图文。详细提示词见原文。

AYi: http://x.com/i/article/2064536412670562304

图像生成教程/实践视频
18:33
AYi@AYi_AInotes
59
10万粉AIGC博主变现揭秘

一个10万粉小红书AIGC博主,不带货、不卖课,80%收入来自蒲公英品牌广告(李锦记、兰蔻、华为、宝格丽均投过),单条推广报价8000-2万。隐藏变现是将账号作为活作品集,品牌看到AI制作的兰蔻级别效果后,绕过平台直接谈全案。一条7000赞爆款可将报价从2000拉至4000,并提升主动邀约率。AI碾平了门槛——一人一电脑能做出接近专业团队的内容,账号就是24小时在线简历。按行业估算,3万粉账号月入可达8000-2万。

AYi: http://x.com/i/article/2064536412670562304

图像生成现象/趋势
16:44
Deedy@deedydas
66
Claude Fable 实现像素级精准,是自 o3 以来 AI 模型质量最大飞跃

Claude Fable 在创建文档、幻灯片、表格、网站等方面实现了像素级精准,被认为是自 o3 以来 AI 模型质量的最大飞跃。其能力包括:完美复现 McKinsey 风格报告、近乎一致的 SpaceX S-1 IPO 草案、像素级还原宝可梦游戏、可控人形机器人 3D 设计、仅用 CSS 实现 Apple Liquid Glass UI、优胜美地 3D 世界渲染、网站设计升级以及精美的邮件营销模板。其中许多任务需要超过 2 小时的深度思考。

Anthropic图像生成多模态大佬观点
09:43
Deedy@deedydas
69
Claude Fable 5 展示惊人能力:迁移 Stripe 5000 万行代码、绘制 3D 图形、通关宝可梦、优化效果远超 GPT 5.5

Claude Fable 5 一天内迁移 Stripe 5000 万行代码库(人类需 2 个月);绘制逼真 3D 图形(波音 747、超 5000 个对象太空模拟、Minecraft 过山车、写实森林、纽约天际线、暴风云);一次性通关宝可梦火红版;优化实际交互网络求值器,效果比 GPT 5.5 好 10 倍。价格相近:输入 $10/M,输出 $50/M(Fable 5)vs $45/M(GPT 5.5),且比 GPT 5.5 Pro 便宜 6 倍。

Anthropic图像生成大佬观点推理
05:52
Artificial Analysis@ArtificialAnlys
67
HiDream O1-Image-1.5 在 Artificial Analysis 文生图排行榜中位列第三,超越 Google Nano Banana 2

HiDream 发布 O1-Image-1.5,在 Artificial Analysis 文生图排行榜中位列第三,超越 Google Nano Banana 2。该闭源模型可生成高达 2K 分辨率图像,基于自研 Unified Transformer(UiT)架构,将原始像素、文本和任务条件编码到统一 token 空间。质量仅次于 OpenAI,与 GPT Image 1.5 (high)、Nano Banana 2(Gemini 3.1 Flash Image Preview)及 Cosmos3-Super-Text2Image 相当。定价 $80/千张,现可通过 HiHarness 及 Vivago 平台使用。

图像生成模型发布评测/基准
01:08
Fei-Fei Li@drfeifei
精选78
创意和想象力无与伦比!非常感谢@theworldlabs能与@withloreco的优秀人才合作,将他们不可思议的想法转化为用户可以享受的互动体验!🤩

World Labs: We turned dreams into worlds. Then filled them with history's greatest minds. Not a video. A world, running directly in ...

产品更新图像生成多模态

推荐理由:World Labs把生成式空间智能做成了可走进的浏览器世界,不是看视频而是和历史伟人互动,技术想象力和产品落地都够惊艳,做虚拟世界和交互叙事的人值得直接点进去体验。
6月9日
22:21
🚨 AI News | TestingCatalog@testingcatalog
55
Maket 推出 Auto-Complete 功能,用户只需输入部分平面图(如粗略草图、几面墙或一个大致定位的卧室),系统即可自动生成剩余布局,同时保持已放置房间完全不变。用户可画出任意平面图形状并添加确定的房间,Maket 会在几分钟内返回一份完整且尺寸合理的平面图,实现从局部到整体的快速设计。

Maket: Draw any floor plan shape. Add the rooms youʼre sure about. Maket completes the floor plan without moving them. Start wi...

产品更新图像生成
04:50
Krea@krea_ai
58
AI 在建筑工作室--Krea 播客与 Nitsan Bartov 完整采访见下方 👇
图像生成现象/趋势
04:49
🚨 AI News | TestingCatalog@testingcatalog
55
iOS 27 Beta 中的一个新图片游乐场显示,其背后的图像模型来自 Google。 然而,在测试提示下,结果与 Nano Banana 和 Imagen 相比截然不同。 这个液态玻璃泡泡很酷 👀
Google产品更新图像生成
02:17
🚨 AI News | TestingCatalog@testingcatalog
69
WWDC 🔥:全新Apple Intelligence由Gemini驱动,对话式Siri AI,更新的图像编辑,以及众多苹果应用中的大量AI功能。 Siri AI将于今年晚些时候以测试版形式推出。初期,Siri AI将不会在欧盟上线。

🚨 AI News | TestingCatalog: Apple #WWDC26 has started 🍿

Google产品更新图像生成语音
02:15
-Zho-@ZHO_ZHO_ZHO
33
Siri AI + 空间智能生成 一顿智能后,这构图和效果还不如原图呢,这是来搞笑的???
图像生成多模态现象/趋势
00:08
Runway@runwayml
同事件精选79
一个视频,现在可以为每个信息流和格式制作。上传你现有的视频,选择你想要的宽高比,然后观看我们的编辑模型 Aleph 2.0,填充场景的其余部分,就像你从一开始就这样制作一样。 在我们的桌面 Web 应用上尝试,链接如下。
产品更新图像生成视频
同一事件,精选展示《Aleph 2.0 与 Edit Studio》
推荐理由:Runway 把视频重构图做成了上传即填充,Aleph 2.0 自动补全不同比例画面,对同时做横竖版内容的人太实用,省掉重新拍摄或手动裁剪的功夫。
6月8日
23:06
SenseTime@SenseTime_AI
56
商汤 SenseNova U1 实现文图交错生成

商汤 SenseTime 展示 SenseNova U1 的文图交错生成能力,通过定制香水逐步演示,证明模型不仅能识别图像,还能以图像为思考单元输出生动视觉内容。相关示例、Gallery、HuggingFace 模型、GitHub 代码及 Discord 社区链接已同步开放。

图像生成多模态教程/实践
18:44
🚨 AI News | TestingCatalog@testingcatalog
56
感谢 Ideogram 发送了这个 ❤️ Ideogram 4.0 是上周最大的发布之一!尤其对开源社区而言。 测试了一下 👀

Ideogram: Today we published a technical blog post about Ideogram 4.0 - our goal is to enable more innovation and creativity. It's...

图像生成开源生态模型发布
16:13
歸藏(guizang.ai)@op7418
53
藏师傅社交媒体卡片Skill重磅升级

藏师傅的社交媒体卡片 Skill 即将迎来重大升级,新增对小红书 Live Photo 的支持。该功能可帮助用户制作带文字排版的动态 Live Photo,使发布动态内容时仍能以图文形式呈现,无需制作完整视频。具体细节尚未公布,但用户可期待更便捷的社交媒体内容创作体验。

歸藏(guizang.ai): http://x.com/i/article/2059811469081141248

图像生成教程/实践
16:13
歸藏(guizang.ai)@op7418
55
藏师傅的社交媒体卡片 Skill 即将重磅升级,可制作小红书动态带文字排版的 Live Photo,方便以图文形式发布动态内容。随后实测发现公众号图文卡片同样支持 Live Photo,但需通过 iPhone 上传。

歸藏(guizang.ai): 藏师傅的社交媒体卡片 Skill,即将迎来一个非常重磅的升级。 可以帮大家解决小红书 Live Photo 的制作问题,同时会帮你制作动态的带文字排版的 Live Photo 这样你可以在发布一些必须的动态内容的时候,依然以图文的形式发布,...

图像生成教程/实践
13:34
Deedy@deedydas
70
AI电影《Hell Grind》制作分析:50万美元成本、14天完成,但质量平庸

95分钟AI电影《Hell Grind》由15人14天完成,成本50万美元(80%为算力)。相比中位数美国电影(约200人2年、1800万美元),实现660倍人时、50倍时间、36倍成本改善。影片从约100小时AI生成素材(使用字节跳动Seedance等模型)中按64:1比率剪辑。质量方面,角色一致性、摄像机角度和写实感基本解决,但剪辑过多、角色口音多变、AI合成声音明显,动作和编排生硬——整体平庸,主因是导演选择而非模型限制。作者认为这是AI电影最差、最慢、最贵的时刻,未来创作者将直接投放YouTube。

图像生成大佬观点视频
06:40
karminski-牙医@karminski3
58
Ideogram 4实测:9.3B开放权重原生2K

ideogram发布Ideogram 4文生图模型,开放权重,仅9.3B参数,支持原生2K分辨率生成。作者将其与通义Z-image-Turbo生成效果对比,认为两者风格相似。

图像生成开源生态评测/基准
6月7日
23:37
Chubby♨️@kimmonismus
64
OpenAI 的 ChatGPT "超级应用"改造可能在未来几周开始推出。 第一波可能不是一次大发布,而是分阶段重新设计,将用户推向 Codex、AI 智能体、图像生成和合作伙伴应用。 正如一位 OpenAI 员工告诉《金融时报》:"聊天已死",新目标是打造一个能在你的工作和个人生活中行动的单一 AI 助手。
智能体OpenAI产品更新图像生成
12:00
宝玉@dotey
精选76
对比一下 GPT-5.5 的设计效果和 Opus 4.8 的设计效果

宝玉对比了GPT-5.5与Opus 4.8的设计能力,认为Opus 4.8效果远优于GPT-5.5。他使用了基于Cursor浏览器和元素标注的baoyu-design Skill,该Skill通过npx skills add JimLiu/baoyu-design安装,可在本地运行:描述屏幕需求即可生成精良HTML,点击预览中任意元素即可发出修改指令。官方推荐搭配Opus 4.8以获得最佳效果。工具GitHub仓库:https://github.com/JimLiu/baoyu-design。

宝玉: Cursor's new browser + element annotation turns it into a design studio. Meet Cursor Design 🎨 - Claude Design, running ...

MCP/工具图像生成教程/实践
关联讨论 1 条X:宝玉 (@dotey)
推荐理由:宝玉这个 skill 把 Claude Design 拉到本地,一个 prompt 就能出图对比,GPT-5.5 和 Opus 4.8 的审美差距肉眼可见,做设计的可以直接套。
04:46
jason@jxnlco
18
LLM 能否一次性生成高斯溅射?
其他图像生成
03:17
fofr@fofrAI
53
从一张建筑图片开始,用提示词在Omni中生成投影映射。主推文:让建筑随音乐舞动。

fofr: Start with an image of a building and prompt for a projection mapping with Omni.

图像生成教程/实践视频
‹ 上一页
1…34567…18
下一页 ›