Training image models requires a surprising amount of Tinkering: prototyping reward models, training a prompt expander, ...
Training image models requires a surprising amount of Tinkering: prototyping reward models, training a prompt expander, ...
I watched the Midjourney scanner get built from my desk; here's a look behind the scenes
传闻中的顶级模型Claude Fable 5在ZenMux平台回归上线并限时免费,官方价格高达50美元/百万token,ZenMux上则零成本使用且无RPM限制。用户分享了一套利用Fable 5生成高质量人像提示词的方法论:先分析AI人像塑料感根源,再搭建涵盖主体人设、服装材质、表情瞬间等8个维度的框架,最后输出示例并自我修正。此外,ZenMux还免费提供Claude Sonnet 5和Gemini Nano banana 2 lite,支持同屏对比Fable 5、GPT-5.5、Opus 4.8等200+模型,自动充值每笔返20%余额(最高300美元赠金)。
Claude Fable 5今天回归上线啦,ZenMux上限时免费使用真的太香了! 怎么用Fable 5输出高质量的「不会塑料 + 顶级人像提示词方法论以及户外美女人像prompt方法论大家收好! 说真的,我以为上次的Fable 5总结的A...
BREAKING: Gemini 3.1 Flash Lite Image (Nano Banana 2 Lite) by @GoogleDeepMind is 7th on Image Arena with an Elo of 1271....
可灵Kling AI官方宣布,由其生成的广告片《Lorem Ipsum》荣获戛纳狮子奖(Cannes Lions)电影类B2B铜奖。该片由阿根廷工作室Purga Films制作,片中所有角色均使用无意义的占位词“Lorem Ipsum”对话,但情感表达依然强烈。全片通过Kling AI生成,涵盖多种风格和世界,展现了可灵在表演一致性、情感深度和电影级控制上的能力。
Claude Fable 5 在 ZenMux 平台回归上线,提供免费端点 claude-fable-5-free,账户有余额即可使用,无 RPM 限制,免去官方高价。博主分享用 Fable 5 生成高质量人像提示词的方法论:先拆解 AI 人像塑料感根源,再搭建覆盖主体人设、服装材质、表情瞬间等 8 维度的框架,最后输出示例并自我修正。三个关键技巧:赋予顶级专业人士身份、必须分析塑料感根源、利用 Fable 自检能力。ZenMux 另支持同屏 PK 模型、自动充值返 20% 余额等福利。
跟大家分享下绝版的Claude Fable 5总结的AI生图焚决,+2个顶级美女人像提示词,这篇至少值3000块! 昨晚睡前让Fable 5总结了AI生图之性感人像提示词最有效的写法: 1️⃣用"成人 + 气质 + 材质"来定人设,比如 2...
歸藏的guizang-social-card-skill新增Live Photo能力,支持单视频动态卡片、拼图式(二/三/四宫格)、三连Live Photo及长视频筛选。核心细节:第一帧可作为静态图发布;小红书5秒/公众号3秒时长区分;发布需将JPG+MOV打包为.pvt并通过AirDrop传到iPhone。建议先粗剪视频每段10秒左右,让AI判断适合做Live Photo的片段。安装或更新后即可使用。
Seedance 2.0 通过详细 prompt 生成一段超真实视频,以 2000 年代初 DV 摄像机美学展示韩国女性日常:手持抖动、自动对焦搜索、曝光波动、运动模糊等不完美感,配合环境自然音(鸟鸣、风声、社区闲聊),实现家庭录像般的独特说服力。
Reve 2.0 文生图模型发布,在 Artificial Analysis 文生图排行榜上位列第二,仅次于 OpenAI 的 GPT Image 2。该模型将原始文本提示转换为结构化布局提示,生成原生 4K 图像,支持对布局中单个元素进行移动、编辑、替换和重新渲染,同时保留其他元素不变。目前可通过 Reve 应用使用,API 平台即将上线。
ModelScope 上开源了 Boogu-Image-0.1-Edit-Turbo,一个 4 步蒸馏的 image-to-image 编辑模型,主打快速视觉编辑。支持物体替换、风格迁移、场景/背景修改,以及带文字感知的图像变换。
Nano Banana 2 Lite: > a photo of an arabian cobra, but the head is replaced with a stapler, seamless, perfect animal-obj...
Google推出超快图像模型Nano Banana 2 Lite(4秒出图)与多模态模型Gemini Omni Flash(支持视频生成与对话式编辑)。两者结合可先快速生成图像再转为动画,大幅降低成本。演示中室内设计照片可快速生成多个方案并动画化,将创意工作流从等待变为快速迭代。
Google推出快速图像模型Nano Banana 2 Lite(4秒生成,$0.034/1K分辨率图像)以及视频编辑模型Gemini Omni Flash(输出10秒片段,$0.10/秒,支持文本/图像/视频输入和对话式剪辑)。两者可链式使用:Nano生成参考图,Omni将其动画化,逐步替代gemini-2.5-flash-image。当前Omni Flash API不支持音频参考,视频参考最多3秒但未正确生效;Interactions API保留会话上下文,支持连续3次编辑。
Introducing Nano Banana 2 Lite 🍌 and Gemini Omni Flash 🔮, our new generative media models in the Gemini API and AI Stu...
Omni Flash is a smart model. The way the hand is wet, the water ripples, the refraction, the shadows, the sound effects ...
Introducing Nano Banana 2 Lite 🍌 and Gemini Omni Flash 🔮, our new generative media models in the Gemini API and AI Stu...
Introducing Nano Banana 2 Lite 🍌 and Gemini Omni Flash 🔮, our new generative media models in the Gemini API and AI Stu...
Google AI 推出两大模型更新:1)Nano Banana 2 Lite——最快、最经济的 Gemini 图像模型,文本生成图像不到 4 秒,已上线 Gemini API 和 AI Studio,即将登陆 NotebookLM、Google 搜索、Google Photos 等;2)Gemini Omni Flash 进入公开预览——原生多模态模型,支持低成本视频生成与对话式编辑,可通过 Gemini API、AI Studio 及 Gemini Enterprise Agent Platform 集成。两模型结合可快速实现空间设计重绘:上传照片、滑动选择设计方案,Omni 将细节以电影级动画呈现。演示应用已在 AI Studio 上架。
关联讨论 2 条X:Logan Kilpatrick (@OfficialLoganK)Google DeepMind:Blog(RSS)We're shipping 2 major releases: 🔘 Nano Banana 2 Lite: our fastest and cheapest Gemini Image model 🔘 Gemini Omni Flash...
GOOGLE 🔥: A new Nano Banana 2 Lite image generation model is on the horizon! > "Introducing Nano Banana 2 Lite for ultr...
GOOGLE 🔥: A new Nano Banana 2 Lite image generation model is on the horizon! > "Introducing Nano Banana 2 Lite for ultr...
⚡️🍌🔮
Personal Intelligence 🤝 Nano Banana 2 Personal Intelligence now gives Gemini an understanding of your preferences and i...
商汤推出 SenseNova-U1-8B-MoT-Infographic 模型,能够生成工作室级别的高密度信息图,此前这类工作流程缓慢且昂贵。YouTuber CAPITAL R 制作了演示视频,模型已在 HuggingFace 上线,GitHub 页面展示示例图片,并开放 Discord 社区。
嘿嘿,skill写好了,开源了朋友们! 实现原理: 把文章或架构内容先压缩成一份结构化 JSON spec,再由本地 Python + Pillow 渲染出黑底手绘风格的 PNG、GIF 和可编辑的 Excalidraw JSON。 开源地...
Webcamのリアルタイムの映像を画像をドラック&ドロップでその人になれるものを作ってみた。 モデルを読み直さなくても、さくさく動くように改変 おっさんが美少女になる日も近い
Our new cloud agent (live tomorrow) can make posters! Its so much nicer to see information in a styled page than plainte...