推主分享了 Claude Fable 5 总结的 AI 生图提示词“焚决”,含 8 条技法:用“成人+气质+材质”定人设;用服装剪裁与面料质感替代直白身体描述;用表情瞬间、镜头语言、光线强化质感;用背景虚化+前景留白突出主体;用克制性感而非夸张;用强负面词防止跑偏。附两个顶级美女提示词示例:香槟色吊带裙温婉小姐姐、黑色深V西装外套霸气御姐,并提醒需用干净住宅 IP 避免风控。
跟大家分享下绝版的Claude Fable 5总结的AI生图焚决,+2个顶级美女人像提示词,这篇至少值3000块! 昨晚睡前让Fable 5总结了AI生图之性感人像提示词最有效的写法: 1️⃣用"成人 + 气质 + 材质"来定人设,比如 2...
iOS 27 开发者测试版为 iPhone 带来首批原生 AI 照片编辑功能。相比谷歌 Pixel 手机的同类工具,新功能显得较为温和,但标志着 iPhone 原生照片应用在编辑能力上的转折点。苹果可能将在面向公众发布前继续调整这些功能。
Claude Fable 5 总结了 AI 生图性感人像提示词的八大技法:用“成人+气质+材质”定人设;用服装剪裁、面料质感替代直白身体描写;用表情瞬间制造吸引力;用镜头语言强化质感;用光线塑造皮肤与轮廓;用背景虚化+前景留白突出主体;用克制性感而非夸张;用强负面词防跑偏。还提供了世界杯狂野风与 NBA 总决赛老钱风两种示例,并强调需用干净住宅 IP 避免风控。
http://x.com/i/article/2065392505554677760
当前参考引导生成管线将高分辨率参考图像(HRRI)降采样至固定低分辨率,丢失细粒度细节,且生成步骤引入身份扭曲等伪影。现有精炼方法仍在低分辨率域操作,超分辨率方法则忽略生成管线伪影分布。论文提出RefGC-SR²任务,在后期处理阶段复用原始HRRI,同时恢复丢失细节、精炼伪影并提升分辨率。构建首个真实世界三元组数据生成管线,训练双面板条件生成器合成配对低质量锚点。提出频率感知扩散Transformer模型,从参考图像选择性注入精细细节并去除伪影。实验优于RefGCR与RefSR基线。
An ancient estate. Teenagers forced to devour the nightmares of the powerful. One defective recruit who drags the darkne...
用户分别测试了Claude Fable 5与gpt-image 2的组合以及Fable 5单模型。生图场景中,用户给了一张女友照片和一句话提示词(“看NBA总决赛,身材丰满,笑靥如花,背后是特朗普”),模型自动分析敏感词,将NBA改为NBC、移除特朗普,生成的人物一致性与光影效果惊艳。另一场景,用户直接对Fable 5说“做落地页,自由发挥”,模型自主搜索2026设计趋势、调整配色动效、藏了3个彩蛋,几分钟内输出完整可用的单文件HTML。模型展现出极强的自然语言理解和主动规划能力。
苦逼牛马眼馋了一天Claude Fable 5,终于在深夜下班回家才得以体验, 卧槽刚才直接被Fable 5干懵了🤯 我直接给它甩了一句话, 给你自己做个落地页,自由发挥, 要2026最新设计趋势,要动态,要彩蛋, 然后我去上厕所去了,几...
商汤推出SenseNova-U1-8B-MoT-Interleaved模型,专门用于交错文本与图像生成。核心升级包括:叙事连续性增强,支持多页连贯故事;角色一致性改进,人物身份与艺术风格保持稳定;视觉质量提升,文字渲染更清晰、布局更可靠、伪影减少。模型已在HuggingFace开放体验。
YouMind 1.0 正式版本发布。从 0.x 开始迭代,官方强调其代表“Create bolder”理念。用户 Berry Xia 发文祝贺,称 YouMind 是最懂生图、调优化 Agent 做得最好的工具,其之前的爆款图片多出自 YouMind,一路见证了该产品的成长。
YouMind 1.0 is officially here. The loudest story about creating is a heavy one. More discipline. More originality. More...
商汤科技开源日日新 SenseNova U1 系列新成员 U1-8B-MoT-Interleaved 图文交错增强版模型。该模型面向图文交错创作与生成场景强化,支持绘本、故事书、多页 PPT 等连续内容创作,解决了多轮生成后角色形象飘移、画风断裂、图文脱节等痛点。核心升级包括叙事一致性与角色连贯性提升、图文对应关系增强、视觉质量改善,以及新增多页 PPT 自动生成能力。模型已开源。
阿里云发布由 Qwen 和 Wan 模型生成的泰国主题 AI 视频,融合娜迦蛇雕、泰拳、冬阴功、大城府朝雾等泰国文化元素。视频旨在展示模型创意能力,并推广 Model Studio 平台,鼓励用户利用该平台将创意转化为现实。推文未提供模型版本号、参数规模、benchmark分数等具体数字。
一句话搞定公众号排版、封面生成、发布 我做了个技能组合,可以一句话搞定公众号排版、封面生成,和一键发送到公众号草稿箱,你只需点下发布即可。 已经开源了 有20种主题颜色可选 最重要的是它会自动分析你的内容,进行自动排版,不是Markdown...
MoVerse 能从单张窄视野图像生成可交互漫游的实时视频世界模型。它将世界构建与观察渲染分离:先用拓扑感知扩散将输入扩展为重力对齐的 360° 全景图,再通过全景几何感知残差预测将其提升为持久 3D Gaussian scaffold,最后由 Gaussian 条件视频渲染器沿用户指定相机轨迹输出逼真视频。渲染器采用双向扩散教师蒸馏为因果自回归学生,实现有限延迟流式输出。在单个 NVIDIA RTX 4090 GPU 上支持 8 FPS 的实时场景漫游。
Surflo将可变数量的未定位RGB视图压缩成K个潜在token(全局状态),通过流匹配独立地将噪声点传输到曲面,解码出定向3D表面点。输出不受固定网格或token预算限制:同一潜在状态可在单次前向传播中生成数千到百万个点。推理时通过ODE积分注入光度梯度,关联邻近点以抑制局部不一致。在表面指标上匹配或超越前馈基线,比需数百视图的优化方法快一个数量级,是唯一结合全局潜在与任意分辨率解码的前馈方法。
InterleaveThinker 提出多智能体管线,通过规划智能体组织图像-文本输入序列、批评智能体评估生成结果并修正指令,使任意现有图像生成器具备交错生成能力。构建 Interleave-Planner-SFT-80k 和 Interleave-Critic-SFT-112k 数据集进行冷启动,并利用 GRPO 在 Interleave-Critic-RL-13k 上强化批评智能体的逐步指令修正。提出 accuracy reward 和 step-wise reward,使单步强化学习有效引导整个生成轨迹。在交错生成基准上性能与 Nano Banana 和 GPT-5 相当;在 4-step FLUX.2-klein 推理基准上,WISE 和 RISE 指标显著提升。
苹果在 iOS 27 中为图乐园新增壁纸自定义功能。用户可通过“设置→壁纸→添加新壁纸”或锁屏界面长按进入壁纸画廊,点击顶栏图乐园入口,用文字描述图像内容、选择风格或基于现有照片/人物生成壁纸。系统还会基于相册照片自动推荐风格化壁纸,所有AI生成壁纸均显示Image Playground图标。生成图像自动匹配iPhone 17等机型屏幕尺寸,无需手动裁剪。该功能于6月11日发布的博文中披露。
RepFusion复用多模态大语言模型(MLLM)作为噪声表示编码器,将其输出作为扩散Transformer的条件信号,用于文本到图像生成的去噪过程。在类似推理预算的对比中,RepFusion优于将同等容量分配给从头初始化的去噪器的基线。实验表明,MLLM为降噪视觉表示提供强先验,通过条件于演化的噪声表示,可以在现代T2I系统中有效利用测试时的重复MLLM计算。
Ideogram 4.0 是 Ideogram 首个开源权重模型,生成 2K×2K 输出,支持多语言文本渲染、边界框布局控制和透明背景。采用结构化 JSON 提示,提示增强器仅限 Ideogram 专有 API。在 Artificial Analysis 开放权重排行榜排名第8,整体第31,领先 Seedream 3.0 等闭源模型。API 三档:Turbo $30/千张、Default $60/千张、Quality $100/千张。开源权重免费用于评估和非商业用途,商业自部署需单独许可。
UPLOAD YOUR OWN FLOOR PLAN TO MAKET HAVE IT RECOGNIZED AND EDITABLE IN MINUTES One of the most requested features weʼve ...
阿里云发布AI生成视频,由通义千问(Qwen)和万相(Wan)模型共同创作。视频以阿联酋为主题,融合沙漠、阿拉伯书法、传统待客之道与迪拜现代天际线等元素,从古代天文智慧到未来科技,展现文化遗产与创新的平衡。官方推荐使用Model Studio平台调用模型进行创作。
V8.1 is live! Our iconic aesthetics are back w native 2K HD rendering - 3x faster and 3x cheaper vs V8. Full quality V8....
关联讨论 2 条X:Midjourney (@midjourney)Midjourney:Updates(RSS)Midjourney 已将默认模型从 V7 升级为 V8.1。V8.1 在智能性、连贯性、对详细提示的遵循度以及文本渲染效果上均有提升,HD 模式也已支持。
关联讨论 2 条X:Midjourney (@midjourney)Midjourney:Updates(RSS)http://x.com/i/article/2064857003743391744
HiLo-Token提出输入自适应高低频token压缩框架,解决扩散Transformer(DiT)在图像编辑中的延迟瓶颈——即使从50步蒸馏至8步,DiT仍占73%延迟。方法在用户掩码编辑区域内保留所有token维持局部关联性;外部区域基于空间频率选取高频token捕捉细节,并用16倍下采样图像的低频token保持全局结构。在生产级评估数据上,针对平均掩码比6.38%、15.92%、35.36%的小/中/大掩码编辑任务,在A100-80GB上分别实现3.13倍、2.59倍、1.67倍DiT加速,且生成质量无退化。
Claude Fable 5でどこまで表現できるのか、あえて難しいお題を投げてみた。 インクが流体みたいに溶け合う演出。 これは厳しいかなと思って限界を見にいったんだけど、普通に形になってしまった。 デザイン表現力もかなりすごい。 実際にこ...
一位10万粉小红书AIGC博主,不带货、不卖课、不引流私域。拆解7篇赞≥5000爆款:封面5篇零文字靠画面,唯二带大字的为品牌广;7篇中5篇品牌合作(兰蔻、李锦记、华为、脉动),产品嵌入“猫咪meme”“穿进古画当厨子”剧情;选题萌宠拟人化,一条AI跳舞猫获7.9万赞、4.2万藏;标题用强动词如“闯进/穿进/征服”+疑问感叹;开头直说用户心里话或具体场景;全部视频、0图文。详细提示词见原文。
http://x.com/i/article/2064536412670562304
一个10万粉小红书AIGC博主,不带货、不卖课,80%收入来自蒲公英品牌广告(李锦记、兰蔻、华为、宝格丽均投过),单条推广报价8000-2万。隐藏变现是将账号作为活作品集,品牌看到AI制作的兰蔻级别效果后,绕过平台直接谈全案。一条7000赞爆款可将报价从2000拉至4000,并提升主动邀约率。AI碾平了门槛——一人一电脑能做出接近专业团队的内容,账号就是24小时在线简历。按行业估算,3万粉账号月入可达8000-2万。
http://x.com/i/article/2064536412670562304