一位10万粉小红书AIGC博主,不带货、不卖课、不引流私域。拆解7篇赞≥5000爆款:封面5篇零文字靠画面,唯二带大字的为品牌广;7篇中5篇品牌合作(兰蔻、李锦记、华为、脉动),产品嵌入“猫咪meme”“穿进古画当厨子”剧情;选题萌宠拟人化,一条AI跳舞猫获7.9万赞、4.2万藏;标题用强动词如“闯进/穿进/征服”+疑问感叹;开头直说用户心里话或具体场景;全部视频、0图文。详细提示词见原文。
http://x.com/i/article/2064536412670562304
一位10万粉小红书AIGC博主,不带货、不卖课、不引流私域。拆解7篇赞≥5000爆款:封面5篇零文字靠画面,唯二带大字的为品牌广;7篇中5篇品牌合作(兰蔻、李锦记、华为、脉动),产品嵌入“猫咪meme”“穿进古画当厨子”剧情;选题萌宠拟人化,一条AI跳舞猫获7.9万赞、4.2万藏;标题用强动词如“闯进/穿进/征服”+疑问感叹;开头直说用户心里话或具体场景;全部视频、0图文。详细提示词见原文。
http://x.com/i/article/2064536412670562304
一个10万粉小红书AIGC博主,不带货、不卖课,80%收入来自蒲公英品牌广告(李锦记、兰蔻、华为、宝格丽均投过),单条推广报价8000-2万。隐藏变现是将账号作为活作品集,品牌看到AI制作的兰蔻级别效果后,绕过平台直接谈全案。一条7000赞爆款可将报价从2000拉至4000,并提升主动邀约率。AI碾平了门槛——一人一电脑能做出接近专业团队的内容,账号就是24小时在线简历。按行业估算,3万粉账号月入可达8000-2万。
http://x.com/i/article/2064536412670562304
Claude Fable 在创建文档、幻灯片、表格、网站等方面实现了像素级精准,被认为是自 o3 以来 AI 模型质量的最大飞跃。其能力包括:完美复现 McKinsey 风格报告、近乎一致的 SpaceX S-1 IPO 草案、像素级还原宝可梦游戏、可控人形机器人 3D 设计、仅用 CSS 实现 Apple Liquid Glass UI、优胜美地 3D 世界渲染、网站设计升级以及精美的邮件营销模板。其中许多任务需要超过 2 小时的深度思考。
微信6月8日发布开发者接入微信AI生态指引,开放平台支持开发者授权接入。美图秀秀作为首批内测开发者完成初步适配,将围绕人像美容、拼图、证件照、智能消除、画质修复等核心场景接入微信AI Agent。京东、美团、滴滴、携程、同程、肯德基等也同步宣布作为首批内测团队接入微信AI生态。
针对流匹配模型中在线强化学习比率裁剪策略约束不当的问题,Flow-DPPO 提出用散度近端约束替代。关键洞察是流模型每步策略为高斯分布,可精确计算新旧策略间的 KL 散度。Flow-DPPO 采用非对称散度掩码,仅在梯度更新偏离信任区域且超阈值时阻止更新。实验表明,Flow-DPPO 获得更高奖励,KL 近端效率更优,缓解了灾难性遗忘,促进多目标均衡,并能在比率裁剪失效时支持稳定的多轮训练。代码已开源。
苹果在 iOS 27 系统中升级了基于 Apple Intelligence 的修图功能 Clean Up,重点修复了 iOS 26 版本中擦除背景后导致的人脸补全失真、画面扭曲问题。新版在人脸变形、画面边缘和肤色过渡方面表现更自然,成片更统一。X 用户 Alvin 反馈,调用苹果云端 AI 模型并选择“自动”或“高质量”模式可获得最佳效果。
SCAIL-2 提出绕过姿态骨架等中间表示的端到端角色动画框架,通过直接拼接驱动视频获取全部视觉信息。为解决端到端数据匮乏,用解耦条件统一子任务,构建异构运动迁移数据集 MotionPair-60K。采用上下文掩码条件与模式特定 RoPE 作为软引导,并引入 Bias-Aware DPO 构建偏好对以缓解合成数据在细节区域的误差。实验表明,该方法在多个任务中显著优于现有 SOTA。部分合成数据与模型权重将开源。
ARM是一种基于离散表示的自回归模型,将图像理解、生成与编辑统一在下一个token预测框架中。首先训练离散语义视觉tokenizer,通过多目标监督实现语义判别、语言对齐与忠实重建;然后在文本与图像token序列上训练7B自回归模型,自然融合视觉语言感知与生成能力;最后用强化学习优化文本到图像生成与指令引导编辑的偏好对齐,使WISE整体得分从0.50提升至0.56,GEdit-Bench-EN的G_O评分从5.75提升至6.68,并观察到跨任务协同效果。
Claude Fable 5 一天内迁移 Stripe 5000 万行代码库(人类需 2 个月);绘制逼真 3D 图形(波音 747、超 5000 个对象太空模拟、Minecraft 过山车、写实森林、纽约天际线、暴风云);一次性通关宝可梦火红版;优化实际交互网络求值器,效果比 GPT 5.5 好 10 倍。价格相近:输入 $10/M,输出 $50/M(Fable 5)vs $45/M(GPT 5.5),且比 GPT 5.5 Pro 便宜 6 倍。
多模态图像融合现有方法基于2D特征网格,局部建模强但全局外观控制有限。本文引入紧凑1D token接口,基于冻结预训练图像tokenizer作为全局载体,同时保留2D空间路径恢复局部结构。提出选择性token编辑(STE),稀疏更新或替换关键token,在不改变融合主干、不引入额外损失下引导全局一致性。在四个基准上取得最佳整体性能,全局一致性和局部保真度均提升。
Z-Image Turbo++是从8步教师模型Z-Image Turbo蒸馏得到的2步图像生成模型。针对两步生成中任务难度提升和模型容量有限的瓶颈,提出三项设计:分布对齐对抗学习(以教师生成图像而非真实图像作为GAN训练的真样本)、步骤分离参数化(两个去噪步独立参数)、以及带迭代正则化的端到端训练(第一步接收最终图像质量梯度并保留有意义的中间生成)。这些策略显著缩小了2步与8步生成的质量差距。
HiDream 发布 O1-Image-1.5,在 Artificial Analysis 文生图排行榜中位列第三,超越 Google Nano Banana 2。该闭源模型可生成高达 2K 分辨率图像,基于自研 Unified Transformer(UiT)架构,将原始像素、文本和任务条件编码到统一 token 空间。质量仅次于 OpenAI,与 GPT Image 1.5 (high)、Nano Banana 2(Gemini 3.1 Flash Image Preview)及 Cosmos3-Super-Text2Image 相当。定价 $80/千张,现可通过 HiHarness 及 Vivago 平台使用。
We turned dreams into worlds. Then filled them with history's greatest minds. Not a video. A world, running directly in ...
Apple在WWDC 2026宣布推出多项AI照片编辑工具,用户可轻松操控图像,但Apple仍将这些图像称为“照片”。两年前,Apple在“照片”应用中推出AI物体移除工具Clean Up(类似Google Photos的Magic Eraser),当时软件主管Craig Federighi表示公司重视避免扭曲真实感知。如今Apple不再坚持照片必须准确还原现实。
针对文本到图像Flow Matching模型与人类偏好对齐时,完整采样轨迹无法存储及跨步雅可比积导致梯度膨胀的问题,FlowBP提出统一代理轨迹框架,将反向轨迹本身作为设计对象。该框架分离奖励模型输入、活跃集、积分权重和桥耦合四个选择,并实例化三个变体:FlowBP-Sparse(稀疏Euler重建)、FlowBP-Bridge(受控桥耦合)和FlowBP-Lagrange(高阶跳跃求积)。三者通过活跃集大小限制内存,梯度链至多含一个雅可比因子。在SD3.5-M、FLUX.1-dev和FLUX.2-Klein-base上,三个变体在偏好、质量和组合指标上均优于直接梯度基线。
苹果确认 iOS 27 系统中部分 Apple Intelligence 功能(包括图像生成)设有每日使用限制,因依赖云端模型。大多数 iCloud+ 订阅方案可解锁更高使用额度,并为兼容的家庭摄像头启用 Apple Intelligence 支持。目前最便宜的 0.99 美元(约 6.7 元人民币)iCloud+ 套餐可能无法提升额度。这表明苹果正将高级 AI 功能与付费体系绑定。
Draw any floor plan shape. Add the rooms youʼre sure about. Maket completes the floor plan without moving them. Start wi...
部分苹果 iPhone 国行机型在升级至 iOS 27 Developer Beta 1 后,新增 AI 壁纸扩图功能。用户可通过长按锁屏壁纸、选择新照片并捏合屏幕激活,选定主体后点击“扩展”,等待片刻即可获得 AI 扩充后的照片。
可灵AI与候鸟300联合发起AIGC影像大赛。线下大赛6月16-26日在阿那亚海边举办,评审包括李少红、陈明昊、焦雄屏等影视与AI专家及美院教授,设10万奖金+超200万灵感值,结果6月27日晚揭晓。线上大赛6月22日前投稿可角逐“最受关注大奖”,获奖者受邀参加6月27日颁奖。参赛要求:视频≥50%由可灵AI生成,官网投稿填表并带话题分享。
亚马逊昨天推出 AI 定制商品功能,用户可通过 Alexa 使用自然语言提示词创建全新商品设计,将创意转化为图案并应用在服装、水杯等产品上。下单后由 Merch on Demand 生产,并通过 Prime 物流交付。该功能适合制作家庭聚会纪念 T 恤、宠物水杯等独一无二的定制商品,挑战 Redbubble、Bonfire 等在线周边平台,有望使 AI 设计商品成为普通消费者的日常购物选项。
基于预训练视觉基础模型(VFM)的表示自编码器(RAE)在图像生成中构建语义丰富的潜空间,但重建质量受限于深层特征丢失细节。IDEAL框架通过联合对齐量化token与浅层和深层VFM特征,使离散视觉token同时保留视觉保真度和丰富语义。在ImageNet上,IDEAL达到0.61 rFID,比之前最优方法提升0.28;用于自回归图像生成时取得1.89 gFID,创下新SOTA。
i1 是一个 3B 参数的文本到图像扩散模型,仅使用公开数据集训练。在 GenEval、DPG、PRISM、CVTG-2K 和 LongText 五个基准上,i1 性能与领先模型相当,平均比最佳现有完全开源模型高 29.5 个百分点。研究基于 300 余项控制实验(超 700K TPU v6e 小时),发现等权重混合 curated 数据集是强默认配置、更大文本编码器适配器以极少参数提升性能。i1 的检查点、训练与推理代码及数据处理流程已全部开源。
苹果今日正式公布 iOS 27 系统更新,其中 Genmoji 自定义表情功能经过全新改造。用户可根据描述创建表情符号,或从现有表情、照片中改造。新增“描述变更”界面,用于微调已创建的表情包,可迭代设计并修改颜色、物体等元素。Genmoji 输出更稳定,默认 3D 卡通风格,并支持切换其他风格。生成时间缩短,系统负担和电量消耗也更少。
在2026年全球开发者大会上,苹果为iOS 27的图乐园加入原生写实图像生成功能,用户输入文字提示即可直接生成接近照片风格的AI图片,不再需要像iOS 26那样借助ChatGPT。动画、插画、素描等原有风格仍可使用。科技媒体Appleinsider指出,新增的写实功能使图乐园更适合演示文稿、邀请函、模型草图和壁纸等场景,将生成内容从趣味表达扩展至日常创作与轻量生产。
在 2026 年 WWDC 上,苹果为 iOS 27 带来三项 AI 修图功能:空间重塑(Spatial Reframing)可围绕拍摄对象旋转图像,并生成新内容填补视角变化造成的空白;扩展(Extend)能在不裁剪关键内容的前提下拉直地平线或调整宽高比,自动填充缺失部分;升级后的 Clean Up 能以更高质量和更逼真的填充效果移除干扰元素。
Apple 发布下一代 Apple Intelligence,将 AI 能力集成到 iPhone、iPad 和 Mac 中,带来更个性化和有帮助的日常体验。
同一事件,精选展示《受 DMA 影响,Siri AI 在欧盟将随 iOS 27 和 iPadOS 27 延迟上线》Apple为Safari、Shortcuts和Password应用添加了AI驱动的新功能,让iPhone能够自动补全句子、完善照片和简化工作流程。
苹果的 AI 图像生成器 Image Playground 正在进行改版,旨在提升其市场竞争力。此次改版有望使该工具在 AI 图像生成领域更具竞争力。
苹果在 WWDC26 中为照片 App 引入“空间构图”技术,该功能源自 Vision Pro,利用设备端空间模型和专用云计算空间模型将照片变为“3D 空间场景”,用户后期可自由放大、移动照片视角位置,支持所有照片包括相机拍摄的。此外还升级了扩图和背景杂物移除功能,并改进图乐园,新增支持生成写实风格图片。
Apple #WWDC26 has started 🍿
微软研究院推出Lens,一个仅3.8B参数的文本到图像模型。依靠由GPT-4.1生成的8亿条详细图像标题,而非模糊的网页替代文本,Lens在基准测试上匹配了规模更大的竞品,训练成本仅一小部分。代码和权重以开源许可证公开可用。
亚马逊扩展按需印刷功能,借助Alexa for Shopping,用户通过文本提示生成图像,印制在T恤、水瓶、连帽衫等空白商品上。设计可分享链接供他人购买。该服务适用于家庭团聚、宠物主题等场景,同时也对代发货产品生态及定制印刷公司构成潜在威胁。
Amazon Shopping应用新增AI功能,用户通过Alexa生成设计图案,并可将图案打印在T恤、连帽衫和随行杯等商品上,实现个性化定制。
商汤 SenseTime 展示 SenseNova U1 的文图交错生成能力,通过定制香水逐步演示,证明模型不仅能识别图像,还能以图像为思考单元输出生动视觉内容。相关示例、Gallery、HuggingFace 模型、GitHub 代码及 Discord 社区链接已同步开放。
公安部网安局6月8日公布10起涉高考网络谣言典型案例。其中,广东潮州网民沈某宏使用AI工具生成“坐在高考考场并用手机拍摄”的虚假图片并发布;河南驻马店网民吴某帅使用AI工具生成虚假“语文试卷”图片发布。其余8起案例涉及网民编造高考答案信息、谎称有答案或试题出售、散布“高考死人”谣言等。所有涉事者均已被公安机关依法行政处罚。