全部 AI 动态 · AI HOT

内容

精选全部 AI 动态 AI 日报主题收藏

接入

更多

关于更新日志反馈

内部员工登录

精选全部日报更多

内部员工登录

全部动态资讯 · 466 条

全部一手资讯 X 论文

标签「图像生成」清除

6月17日周三

08:00HuggingFace Daily Papers（社区热门论文）52Moebius：0.22B参数轻量级图像修复框架，性能媲美10B级模型

06:13Midjourney：Updates（RSS）66同事件精选Midjourney V8.1 推出 Draft mode 草稿模式与新功能预览同一事件，精选展示《Midjourney V8.1 已成为默认模型》

06:13Midjourney：Updates（RSS）35Midjourney 将于明天直播揭晓首个秘密硬件项目

6月16日周二

22:01IT之家（RSS）39华为 nova 15 系列手机获 HarmonyOS 6.1.0.125 SP10 升级，新增逆光人物图生成剪影效果功能

18:00IT之家（RSS）52《浪浪山小妖怪》将拍第二部，导演於水回应AI模仿风格担忧

11:27HuggingFace Daily Papers（社区热门论文）45BRDFusion：物理与生成融合的城市场景逆渲染框架

10:00IT之家（RSS）46AMD：RX 7000 显卡上基于 INT8 的 FSR 超分辨率 4.1 质量齐平 FP8 版本

07:59IT之家（RSS）61Adobe 升级 Creative Cloud 套件，Lightroom/Premiere/After Effects/Photoshop 加入 AI 功能

02:33TechCrunch：AI（RSS）71精选Meta 在 Facebook 上线"AI Mode"，基于平台公开信息合成答案

6月15日周一

08:00HuggingFace Daily Papers（社区热门论文）47TV-Edit：文本-视觉联合指导的图像编辑框架

6月13日周六

20:27The Verge：AI（RSS）60苹果新 AI 照片编辑工具大体可用，有利有弊

08:00HuggingFace Daily Papers（社区热门论文）34RefGC-SR2：参考引导生成内容超分辨率与精炼

6月12日周五

17:35IT之家（RSS）69商汤开源 SenseNova U1 图文交错生成增强版模型：支持多页连续创作，角色风格不"跑偏"

11:00HuggingFace Daily Papers（社区热门论文）65MoVerse：基于全景高斯支架的实时视频世界模型

11:00HuggingFace Daily Papers（社区热门论文）59Surflo：具有全局状态的一致3D曲面流模型

11:00HuggingFace Daily Papers（社区热门论文）63InterleaveThinker：强化智能体交错生成管线

08:34IT之家（RSS）46苹果 iOS 27 升级图乐园：AI 生成壁纸适配 iPhone 17 等机型

08:00HuggingFace Daily Papers（社区热门论文）53RepFusion：利用多模态先验在表示空间中降噪

6月11日周四

12:10Midjourney：Updates（RSS）64精选Midjourney V8.1 已成为默认模型

08:00HuggingFace Daily Papers（社区热门论文）48HiLo-Token：面向高效图像编辑的输入自适应高低频Token压缩框架

6月10日周三

15:28IT之家（RSS）59一句话 P 图发朋友圈？美图秀秀宣布首批接入微信 AI 生态

12:56HuggingFace Daily Papers（社区热门论文）73精选Flow-DPPO：面向流匹配模型的散度近端策略优化

11:28IT之家（RSS）48初探苹果 iOS 27 版 AI 擦除工具 Clean Up：减少人脸失真

10:56HuggingFace Daily Papers（社区热门论文）60SCAIL-2：端到端上下文条件控制的角色动画统一框架

10:56HuggingFace Daily Papers（社区热门论文）63ARM：统一离散表示的自回归大型多模态模型

08:00HuggingFace Daily Papers（社区热门论文）59从2D网格到1D token：改革多模态图像融合的共享表示

08:00HuggingFace Daily Papers（社区热门论文）65Z-Image Turbo++：通过教师对齐的端到端蒸馏实现高保真两步图像生成

00:43The Verge：AI（RSS）47苹果拥抱AI照片编辑的幻想

00:36HuggingFace Daily Papers（社区热门论文）47FlowBP：一种面向Flow Matching的奖励反向传播设计空间探索框架

6月9日周二

22:26IT之家（RSS）54苹果 iOS 27 系统部分 Apple Intelligence 功能设每日使用限额，iCloud+ 订阅可解锁更高额度

20:26IT之家（RSS）42苹果 iPhone 国行机型升级 iOS 27 后可使用 AI 壁纸扩图功能

19:30公众号：可灵AI（快手·视频）55可灵AI×候鸟300发起AI主义新浪潮AIGC影像大赛

15:26IT之家（RSS）48亚马逊推出 AI 定制商品功能，支持水杯、T 恤等

08:00HuggingFace Daily Papers（社区热门论文）57IDEAL：深度对齐使离散表示自编码器更优

08:00HuggingFace Daily Papers（社区热门论文）82精选i1：面向强文生图模型的简单且完全开源配方

06:21IT之家（RSS）58苹果 iOS 27 大改 Genmoji 自定义表情功能，可微调描述语言

04:21IT之家（RSS）57无需调用ChatGPT，苹果iOS 27版图乐园首次实现写实AI生图

03:21IT之家（RSS）58苹果 iOS 27 升级 AI 修图：调整照片构图、移除干扰元素等

03:14Apple：Newsroom（RSS）63同事件精选Apple Intelligence 将强大 AI 能力融入日常体验同一事件，精选展示《受 DMA 影响，Siri AI 在欧盟将随 iOS 27 和 iPadOS 27 延迟上线》

03:09TechCrunch：AI（RSS）73精选苹果刚刚教会你的iPhone补全句子、完善照片和简化工作流程

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

6月17日

08:00

HuggingFace Daily Papers（社区热门论文）

52

Moebius：0.22B参数轻量级图像修复框架，性能媲美10B级模型

Moebius是一个仅0.22B参数的轻量级图像修复框架。它通过引入Local-λ Mix Interaction（LλMI）块重构扩散主干，其中Local-λ和Interactive-λ模块将空间上下文与全局语义先验压缩为固定大小的线性矩阵，在削减参数的同时保留复杂潜在交互。配合仅在隐空间执行的自适应多粒度蒸馏策略，Moebius在自然图像和人像基准上达到了与11.9B参数模型FLUX.1-Fill-Dev相当甚至更优的生成质量，总推理速度提升超过15倍。

arXiv 图像生成论文/研究

06:13

Midjourney：Updates（RSS）

同事件精选66

Midjourney V8.1 推出 Draft mode 草稿模式与新功能预览

Midjourney V8.1 的 Draft mode 草稿模式每次生成24张低分辨率低质量图片。用户可对任意图片点击 "Vary"，将其渲染为全质量、全分辨率版本。草稿任务消耗的快速小时数减半。

产品更新图像生成

同一事件，精选展示《Midjourney V8.1 已成为默认模型》

推荐理由：这是我最近看到最实用的 Midjourney 更新，草稿模式半价生成 24 张低质量图，快速筛选后再渲染，直接降低试错成本。

06:13

Midjourney：Updates（RSS）

35

Midjourney 将于明天直播揭晓首个秘密硬件项目

Midjourney 将在明天（美国太平洋时间下午6点）通过 Discord 和 X 平台直播，首次公开其秘密硬件项目。该项目被描述为“雄心勃勃、物理尺寸巨大且出人意料”。具体细节尚未公布。

产品更新图像生成端侧

6月16日

22:01

IT之家（RSS）

39

华为 nova 15 系列手机获 HarmonyOS 6.1.0.125 SP10 升级，新增逆光人物图生成剪影效果功能

6 月 16 日，华为 nova 15 系列手机开启鸿蒙 HarmonyOS 6.1.0.125 SP10 版本升级，系统包约 2.85GB。本次更新后，图库 AI 沾色支持为逆光人物图一键生成剪影效果，在复刻色调的同时增强人物光影对比。此外优化了部分应用和第三方相机拍照体验，提升部分游戏流畅性，并合入 2026 年 6 月安全补丁。华为采取分批推送，未收到更新的用户需等待。

产品更新图像生成

18:00

IT之家（RSS）

52

《浪浪山小妖怪》将拍第二部，导演於水回应AI模仿风格担忧

6月16日，导演於水在上海国际电影节透露下一步工作计划是《浪浪山小妖怪2》。他坦言第一部故事已完整，第二部需在此基础上提升。谈及AI模仿其动画风格时，於水认为AI基于大模型无所不知，但人作为“小模型”因不完美才构成喜怒哀乐；艺术源于人类痛苦喜悦，大模型只能模拟概率而非真实情感，无法与观众产生共鸣。《浪浪山小妖怪》在2025年暑期档票房突破17.19亿元，成为中国影史二维动画票房冠军。

图像生成现象/趋势

11:27

HuggingFace Daily Papers（社区热门论文）

45

BRDFusion：物理与生成融合的城市场景逆渲染框架

BRDFusion是一个统一框架，结合物理建模和生成先验，用于从视频中恢复城市场景的显式、一致的场景属性，同时缓解优化歧义。在正向渲染中，物理模型提供基于场景配置的可控渲染，生成模型负责去噪和修复伪影，从而生成高质量视频并支持精确控制。该方法在真实和合成场景中均优于基线，并支持新视角重光照、夜间模拟以及动态物体插入/编辑。

图像生成多模态论文/研究

10:00

IT之家（RSS）

46

AMD：RX 7000 显卡上基于 INT8 的 FSR 超分辨率 4.1 质量齐平 FP8 版本

AMD 在 COMPUTEX 2026 上透露，FSR 4.1 模型基于 FP8 开发，但 RDNA 3 AI 加速器仅支持 INT8，因此将模型全面适配 INT8，且画质与 FP8 一致。RX 7000 系列今年 7 月可用 FSR 4.1，而 RX 6000 系列因 RDNA 2 无专用 AI 加速器，需优化着色器周期，预计明年初上线。开发流程采用 Instinct MI 训练、Radeon PRO 优化，并在数十万 PC 配置中测试，依托 ROCm 平台完成模型迁移。

图像生成行业动态

07:59

IT之家（RSS）

61

Adobe 升级 Creative Cloud 套件，Lightroom/Premiere/After Effects/Photoshop 加入 AI 功能

Adobe 于 6 月 15 日升级 Creative Cloud 套件。Lightroom 新增辅助筛选（按“睁眼”“眼部清晰度”过滤）、照片转视频功能，以及基于 Topaz Labs 模型的 AI 锐化，已支持索尼 Alpha 7R VI 的 RAW 格式。Premiere 引入全局音频静音、标记搜索、Single Word 编辑、3D Spinback 和 Slide 转场及纹理效果。After Effects 新增 AI 对象蒙版，支持 SVG 导入为形状图层，优化与 Illustrator 的复制粘贴。Photoshop 加入设备端 AI 移除工具和反光去除工具。

产品更新图像生成

02:33

TechCrunch：AI（RSS）

精选71

Meta 在 Facebook 上线"AI Mode"，基于平台公开信息合成答案

Meta 宣布在 Facebook 推出“AI Mode”搜索功能，利用 Meta AI 从公开帖子（含群组和 Reels）提取信息并合成答案，用户可用自然语言提问获得摘要。同时新增视频拼贴剪辑、过渡效果及 AI 照片预设（可更换服装、发型和配饰），体育迷可在 Stories 中点击“AI Edit”虚拟穿上队服。这些更新延续了此前动态头像、Marketplace 自动回复和创作者 AI 助手的部署节奏。此外，Meta 近期启动了 Facebook、Instagram 和 WhatsApp 的全球订阅计划（每月 3.99 美元起），更多 AI 订阅层级正在规划中。

Meta 产品更新图像生成搜索

推荐理由：Facebook 的 AI 模式把社交搜索变成问答，想法不新但执行够快，对普通用户吸引力大，只是答案来自群聊，可靠性是个坑。配套的 AI 照片编辑也让玩梗更方便，Meta 在拼命给 Facebook 塞 AI 留住用户。

6月15日

08:00

HuggingFace Daily Papers（社区热门论文）

47

TV-Edit：文本-视觉联合指导的图像编辑框架

TV-Edit 联合文本与视觉指令，以文本作为语义意图、稀疏视觉指令（拖拽/点）作为空间指导，实现精确且忠实于意图的图像编辑。构建超23K文本-视觉指令配对数据集，将视觉指令与图像-文本语义融合为语义感知控制表征，输入预训练编辑骨干。相比纯文本或纯拖拽方法，空间控制更精确、指令歧义更少、结构一致性更强。TV-Edit-Bench 从语义忠实度、空间对齐和视觉一致性评估，TV-Edit 在多编辑骨干上一致优于 SOTA 基线。

图像生成多模态论文/研究

6月13日

20:27

The Verge：AI（RSS）

60

苹果新 AI 照片编辑工具大体可用，有利有弊

iOS 27 开发者测试版为 iPhone 带来首批原生 AI 照片编辑功能。相比谷歌 Pixel 手机的同类工具，新功能显得较为温和，但标志着 iPhone 原生照片应用在编辑能力上的转折点。苹果可能将在面向公众发布前继续调整这些功能。

图像生成评测/基准

08:00

HuggingFace Daily Papers（社区热门论文）

34

RefGC-SR2：参考引导生成内容超分辨率与精炼

当前参考引导生成管线将高分辨率参考图像（HRRI）降采样至固定低分辨率，丢失细粒度细节，且生成步骤引入身份扭曲等伪影。现有精炼方法仍在低分辨率域操作，超分辨率方法则忽略生成管线伪影分布。论文提出RefGC-SR²任务，在后期处理阶段复用原始HRRI，同时恢复丢失细节、精炼伪影并提升分辨率。构建首个真实世界三元组数据生成管线，训练双面板条件生成器合成配对低质量锚点。提出频率感知扩散Transformer模型，从参考图像选择性注入精细细节并去除伪影。实验优于RefGCR与RefSR基线。

图像生成论文/研究

6月12日

17:35

IT之家（RSS）

69

商汤开源 SenseNova U1 图文交错生成增强版模型：支持多页连续创作，角色风格不"跑偏"

商汤科技开源日日新 SenseNova U1 系列新成员 U1-8B-MoT-Interleaved 图文交错增强版模型。该模型面向图文交错创作与生成场景强化，支持绘本、故事书、多页 PPT 等连续内容创作，解决了多轮生成后角色形象飘移、画风断裂、图文脱节等痛点。核心升级包括叙事一致性与角色连贯性提升、图文对应关系增强、视觉质量改善，以及新增多页 PPT 自动生成能力。模型已开源。

Hugging Face 图像生成多模态模型发布

11:00

HuggingFace Daily Papers（社区热门论文）

65

MoVerse：基于全景高斯支架的实时视频世界模型

MoVerse 能从单张窄视野图像生成可交互漫游的实时视频世界模型。它将世界构建与观察渲染分离：先用拓扑感知扩散将输入扩展为重力对齐的 360° 全景图，再通过全景几何感知残差预测将其提升为持久 3D Gaussian scaffold，最后由 Gaussian 条件视频渲染器沿用户指定相机轨迹输出逼真视频。渲染器采用双向扩散教师蒸馏为因果自回归学生，实现有限延迟流式输出。在单个 NVIDIA RTX 4090 GPU 上支持 8 FPS 的实时场景漫游。

图像生成视频论文/研究

11:00

HuggingFace Daily Papers（社区热门论文）

59

Surflo：具有全局状态的一致3D曲面流模型

Surflo将可变数量的未定位RGB视图压缩成K个潜在token（全局状态），通过流匹配独立地将噪声点传输到曲面，解码出定向3D表面点。输出不受固定网格或token预算限制：同一潜在状态可在单次前向传播中生成数千到百万个点。推理时通过ODE积分注入光度梯度，关联邻近点以抑制局部不一致。在表面指标上匹配或超越前馈基线，比需数百视图的优化方法快一个数量级，是唯一结合全局潜在与任意分辨率解码的前馈方法。

图像生成论文/研究

11:00

HuggingFace Daily Papers（社区热门论文）

63

InterleaveThinker：强化智能体交错生成管线

InterleaveThinker 提出多智能体管线，通过规划智能体组织图像-文本输入序列、批评智能体评估生成结果并修正指令，使任意现有图像生成器具备交错生成能力。构建 Interleave-Planner-SFT-80k 和 Interleave-Critic-SFT-112k 数据集进行冷启动，并利用 GRPO 在 Interleave-Critic-RL-13k 上强化批评智能体的逐步指令修正。提出 accuracy reward 和 step-wise reward，使单步强化学习有效引导整个生成轨迹。在交错生成基准上性能与 Nano Banana 和 GPT-5 相当；在 4-step FLUX.2-klein 推理基准上，WISE 和 RISE 指标显著提升。

智能体图像生成多模态推理

08:34

IT之家（RSS）

46

苹果 iOS 27 升级图乐园：AI 生成壁纸适配 iPhone 17 等机型

苹果在 iOS 27 中为图乐园新增壁纸自定义功能。用户可通过“设置→壁纸→添加新壁纸”或锁屏界面长按进入壁纸画廊，点击顶栏图乐园入口，用文字描述图像内容、选择风格或基于现有照片/人物生成壁纸。系统还会基于相册照片自动推荐风格化壁纸，所有AI生成壁纸均显示Image Playground图标。生成图像自动匹配iPhone 17等机型屏幕尺寸，无需手动裁剪。该功能于6月11日发布的博文中披露。

产品更新图像生成

08:00

HuggingFace Daily Papers（社区热门论文）

53

RepFusion：利用多模态先验在表示空间中降噪

RepFusion复用多模态大语言模型（MLLM）作为噪声表示编码器，将其输出作为扩散Transformer的条件信号，用于文本到图像生成的去噪过程。在类似推理预算的对比中，RepFusion优于将同等容量分配给从头初始化的去噪器的基线。实验表明，MLLM为降噪视觉表示提供强先验，通过条件于演化的噪声表示，可以在现代T2I系统中有效利用测试时的重复MLLM计算。

图像生成多模态论文/研究

6月11日

12:10

Midjourney：Updates（RSS）

精选64

Midjourney V8.1 已成为默认模型

Midjourney 已将默认模型从 V7 升级为 V8.1。V8.1 在智能性、连贯性、对详细提示的遵循度以及文本渲染效果上均有提升，HD 模式也已支持。

图像生成模型发布

关联讨论 1 条X：Midjourney (@midjourney)

推荐理由：虽然V8.1不是大版本，但设为默认后所有用户自动升级，尤其是文本和复杂提示词的理解增强，做设计的朋友值得重新测试一下关键词。

08:00

HuggingFace Daily Papers（社区热门论文）

48

HiLo-Token：面向高效图像编辑的输入自适应高低频Token压缩框架

HiLo-Token提出输入自适应高低频token压缩框架，解决扩散Transformer（DiT）在图像编辑中的延迟瓶颈——即使从50步蒸馏至8步，DiT仍占73%延迟。方法在用户掩码编辑区域内保留所有token维持局部关联性；外部区域基于空间频率选取高频token捕捉细节，并用16倍下采样图像的低频token保持全局结构。在生产级评估数据上，针对平均掩码比6.38%、15.92%、35.36%的小/中/大掩码编辑任务，在A100-80GB上分别实现3.13倍、2.59倍、1.67倍DiT加速，且生成质量无退化。

图像生成论文/研究

6月10日

15:28

IT之家（RSS）

59

一句话 P 图发朋友圈？美图秀秀宣布首批接入微信 AI 生态

微信6月8日发布开发者接入微信AI生态指引，开放平台支持开发者授权接入。美图秀秀作为首批内测开发者完成初步适配，将围绕人像美容、拼图、证件照、智能消除、画质修复等核心场景接入微信AI Agent。京东、美团、滴滴、携程、同程、肯德基等也同步宣布作为首批内测团队接入微信AI生态。

MCP/工具图像生成行业动态

12:56

HuggingFace Daily Papers（社区热门论文）

精选73

Flow-DPPO：面向流匹配模型的散度近端策略优化

针对流匹配模型中在线强化学习比率裁剪策略约束不当的问题，Flow-DPPO 提出用散度近端约束替代。关键洞察是流模型每步策略为高斯分布，可精确计算新旧策略间的 KL 散度。Flow-DPPO 采用非对称散度掩码，仅在梯度更新偏离信任区域且超阈值时阻止更新。实验表明，Flow-DPPO 获得更高奖励，KL 近端效率更优，缓解了灾难性遗忘，促进多目标均衡，并能在比率裁剪失效时支持稳定的多轮训练。代码已开源。

图像生成推理视频论文/研究

推荐理由：用 KL 散度代替比值裁剪来解决流匹配 RL 训练的不稳定，理论简洁，代码已开源，做图像/视频生成优化的同学可以跑一下。

11:28

IT之家（RSS）

48

初探苹果 iOS 27 版 AI 擦除工具 Clean Up：减少人脸失真

苹果在 iOS 27 系统中升级了基于 Apple Intelligence 的修图功能 Clean Up，重点修复了 iOS 26 版本中擦除背景后导致的人脸补全失真、画面扭曲问题。新版在人脸变形、画面边缘和肤色过渡方面表现更自然，成片更统一。X 用户 Alvin 反馈，调用苹果云端 AI 模型并选择“自动”或“高质量”模式可获得最佳效果。

产品更新图像生成

10:56

HuggingFace Daily Papers（社区热门论文）

60

SCAIL-2：端到端上下文条件控制的角色动画统一框架

SCAIL-2 提出绕过姿态骨架等中间表示的端到端角色动画框架，通过直接拼接驱动视频获取全部视觉信息。为解决端到端数据匮乏，用解耦条件统一子任务，构建异构运动迁移数据集 MotionPair-60K。采用上下文掩码条件与模式特定 RoPE 作为软引导，并引入 Bias-Aware DPO 构建偏好对以缓解合成数据在细节区域的误差。实验表明，该方法在多个任务中显著优于现有 SOTA。部分合成数据与模型权重将开源。

图像生成视频论文/研究

10:56

HuggingFace Daily Papers（社区热门论文）

63

ARM：统一离散表示的自回归大型多模态模型

ARM是一种基于离散表示的自回归模型，将图像理解、生成与编辑统一在下一个token预测框架中。首先训练离散语义视觉tokenizer，通过多目标监督实现语义判别、语言对齐与忠实重建；然后在文本与图像token序列上训练7B自回归模型，自然融合视觉语言感知与生成能力；最后用强化学习优化文本到图像生成与指令引导编辑的偏好对齐，使WISE整体得分从0.50提升至0.56，GEdit-Bench-EN的G_O评分从5.75提升至6.68，并观察到跨任务协同效果。

arXiv 图像生成多模态论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

59

从2D网格到1D token：改革多模态图像融合的共享表示

多模态图像融合现有方法基于2D特征网格，局部建模强但全局外观控制有限。本文引入紧凑1D token接口，基于冻结预训练图像tokenizer作为全局载体，同时保留2D空间路径恢复局部结构。提出选择性token编辑（STE），稀疏更新或替换关键token，在不改变融合主干、不引入额外损失下引导全局一致性。在四个基准上取得最佳整体性能，全局一致性和局部保真度均提升。

图像生成多模态论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

65

Z-Image Turbo++：通过教师对齐的端到端蒸馏实现高保真两步图像生成

Z-Image Turbo++是从8步教师模型Z-Image Turbo蒸馏得到的2步图像生成模型。针对两步生成中任务难度提升和模型容量有限的瓶颈，提出三项设计：分布对齐对抗学习（以教师生成图像而非真实图像作为GAN训练的真样本）、步骤分离参数化（两个去噪步独立参数）、以及带迭代正则化的端到端训练（第一步接收最终图像质量梯度并保留有意义的中间生成）。这些策略显著缩小了2步与8步生成的质量差距。

arXiv 图像生成数据/训练论文/研究

00:43

The Verge：AI（RSS）

47

苹果拥抱AI照片编辑的幻想

Apple在WWDC 2026宣布推出多项AI照片编辑工具，用户可轻松操控图像，但Apple仍将这些图像称为“照片”。两年前，Apple在“照片”应用中推出AI物体移除工具Clean Up（类似Google Photos的Magic Eraser），当时软件主管Craig Federighi表示公司重视避免扭曲真实感知。如今Apple不再坚持照片必须准确还原现实。

产品更新图像生成

00:36

HuggingFace Daily Papers（社区热门论文）

47

FlowBP：一种面向Flow Matching的奖励反向传播设计空间探索框架

针对文本到图像Flow Matching模型与人类偏好对齐时，完整采样轨迹无法存储及跨步雅可比积导致梯度膨胀的问题，FlowBP提出统一代理轨迹框架，将反向轨迹本身作为设计对象。该框架分离奖励模型输入、活跃集、积分权重和桥耦合四个选择，并实例化三个变体：FlowBP-Sparse（稀疏Euler重建）、FlowBP-Bridge（受控桥耦合）和FlowBP-Lagrange（高阶跳跃求积）。三者通过活跃集大小限制内存，梯度链至多含一个雅可比因子。在SD3.5-M、FLUX.1-dev和FLUX.2-Klein-base上，三个变体在偏好、质量和组合指标上均优于直接梯度基线。

Hugging Face 图像生成数据/训练论文/研究

6月9日

22:26

IT之家（RSS）

54

苹果 iOS 27 系统部分 Apple Intelligence 功能设每日使用限额，iCloud+ 订阅可解锁更高额度

苹果确认 iOS 27 系统中部分 Apple Intelligence 功能（包括图像生成）设有每日使用限制，因依赖云端模型。大多数 iCloud+ 订阅方案可解锁更高使用额度，并为兼容的家庭摄像头启用 Apple Intelligence 支持。目前最便宜的 0.99 美元（约 6.7 元人民币）iCloud+ 套餐可能无法提升额度。这表明苹果正将高级 AI 功能与付费体系绑定。

产品更新图像生成

20:26

IT之家（RSS）

42

苹果 iPhone 国行机型升级 iOS 27 后可使用 AI 壁纸扩图功能

部分苹果 iPhone 国行机型在升级至 iOS 27 Developer Beta 1 后，新增 AI 壁纸扩图功能。用户可通过长按锁屏壁纸、选择新照片并捏合屏幕激活，选定主体后点击“扩展”，等待片刻即可获得 AI 扩充后的照片。

产品更新图像生成

19:30

公众号：可灵AI（快手·视频）

55

可灵AI×候鸟300发起AI主义新浪潮AIGC影像大赛

可灵AI与候鸟300联合发起AIGC影像大赛。线下大赛6月16-26日在阿那亚海边举办，评审包括李少红、陈明昊、焦雄屏等影视与AI专家及美院教授，设10万奖金+超200万灵感值，结果6月27日晚揭晓。线上大赛6月22日前投稿可角逐“最受关注大奖”，获奖者受邀参加6月27日颁奖。参赛要求：视频≥50%由可灵AI生成，官网投稿填表并带话题分享。

图像生成行业动态视频

15:26

IT之家（RSS）

48

亚马逊推出 AI 定制商品功能，支持水杯、T 恤等

亚马逊昨天推出 AI 定制商品功能，用户可通过 Alexa 使用自然语言提示词创建全新商品设计，将创意转化为图案并应用在服装、水杯等产品上。下单后由 Merch on Demand 生产，并通过 Prime 物流交付。该功能适合制作家庭聚会纪念 T 恤、宠物水杯等独一无二的定制商品，挑战 Redbubble、Bonfire 等在线周边平台，有望使 AI 设计商品成为普通消费者的日常购物选项。

产品更新图像生成

08:00

HuggingFace Daily Papers（社区热门论文）

57

IDEAL：深度对齐使离散表示自编码器更优

基于预训练视觉基础模型（VFM）的表示自编码器（RAE）在图像生成中构建语义丰富的潜空间，但重建质量受限于深层特征丢失细节。IDEAL框架通过联合对齐量化token与浅层和深层VFM特征，使离散视觉token同时保留视觉保真度和丰富语义。在ImageNet上，IDEAL达到0.61 rFID，比之前最优方法提升0.28；用于自回归图像生成时取得1.89 gFID，创下新SOTA。

图像生成论文/研究

08:00

HuggingFace Daily Papers（社区热门论文）

精选82

i1：面向强文生图模型的简单且完全开源配方

i1 是一个 3B 参数的文本到图像扩散模型，仅使用公开数据集训练。在 GenEval、DPG、PRISM、CVTG-2K 和 LongText 五个基准上，i1 性能与领先模型相当，平均比最佳现有完全开源模型高 29.5 个百分点。研究基于 300 余项控制实验（超 700K TPU v6e 小时），发现等权重混合 curated 数据集是强默认配置、更大文本编码器适配器以极少参数提升性能。i1 的检查点、训练与推理代码及数据处理流程已全部开源。

arXiv 图像生成多模态开源生态

推荐理由：i1 是第一个用全公开数据、完全开源代码/权重/数据管线打造的 3B 模型，直接把全开放模型的性能拉到可与闭源竞争，对做文生图研究的同行是个扎实起点。

06:21

IT之家（RSS）

58

苹果 iOS 27 大改 Genmoji 自定义表情功能，可微调描述语言

苹果今日正式公布 iOS 27 系统更新，其中 Genmoji 自定义表情功能经过全新改造。用户可根据描述创建表情符号，或从现有表情、照片中改造。新增“描述变更”界面，用于微调已创建的表情包，可迭代设计并修改颜色、物体等元素。Genmoji 输出更稳定，默认 3D 卡通风格，并支持切换其他风格。生成时间缩短，系统负担和电量消耗也更少。

产品更新图像生成

04:21

IT之家（RSS）

57

无需调用ChatGPT，苹果iOS 27版图乐园首次实现写实AI生图

在2026年全球开发者大会上，苹果为iOS 27的图乐园加入原生写实图像生成功能，用户输入文字提示即可直接生成接近照片风格的AI图片，不再需要像iOS 26那样借助ChatGPT。动画、插画、素描等原有风格仍可使用。科技媒体Appleinsider指出，新增的写实功能使图乐园更适合演示文稿、邀请函、模型草图和壁纸等场景，将生成内容从趣味表达扩展至日常创作与轻量生产。

产品更新图像生成

03:21

IT之家（RSS）

58

苹果 iOS 27 升级 AI 修图：调整照片构图、移除干扰元素等

在 2026 年 WWDC 上，苹果为 iOS 27 带来三项 AI 修图功能：空间重塑（Spatial Reframing）可围绕拍摄对象旋转图像，并生成新内容填补视角变化造成的空白；扩展（Extend）能在不裁剪关键内容的前提下拉直地平线或调整宽高比，自动填充缺失部分；升级后的 Clean Up 能以更高质量和更逼真的填充效果移除干扰元素。

产品更新图像生成

03:14

Apple：Newsroom（RSS）

同事件精选63

Apple Intelligence 将强大 AI 能力融入日常体验

Apple 发布下一代 Apple Intelligence，将 AI 能力集成到 iPhone、iPad 和 Mac 中，带来更个性化和有帮助的日常体验。

产品更新图像生成多模态

同一事件，精选展示《受 DMA 影响，Siri AI 在欧盟将随 iOS 27 和 iPadOS 27 延迟上线》

推荐理由：苹果这次把 AI 深度植入常用 app，从空间重构图到自动修密码，方向很务实，但秋季才上线，目前只有开发者能尝鲜。

03:09

TechCrunch：AI（RSS）

精选73

苹果刚刚教会你的iPhone补全句子、完善照片和简化工作流程

Apple为Safari、Shortcuts和Password应用添加了AI驱动的新功能，让iPhone能够自动补全句子、完善照片和简化工作流程。

产品更新图像生成多模态

推荐理由：WWDC 2026 的 Apple Intelligence 更新不是颠覆性突破，但 Safari 标签管理、跨应用上下文和 Shortcuts 的 AI 创建让 AI 真正渗透到日常使用中，是所有苹果用户都该看看的实用升级。

1 234 5…12