AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态
全部一手资讯X论文
标签「图像生成」清除
6月10日周三
21:34AYi6810万粉小红书AIGC博主爆款拆解:封面靠画面、选题萌宠拟人化、5/7为品牌合作
18:33AYi5910万粉AIGC博主变现揭秘
16:44Deedy66Claude Fable 实现像素级精准,是自 o3 以来 AI 模型质量最大飞跃
15:28IT之家(RSS)59一句话 P 图发朋友圈?美图秀秀宣布首批接入微信 AI 生态
12:56HuggingFace Daily Papers(社区热门论文)73精选Flow-DPPO: 面向流匹配模型的散度近端策略优化
11:28IT之家(RSS)48初探苹果 iOS 27 版 AI 擦除工具 Clean Up:减少人脸失真
10:56HuggingFace Daily Papers(社区热门论文)60SCAIL-2:端到端上下文条件控制的角色动画统一框架
10:56HuggingFace Daily Papers(社区热门论文)63ARM:统一离散表示的自回归大型多模态模型
09:43Deedy69Claude Fable 5 展示惊人能力:迁移 Stripe 5000 万行代码、绘制 3D 图形、通关宝可梦、优化效果远超 GPT 5.5
08:00HuggingFace Daily Papers(社区热门论文)59从2D网格到1D token:改革多模态图像融合的共享表示
08:00HuggingFace Daily Papers(社区热门论文)65Z-Image Turbo++:通过教师对齐的端到端蒸馏实现高保真两步图像生成
05:52Artificial Analysis67HiDream O1-Image-1.5 在 Artificial Analysis 文生图排行榜中位列第三,超越 Google Nano Banana 2
01:08Fei-Fei Li78精选World Labs与Lore合作打造互动体验
00:43The Verge:AI(RSS)47苹果拥抱AI照片编辑的幻想
00:36HuggingFace Daily Papers(社区热门论文)47FlowBP:一种面向Flow Matching的奖励反向传播设计空间探索框架
6月9日周二
22:26IT之家(RSS)54苹果 iOS 27 系统部分 Apple Intelligence 功能设每日使用限额,iCloud+ 订阅可解锁更高额度
22:21🚨 AI News | TestingCatalog55Maket 发布 Auto-Complete 自动补全平面图功能
20:26IT之家(RSS)42苹果 iPhone 国行机型升级 iOS 27 后可使用 AI 壁纸扩图功能
19:30公众号:可灵AI(快手·视频)55可灵AI×候鸟300发起AI主义新浪潮AIGC影像大赛
15:26IT之家(RSS)48亚马逊推出 AI 定制商品功能,支持水杯、T 恤等
08:00HuggingFace Daily Papers(社区热门论文)57IDEAL:深度对齐使离散表示自编码器更优
08:00HuggingFace Daily Papers(社区热门论文)82精选i1:面向强文生图模型的简单且完全开源配方
06:21IT之家(RSS)58苹果 iOS 27 大改 Genmoji 自定义表情功能,可微调描述语言
04:50Krea58Krea 播客:与 Nitsan Bartov 谈 AI 在建筑
04:49🚨 AI News | TestingCatalog55iOS 27 Beta 图片游乐场使用 Google 模型
04:21IT之家(RSS)57无需调用ChatGPT,苹果iOS 27版图乐园首次实现写实AI生图
03:21IT之家(RSS)58苹果 iOS 27 升级 AI 修图:调整照片构图、移除干扰元素等
03:14Apple:Newsroom(RSS)63同事件精选Apple Intelligence 将强大 AI 能力融入日常体验同一事件,精选展示《受 DMA 影响,Siri AI 在欧盟将随 iOS 27 和 iPadOS 27 延迟上线》
03:09TechCrunch:AI(RSS)73精选苹果刚刚教会你的iPhone补全句子、完善照片和简化工作流程
02:38TechCrunch:AI(RSS)65苹果照片应用将新增AI编辑功能
02:38TechCrunch:AI(RSS)45苹果 Image Playground 改版以提升竞争力
02:21IT之家(RSS)49苹果 iOS 27 照片 App 升级"空间构图"技术,先拍照再调整视角
02:17🚨 AI News | TestingCatalog69苹果智能由Gemini驱动,Siri AI年内公测
02:15-Zho-33Siri AI + 空间智能生成 一顿智能后,这构图和效果还不如原图呢,这是来搞笑的???
02:11The Decoder:AI News(RSS)61微软研究院的Lens:详细描述比原始规模更能训练高效图像生成器
02:10The Verge:AI(RSS)57亚马逊推出AI生成定制商品
00:08Runway79同事件精选Runway Aleph 2.0 编辑模型:一键适配任意视频格式同一事件,精选展示《Aleph 2.0 与 Edit Studio》
00:08TechCrunch:AI(RSS)67亚马逊推出AI定制商品设计功能:用户可通过Alexa生成印花图案
6月8日周一
23:06SenseTime56商汤 SenseNova U1 实现文图交错生成
19:20IT之家(RSS)59全国公安机关严查严打涉高考网络谣言,10 起典型案例公布
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
6月10日
21:34
AYi@AYi_AInotes
68
10万粉小红书AIGC博主爆款拆解:封面靠画面、选题萌宠拟人化、5/7为品牌合作

一位10万粉小红书AIGC博主,不带货、不卖课、不引流私域。拆解7篇赞≥5000爆款:封面5篇零文字靠画面,唯二带大字的为品牌广;7篇中5篇品牌合作(兰蔻、李锦记、华为、脉动),产品嵌入“猫咪meme”“穿进古画当厨子”剧情;选题萌宠拟人化,一条AI跳舞猫获7.9万赞、4.2万藏;标题用强动词如“闯进/穿进/征服”+疑问感叹;开头直说用户心里话或具体场景;全部视频、0图文。详细提示词见原文。

AYi: http://x.com/i/article/2064536412670562304

图像生成教程/实践视频
18:33
AYi@AYi_AInotes
59
10万粉AIGC博主变现揭秘

一个10万粉小红书AIGC博主,不带货、不卖课,80%收入来自蒲公英品牌广告(李锦记、兰蔻、华为、宝格丽均投过),单条推广报价8000-2万。隐藏变现是将账号作为活作品集,品牌看到AI制作的兰蔻级别效果后,绕过平台直接谈全案。一条7000赞爆款可将报价从2000拉至4000,并提升主动邀约率。AI碾平了门槛——一人一电脑能做出接近专业团队的内容,账号就是24小时在线简历。按行业估算,3万粉账号月入可达8000-2万。

AYi: http://x.com/i/article/2064536412670562304

图像生成现象/趋势
16:44
Deedy@deedydas
66
Claude Fable 实现像素级精准,是自 o3 以来 AI 模型质量最大飞跃

Claude Fable 在创建文档、幻灯片、表格、网站等方面实现了像素级精准,被认为是自 o3 以来 AI 模型质量的最大飞跃。其能力包括:完美复现 McKinsey 风格报告、近乎一致的 SpaceX S-1 IPO 草案、像素级还原宝可梦游戏、可控人形机器人 3D 设计、仅用 CSS 实现 Apple Liquid Glass UI、优胜美地 3D 世界渲染、网站设计升级以及精美的邮件营销模板。其中许多任务需要超过 2 小时的深度思考。

Anthropic图像生成多模态大佬观点
15:28
IT之家(RSS)
59
一句话 P 图发朋友圈?美图秀秀宣布首批接入微信 AI 生态

微信6月8日发布开发者接入微信AI生态指引,开放平台支持开发者授权接入。美图秀秀作为首批内测开发者完成初步适配,将围绕人像美容、拼图、证件照、智能消除、画质修复等核心场景接入微信AI Agent。京东、美团、滴滴、携程、同程、肯德基等也同步宣布作为首批内测团队接入微信AI生态。

MCP/工具图像生成行业动态
12:56
HuggingFace Daily Papers(社区热门论文)
精选73
Flow-DPPO: 面向流匹配模型的散度近端策略优化

针对流匹配模型中在线强化学习比率裁剪策略约束不当的问题,Flow-DPPO 提出用散度近端约束替代。关键洞察是流模型每步策略为高斯分布,可精确计算新旧策略间的 KL 散度。Flow-DPPO 采用非对称散度掩码,仅在梯度更新偏离信任区域且超阈值时阻止更新。实验表明,Flow-DPPO 获得更高奖励,KL 近端效率更优,缓解了灾难性遗忘,促进多目标均衡,并能在比率裁剪失效时支持稳定的多轮训练。代码已开源。

图像生成推理视频论文/研究

推荐理由:用 KL 散度代替比值裁剪来解决流匹配 RL 训练的不稳定,理论简洁,代码已开源,做图像/视频生成优化的同学可以跑一下。
11:28
IT之家(RSS)
48
初探苹果 iOS 27 版 AI 擦除工具 Clean Up:减少人脸失真

苹果在 iOS 27 系统中升级了基于 Apple Intelligence 的修图功能 Clean Up,重点修复了 iOS 26 版本中擦除背景后导致的人脸补全失真、画面扭曲问题。新版在人脸变形、画面边缘和肤色过渡方面表现更自然,成片更统一。X 用户 Alvin 反馈,调用苹果云端 AI 模型并选择“自动”或“高质量”模式可获得最佳效果。

产品更新图像生成
10:56
HuggingFace Daily Papers(社区热门论文)
60
SCAIL-2:端到端上下文条件控制的角色动画统一框架

SCAIL-2 提出绕过姿态骨架等中间表示的端到端角色动画框架,通过直接拼接驱动视频获取全部视觉信息。为解决端到端数据匮乏,用解耦条件统一子任务,构建异构运动迁移数据集 MotionPair-60K。采用上下文掩码条件与模式特定 RoPE 作为软引导,并引入 Bias-Aware DPO 构建偏好对以缓解合成数据在细节区域的误差。实验表明,该方法在多个任务中显著优于现有 SOTA。部分合成数据与模型权重将开源。

图像生成视频论文/研究
10:56
HuggingFace Daily Papers(社区热门论文)
63
ARM:统一离散表示的自回归大型多模态模型

ARM是一种基于离散表示的自回归模型,将图像理解、生成与编辑统一在下一个token预测框架中。首先训练离散语义视觉tokenizer,通过多目标监督实现语义判别、语言对齐与忠实重建;然后在文本与图像token序列上训练7B自回归模型,自然融合视觉语言感知与生成能力;最后用强化学习优化文本到图像生成与指令引导编辑的偏好对齐,使WISE整体得分从0.50提升至0.56,GEdit-Bench-EN的G_O评分从5.75提升至6.68,并观察到跨任务协同效果。

arXiv图像生成多模态论文/研究
09:43
Deedy@deedydas
69
Claude Fable 5 展示惊人能力:迁移 Stripe 5000 万行代码、绘制 3D 图形、通关宝可梦、优化效果远超 GPT 5.5

Claude Fable 5 一天内迁移 Stripe 5000 万行代码库(人类需 2 个月);绘制逼真 3D 图形(波音 747、超 5000 个对象太空模拟、Minecraft 过山车、写实森林、纽约天际线、暴风云);一次性通关宝可梦火红版;优化实际交互网络求值器,效果比 GPT 5.5 好 10 倍。价格相近:输入 $10/M,输出 $50/M(Fable 5)vs $45/M(GPT 5.5),且比 GPT 5.5 Pro 便宜 6 倍。

Anthropic图像生成大佬观点推理
08:00
HuggingFace Daily Papers(社区热门论文)
59
从2D网格到1D token:改革多模态图像融合的共享表示

多模态图像融合现有方法基于2D特征网格,局部建模强但全局外观控制有限。本文引入紧凑1D token接口,基于冻结预训练图像tokenizer作为全局载体,同时保留2D空间路径恢复局部结构。提出选择性token编辑(STE),稀疏更新或替换关键token,在不改变融合主干、不引入额外损失下引导全局一致性。在四个基准上取得最佳整体性能,全局一致性和局部保真度均提升。

图像生成多模态论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
65
Z-Image Turbo++:通过教师对齐的端到端蒸馏实现高保真两步图像生成

Z-Image Turbo++是从8步教师模型Z-Image Turbo蒸馏得到的2步图像生成模型。针对两步生成中任务难度提升和模型容量有限的瓶颈,提出三项设计:分布对齐对抗学习(以教师生成图像而非真实图像作为GAN训练的真样本)、步骤分离参数化(两个去噪步独立参数)、以及带迭代正则化的端到端训练(第一步接收最终图像质量梯度并保留有意义的中间生成)。这些策略显著缩小了2步与8步生成的质量差距。

arXiv图像生成数据/训练论文/研究
05:52
Artificial Analysis@ArtificialAnlys
67
HiDream O1-Image-1.5 在 Artificial Analysis 文生图排行榜中位列第三,超越 Google Nano Banana 2

HiDream 发布 O1-Image-1.5,在 Artificial Analysis 文生图排行榜中位列第三,超越 Google Nano Banana 2。该闭源模型可生成高达 2K 分辨率图像,基于自研 Unified Transformer(UiT)架构,将原始像素、文本和任务条件编码到统一 token 空间。质量仅次于 OpenAI,与 GPT Image 1.5 (high)、Nano Banana 2(Gemini 3.1 Flash Image Preview)及 Cosmos3-Super-Text2Image 相当。定价 $80/千张,现可通过 HiHarness 及 Vivago 平台使用。

图像生成模型发布评测/基准
01:08
Fei-Fei Li@drfeifei
精选78
创意和想象力无与伦比!非常感谢@theworldlabs能与@withloreco的优秀人才合作,将他们不可思议的想法转化为用户可以享受的互动体验!🤩

World Labs: We turned dreams into worlds. Then filled them with history's greatest minds. Not a video. A world, running directly in ...

产品更新图像生成多模态

推荐理由:World Labs把生成式空间智能做成了可走进的浏览器世界,不是看视频而是和历史伟人互动,技术想象力和产品落地都够惊艳,做虚拟世界和交互叙事的人值得直接点进去体验。
00:43
The Verge:AI(RSS)
47
苹果拥抱AI照片编辑的幻想

Apple在WWDC 2026宣布推出多项AI照片编辑工具,用户可轻松操控图像,但Apple仍将这些图像称为“照片”。两年前,Apple在“照片”应用中推出AI物体移除工具Clean Up(类似Google Photos的Magic Eraser),当时软件主管Craig Federighi表示公司重视避免扭曲真实感知。如今Apple不再坚持照片必须准确还原现实。

产品更新图像生成
00:36
HuggingFace Daily Papers(社区热门论文)
47
FlowBP:一种面向Flow Matching的奖励反向传播设计空间探索框架

针对文本到图像Flow Matching模型与人类偏好对齐时,完整采样轨迹无法存储及跨步雅可比积导致梯度膨胀的问题,FlowBP提出统一代理轨迹框架,将反向轨迹本身作为设计对象。该框架分离奖励模型输入、活跃集、积分权重和桥耦合四个选择,并实例化三个变体:FlowBP-Sparse(稀疏Euler重建)、FlowBP-Bridge(受控桥耦合)和FlowBP-Lagrange(高阶跳跃求积)。三者通过活跃集大小限制内存,梯度链至多含一个雅可比因子。在SD3.5-M、FLUX.1-dev和FLUX.2-Klein-base上,三个变体在偏好、质量和组合指标上均优于直接梯度基线。

Hugging Face图像生成数据/训练论文/研究
6月9日
22:26
IT之家(RSS)
54
苹果 iOS 27 系统部分 Apple Intelligence 功能设每日使用限额,iCloud+ 订阅可解锁更高额度

苹果确认 iOS 27 系统中部分 Apple Intelligence 功能(包括图像生成)设有每日使用限制,因依赖云端模型。大多数 iCloud+ 订阅方案可解锁更高使用额度,并为兼容的家庭摄像头启用 Apple Intelligence 支持。目前最便宜的 0.99 美元(约 6.7 元人民币)iCloud+ 套餐可能无法提升额度。这表明苹果正将高级 AI 功能与付费体系绑定。

产品更新图像生成
22:21
🚨 AI News | TestingCatalog@testingcatalog
55
Maket 推出 Auto-Complete 功能,用户只需输入部分平面图(如粗略草图、几面墙或一个大致定位的卧室),系统即可自动生成剩余布局,同时保持已放置房间完全不变。用户可画出任意平面图形状并添加确定的房间,Maket 会在几分钟内返回一份完整且尺寸合理的平面图,实现从局部到整体的快速设计。

Maket: Draw any floor plan shape. Add the rooms youʼre sure about. Maket completes the floor plan without moving them. Start wi...

产品更新图像生成
20:26
IT之家(RSS)
42
苹果 iPhone 国行机型升级 iOS 27 后可使用 AI 壁纸扩图功能

部分苹果 iPhone 国行机型在升级至 iOS 27 Developer Beta 1 后,新增 AI 壁纸扩图功能。用户可通过长按锁屏壁纸、选择新照片并捏合屏幕激活,选定主体后点击“扩展”,等待片刻即可获得 AI 扩充后的照片。

产品更新图像生成
19:30
公众号:可灵AI(快手·视频)
55
可灵AI×候鸟300发起AI主义新浪潮AIGC影像大赛

可灵AI与候鸟300联合发起AIGC影像大赛。线下大赛6月16-26日在阿那亚海边举办,评审包括李少红、陈明昊、焦雄屏等影视与AI专家及美院教授,设10万奖金+超200万灵感值,结果6月27日晚揭晓。线上大赛6月22日前投稿可角逐“最受关注大奖”,获奖者受邀参加6月27日颁奖。参赛要求:视频≥50%由可灵AI生成,官网投稿填表并带话题分享。

图像生成行业动态视频
15:26
IT之家(RSS)
48
亚马逊推出 AI 定制商品功能,支持水杯、T 恤等

亚马逊昨天推出 AI 定制商品功能,用户可通过 Alexa 使用自然语言提示词创建全新商品设计,将创意转化为图案并应用在服装、水杯等产品上。下单后由 Merch on Demand 生产,并通过 Prime 物流交付。该功能适合制作家庭聚会纪念 T 恤、宠物水杯等独一无二的定制商品,挑战 Redbubble、Bonfire 等在线周边平台,有望使 AI 设计商品成为普通消费者的日常购物选项。

产品更新图像生成
08:00
HuggingFace Daily Papers(社区热门论文)
57
IDEAL:深度对齐使离散表示自编码器更优

基于预训练视觉基础模型(VFM)的表示自编码器(RAE)在图像生成中构建语义丰富的潜空间,但重建质量受限于深层特征丢失细节。IDEAL框架通过联合对齐量化token与浅层和深层VFM特征,使离散视觉token同时保留视觉保真度和丰富语义。在ImageNet上,IDEAL达到0.61 rFID,比之前最优方法提升0.28;用于自回归图像生成时取得1.89 gFID,创下新SOTA。

图像生成论文/研究
08:00
HuggingFace Daily Papers(社区热门论文)
精选82
i1:面向强文生图模型的简单且完全开源配方

i1 是一个 3B 参数的文本到图像扩散模型,仅使用公开数据集训练。在 GenEval、DPG、PRISM、CVTG-2K 和 LongText 五个基准上,i1 性能与领先模型相当,平均比最佳现有完全开源模型高 29.5 个百分点。研究基于 300 余项控制实验(超 700K TPU v6e 小时),发现等权重混合 curated 数据集是强默认配置、更大文本编码器适配器以极少参数提升性能。i1 的检查点、训练与推理代码及数据处理流程已全部开源。

arXiv图像生成多模态开源生态

推荐理由:i1 是第一个用全公开数据、完全开源代码/权重/数据管线打造的 3B 模型,直接把全开放模型的性能拉到可与闭源竞争,对做文生图研究的同行是个扎实起点。
06:21
IT之家(RSS)
58
苹果 iOS 27 大改 Genmoji 自定义表情功能,可微调描述语言

苹果今日正式公布 iOS 27 系统更新,其中 Genmoji 自定义表情功能经过全新改造。用户可根据描述创建表情符号,或从现有表情、照片中改造。新增“描述变更”界面,用于微调已创建的表情包,可迭代设计并修改颜色、物体等元素。Genmoji 输出更稳定,默认 3D 卡通风格,并支持切换其他风格。生成时间缩短,系统负担和电量消耗也更少。

产品更新图像生成
04:50
Krea@krea_ai
58
AI 在建筑工作室--Krea 播客与 Nitsan Bartov 完整采访见下方 👇
图像生成现象/趋势
04:49
🚨 AI News | TestingCatalog@testingcatalog
55
iOS 27 Beta 中的一个新图片游乐场显示,其背后的图像模型来自 Google。 然而,在测试提示下,结果与 Nano Banana 和 Imagen 相比截然不同。 这个液态玻璃泡泡很酷 👀
Google产品更新图像生成
04:21
IT之家(RSS)
57
无需调用ChatGPT,苹果iOS 27版图乐园首次实现写实AI生图

在2026年全球开发者大会上,苹果为iOS 27的图乐园加入原生写实图像生成功能,用户输入文字提示即可直接生成接近照片风格的AI图片,不再需要像iOS 26那样借助ChatGPT。动画、插画、素描等原有风格仍可使用。科技媒体Appleinsider指出,新增的写实功能使图乐园更适合演示文稿、邀请函、模型草图和壁纸等场景,将生成内容从趣味表达扩展至日常创作与轻量生产。

产品更新图像生成
03:21
IT之家(RSS)
58
苹果 iOS 27 升级 AI 修图:调整照片构图、移除干扰元素等

在 2026 年 WWDC 上,苹果为 iOS 27 带来三项 AI 修图功能:空间重塑(Spatial Reframing)可围绕拍摄对象旋转图像,并生成新内容填补视角变化造成的空白;扩展(Extend)能在不裁剪关键内容的前提下拉直地平线或调整宽高比,自动填充缺失部分;升级后的 Clean Up 能以更高质量和更逼真的填充效果移除干扰元素。

产品更新图像生成
03:14
Apple:Newsroom(RSS)
同事件精选63
Apple Intelligence 将强大 AI 能力融入日常体验

Apple 发布下一代 Apple Intelligence,将 AI 能力集成到 iPhone、iPad 和 Mac 中,带来更个性化和有帮助的日常体验。

产品更新图像生成多模态
同一事件,精选展示《受 DMA 影响,Siri AI 在欧盟将随 iOS 27 和 iPadOS 27 延迟上线》
推荐理由:苹果这次把 AI 深度植入常用 app,从空间重构图到自动修密码,方向很务实,但秋季才上线,目前只有开发者能尝鲜。
03:09
TechCrunch:AI(RSS)
精选73
苹果刚刚教会你的iPhone补全句子、完善照片和简化工作流程

Apple为Safari、Shortcuts和Password应用添加了AI驱动的新功能,让iPhone能够自动补全句子、完善照片和简化工作流程。

产品更新图像生成多模态

推荐理由:WWDC 2026 的 Apple Intelligence 更新不是颠覆性突破,但 Safari 标签管理、跨应用上下文和 Shortcuts 的 AI 创建让 AI 真正渗透到日常使用中,是所有苹果用户都该看看的实用升级。
02:38
TechCrunch:AI(RSS)
65
苹果照片应用将新增AI编辑功能

苹果照片应用将新增AI编辑功能,包括空间“Reframe”特性,让用户利用AI调整照片视角。

产品更新图像生成多模态
02:38
TechCrunch:AI(RSS)
45
苹果 Image Playground 改版以提升竞争力

苹果的 AI 图像生成器 Image Playground 正在进行改版,旨在提升其市场竞争力。此次改版有望使该工具在 AI 图像生成领域更具竞争力。

产品更新图像生成
02:21
IT之家(RSS)
49
苹果 iOS 27 照片 App 升级"空间构图"技术,先拍照再调整视角

苹果在 WWDC26 中为照片 App 引入“空间构图”技术,该功能源自 Vision Pro,利用设备端空间模型和专用云计算空间模型将照片变为“3D 空间场景”,用户后期可自由放大、移动照片视角位置,支持所有照片包括相机拍摄的。此外还升级了扩图和背景杂物移除功能,并改进图乐园,新增支持生成写实风格图片。

产品更新图像生成端侧
02:17
🚨 AI News | TestingCatalog@testingcatalog
69
WWDC 🔥:全新Apple Intelligence由Gemini驱动,对话式Siri AI,更新的图像编辑,以及众多苹果应用中的大量AI功能。 Siri AI将于今年晚些时候以测试版形式推出。初期,Siri AI将不会在欧盟上线。

🚨 AI News | TestingCatalog: Apple #WWDC26 has started 🍿

Google产品更新图像生成语音
02:15
-Zho-@ZHO_ZHO_ZHO
33
Siri AI + 空间智能生成 一顿智能后,这构图和效果还不如原图呢,这是来搞笑的???
图像生成多模态现象/趋势
02:11
The Decoder:AI News(RSS)
61
微软研究院的Lens:详细描述比原始规模更能训练高效图像生成器

微软研究院推出Lens,一个仅3.8B参数的文本到图像模型。依靠由GPT-4.1生成的8亿条详细图像标题,而非模糊的网页替代文本,Lens在基准测试上匹配了规模更大的竞品,训练成本仅一小部分。代码和权重以开源许可证公开可用。

Microsoft图像生成开源生态数据/训练
02:10
The Verge:AI(RSS)
57
亚马逊推出AI生成定制商品

亚马逊扩展按需印刷功能,借助Alexa for Shopping,用户通过文本提示生成图像,印制在T恤、水瓶、连帽衫等空白商品上。设计可分享链接供他人购买。该服务适用于家庭团聚、宠物主题等场景,同时也对代发货产品生态及定制印刷公司构成潜在威胁。

产品更新图像生成
00:08
Runway@runwayml
同事件精选79
一个视频,现在可以为每个信息流和格式制作。上传你现有的视频,选择你想要的宽高比,然后观看我们的编辑模型 Aleph 2.0,填充场景的其余部分,就像你从一开始就这样制作一样。 在我们的桌面 Web 应用上尝试,链接如下。
产品更新图像生成视频
同一事件,精选展示《Aleph 2.0 与 Edit Studio》
推荐理由:Runway 把视频重构图做成了上传即填充,Aleph 2.0 自动补全不同比例画面,对同时做横竖版内容的人太实用,省掉重新拍摄或手动裁剪的功夫。
00:08
TechCrunch:AI(RSS)
67
亚马逊推出AI定制商品设计功能:用户可通过Alexa生成印花图案

Amazon Shopping应用新增AI功能,用户通过Alexa生成设计图案,并可将图案打印在T恤、连帽衫和随行杯等商品上,实现个性化定制。

产品更新图像生成
6月8日
23:06
SenseTime@SenseTime_AI
56
商汤 SenseNova U1 实现文图交错生成

商汤 SenseTime 展示 SenseNova U1 的文图交错生成能力,通过定制香水逐步演示,证明模型不仅能识别图像,还能以图像为思考单元输出生动视觉内容。相关示例、Gallery、HuggingFace 模型、GitHub 代码及 Discord 社区链接已同步开放。

图像生成多模态教程/实践
19:20
IT之家(RSS)
59
全国公安机关严查严打涉高考网络谣言,10 起典型案例公布

公安部网安局6月8日公布10起涉高考网络谣言典型案例。其中,广东潮州网民沈某宏使用AI工具生成“坐在高考考场并用手机拍摄”的虚假图片并发布;河南驻马店网民吴某帅使用AI工具生成虚假“语文试卷”图片发布。其余8起案例涉及网民编造高考答案信息、谎称有答案或试题出售、散布“高考死人”谣言等。所有涉事者均已被公安机关依法行政处罚。

图像生成政策/监管
‹ 上一页
1…678910…30
下一页 ›