5月21日

07:15

Google Gemini@GeminiApp

Gemini 3.5 Flash 能理解复杂主题和图表，满足您的特定需求，以最适合您的方式可视化结果。观看 Gemini 处理一篇高等数学论文，进行可视化探索，并生成最重要的元素。

Google 产品更新多模态

关联讨论 19 条

05:35

Google AI Developers@googleaidevs

同事件精选74

Google Stitch更新：AI设计助手实现全流程构建

Google推出了其AI设计伙伴Stitch的多项重要更新。新功能支持实时流式构建设计，允许用户在不中断流程的情况下直接进行编辑和互动反馈。Stitch现已能够导入现有代码库或Design.md文件，基于实际生产组件进行设计以保持品牌一致性。同时，工具新增了动态界面生成功能，并可将设计项目直接导出为可分享的线上URL，简化了从原型到生产的部署流程。该工具现已面向全球用户开放。

智能体 Google 产品更新多模态

同一事件，精选展示《谷歌发布多款AI创意工具新功能》

推荐理由：Stitch 这次更新把设计到生产流水线打通了，实时流加运动 UI 让原型更接近真产品，做移动端和 Web 的可以直接试试，比自己搭环境快太多。

04:17

Google DeepMind@GoogleDeepMind

同事件精选84

Gemini 3.5 Flash 已正式发布。

Google 多模态模型发布

同一事件，精选展示《Gemini 3.5：具备行动能力的前沿智能》

推荐理由：Google 在 Gemini 3.5 上继续扩展 Flash 线，这种轻量模型对成本和延迟敏感场景很关键，如果你在等一个便宜的 Gemini API，该看了。

03:53

小互@xiaohu

由Gemma 4驱动的Open Duck机器人具备视觉能力，还能对话

Google 产品更新具身智能多模态

02:14

Google Gemini@GeminiApp

同事件精选72

使用Gemini Omni创建、混剪和编辑视频比以往任何时候都更容易。它提供了一种流畅的对话式创作和编辑方式。只需从相册上传视频，并让Gemini进行修改即可。

Google 产品更新多模态视频

同一事件，精选展示《Gemini 3.5：具备行动能力的前沿智能》

推荐理由：Gemini Omni把视频编辑做成了对话，虽然不算革命性更新，但对随手剪片的普通人来说，不用学剪辑软件就是最大的可用性。

00:36

Rohan Paul@rohanpaul_ai

商汤开源统一多模态模型SenseNova U1

商汤科技近日开源了SenseNova U1，其核心创新在于架构设计。该模型摒弃了传统的视觉编码器与变分自编码器分离结构，采用单一共享表示空间原生处理图像与文本，极大减少了模块间转换导致的信息损耗。这一设计使模型能够连贯地同时生成图文内容，在信息图、海报、漫画等需要高一致性的密集视觉内容创作上优势显著。性能方面，其信息图生成速度在同等质量下约为Qwen-Image-2.0/Seedream-4.5的两倍。

图像生成多模态开源/仓库模型发布

00:14

Google AI@GoogleAI

精选69

谷歌发布多款AI创意工具新功能

谷歌与创作者合作推出系列AI工具更新。Google Workspace新增图像创作编辑工具Pics；Google Flow支持Gemini Omni Flash模型，并推出Flow Agent作为多步骤创作伙伴；设计工具StitchbyGoogle支持实时文字或语音编辑布局并导出代码；音乐工具Google FlowMusic增加分段编辑、风格混音及视频生成功能。

智能体 Google 产品更新图像生成

推荐理由：Google这次更新的不是单点工具，而是把AI能力像乐高一样嵌入到创意工作流的每一步，Flow Agent的多步骤推理尤其值得做设计的人试试看。

5月20日

22:08

Berryxia.AI@berryxia

性能飞跃但成本激增，Gemini 3.5 Flash重新定义"轻量"？

Google发布的Gemini 3.5 Flash在性能上实现飞跃，智能指数达55分，超越Grok 4.3等竞品，幻觉率大幅下降，输出速度超280 tokens/s。然而，其运行成本是前代的5.5倍，定价显著提高，引发对“Flash”是否仍代表“便宜”的讨论。该模型已在ZenMux平台开放免费体验，实际测试显示效果惊艳，在多项Agent和多模态榜单中表现顶尖，标志着顶级智能与极致速度的新结合。

Berryxia.AI: 兄弟们! 今天已经可以在ZenMux上免费体验Gemini 3.5 Flash 了! 我第一时间用它跑了那个经典的「AI模型递归二叉树生长测试」. 同一个 Prompt ,不同模型画出的树形态完全不一样。(见视频-Prompt见评论区) G...

Google 多模态推理评测/基准

22:02

向阳乔木@vista8

AI生成3D资产模型Rodin Gen-2.5发布：宣称千万级面数，助产业提效

AI 3D生成模型Rodin Gen-2.5发布，号称全球首款能实现千万级面数的同类产品，材质纹理精细。该模型可从单张图片生成高质量3D资产，快速输出obj等通用格式文件供进一步编辑，极大地简化了传统建模、绑骨、贴图的复杂流程。其技术亮点包括原生3D贴图算法，旨在为游戏、动画、影视等产业提供真正的生产力工具。

Hyper3D by Deemos: Introducing #Rodin Gen-2.5🚀 🔥World's 1st 10 MILLION polygon #3D GenAI - down to skin microstructures. 1️⃣1M-poly in 4s...

产品更新图像生成多模态

18:46

SenseTime@SenseTime_AI

同事件精选68

将你的想法转化为激发故事的视觉画面 🧨 【引用 @Adamaestr0_】：大多数AI工具可以写作或生成图像。但这个能同时做这两件事。向你介绍 SenseNova U1。一个能同时思考文本和图像的AI。这改变了一切 🧵

Adam: La mayoría de las herramientas de IA pueden escribir o generar imágenes. Pero esta hace AMBAS cosas a la vez. Te present...

多模态模型发布

同一事件，精选展示《商汤发布信息图生成模型升级，增强多项核心能力》

推荐理由：商汤发了 SenseNova U1，主打文本和图像同时生成的「全模态」，但宣传语太简略，没给任何性能数据或技术细节，暂时看不出是真突破还是常规迭代，先标记关注。