小互@xiaohu

2026-05-04 20:55·59天前

AI 摘要

据传谷歌将在I/O大会发布名为“Omni”的新模型，旨在将Gemini从聊天助手升级为集成写作、图片、视频、长上下文记忆与复杂任务流的全模态生产力平台。该模型可能原生支持视频生成与输出，超越现有的Veo 3.1。同时，Gemini 3.2/3.5版本或专注于提升推理速度与效率，而Ultra版本则向长上下文、重记忆及多步骤工作流方向深化。若消息属实，Gemini将成为首个具备视频输出能力的顶级Omni模型。

据传Google将在本月的Google I/O 大会上发布一个全新的模型

将 Gemini 从"聊天助手"推向"全模态生产力入口"

一个名为Omni 的疑似新模型泄露

它可能会承担更深的视频与多模态生成能力，甚至让 Gemini 原生支持视频输出，而不只是文字、图片和调用外部视频模型。

如果这个方向成立，Gemini 接下来真正要拼的就不只是模型分数，而是"一个入口完成多种内容生产"：写作、图片、视频、长上下文记忆、复杂任务流，全部都在 Gemini 里打通。

同时，Gemini 3.2、3.5 也被传正在测试，重点可能会放在更快、更高效的推理体验上。

Ultra 版本则可能继续往长上下文、重记忆、多步骤工作流方向演进，服务那些需要连续执行、反复调用上下文的高价值任务。

TestingCatalog News 🗞GOOGLE I/O 🚨: A NEW OMNI MODEL IS BEING TESTED ON GEMINI FOR VIDEO GENERATION! > "Start with an idea or try a template. Powered by Omni." > This is a new leake...

Google 多模态模型发布视频

在 X 查看原推导出 Markdown

小互@xiaohu · X

56导出 Markdown