据传谷歌将在I/O大会发布名为“Omni”的新模型,旨在将Gemini从聊天助手升级为集成写作、图片、视频、长上下文记忆与复杂任务流的全模态生产力平台。该模型可能原生支持视频生成与输出,超越现有的Veo 3.1。同时,Gemini 3.2/3.5版本或专注于提升推理速度与效率,而Ultra版本则向长上下文、重记忆及多步骤工作流方向深化。若消息属实,Gemini将成为首个具备视频输出能力的顶级Omni模型。
据传Google将在本月的Google I/O 大会上发布一个全新的模型
将 Gemini 从"聊天助手"推向"全模态生产力入口"
一个名为Omni 的疑似新模型泄露
它可能会承担更深的视频与多模态生成能力,甚至让 Gemini 原生支持视频输出,而不只是文字、图片和调用外部视频模型。
如果这个方向成立,Gemini 接下来真正要拼的就不只是模型分数,而是"一个入口完成多种内容生产":写作、图片、视频、长上下文记忆、复杂任务流,全部都在 Gemini 里打通。
同时,Gemini 3.2、3.5 也被传正在测试,重点可能会放在更快、更高效的推理体验上。
Ultra 版本则可能继续往长上下文、重记忆、多步骤工作流方向演进,服务那些需要连续执行、反复调用上下文的高价值任务。