Gemini 3.5 Flash 引入 computer use 功能
阅读原文· deepmind.google把 computer use 能力塞进轻量级的 Flash 模型,意味着在浏览器里跑视觉 agent 的成本会大幅降低,做企业自动化的团队可以立即试起来,安全措施也给了落地信心。
Google DeepMind 宣布,computer use 现作为内置工具集成于 Gemini 3.5 Flash,开发者可构建跨浏览器、移动端和桌面的智能体,实现视觉感知、推理与操作。此前该功能仅以独立模型形式存在于 Gemini 2.5。3.5 Flash 已支持函数调用及 Search、Maps 等内置工具,新增的 computer use 可提升持续软件测试和跨专业应用知识工作等长周期企业自动化任务的性能。安全方面采用针对性对抗训练,并可选配两项企业防护系统:要求用户确认敏感操作,以及在检测到间接 prompt 注入时自动停止任务。可通过 Gemini API 和 Gemini Enterprise Agent Platform 使用。
Gemini 3.5 Flash 引入计算机使用功能
2026年6月24日
· 阅读时间 5 分钟
X平台/Facebook/LinkedIn/邮件
计算机使用现已成为 Gemini 3.5 Flash 的内置工具,用于构建可跨平台交互的智能体。
M
Mateo Quiros
产品经理,Google DeepMind
X平台/Facebook/LinkedIn/邮件

本内容由 Google AI 生成。生成式 AI 处于实验阶段
[[时长]] 分钟
语音 Umbriel 速度 1X
语音 Umbriel Gacrux
速度 0.75X 1X 1.5X 2X
计算机使用现已成为 Gemini 3.5 Flash 支持的内置工具,在智能体计算机使用任务中提供了我们迄今为止最佳的性能。此前,计算机使用仅作为独立的 Gemini 2.5 计算机使用模型提供,现已原生集成到主要的 Gemini Flash 模型中。Gemini 在函数调用及使用搜索和地图定位等内置工具方面已表现出色。借助内置的计算机使用能力,开发者现在可以使用 3.5 Flash 可靠地构建自定义智能体,使其能够在浏览器、移动设备和桌面环境中进行观察、推理和操作。这为长周期和企业自动化任务(如持续软件测试以及跨专业应用的知识工作)带来了性能提升。

开发者和企业现在可以通过 Gemini API 和 Gemini Enterprise Agent Platform 开始使用 3.5 Flash 中的计算机使用功能。