Computer Use 从浏览器扩展到移动和桌面,Google 正式把 agent 战场拉到全部界面。安全策略的加入说明不是 demo,而是认真考虑落地。
Google AI 宣布 Gemini 3.5 Flash 的 Computer Use 工具正式可用,支持构建能观察并操作浏览器、移动端和桌面环境的 AI 智能体,可处理长期任务。新特性包括:内置移动与桌面操作系统支持;所有函数调用配备 intent arguments;可定制的客户端函数实现人工接管(HITL);提示词注入检测及可配置的 action-level 安全策略。可用于自动化 QA 测试、业务流程等场景。
The Computer Use 工具现已可用于 Gemini 3.5 Flash 🛠️
构建能够跨浏览器、移动和桌面环境进行视觉识别并执行操作的智能体,以无缝处理长周期任务。
以下是新功能:
- 内置对移动和桌面操作系统的支持 - 所有函数调用支持意图参数 - 可自定义的客户端函数,轻松支持人工介入(HITL)接管 - 提示词注入检测和可配置的操作级安全策略,以满足你的应用需求
了解如何在博客中利用 3.5 Flash 自动化 QA 测试、业务流程等:https://blog.google/innovation-and-ai/models-and-research/gemini-models/introducing-computer-use-gemini-3-5-flash/