泄露的Gemini Spark内部截图显示,新模型整合了Agent与Chat模式,重点提升高级工具使用和Skills创建流程。然而,当前Skills仅支持复制粘贴MD文件创建,缺乏直接导入选项,且未见Browser或Computer Use功能。这表明Google在推进AI工具能力时采取了渐进策略,优先打磨核心流程,而非一步到位开放激进功能。
Google刚刚泄露了Gemini Spark的最新内部截图。
新模型同时支持Agent模式和Chat模式,重点放在了高级工具使用和Skills创建流程上。
我把截图仔细看完后,发现两个关键限制目前很明显:
Skills只能通过复制粘贴MD文件的方式创建,没有直接导入选项。
目前也没有任何Browser或Computer Use的痕迹,也就是说还无法直接控制用户的电脑。
这波更新把Gemini的工具能力又往前推了一步,但也暴露了Google在落地Agent时的谨慎节奏。
以前大家觉得Google会在工具使用上直接一步到位,现在看起来他们选择先把核心流程打磨扎实,再逐步开放更激进的功能。`