6月25日

03:15

Ethan Mollick@emollick

Gemini 3 Pro 是首个在 ARC-AGI-2 上达到至少 23% 的模型，它在 2025 年 11 月就做到了（实际得分 31%）。所以闭源与开源模型之间 8-12 个月的差距似乎仍然存在。但它们也更参差不齐，有些任务表现更好，有些则更差。

ARC Prize: GLM-5.2 from @Zai_org on ARC-AGI (Verified) - ARC-AGI-2: 22.8%, $0.25 - ARC-AGI-1: 77.0%, $0.19 Performance is comparabl...

Google OpenAI 大佬观点开源生态

03:13

🚨 AI News | TestingCatalog@testingcatalog

Google 为 Gemini 3.5 Flash 新增 Computer Use 能力，作为内置工具支持智能体计算机操作任务。该模型在 OSWorld-Verified 基准上取得 78.4 分，为谷歌迄今最佳性能。Computer Use 可跨浏览器、移动和桌面环境推理与执行，自动化工单提交等工作流程。

Omar Sanseviero: Excited to introduce Computer Use support for Gemini 3.5 Flash!🔥 This enables Gemini to reason and act across platforms...

智能体 Google 产品更新

01:07

Google DeepMind：Blog（RSS）

精选70

Gemini 3.5 Flash 引入 computer use 功能

Google DeepMind 宣布，computer use 现作为内置工具集成于 Gemini 3.5 Flash，开发者可构建跨浏览器、移动端和桌面的智能体，实现视觉感知、推理与操作。此前该功能仅以独立模型形式存在于 Gemini 2.5。3.5 Flash 已支持函数调用及 Search、Maps 等内置工具，新增的 computer use 可提升持续软件测试和跨专业应用知识工作等长周期企业自动化任务的性能。安全方面采用针对性对抗训练，并可选配两项企业防护系统：要求用户确认敏感操作，以及在检测到间接 prompt 注入时自动停止任务。可通过 Gemini API 和 Gemini Enterprise Agent Platform 使用。

智能体 DeepMind Google 产品更新

关联讨论 2 条

推荐理由：把 computer use 能力塞进轻量级的 Flash 模型，意味着在浏览器里跑视觉 agent 的成本会大幅降低，做企业自动化的团队可以立即试起来，安全措施也给了落地信心。

01:05

Google Research：Blog（网页）

精选69

思考即回忆：推理如何解锁LLM中的参数化知识

Google Research研究发现，推理（chain-of-thought）能帮助大语言模型（LLM）回忆简单事实，即使这些事实无需复杂推导。在Gemini-2.5 Flash和Pro以及Qwen3-32B上，启用推理后模型能够回答原本无法直接回答的简单问题，pass@k显示正确事实存在于输出分布中。该现象由两个机制驱动：一是生成的推理token充当计算缓冲，允许模型进行隐藏计算以提取参数化知识；二是推理过程中产生的相关事实起到启动效应（factual priming），帮助模型激活正确答案。

Google 推理论文/研究

推荐理由：发现一个反直觉现象，让模型推理能提升简单事实回忆，不是靠分步解题而是计算缓冲和事实预热，对理解模型知识召回机制很有启发，但中间步骤幻觉也带来风险。

00:18

Berryxia.AI@berryxia

Google Gemini桌面版推出Speak to Window和Magic Pointer，将AI注入macOS系统层

Google Gemini桌面版新增两大功能：Speak to Window允许用户在任意窗口按住fn键语音指挥Gemini写邮件、写文档、生成图片，操作在当前应用内完成；Magic Pointer可圈选屏幕信息，让Gemini理解上下文后执行编辑、总结或创建任务。目标是把Gemini变成系统级上下文感知助手，抢占工作流入口。

智能体 Google 产品更新语音

00:13

🚨 AI News | TestingCatalog@testingcatalog

Gemini 桌面应用（macOS）将新增两项功能：一是 "Magic Pointer"，用户可高亮任意窗口中的信息并指示 Gemini 编辑、总结或创建内容；二是 "Speak to Window" 语音听写功能，按住 fn 键即可用语音让 Gemini 起草邮件、撰写文档、生成图像等，无需切换应用。

🚨 AI News | TestingCatalog: GOOGLE 🔥: Gemini desktop app for macOS will get a new voice dictation feature called "Speak to Window" that works with ...

Google 产品更新语音

6月24日

23:13

🚨 AI News | TestingCatalog@testingcatalog

GOOGLE 🔥： Gemini 桌面应用（macOS）将新增名为 "Speak to Window" 的语音听写功能，可在任意其他应用中使用。

Google 产品更新语音

22:36

Google DeepMind@GoogleDeepMind

DeepMind 播客探索 AI 智能体经济与群体思维

Google DeepMind 发布播客，由 @weballergy 与 @fryrsquared 共同探讨 AI 智能体经济的崛起。内容涵盖：AI 智能体的定义、在科研中的探索、智能体间的委托与协作、安全风险与陷阱、如何构建智能体经济、认知单一文化（群体思维）风险，以及分布式智能的解决方案。播客还设有详细时间戳分段，帮助听众聚焦不同话题。

智能体 DeepMind Google 现象/趋势