GLM-5.2 from @Zai_org on ARC-AGI (Verified) - ARC-AGI-2: 22.8%, $0.25 - ARC-AGI-1: 77.0%, $0.19 Performance is comparabl...
GLM-5.2 from @Zai_org on ARC-AGI (Verified) - ARC-AGI-2: 22.8%, $0.25 - ARC-AGI-1: 77.0%, $0.19 Performance is comparabl...
Excited to introduce Computer Use support for Gemini 3.5 Flash!🔥 This enables Gemini to reason and act across platforms...
Google DeepMind 宣布,computer use 现作为内置工具集成于 Gemini 3.5 Flash,开发者可构建跨浏览器、移动端和桌面的智能体,实现视觉感知、推理与操作。此前该功能仅以独立模型形式存在于 Gemini 2.5。3.5 Flash 已支持函数调用及 Search、Maps 等内置工具,新增的 computer use 可提升持续软件测试和跨专业应用知识工作等长周期企业自动化任务的性能。安全方面采用针对性对抗训练,并可选配两项企业防护系统:要求用户确认敏感操作,以及在检测到间接 prompt 注入时自动停止任务。可通过 Gemini API 和 Gemini Enterprise Agent Platform 使用。
关联讨论 2 条Hacker News 热门(buzzing.cc 中文翻译)X:Google AI for Developers (@googleaidevs)Google Research研究发现,推理(chain-of-thought)能帮助大语言模型(LLM)回忆简单事实,即使这些事实无需复杂推导。在Gemini-2.5 Flash和Pro以及Qwen3-32B上,启用推理后模型能够回答原本无法直接回答的简单问题,pass@k显示正确事实存在于输出分布中。该现象由两个机制驱动:一是生成的推理token充当计算缓冲,允许模型进行隐藏计算以提取参数化知识;二是推理过程中产生的相关事实起到启动效应(factual priming),帮助模型激活正确答案。
Google Gemini桌面版新增两大功能:Speak to Window允许用户在任意窗口按住fn键语音指挥Gemini写邮件、写文档、生成图片,操作在当前应用内完成;Magic Pointer可圈选屏幕信息,让Gemini理解上下文后执行编辑、总结或创建任务。目标是把Gemini变成系统级上下文感知助手,抢占工作流入口。
GOOGLE 🔥: Gemini desktop app for macOS will get a new voice dictation feature called "Speak to Window" that works with ...
Google DeepMind 发布播客,由 @weballergy 与 @fryrsquared 共同探讨 AI 智能体经济的崛起。内容涵盖:AI 智能体的定义、在科研中的探索、智能体间的委托与协作、安全风险与陷阱、如何构建智能体经济、认知单一文化(群体思维)风险,以及分布式智能的解决方案。播客还设有详细时间戳分段,帮助听众聚焦不同话题。
Google 新款 Home Speaker 售价 99 美元,体积小巧但音质饱满,低音优于同尺寸的 UE Wonderboom,清晰度和响度均超过 Amazon Echo Dot Max。配备三个麦克风,唤醒词识别灵敏,即便在淋浴中也能响应“Hey, Google”。外观呈彩色毛线球状,无可见按键;音量可通过点击左右侧调节,但触控区域小且方向不直观,顶部播放/暂停触控正常。灯光环隐藏于底部,反馈不够明显。不支持标准蓝牙,可通过 Google Cast 串流或与 Google TV Streamer 配对。内置 Gemini 智能助手,可用于控制家居、规划日程和查询信息。
Two months ago I was fired by Google for creating the Google Workspace CLI. It went viral, hit #1 on Hacker News, gained...
Google Home 将从 6 月 23 日起更新面部识别功能:当人脸不清晰时,可通过“非生物识别信号(体型、衣服颜色等)”继续识别已在 Familiar Faces 库中标记的人。该库还将自动更新家庭成员的最新照片。AI 生成的事件描述新增识别特定声音(狗叫、警报、脚步声)的能力,即使声音来自摄像头外。同步发布的 Google Home 应用 4.20 版加入了 Nest 恒温器检测到的 HVAC 系统健康警报,并改进了 Matter 开关支持。
http://x.com/i/article/2069439163758170112
谷歌开发者关系工程师 Justin Poehnelt 今年 3 月初用 Rust 创建了 Google Workspace CLI,支持命令行操作 Gmail、Drive、Calendar 等服务并内置 MCP 服务器。项目发布后登顶 Hacker News,GitHub 获两万多星。谷歌内部反应两极:高管主动请教,法务质疑品牌色。4 月 22–24 日 Google Cloud Next 大会官方宣布即将推出官方 CLI,两天后 Justin 被开除。他怀疑管理层害怕被 AI agent 颠覆。项目仍在 Google GitHub 组织下正常维护(26000+ 星)。
Two months ago I was fired by Google for creating the Google Workspace CLI. It went viral, hit #1 on Hacker News, gained...
Google AI for Developers 宣布在 Gemini API 中推出 Managed Agents,开发者只需一条提示即可构建自主智能体。该智能体能自动研究主题并从头制作广播节目,包括生成对话音频、音乐、专辑封面等。核心特性:零基础设施设置——API 自动创建安全的临时 Linux 沙箱;自主循环——智能体独立规划、自我纠错并执行代码;多步逻辑——通过 agents.md 和 skills.md 文件定义指令和工具,Gemini 优化理解后在一次 API 调用内完成全部任务。
🚨 SCOOP(s): - GPT-5.6 has been delayed and will no longer release this week. New target is ~mid-July. - DeepMind are no...
售价 99 美元的 Fitbit Air 是一款轻便手环,续航出色(一个月仅充电三次,45 分钟可充至 85%),支持心率、睡眠、血氧、准备度等指标。核心亮点是与 Google Health 绑定的 AI 健康教练,基于 Gemini 驱动,每日推送睡眠与准备度总结及行动建议,可解读数据趋势并生成旅行健身计划,但不提供诊断。该教练需 $99/年 Premium 订阅,且不独占于 Air。作者认为多数 AI 健康功能是“糟糕的贴金捞钱”,但 Google Health Coach 是其中最接近不糟糕的一款,前提是用户愿意投入大量精力进行引导。
🚨 SCOOP(s): - GPT-5.6 has been delayed and will no longer release this week. New target is ~mid-July. - DeepMind are no...
Today, the Interactions API is now generally available as our primary interface for Gemini models and agents. Built base...
欧洲自由软件基金会(FSFE)于6月15日向欧盟委员会提交意见,要求依据《数字市场法》加强管控谷歌安卓系统。FSFE指出,谷歌在未明确告知用户的情况下悄然安装AI模型,用户卸载后仍会重装,违反法案。建议欧盟施压谷歌整改AOSP,让用户完整移除预载AI组件,禁止未经知情重新安装或激活。同时要求谷歌扩展安卓互操作性,不应以注册、授权或签订合同为前提。此外,谷歌拟于2026年9月上线的开发者验证计划要求开发者登记并付费才能发布应用到F-Droid等替代商店,FSFE认为这对自由软件开发者不利。
Oracle披露过去12个月裁员2.1万人(13%),AI是原因之一;5月科技裁员创单月新高,AI最常被引用。GitLab裁员350人(14%)以资助AI基础设施;Google通过绩效评估和买断计划裁减Cloud部门,估计2026年裁减1500-3000+工程师;Intuit裁员3000人(17%);Meta裁员8000人(10%)并转岗7000人;Cisco裁员近4000人(5%)聚焦AI;Cloudflare裁员1100人(20%)。
Flashcards are now fully customizable. Edit questions, tweak answers, and add brand-new cards to create the ultimate set...
Google DeepMind 宣布 Interactions API 正式可用,成为 Gemini 模型和智能体的默认接口。该 API 自 2025 年 12 月进入 Beta 测试,现取代 Google AI Studio 和文档中的旧 generateContent 接口;未来新智能体功能仅通过它提供。近期新增功能包括:自带 Linux 沙箱的 Managed Agents、后台执行、Google 搜索与地图工具链、图像/音乐/语音媒体生成。架构从旧的 "user"/"model" 角色简化为 typed steps,每步动作独立定义。开发者可选择 Flex 模式(成本降低 50%)或 Priority 模式(优化速度)。
http://x.com/i/article/2069077093036576768
Google Interactions API 现已正式可用(GA),通过统一 /interactions 端点提供稳定 schema,同时支持模型推理与自主智能体。关键更新包括:Managed Agents — 单次 API 调用即可启动安全远程 Linux 沙箱进行代码执行与网页浏览,默认使用 antigravity-preview-05-2026 智能体或自定义指令;简化 schema — 每个操作作为独立 step 形成线性流;后台执行 — 设置 background=True 实现异步运行并轮询结果;扩展工具生态 — 原生支持 Computer Use、File Search、Google Maps,新增 Gemini API Docs MCP server 与 gemini-interactions-api Skill;媒体生成 — 基于 Google Search 的 Nano Banana 2 图像生成、Lyria 3 音乐生成及多说话人 TTS。
SpaceX 每月从 AI 算力服务获 23.2 亿美元,三家 AI 公司签约:Anthropic 月付 12.5 亿、Google 月付 9.2 亿、Reflection 月付 1.5 亿。正从航天公司向“AI+航天基础设施”转型,此收入已远超传统 NASA 合同和 Starlink 用户收入。
一篇技术博客展示了如何用 Google Agent Development Kit (ADK) 与 Agent2Agent (A2A) 协议搭建跨语言多智能体流水线:Python agent 调用 Gemini 解析合同条款,Go agent 用纯确定性逻辑校验合规性。A2A 协议通过 Agent Card 实现能力发现、JSON-RPC 2.0 完成通信、Task 状态机管理任务生命周期;ADK 的 RemoteA2aAgent 抽象可将任意 A2A 兼容服务封装成本地子智能体。文中强调将单体提示词分解为专业化微智能体,以解决上下文退化、故障爆炸半径和不可测试性问题。完整源码已在 GitHub 发布。
Google Labs 提出以“洞察策略”评估 AI 编码智能体的主动性,而非仅按任务完成度打分。团队基于 Google 内部代码库 705 个 bug(1178 个 CL),通过时空近邻与语义相似度聚类还原开发者实际的高层级目标。初步实验显示:Jules 在单轮探索下洞察相关性评分平均 4.5/5;探索预算从两轮增至三轮时,Hit@5 准确率从 33% 升至 57%。团队正将评估方法扩展至公开 GitHub 数据,并探索纳入问题追踪器、对话等更丰富的上下文。
谷歌 DeepMind 杰出工程师、Gemini 预训练负责人弗拉基米尔·费恩伯格在博客中指出,进入 OpenAI、Anthropic 等前沿 AI 实验室竞争激烈。顶尖大学生通常具备目标感、数学成熟度和毅力三项特质。他建议选择困难数学证明课程、大量编程,并牺牲夜晚和周末投入额外时间。求职者可从前沿实验室的业务边界(如基础设施或输出接入)寻找突破口,同时要成为同事愿意看到你成功的人,推动合作项目。
Google Deepmind与电影工作室A24建立长期研究合作伙伴关系,Google同时向A24投资约7500万美元。A24电影制作人将在日常工作中测试并帮助塑造AI工具,作为交换,Google Deepmind获得来自专业从业者的实际反馈。目前尚无具体产品或成果,双方表示将共同探索AI在电影制作中的可用方式。A24曾出品《瞬息全宇宙》及近期作品《Backrooms》。
谷歌云与诺基亚宣布扩展合作,将谷歌 Gemini 模型整合至 Nokia Assurance Center 网络软件套件。双方基于 Gemini 开发了六个专项 AI 智能体:路由智能体(核心编排)、事件分类智能体(告警分析与历史比对)、KPI 选择器智能体(解读性能指标)、异常推理智能体(判断数据偏差是否为故障)、动作推理智能体(匹配自动化操作目录)及仪表板智能体(自然语言生成可视化)。目标是为电信运营商降低运营成本、快速定位网络故障,推动网络运维向全自动化“自驾”模式演进。官方将于 6 月 23 日至 25 日在哥本哈根 DTW Ignite 大会现场演示上述智能体。
郭明錤6月22日称,谷歌将在TPU v9基础上升级推理优化版,代号或为“Triggerfish”,由联发科独家接单。该芯片旨在缓解“CPU墙”与“内存墙”,片内SRAM缓存为原版2~3倍,片外DRAM升级至HBM4E。预计2027年底投产、2028年底放量,生命周期出货100~200万颗,单价高出约三成。此外引入“simulation die”,可能用于本地TPU管理、训推切换等。
郭明錤产业调查显示,Google 在 TPU v9 (Humufish) 基础上开发升级版晶片 Triggerfish,由联发科独家代工。升级包括:SRAM 容量提升至 Humufish 的 2–3 倍、新增 simulation die(聚焦强化学习与 AI 代理协作)、内存升级至 HBM4E。Google 额外追加 100–200 万颗订单,单价较 Humufish 高约 30%。预计 2027 年底开始生产,2028 年放量。Humufish 生命周期出货量 400–500 万颗预估不变。
郭明錤爆料,Google基于TPU v9 / Humufish开发升级版芯片Triggerfish,由MediaTek独家代工。相比Humufish,Triggerfish的SRAM容量提升2-3倍,新增模拟die(用于强化学习和AI智能体协同),内存升级至HBM4E(Humufish为HBM4),强化推理能力以缓解CPU墙和内存墙。Humufish生命周期出货量约400-500万颗,Triggerfish追加订单100-200万颗,预计2027年底试产、2028年放量,单价高约30%,有望推动联发科2028年业绩增长。