4月9日

05:34

Sundar Pichai@sundarpichai

Google Gemini应用正式上线Notebooks（笔记本）功能，用户可将对话、笔记及其他资源按项目分类整理，实现高效管理。该功能支持与NotebookLM无缝切换，便于深度研究。目前该功能已开始向Google AI Ultra、Pro及Plus订阅用户推送，首批支持网页端使用。

Google 产品更新

关联讨论 1 条

01:17

Demis Hassabis@demishassabis

Demis Hassabis 做客 20VC 播客，与 Harry Stebbings 探讨 AGI 路径、AI 在科学医学中的应用及英国深科技潜力。主持人盛赞其历史地位堪比图灵、牛顿与爱因斯坦，并分享自己 11 年前在卧室无资金创办播客的创业历程。

Harry Stebbings: This sounds harsh but it is true, very few of the guests we have on 20VC will be remembered in history for truly progres...

DeepMind Google 大佬观点

00:00

Google Research：Blog（网页）

ConvApparel：测量并弥合用户模拟器中的真实感差距

Google Research 发布 ConvApparel 数据集与评估框架，用于量化 LLM 用户模拟器的"真实感差距"。该数据集包含 4000 余组服装购物多轮对话，采用"好/坏"双智能体协议收集，涵盖从满意到恼怒的全谱系用户行为。框架通过反事实验证测试模拟器对意外糟糕体验的适应能力，解决现有模拟器过于耐心、知识过剩等不现实问题，为训练更鲁棒的对话智能体提供可信的 AI 测试基准。

智能体 Google 数据/训练论文/研究

4月8日

23:09

Artificial Analysis@ArtificialAnlys

Artificial Analysis 发布 APEX-Agents-AA 排行榜，评估 AI 代理长周期专业任务能力

Artificial Analysis 发布 APEX-Agents-AA 排行榜，基于 Mercor 的 APEX-Agents 基准评估 AI 代理在长周期专业任务（投资银行、管理咨询、公司法）的表现。测试通过 Stirrup 框架和 MCP 工具执行 452 个任务，涵盖消息回复、文档处理等。结果显示 GPT-5.4 以 33.3% 领先，Claude Opus 4.6 (33.0%) 和 Gemini 3.1 Pro Preview (32%) 紧随其后，三强竞争激烈。评分采用 LLM 评判和 pass@1 标准。

智能体 Anthropic Google MCP/工具

08:56

Demis Hassabis@demishassabis

Demis Hassabis 与 Cleo Abram 对谈，探讨 AI 推动科学发展的最佳实践、AlphaFold 背后故事、药物发现前沿、AI 创造力进化、政府军事应用等议题，并畅想了人类与 AI 共存的科幻未来愿景。

Cleo Abram: What is the real future Google DeepMind CEO @demishassabis is trying to build? That's what we talk about in this HUGE* C...

DeepMind Google 大佬观点

03:32

Epoch AI@EpochAIResearch

Google 现象/趋势部署/工程

00:00

Google Research：Blog（网页）

改进学术工作流程：推出两款用于图表生成与同行评审的AI智能体

Google Cloud推出PaperVizAgent与ScholarPeer两款学术AI智能体。前者通过检索、规划、风格、可视化与批判五个专门智能体协作迭代，将论文文本转化为符合发表标准的图表，综合评分（60.2）显著超越人类基线（50.0）及GPT-Image-1.5等模型；后者模拟资深审稿人流程，动态构建文献背景并验证基线，实现基于实证的自动化同行评审。

智能体 Google 论文/研究

4月7日

22:03

swyx 🇬🇧@swyx

AI Engineer Europe Build Day公布六大技术分论坛议程

AI Engineer Europe Build Day公布六大技术分论坛，聚焦AI工程前沿实践。议程涵盖Personal Agent（Claw）个人代理、Context Engineering长上下文管理、Harness Engineering代理性能优化、Evals & Observability评估体系、Voice & Vision语音视觉多模态，以及Gemini专场。从OpenClaw到Google DeepMind，内容涉及RAG、TTS、ASR、WebMCP等技术方向，呈现AI工程从提示词向复杂代理系统演进的最新趋势。

swyx 🇬🇧: just went live on european TBPN! exclusive preview of the @aiDotEngineer Europe Build Day today

智能体 Google 多模态行业动态

07:22

Sundar Pichai@sundarpichai

Cheeky Pint 明日播出新一期，Sundar Pichai 与 Elad Gil、Collision 在酒吧录制 AI 对谈。嘉宾自嘲这是自己在酒吧谈论延迟预算最多的一次，节目氛围轻松随性。

John Collison: Tomorrow on Cheeky Pint: @sundarpichai gets into everything AI with @eladgil and me.

Google 大佬观点

06:39

Yuchen Jin@Yuchenj_UW

Anthropic 收入增速惊人，可能已超越 OpenAI 的 250 亿美元 ARR。其编程模型和企业策略成效显著，长期合同锁定用户难以转向 Codex。Claude Code 迭代速度极快，几乎日更。同时与 Google、Broadcom 签署协议，确保 2027 年起获得多千兆瓦 TPU 算力支持。

Anthropic: We've signed an agreement with Google and Broadcom for multiple gigawatts of next-generation TPU capacity, coming online...

Anthropic Google 编码行业动态