Google AI Developers@googleaidevs · 6月9日76

Our latest audio model, Gemini 3.5 Live Translate, takes real-time speech translation to the next level for developers by delivering low-latency translation across 70+ languages. By processing speech as it streams in near real time, the model enables devs to build low-latency audio experiences with: — Multilingual input: Understands multiple languages in a single session without needing to adjust settings. — Auto-detection: Identifies the spoken language and begins translation instantly. — Native audio processing: Generates more natural-sounding speech that preserves speakers' intonation, pacing, and pitch. — Noise robustness: Filters out ambient noise for clearer conversation in loud environments.

译Google AI 推出音频模型 Gemini 3.5 Live Translate，为开发者提供低延迟实时语音翻译，支持 70+ 种语言。模型具备多语言输入（同会话无需切换）、自动语言检测、原生音频处理（保留说话者语调、语速和音高）以及噪声鲁棒性（过滤环境噪音），可直接处理流式语音。

Google AI@GoogleAI · 6月9日85

Today, we released Gemini 3.5 Live Translate, our latest audio model for live speech-to-speech translation. It supports over 70 languages and starts translating as soon as you start talking, streaming translations while listening to what you say next. No awkward pauses or choppy audio, just real connection without language barriers. So, how does it work? 🤔 The model is able to make split-second decisions to juggle speed and translation quality so conversations actually feel fluid, human, and natural. In order to do this, the model must receive and contextualize the input while simultaneously outputting the translated speech. Through this process, Gemini 3.5 Live Translate manages to stay mere seconds behind each speaker and can even maintain pacing, pitch, and intonation across extended sessions. See it in action below, or try it yourself in the Google Translate app on iOS & Android.

译Google AI 推出 Gemini 3.5 Live Translate，一款面向实时语音到语音翻译的音频模型。该模型支持 70 多种语言，可在用户说话的同时开始翻译并流式输出译文，避免尴尬停顿或断续。模型通过毫秒级决策平衡速度与翻译质量，使对话流畅自然。它可边接收输入边输出翻译语音，延迟仅比说话者慢几秒，并能在长对话中维持语速、音高和语调。目前已在 iOS 和 Android 版 Google Translate 应用中上线。

Google DeepMind@GoogleDeepMind · 6月9日69

Say hello, hola, 你好 to Gemini 3.5 Live Translate: our latest audio model built for fast, cross-language communication. 🌐

译说 hello, hola, 你好——欢迎 Gemini 3.5 Live Translate：我们最新的音频模型，专为快速跨语言交流而构建。🌐

小互@xiaohu · 6月9日46

Google 的 Gemini 模型并不驱动 Siri Siri 是由苹果自研的的基础模型驱动 Siri 不过这个自研的的基础模型是通过Gemini蒸馏训练而来 Google 的Gemini 模型只在 Apple iCloud 上提供额外支持，而且也是苹果定制的，而且也不使用Google 的搜索来提供世界知识，由苹果自己的服务提供。感觉Google 又被耍了😂

译苹果Siri由自研基础模型驱动，但该模型通过Google Gemini蒸馏训练而来。Gemini本身不直接驱动Siri，仅在Apple iCloud上提供额外定制支持，且不接入Google搜索，世界知识由苹果自有服务提供。

fofr@fofrAI · 6月9日70

Agents, collect your power-up

译Google Colab CLI与Skills正式推出，用户可直接从终端使用完整Colab运行时，包括GPU/TPU分配（如colab --gpu A100）、远程脚本执行（colab exec）、交互式控制台/REPL访问以及内置智能体技能。只需告诉智能体“在此数据集上微调Gemma 3 1B”，它就会自动分配GPU、运行训练并下载适配器权重，全程自动化。智能体们，来领取你们的增强道具。

小互@xiaohu · 6月9日64

NotebookLM 迎来重大升级 · 底层模型换成 Gemini 3.5 + Antigravity · 每个Notebook自带云端电脑，能写代码做复杂分析，内置 100 多个技能 · 新增十几种输出格式：PDF、docx、Excel、PPT、图表、图片等，生成后还能再改 · 还打通了 Google 搜索让你不用自带资料也能开工

译NotebookLM 迎来重大升级。底层模型更换为 Gemini 3.5 和 Antigravity；每个 Notebook 自带云端电脑，支持写代码和复杂分析，内置 100 多个技能；新增十几种输出格式，包括 PDF、docx、Excel、PPT、图表、图片等，生成后可二次修改；还打通了 Google 搜索，用户无需自带资料即可开工。

AYi@AYi_AInotes · 6月9日65

Google DeepMind 的联合创始人兼 CEO Demis Hassabis说，我们正站在奇点的山脚， AGI大概在2030年，我们没有多少时间准备了。以前看别人聊AGI，我都当热闹看，直到看到Demis说这句话，我突然有点慌了， Demis一直偏保守，以前不这么说话的，作为目前全球 AI 领域最具科学背景和公信力的领军人物之一，Google DeepMind 的联合创始人兼 CEO，同时也是 Isomorphic Labs（专注于 AI 药物研发）的创始人兼 CEO，并担任英国政府 AI 顾问，以及拿过 AlphaFold 这种硬成果的科学家，他不是那种靠喊口号吃饭的人，然后在 Google I/O 和斯坦福对谈里，他说了这么一段—— 我们回头看，会意识到当时正站在奇点的山脚，AGI 大概在 2030 年左右，那将是新人类时代，社会需要听到这个信号，因为我们没有多少时间准备了。为什么他这次改口，比一般 CEO 喊 AGI 更值得听，详细拆解如下👇

译Google DeepMind CEO Demis Hassabis在Google I/O和斯坦福对谈中称，我们正站在奇点山脚，AGI约2030年出现，将进入新人类时代，社会需重视并做准备。这位一向保守的科学家此次改口引发广泛关注。

Berryxia.AI@berryxia · 6月9日61

兄弟们！Google NotebookLM 大更新了！ NotebookLM一夜之间从你的笔记小助手！直接进化成能独立带你搞定复杂多步研究的agent，把一堆靠云端幻觉混日子的研究工具直接干沉默了。官方这次升级很大：聊天里塞进agentic能力、更狠的推理逻辑，还有一整套新输出格式。以前那种得手动来回好几轮、层层推进的硬骨头研究，现在它直接自己拆任务、自己推理、自己输出。并且它还能从网上挖新资料给你加进来，但真正生成答案、做报告的时候，死死只认你自己选好、批准过的来源，一点都不乱编。以前大家以为Agent AI就等于高风险幻觉，结果NotebookLM用这个方式告诉你：真正牛的agent不是胆子大，而是把“靠谱”当成底层铁律，然后再给你agent级生产力。这波升级一出，研究、生产、学习这些活儿，彻底从“人机对话”变成“人机搭档”了。减少幻觉，提供置信度高的来源。可以体验一下～

译Google NotebookLM 迎来重大升级，在聊天中注入智能体（agentic）能力、更先进的推理逻辑以及一整套新输出格式。它可自主拆解复杂多步研究任务，逐步推理并生成结果；能主动从网络挖掘新资料，但最终答案严格基于用户批准过的来源，大幅减少幻觉。这让人机协作从“对话”升级为“搭档”。该更新已面向 Google AI Ultra 订阅用户逐步推送。

NotebookLM@NotebookLM · 6月9日72

Want a closer look at today’s launch? Here is a breakdown of what’s new and exciting 🧵: First up: An upgraded, more thoughtful chat experience. Powered by Gemini 3.5 and @Antigravity, you will now have better visibility into the AI's thinking process. Plus, each notebook has a secure cloud computer including 100+ curated software skills, unlocking deeper research and more complex analysis.

译想更详细了解今天的发布吗？以下是新功能和亮点的介绍🧵：首先：升级版、更周到的聊天体验。由Gemini 3.5和@Antigravity提供支持，您现在将更清晰地看到AI的思考过程。此外，每个笔记本都有一台安全的云电脑，包含100多种精选软件技能，解锁更深入的研究和更复杂的分析。

🚨 AI News | TestingCatalog@testingcatalog · 6月9日55

A new image Playground on iOS 27 Beta says that image model behind the scenes is from Google. However, on test prompts results look quite different from Nano Banana and Imagen. This Liquid Glass bubble is cool 👀

译iOS 27 Beta 中的一个新图片游乐场显示，其背后的图像模型来自 Google。然而，在测试提示下，结果与 Nano Banana 和 Imagen 相比截然不同。这个液态玻璃泡泡很酷 👀

Chubby♨️@kimmonismus · 6月9日73

Apple: “Our most powerful on-device AI model runs on iPhone 17 Pro.” Me: Great, I have one. Apple: “Do you live in Europe?” Me: …

译Apple 在 WWDC 2026 推出基于 Google Gemini（多年度协议，据报约每年 10 亿美元定制大模型）与自研端侧 Foundation Models 的全新 Siri AI，支持屏幕感知、个人上下文搜索、跨应用操作及独立 Siri app（iCloud 同步对话历史）。Apple Intelligence 还包括 Photos Spatial Reframing、Safari 页面监控、Messages 一键建议、Image Playground 照片级生成等功能。最强端侧 AI 模型仅运行在 iPhone 17 Pro 上，且初期不在欧盟推出。隐私端强调数据仅用于执行请求，可被外部专家验证。

AYi@AYi_AInotes · 6月9日45

吹了半天，合着就是专门来扎我们 Pro账号的是吧😭

译NotebookLM 推出重大升级，新增聊天中的智能体能力、更高级推理以及一系列新输出格式，现已面向 Google AI Ultra 订阅者开放。有用户吐槽：吹了半天，合着就是专门来扎我们 Pro 账号的是吧😭

Josh Woodward@joshwoodward · 6月9日67

The new killer NotebookLM feature: easily being able to expand your search beyond your own source files Then, with today's update, you can also make new output formats: PDFs, DOCX, XLSX, PPTX, charts, etc. We want NotebookLM to keep helping you do better research

译NotebookLM 今日迎来重大升级，对话中新增智能体能力与更强推理，并可搜索用户源文件之外的网络内容。同时支持导出为 PDF、DOCX、XLSX、PPTX 及图表等新格式。该更新已向 Google AI Ultra 订阅者开放。

🚨 AI News | TestingCatalog@testingcatalog · 6月9日69

WWDC 🔥: A new Apple Intelligence powered by Gemini, conversational Siri AI, updated image editing, and loads of AI features across many Apple apps. Siri AI will launch in beta later this year. Initially, Siri AI won't be available in the EU.

译WWDC 🔥：全新Apple Intelligence由Gemini驱动，对话式Siri AI，更新的图像编辑，以及众多苹果应用中的大量AI功能。 Siri AI将于今年晚些时候以测试版形式推出。初期，Siri AI将不会在欧盟上线。

🚨 AI News | TestingCatalog@testingcatalog · 6月9日68

WWDC 🔥: New Apple Intelligence is built on top of Apple Foundation and Gemini models! Let's see what's inside 👀

译WWDC 🔥：新的Apple Intelligence基于Apple Foundation和Gemini模型！让我们看看里面有什么👀

Google Gemini@GeminiApp · 6月9日54

We asked Gemini 3.5 Flash to bring back the classic early-2000s PC drawing experience, and it delivered in one shot. What are you building first with Canvas?

译我们让 Gemini 3.5 Flash 重现经典早期 2000 年代 PC 绘图体验，它一次就做到了。你打算先用 Canvas 构建什么？

NotebookLM@NotebookLM · 6月9日67

Forget about our users? Who? Us??? Please. These updates are rolling out globally on the web starting with Google AI Ultra and all Workspace business customers with AI Ultra Access and AI Expanded Access, however we *absolutely* plan to expand to others over time!

译NotebookLM 迎来重大更新，在对话中新增智能体能力、更高级推理及多种新输出格式，旨在简化复杂多步骤研究。该更新面向 Google AI Ultra 订阅者以及拥有 AI Ultra Access 和 AI Expanded Access 的 Workspace 业务客户率先推出，后续计划扩展至更多用户。

🚨 AI News | TestingCatalog@testingcatalog · 6月9日48

GOOGLE 🔥: @NotebookLM now supports advanced agentic reasoning in chat and new output formats, including Excel sheets and images. Only Ultra subscribers 👀

译GOOGLE 🔥: @NotebookLM 现在在聊天中支持高级智能体推理，并新增了包括 Excel 表格和图片在内的输出格式。仅限 Ultra 订阅用户 👀

Chubby♨️@kimmonismus · 6月9日63

What many misunderstand: Apple doesn't actually need the best model in the world. It's similar to Meta. Their model only needs to be good enough for 99% of everyday use cases. They don't even want to compete with Frontier Labs, but primarily reach the consumer market. And Apple actually has a good chance there. Because a well-adapted Gemini model, based on (3.1/3.5?) and well integrated into the OS, could achieve exactly the use case that many need: AI that simplifies their daily work.

译苹果在WWDC 2026上承认无法独立构建前沿AI，转而与Google合作。新Siri将基于定制1.2T参数Gemini模型（版本或为3.1/3.5），每年花费约10亿美元（Gurman）。Siri作为独立应用，支持iMessage式聊天、动态岛弹窗、扩展系统及邮件/日历/网页查询，运行在Private Cloud Compute上，Google不会用查询数据训练。苹果策略类似Meta——模型只需满足99%日常场景。iOS 27被定位为“雪豹”式清理更新，放弃iPhone 11和SE2支持，并可能允许用户选择AI引擎（Gemini或Claude）。

NotebookLM@NotebookLM · 6月9日72

Introducing a more powerful NotebookLM 🚀 Massive upgrades deliver agentic capabilities in chat, more advanced reasoning, and a suite of new output formats. Tackling complex, multi-step research problems has never been easier. Rolling out now to Google AI Ultra subscribers.

译推出更强大的 NotebookLM 🚀 重大升级带来了对话中的智能体能力、更高级的推理以及一系列新的输出格式。处理复杂的多步骤研究问题从未如此简单。现已面向 Google AI Ultra 订阅者推出。

🚨 AI News | TestingCatalog@testingcatalog · 6月8日42

NotebookLM updates soon 👀 We are expecting Gemini 3.5 Flash and Gemini Omni upgrades, aside a bunch of new features. Which ones do you want the most?

译NotebookLM 即将更新 👀 我们期待 Gemini 3.5 Flash 和 Gemini Omni 升级，此外还有一堆新功能。你最想要哪个？

Chubby♨️@kimmonismus · 6月8日54

WWDC 2026 - Apple rents Google's brain to fix Siri. What we can expect: Apple's keynote today is a software reset built around one admission: it couldn't build frontier AI alone. What to expect: - Gemini-powered Siri, a rebuilt assistant on a custom 1.2T-parameter Google model, ~$1B/year (Gurman). Runs via Private Cloud Compute, no Google training on your queries. - Siri as an app, standalone, iMessage-style chat with synced history, a "Search or Ask" Dynamic Island pop-up, and an Extensions system. Drafts emails, pulls from mail, calendar, contacts and the web. - Six OS betas - iOS 27, iPadOS 27, macOS 27 ("Big Bear"), watchOS 27, tvOS 27, visionOS 27. iOS 27 is a "Snow Leopard" cleanup release. iPhone 11 and SE2 lose support. - Liquid Glass 2.0 - system-wide opacity slider, fixes for the shadow and transparency complaints. - AI health coach - the watered-down "Health+", now fitness and wellness instead of an AI doctor (pretty cool!) - Model choice (rumored), users may pick the engine behind Apple Intelligence, with Gemini and Claude floated. - Hardware mostly later - M5 Macs, new iMac, foldable iPhone (~$2.5K, Sept), OLED touchscreen MacBook Pro, smart-home hub. Sources: TechInsider, Bloomberg, Gamebezz

译苹果在WWDC 2026承认无法独自构建前沿AI，与Google合作，基于1.2T参数的Gemini模型重建Siri，年费约10亿美元。新版Siri通过Private Cloud Compute运行，谷歌不训练用户数据；Siri成为独立应用，支持聊天、同步历史、Dynamic Island弹出和扩展系统，可起草邮件并获取信息。六个OS beta发布，iOS 27为Snow Leopard清理版，iPhone 11/SE2失去支持；Liquid Glass 2.0透明度滑块；Health+改为健身聚焦；用户或可选AI引擎（Gemini或Claude）。硬件稍后推出。

Rohan Paul@rohanpaul_ai · 6月8日59

The Information reports that Google has picked Intel to manufacture 3M+ Google TPUs in 2028. Great win for Intel foundry that would make Intel a factory for one of Nvidia’s biggest AI challengers. Intel’s foundry bet is to become a second source for those chips, which matters because relying too heavily on TSMC creates a supply choke point for Google, Nvidia, Apple, Tesla, and others. Rising chip demand from the AI boom has made it hard for TSMC to secure enough supply, pushing several major AI chip design firms toward Intel. --- theinformation .com/articles/google-nvidia-consider-intel-backup-chip-manufacturer

译The Information报道，Google已选择Intel在2028年为其制造超过300万块Google TPU。这对Intel代工业务是重大胜利，使其成为Nvidia最大AI挑战者之一的芯片工厂。Intel代工的目标是成为这些芯片的第二来源，因为过度依赖台积电会造成Google、Nvidia、Apple、Tesla等公司的供应瓶颈。AI热潮推动芯片需求激增，台积电难以保证足够供应，正促使多家大型AI芯片设计公司转向Intel。

Chubby♨️@kimmonismus · 6月8日53

Intel shares jumped on the report that Google and Nvidia are testing it as a backup foundry, with Google already ordering more than three million TPUs for 2028. The move is less about an Intel turnaround and more about TSMC's capacity crunch, since its leading-edge and advanced-packaging lines are fully booked in the AI boom. Intel's opening is EMIB packaging plus early 18A trials, which would make it a credible second source if SK Hynix's memory tests work out. Do we see a big intel comeback?

译Intel shares jumped on the report that Google and Nvidia are testing it as a backup foundry, with Google already ordering more than three million TPUs for 2028. 英特尔股价因报道称谷歌和英伟达正在测试其作为备用代工厂而上涨，谷歌已为2028年订购超过300万个TPU。 The move is less about an Intel turnaround and more about TSMC's capacity crunch, since its leading-edge and advanced-packaging lines are fully booked in the AI boom. Intel's opening is EMIB packaging plus early 18A trials, which would make it a credible second source if SK Hynix's memory tests work out. 此举更多是由于台积电产能紧张（其先进制程和先进封装线在AI热潮中已被完全预订），而非英特尔翻身。英特尔的机遇在于EMIB封装加上早期18A试验，如果SK海力士的内存测试成功，它将成为一个可靠的第二供应商。 Do we see a big intel comeback? 我们会看到英特尔大回归吗？

郭明錤｜Ming-Chi Kuo@mingchikuo · 6月8日60

WWDC26 won't change Apple's positive 2H26 share-price trend, but it will test the staying power of the bull narrative ‒‒ 1. Apple's core bull narrative right now is an almost intuitive market consensus that few people push back on: "Even if Apple is temporarily behind on AI, it will ultimately catch up and come out ahead." 2. Based on my latest supply-chain checks, I believe Apple's business momentum will remain strong through year-end, which should further reinforce the narrative into something like: "If Apple is doing this well without AI, just imagine once it has AI." 3. So regardless of what Apple says at WWDC26, as long as this core bull narrative stays intact, Apple's positive 2H26 share-price trend is unlikely to change. 4. That core bull narrative has its weak spots, but I think it has a good chance of holding at least through end-2026. How much longer it can last is what makes WWDC26 genuinely worth watching. 5. The key takeaway from WWDC26 will not be the short-term share-price reaction after the event. It will be whether Apple, using the same Gemini, can deliver better AI applications, agentic workflows, and on-device & cloud hybrid experiences than Google. 6. If the answer is yes, it would help extend Apple's core bull narrative. If the answer is no, it would suggest that Gemini sets the ceiling for Apple's AI experience. The stock may not necessarily turn bearish, but the "Apple will ultimately come out ahead" narrative would start to face growing scrutiny.

译郭明錤指出，苹果核心看涨叙事是“AI暂时落后但最终会迎头赶上”。供应链显示业务势头年底前强劲，强化“无AI已不错，有AI更想象”叙事。故无论WWDC26内容，只要叙事不变，苹果2026下半年股价趋势积极。WWDC26真正看点在于苹果能否用同款Gemini做出比谷歌更好的AI应用、智能体工作流及端云混合体验。若能，叙事延续；若不能，Gemini设定AI上限，“苹果最终领先”将受质疑。

小互@xiaohu · 6月8日57

http://x.com/i/article/2063870567355400192 # Google 发布 Agentic RAG ：搜不全就接着搜的"质检 Agent" 准确率提升 34% Agentic RAG 跨库检索是 Google 给企业问答场景做的一套检索框架，靠多个 AI Agent 分工协作：让系统自己判断"搜到的资料够不够回答这个问题"，不够就带着线索回去接着搜，凑齐了再开口。 - 它针对一个老毛病：传统 RAG 搜一轮就回答，可信息往往分散在不同数据库里，结果要么给半截答案，要么干脆甩一句"没找到"。 - 真正的新东西是一个叫 Sufficient Context Agent 的"质检员"，专门检查信息够不够、到底缺哪一块，再让系统带着具体反馈回去补搜。 - 在 FramesQA 多跳问答测试里，准确率比传统 RAG 最高提升 34%；要从 4 个数据库里挑对地方检索时，仍能答对 90.1%，而且速度几乎没变慢（平均差距 3% 以内）。一位医生在系统里输入：John Doe 做完膝盖手术，出院后用什么药、有什么饮食限制、住院期间有没有出现过敏反应？系统转一圈回来：用药列在这里，低钠饮食列在这里。至于过敏，没找到。麻烦就在这。过敏记录其实在档案里，只是没躺在最显眼的那几份文件里。系统第一遍没翻到，就当它不存在，干脆利落交了一份缺了一块的答案。对医生来说，“没查到过敏”和“没有过敏”是两回事，差这一点可能就是一次用药事故。我们现在多少都在用“能查资料的 AI 助手”，也多半都遇过这种半个答案：问它一个稍微绕点的问题，它信心十足回你一段，看着挺像样，仔细一对，漏了关键一块，或者干脆编了一块。 Google Research 和 Google Cloud 在六月初联合发布了一套新框架，专门治这个毛病，名字叫智能体检索增强生成（Agentic RAG），目前在 Gemini Enterprise Agent Platform 上以公开预览（public preview）开放。它真正的新东西不是“搜得更强”，而是一个听起来很朴素的能力：让系统知道自己没找全。 ## 先说清楚：RAG 是什么，为什么它会一本正经地胡说大语言模型（Gemini、GPT、Claude）有个天生缺陷：知识是训练时“背”下来的，背完就定格了。你问它公司昨天的财报、病人上周的检查结果，它压根不知道。检索增强生成（RAG）就是给模型外挂一个能随时翻阅的资料库。你提问时，系统先去库里搜出相关片段，连同问题一起塞给模型，让它“看着资料回答”。企业查内部文档、客服查产品手册、医院查病例，全靠这套机制。问题出在一个魔鬼细节上：模型答得好不好，全看塞给它的资料够不够。资料齐全，它头头是道；资料缺了一块，它不会停下来说“我手上的材料不够”，而是拿着残缺资料继续编，把缺的那块用想象补上。这就是“幻觉”。更要命的一点后面会讲到：喂资料有时反而让它编得更凶。传统的 RAG 是“一步到位”式的：看一眼问题，去库里捞一把相关文档，丢给模型，完事。应付简单问题没问题，但企业里的问题往往一步查不完。 Google 博客里的例子：你问“Project X 用的服务器是什么配置？”系统找到了 Project X 的文档，可里头只写了一个服务器编号（ID），真正的配置参数存在另一个数据库，得拿这个 ID 再去那边查一次。传统 RAG 不做这第二步——它捞到文档发现没配置，就给你“半个答案”或一句“没找到”，不知道手里那个 ID 是把钥匙，更不知道还有另一扇门要开。信息散落在一座座彼此不通的“数据孤岛”上，传统 RAG 只在第一座岛上找。 ## 把多智能体系统想成一个有分工的研究部门 Google 这套框架的第一层改造，是不再让一个“搜索引擎”单打独斗，而是组一支有分工的研究团队。传统 RAG 像个实习生：给他一个问题，他跑去档案室抓一把看着相关的文件就回来了。而这套多智能体（multi-agent）框架更像一个真正的研究部门，里面好几个角色各司其职： - 编排者（Orchestrator）：部门主管。看一眼问题先做个判断“这不是一步能干完的活”，然后把任务拆开、分派下去。 - 规划智能体（Planner）：制定路线的人。你问一个项目的预算和进度，他会规划“先查财务库，再查项目管理日志”，哪个信息在哪儿、按什么顺序取，由他安排。 - 查询改写智能体（Query Rewriter）：翻译官。把含糊的话改成精确搜索词——你随口一句“Project X 怎么样了”，他拆成“Project X 第三季度状态报告”和“团队的关键阻塞”，机器照这种精确的词去搜，命中率高得多。 - 搜索扇出智能体（Search Fanout）：同时跑腿的人。把改写好的多条查询一次性并行发给多个资料源，把片段都收集回来。 - 综合智能体（Synthesis）：最后执笔的人。材料齐了，由他把所有片段整合成一份干净、准确的答案。到这一步你可能觉得，多请几个人分工干活，也只是把传统 RAG 做得精细了点，市面上别家的“多智能体 RAG”也是这个路数。 Google 这套真正不一样的地方，是下面这个。 ## 核心创新：一个站在流水线尽头的“质检员” 这个新角色叫充分上下文智能体（Sufficient Context Agent），是这套框架和别家最不一样的地方。最直白的比喻：它是站在流水线尽头的质检员。别的环节都在埋头搜资料、攒材料，只有它专管一件事：在答案生成之前，检查手里这堆材料到底够不够回答问题。它和其他多智能体 RAG 的根本区别，Google 用一个词概括：持续性（persistence）——发现信息不够时，它会让系统回去接着搜，直到材料凑齐为止，而不是两种偷懒做法二选一：要么第一次没搜到就硬着头皮瞎编，要么干脆甩一句“我没有足够的信息”。后面这句看着挺诚实，其实常常是另一种失职：信息明明就在库里，只是第一遍没翻到。该接着找的时候放弃，和该停的时候硬编，是同一个病的两种症状——系统不知道自己手里到底缺什么。这位质检员具体查三件事：第一，检查捞回来的资料片段。它去读搜索智能体从库里实际拉出来的文本块，比如医生那例子里“出院小结”和“营养记录”的具体段落，一句句读，判断回答这个问题需要的信息到底在不在这些句子里。第二，对照一份“粗稿”。系统先用现有材料生成一份草稿答案，质检员把三样东西摆一起看：原始问题、这份粗稿、捞回来的资料片段。问题问了三件事（用药、饮食、过敏），材料里只有两件，它立刻标记“上下文不充分”。第三，也是最关键的：缺失分析。质检员不会只甩一句“材料不够”就完事，那等于没说。它会生成具体的原因和反馈，精确指出缺的是哪一块、回去该搜什么。还是医生那例子，它发现过敏记录缺失后，输出不是“信息不全”，而是这样一段： > 已有的：用药清单和低钠饮食说明。缺的：源文件里关于住院期间过敏反应或不良事件的信息。怎么办：回去专门搜“皮疹”或“不良事件”。有了这条精确反馈，查询改写智能体立刻据此造一条新搜索，搜索智能体回头深挖第一遍忽略掉的那些文件，这次找到了过敏记录。质检员再核一遍，确认用药、饮食、过敏三样齐了，才放行。整个流程一共五个阶段：编排 → 搜索 → 充分上下文检查 → 迭代 → 综合。前两步别家也有，真正让它和“瞎猜”或“放弃”分道扬镳的，是中间那个会反复较真的质检员。 ## 整套思路的起点：相关，不等于够用这套思路背后，藏着一个非常出人意料、也非常容易被忽略的判断，它来自 Google 一年前的一篇前作研究。这才是整件事真正的思想源头。过去人们衡量“搜来的资料好不好”，几乎只看一个指标：相不相关。资料跟问题沾边，就算搜得不错。但 Google 这帮研究者说，相关是个错的尺子，真正该问的是另一个问题：这些资料够不够回答问题？相关，和够用，是两码事。看一个例子就懂问题是：404 报错（网页打不开时常见的“页面未找到”）这个编号，据说是以某个实验室里编号为 404 的房间命名的，那个存放着错误信息中央数据库的房间，在哪个著名实验室里？来看两段都“相关”的资料：第一段： 404 报错得名于 CERN（欧洲核子研究中心）的 404 号房间，那房间当年存放着错误信息的中央数据库。第二段： 404 报错表示网页服务器找不到你请求的页面，原因可能有很多：网址打错了、页面被移动或删除了，或者网站临时出了点问题。你看，第二段和这个问题极其相关，确实在讲 404 是什么，任何一个只看“相不相关”的系统都会觉得它是个好结果。但它回答不了那个问题：404 房间到底在哪个实验室？答案（CERN）压根不在这段话里。这就是“相关但不够用”。系统失败，往往不是因为搜来的东西不相关，而是它把“相关”当成了“够用”，拿着一堆沾边但答不了题的资料，就大模大样地开始编答案了。那篇前作还证明了一件挺关键的事：判断“上下文充不充分”，机器是能做到的，而且做得相当准。他们造了个自动评分器（autorater），专门给“问题—资料”这一对打分，准确率至少有 93%。最有意思的是，效果最好的不是什么专门训练过的模型，而是直接拿 Gemini 1.5 Pro 写个提示词去问，连微调都不用。也就是说，“判断自己缺没缺信息”这件事，现成的大模型本来就会，只是过去没人专门让它去做。 ## 最让人意料之外的发现：喂资料反而让它编得更凶还挖出两个让人意外的发现，直接解释了 RAG 为什么这么不靠谱。第一个：顶级大模型普遍“不会认怂”：拿 Gemini、GPT、Claude 这几个最强的模型做测试，结论很一致：它们资料充足时答得非常好，却普遍缺乏“识别资料不够”的能力。该弃权时不弃权，材料明明残缺，照样信心满满给你一个答案。会答题，但不会说“我不知道”。第二个，是全文最出人意料的数字：直觉上，多喂点资料总该答得更准，研究者发现恰恰相反：喂了不充分的资料，模型反而更容易胡说。一个叫 Gemma 的模型，在完全不给资料时答错率是 10.2%，可一旦喂给它不充分的资料，答错率直接飙到 66.1%——翻了六倍多。为什么？研究者的解释是：额外的资料抬高了模型的“自信”。它面前摆着一堆看起来相关的材料，于是更倾向于相信“我手上有料，能答”，更愿意去编一个答案，而不是老老实实承认“我不知道”。资料越多，它越敢编。两个发现合在一起，把问题的本质点透了：RAG 不靠谱，真正的病根不是“搜得不够强”，而是系统不知道自己没找全。它分不清“相关”和“够用”，又天生不会认怂，手里材料一残缺，第一反应不是回去补，而是自信地往下编。 ## 实验：在 824 道刁钻题上，准确率最高提了 34% 光讲道理不够，看 Google 自己跑出来的数据。他们用了一个叫 FramesQA 的评测集，专门挑那种“一步答不出来”的多跳问题，一共 824 道题，配一个装着 2676 份 PDF 文档的资料库。题有多刁钻？看一道样例： > 截至 2024 年 6 月，收视率最高的两个电视剧大结局里，哪一个时长更长，长多少？人来答这道题得分三步：先认出“收视最高的两个大结局”是哪两部剧（《陆军野战医院》和《干杯酒吧》），再分别查到它们的时长，最后算差值。任何一步断了，整道题就废了。传统 RAG 碰上这种题常卡在中间，给一句“反复检索后，我没找到明确时长”。而 Google 这套靠着查询改写和那位质检员，会先搜出是哪两部剧，再发起一次专门针对时长的精确搜索，最后由 Gemini 算出“前者大结局 150 分钟，是两者中更长的，比后者长 52 分钟”。这就是“持续性”的价值：第一遍没查到不是终点，而是再搜一轮的起点。放大到 824 道题的规模上，对比标准 RAG，这套框架在事实性数据集上的准确率最高提升了 34%。这里的“标准 RAG”不是个软柿子：它用的是 Google 自家的 Vertex AI RAG Engine，本身就带了高级检索、大模型解析和重排序。能在这么强的底子上再提 34%，说明这提升是充分性检查加反复补搜实打实挣来的，不是靠垫高弱对手刷出来的。还有一个更能说明问题的设置：跨库检索。研究者故意往资料库里额外混进 3 个不相干的“干扰数据集”，逼着规划智能体必须先判断“这道题该去哪个库取料”，模拟的是真实企业里不同数据库分属不同团队、散落各处的常见局面。结果是：即便要从 4 个库里选对那一个，系统仍然答对了 90.1%，几乎追平了只在单一库里检索的成绩——多了一道“找对库”的难关，准确率几乎没掉。 ## 另一面：有点贵，还有点慢智能体 RAG 更准，是因为派了一支团队反复搜、反复查、反复迭代。每多一个智能体、每多一轮迭代，都是实打实的算力和时间。综合行业经验，相比传统 RAG，它通常要多烧 3 到 10 倍的 token、延迟增加 2 到 5 倍。按每天 1 万次查询估算：传统 RAG，每日成本约 $500，单次响应时间 1 - 2 秒智能体 RAG，每日成本约$1500 - $5000，单次响应时间，8 - 12 秒。 8 - 12 秒，对一个等答案的人已经到了怀疑系统是不是卡死的临界点；成本翻几倍，放到日查询百万次的业务上，就是按月几十万美元的差距。这里有个数字特别要小心。Google 强调：跨库版本比单库版本，延迟只多 3%。听起来很漂亮，多查好几个库几乎不拖慢速度。但这个 3% 是障眼法。它比的是「智能体 RAG 跑单库」和「智能体 RAG 跑跨库」，两边都是智能体 RAG，只是配置不同，差距当然小。真正该问的是另一件事：智能体 RAG 比传统 RAG 慢多少？答案就在上面那张表里，1-2 秒变成 8-12 秒，慢了好几倍。Google 用一个 3% 的小数字，把「比传统方案慢好几倍」这个大事实轻轻绕了过去。另外，那些准确率数字（34%、90.1%）也是 Google 用自家「大模型当裁判」（LLM-as-a-judge）评出来的，是公开预览阶段的产品口径，不是中立第三方复现的结果，看的时候自己打个折。 ## 谁能用、怎么用、还差什么这个功能现在是 Gemini Enterprise Agent Platform 上的公开预览。Gemini Enterprise Agent Platform 是 Google 今年 4 月 22 日在 Cloud Next '26 上推出的平台，本质是 Vertex AI 的升级换代版，主打企业级 AI Agent 的搭建、治理和扩展。入口在 RAG Engine 的 Cross Corpus Retrieval（跨库检索）文档里。值得用的场景： - 多跳问题：答案散在多个数据源里，要查好几步、再做推理才能拼出来； - 模糊查询：用户问得含糊，需要先改写、再澄清才知道到底在问什么； - 高风险领域：法律、医疗、金融，答错的代价极高，慢一点、贵一点完全能接受，换来的是少出一次致命错误。医生查病例那个开场例子，正落在这一类里：宁可多花八秒、多烧几倍 token，也不能漏掉一条过敏记录。不值得用的场景： - FAQ 机器人、单一事实查询：答案就在某一个自包含的资料块里，一步就能捞到； - 速度或成本敏感的场景：用户等不起十秒，或者预算扛不住翻几倍，这时候传统 RAG 更快、更便宜，也更实际。拿一支研究团队去回答一句 FAQ，是杀鸡用牛刀。原文：https://research.google/blog/unlocking-dependable-responses-with-gemini-enterprise-agent-platforms-agentic-rag/

译Google 发布 Agentic RAG 框架，核心新增 Sufficient Context Agent，负责在生成答案前检查检索材料是否充分，若不充分则生成缺失分析并引导系统迭代搜索。在 FramesQA 多跳测试中准确率最高提升 34%，从 4 个数据库检索时正确率达 90.1%，速度仅慢 3% 以内。该设计基于前作发现：Gemini 1.5 Pro 判断“上下文充分性”准确率达 93%，且“相关≠够用”是幻觉关键原因。目前以公开预览在 Gemini Enterprise Agent Platform 开放。

Logan Kilpatrick@OfficialLoganK · 6月8日18

bullish on Gemini

译看好 Gemini

François Chollet@fchollet · 6月8日21

I wrote my first neural networks in pure C, then in Matlab, then in NumPy, before eventually upgrading to Theano. Since then I have seen and tried pretty much every NN framework ever developed. Some are bad, some are good. The good ones understand API design principles.

译我最初用纯C写神经网络，然后在Matlab里写，接着在NumPy里写，最后升级到Theano。从那以后，我见过并尝试过几乎所有开发出来的NN框架。有些很烂，有些很好。好的框架都理解API设计原则。

Berryxia.AI@berryxia · 6月8日14

Google 3.5 Pro 看来真的是没有能打的了！只能拿这种测试来“蒙骗”大众了。 Google 大善人醒醒啊，你看看隔壁即将发布的是啥模型和自己家的这对比下啊！ 😑

AYi@AYi_AInotes · 6月8日62

Google的研究找到了一种把 AI记忆大幅压缩的技术，让本地跑大模型 + 自己数据变得更容易了。也就是说可以把 1000 万个文档的向量存储，从 31GB 内存压缩到只剩 4GB，而且搜索速度还比现在最常用的 FAISS 更快。

译Google提出一种AI记忆压缩技术，可将1000万个文档的向量存储从31GB内存压缩至仅4GB，且搜索速度超过目前最常用的FAISS方法。该技术使本地运行大语言模型并结合个人数据变得更加可行。

AYi@AYi_AInotes · 6月8日69

http://x.com/i/article/2063647311423561728 # 免费白嫖顶级AI额度的N个隐藏入口（Codex Pro半年/Anything AI 20K/Lenny's bundle/云startup credits）现在玩 AI，最烧钱是Token额度，GPT-5.5、Claude Opus4.8，一个比一个能打，也一个比一个贵,想认真用上一阵，账单就能直接把你劝退了。但说实话，市面上一直有几个官方自己留的口子，赠金从几百刀到几十万刀不等。知道的人闷声用着，不知道的人月月真金白银往里充。这篇我就把查到的几个靠谱入口，一个个拆开说清楚——怎么申请、适合谁、坑在哪，跟着操作就行。先把难听的说在前头：这世上没有纯粹白给，每个口子都有它的门票。有的门票是“你得是开源作者”，有的门票是“你得先掏 200 刀订阅费”，有的门票是“你得算个创业公司”。下面每一条，我都会把门票和限制条件一起摊出来，大家自己结合自己情况评估。 ## 这篇讲哪几块 - 入口一：OpenAI「Codex for OSS」——开源作者免费拿半年 ChatGPT Pro（约值 $1200） - 入口二：Anything AI——新用户注册薅 2 万额度（官方默认才给 3000） - 入口三：Lenny's Product Pass——一份订阅换 $30000+ 的 AI 工具全家桶 - 入口四：三大云的 startup credits——AWS / 微软 / 谷歌，最高单家几十万刀 - 最后给你一张对照表 + 一段申请话术，直接抄 ## 先看全局：四个口子到底给什么动手之前，先用一张表把你心里的地图建起来。别一上来就闷头点链接，先看清哪个口子真适合你。人话总结这张表怎么用：想纯免费、零门槛 → 看 Anything；自己有开源项目 → 冲 Codex；愿意花点小钱换一堆工具 → 看 Lenny；在搞创业/产品 → 云额度才是大头。记住一句口诀就够了：白嫖的本质不是省钱，是把"门票"对上"身份"。下面挨个拆。 ## 入口一：Codex for OSS——开源作者的半年 Pro 这个口子是 OpenAI 自己开的，2026 年 3 月官宣，叫 Codex for Open Source。它给的东西挺实在：半年的 ChatGPT Pro（带 Codex），也就是那个 $200/月的顶配档，免费用 6 个月，算下来约 $1200。除此之外，符合条件的项目还能额外申请 API credits（来自 OpenAI 那个 100 万美元的开源基金），以及有条件开放的 Codex Security。谁能拿？核心是一句话：你得是一个公开开源项目的维护者（maintainer）。 OpenAI 官方写得比较宽松——如果你是被广泛使用的项目的核心维护者，就去申请；哪怕你的项目不完全符合标准，但在生态里确实重要，也可以申请，附上说明就行。而且它明确说了：不卡硬性 star 数门槛，不要信用卡，不要购买承诺。怎么拿（保姆级步骤）： 1. 打开 OpenAI 开发者社区的官方页面 developers.openai.com/community/codex-for-oss 1. 点申请，填你的项目信息——GitHub 仓库链接、star 数、月下载量这类指标 1. 重点写清楚"我这项目为啥重要、被谁在用" 1. 提交，等审核回复这盆冷水你得喝：第一，这是给开源作者的，不是给所有 ChatGPT 用户的全民福利。你要是没有一个拿得出手的公开项目，这条基本和你无关。第二，别和另一个东西搞混了——之前 OpenAI 还搞过一个"Codex 用量翻倍"的促销（Pro 档加量），那个是给已付费用户加量，不是免费，而且已经在 2026 年 5 月 31 号到期了。咱们这条说的是 OSS 那个免费半年的项目，两码事。 ## 入口二：Anything AI——注册就薅 2 万额度这个是目前门槛最低的一个，几乎是注册即得。 Anything（官网 createanything.com）是个 AI 应用搭建工具，用大白话描述一句你的需求，它帮你把 App 或网页搭出来，背后接的是 Claude、GPT、Gemini 这些顶级模型，不用你自己配 API key。它的免费档默认只给 3000 credits，一次性的，问几个问题就见底了。但在新用户启动促销期，能薅到的是 2 万 credits——机制大致是：注册到账一批，登录后再点一次同一个邀请链接，触发 bonus 再到账一批，凑齐 2 万，整个过程不要信用卡。怎么拿（保姆级步骤）： 1. 通过促销注册链接进入 Anything 官网，完成注册 1. 注册后，第一批 credits 自动到账 1. 登录状态下，再打开一次那个注册/促销链接，触发额外的 bonus 1. 到账后进 builder，credits 就能拿去搭东西、跑 AI 集成这盆冷水：第一，这是平台币，不是现金，也不是 OpenAI/Anthropic 的官方 API 额度。它只能在 Anything 平台里用，搭 App、跑集成消耗，跨平台带不走。第二，credits 烧得快慢看任务复杂度，复杂任务一条消息就能吃掉一大把，2 万听着多，认真搭起来其实也就够你玩一阵。第三，得提醒一句——这种"点两次链接拿双倍"的促销玩法，链接很多是在羊毛党论坛流转的第三方推广链接。官方注册当然是安全的，但你点别人贴的促销链接前，自己心里有个数，至少认准是 anything.com 的域名。促销随时可能结束，看到了就趁早。 ## 入口三：Lenny's Product Pass——一份订阅换一堆工具这个口子最"反直觉"，因为它表面上叫"免费"，其实是你先掏钱订阅，然后一堆工具白送给你用一年。 Lenny's Newsletter 是产品圈最大的那个 newsletter。它搞了个 Product Pass：只要你是它的付费年度订阅者，就能领一大堆顶级 AI / 产品工具各 1 年的免费会员，标称总价值 $30000+。里面的货是真硬。我给你贴几个看看：怎么拿（保姆级步骤）： 1. 去 lennysnewsletter.com 开通年度付费订阅——Annual（$200/年）或 Insider（$400/年），月付不行 1. 登录 lennysproductpass.com 1. 往下滚，找到你想要的工具的 logo，点 Redeem 1. 拿到专属兑换码，按提示去对应工具开通（通常会跳到那个工具的注册/结账页）这盆冷水必须喝，而且是一大盆：第一，它根本不是白嫖，是花 $200-400 买门票换一堆工具。值不值，取决于你是不是真能用上里面那几样。如果你本来就要买 Cursor + Notion + Google AI，那这笔订阅可能直接帮你回本还倒赚；如果你一个都用不上，那就是纯花钱。第二，码是有限的，先到先得。Lenny 自己说了，合作方不是给无限量账号，热门工具的码会发完，发完就没了。Insider（$400 档）才有优先权，Annual（$200 档）是抢的。第三，每个工具基本要求你是"新用户"。你要是已经自己付费用着 Cursor 了，那这个免费年大概率领不了。第四，有有效期，每批 offer launch 后半年左右过期，领了记得赶紧兑换，别囤着烂手里。我的判断是：这条适合"本来就准备给一堆 AI 工具付费"的人，对这类人它是真划算；纯薅羊毛心态、一个工具都用不上的，别上头。 ## 入口四：云 startup credits——大头在这如果你在搞创业、做产品，那前面三个都是零花钱，真正的大额度在云厂商的 startup 计划里。三大云都有自己的创业扶持计划，给的是云资源额度，里面就包含跑 AI 模型的额度（比如 AWS 的 Bedrock、谷歌的 Vertex AI、微软 Azure 上的 OpenAI 服务）。而且关键是——这三家互相独立，你可以同时申请、各拿各的。几个最实用的点，我直说： - 门槛最低、最友好的是微软 Founders Hub。它不要求你有 VC 背书，公开申请就行，入门档先给 $1K–$5K，随着产品有进展再往上解锁，而且还附带 GitHub、Microsoft 365，以及 Azure 上的 OpenAI 服务额度。你只要 ship 过点东西，基本都能拿到入门档。 - AI 创业天花板最高的是谷歌，AI-first 的创业公司最高能摸到 $350K，但顶档要求严，通常得是有 VC 的 Series A 阶段；种子期一般也就 $2K–$10K。 - AWS 自筹创业者走 Founders 档是 $1K，但能叠加——比如 YC Startup School 能再领约 $2500 的 AWS 额度，Stripe Atlas 注册公司能再叠 $5000，攒一攒一个自筹 solo 也能凑出几千刀。怎么拿（保姆级步骤）： 1. 先备好三样东西：一个公司网站、一个企业邮箱、一句能讲清楚"你在做什么"的描述 1. 微软先冲——去 Microsoft for Startups Founders Hub 直接申请，最容易过 1. 再分别申请 AWS Activate（自筹选 Founders 档）和 Google for Startups Cloud 1. 有加速器/VC 的话，拿它们的 Org ID 去申请 Portfolio 这种高档位泼盆冷水清醒下：第一，那些几十万刀的天花板数字，绝大多数要 VC 或加速器背书，自筹个人开发者通常就是 $1K–$5K 这个量级，别看着 $200K 就以为能直接拿。第二，这是云资源额度，不是给你随便提现的钱，你得真把东西跑在它的云上才花得掉。所以选哪家，应该看你的技术栈适合谁，别为了额度把整个架构绑死在一家——那本身就是另一种 lock-in。 ## 直接抄：一段万能申请话术不管是 Codex OSS 还是云 startup credits，审核方最想看到的，都是"你是谁 + 你在做什么 + 为啥值得给你"。下面这段你改改就能用： > 我是 [项目/产品名] 的维护者/创始人。 > > 我们在做 [一句话讲清楚做什么]，目前 [一个能证明你在认真做的指标：GitHub star / 月下载量 / 用户数 / 上线时间]。 > > 我们正在用 / 计划用 [你们家的产品] 来做 [具体场景：代码评审 / 自动化 / AI 功能]，这部分额度能直接帮我们 [具体的事]。 > > 项目链接：[贴上] 记住一句口诀：指标 > 形容词。别写"我们很有潜力"，写"我们有 800 star、月下载 1 万"。审核的人一天看几百份申请，具体数字才让他停下来。 ## 最后说到底，这几个口子能不能薅到，拼的不是手速，是你站在哪个身份上。开源作者有开源作者的口子，创业者有创业者的口子，普通用户也有普通用户的小份额——没有一个口子是为"所有人"开的，但总有一个是为"现在的你"开的。所以与其满世界找"最大的羊毛"，不如先想清楚：我现在是个什么身份，哪扇门是冲我开的，然后把那一扇推到底。剩下那些不属于你的，看看就好，别眼红。该掏钱用顶级模型的时候，也别太抠——工具是放大器，省下的那点订阅费，有时候还不够你纠结浪费掉的时间值钱。（本文基于 OpenAI Developers 官方页面、Lenny's Newsletter / Product Pass 公开页、Anything 官方文档及公开促销信息、AWS / 微软 / 谷歌三家 startup 计划官方页综合写成。所有额度、价格、有效期均为时效性信息，可能随时变动，以各官方页面为准。文中提到的产品只是举例，不构成任何推荐。这些是个人整理，不是投资/购买建议。）

译文章盘点四大渠道：① OpenAI Codex for OSS，开源项目维护者可免费获6个月ChatGPT Pro（价值$1200）及API credits；② Anything AI，新用户通过促销链接注册可得2万credits，需重复点击触发bonus；③ Lenny's Product Pass，付费订阅其年度Newsletter（$200-400）可兑换总价值$30000+的AI工具一年会员，先到先得且要求新用户；④ 三大云startup credits，微软Founders Hub最低$1K-$5K（无VC要求），谷歌AI-first创业最高$350K但要求严，AWS可叠加（自筹$1K+YC等）。每个口子均有门槛限制。

宝玉@dotey · 6月7日54

这个确实，Deep Research 方面 Claude 做的不怎么样，ChatGPT 的 DeepResearch 做的最好，Gemini 也不错，胜在搜索能力强，通常我会用 ChatGPT 和 Gemini 一起做，然后对比结果

译宝玉 (@dotey) 对比各模型 Deep Research 表现：ChatGPT 的 DeepResearch 最好，Gemini 搜索能力强、表现也不错，Claude 做得很差。引用推文补充：在写代码、工程工作及需联网搜索数据并分析得出结论的任务上，Claude 的“5.5”版本远超 Opus，Opus 搜索能力几乎不可用。

Chubby♨️@kimmonismus · 6月7日64

Apple’s Touch Bar was ahead of its time. Just imagine the incredible use cases it could have today. - rate limits, context and much more

译WWDC 2026 预计将成为苹果 AI 关键节点。Siri 将围绕定制版 Google Gemini 模型（约 1.2 万亿参数）重建，自有设备端模型仅约 3B 参数。新 Siri 采用混合架构——本地小模型 + 云端大模型，由苹果控制 UI、应用权限和隐私层。预期功能包括更自然对话、跨应用个人上下文、屏幕感知、应用内操作、独立 Siri 应用（支持语音、文件上传和多模态交互）、Dynamic Island 深度集成，并可选择接入 ChatGPT、Claude 或 Gemini 等第三方服务。苹果意将 Siri 打造成操作系统的隐私 AI 层，成为跨 iPhone、Mac、iPad 的系统智能体。

Chubby♨️@kimmonismus · 6月7日66

Tomorrow could be Apple’s most important AI moment yet. WWDC 2026 is expected to be all about one thing: making Siri relevant again. If the leaks are right, Apple is rebuilding Siri around a custom Google Gemini model, reportedly around 1.2 trillion parameters. For context: Apple’s own on-device AI model is roughly 3B parameters. The biggest rumor: Apple’s new Siri will reportedly be powered in the background by Google Gemini. Not as a Google-branded chatbot, but as an Apple-controlled intelligence layer running behind Siri, likely tied to Apple’s privacy-first infrastructure. So the new Siri likely becomes a hybrid system: • small Apple model locally on your device • large Gemini-class model in the cloud • Siri as the orchestration layer • Apple controlling the UI, app access and privacy layer What to further expect: • a much more conversational Siri • deeper personal context across apps, messages, files, calendar, photos and contacts • screen awareness • actions inside apps • a dedicated Siri app with chat history • voice chat, file uploads and multimodal interaction • better integration with Dynamic Island • optional support for other AI services like ChatGPT, Claude or Gemini Apple wants to turn Siri into the private AI layer of the operating system. A system agent that can search, understand, write, edit, summarize, organize and act across your iPhone, Mac and iPad. We may also see new Apple Intelligence features for: • AI photo editing • smarter Camera / Visual Intelligence • improved Writing Tools • natural-language Shortcuts • better Wallet and Health integrations • more privacy controls around AI data Either way, WWDC 2026 could define Apple’s position in the AI race. Exciting how the new CEO will handle all of this. Images: Bloomberg, Mark Gurman

译据传 WWDC 2026 苹果将彻底重构 Siri，底层集成 Google Gemini 模型（约 1.2 万亿参数）作为云端智能层，与自有 3B 参数设备端模型组成混合系统。Siri 担任编排层，控制 UI、隐私和应用权限。预期新 Siri 支持更自然对话、跨应用上下文、屏幕感知、应用内操作、专用 Siri app、语音/文件/多模态交互、动态岛增强，并可选接入 ChatGPT/Claude 等第三方 AI。同时可能推出 AI 修图、智能相机、写作工具、自然语言快捷指令等新 Apple Intelligence 功能。

Ethan Mollick@emollick · 6月7日60

The Gemini Pro models do not seem to be iterating anywhere near as quickly as Claude or GPT (last release was 3.1 Pro in February). Its causing a growing performance gap between Google and the other two labs, and the Gemini 3.5 Flash model, good as it is, doesn't close it much.

译Gemini Pro 模型的迭代速度似乎远不及 Claude 或 GPT（上次发布是二月份的 3.1 Pro）。这导致 Google 与其他两家实验室之间的性能差距不断扩大，而 Gemini 3.5 Flash 模型尽管不错，也未能显著缩小这一差距。

Rohan Paul@rohanpaul_ai · 6月6日70

Rreuters: SpaceX’s $75B IPO is already seeing about $150B in demand (2x oversubscribed) SpaceX has said its AI business could chase a $23 trillion market, that it can use space to build AI compute capacity beyond the limits of Earth-based companies. "By dramatically reducing the cost of access to space, we have been able to expand our mission to address some of the Earth's most pressing challenges, including bridging the digital divide by aiming to connect over three ‌billion unconnected people to the internet and humanity's collective knowledge," SpaceX said in the roadshow presentation. SpaceX said U.S. electricity generation and computer-capacity growth have fallen behind China, partly due to barriers around major U.S. projects. SpaceX thinks that shortfall can ‌be remedied by putting data centers and other infrastructure in space using SpaceX launches. --- reuters. com/business/finance/spacex-ipo-running-two-times-oversubscribed-sources-say-2026-06-05

译据路透报道，SpaceX 750亿美元IPO已获约1500亿美元需求（2倍超额认购）。SpaceX在路演中表示，其AI业务可瞄准23万亿美元市场，通过太空建设AI算力突破地球限制。公司称美国电力与算力增长落后于中国，计划用SpaceX发射将数据中心等送入太空弥补差距。此前SpaceX披露与Google的云服务协议，Google每月支付9.2亿美元（约110亿美元/年）用于xAI数据中心算力。

AYi@AYi_AInotes · 6月6日60

一定要给你的龙虾或者Hermes配上多模态大模型，我今天实测下来，目前多模态大模型性价比最高的就是Qwen3-VL / Qwen3.5 VL系列，比Gemini 3.5 Flash 输出便宜 22 倍,读图能力一样在，我自己用的是qwen/qwen3.5-flash($0.1/$0.4,多模态图+视频,1M 上下文)，供大家参考。

译用户实测推荐，目前多模态大模型性价比最高的是Qwen3-VL / Qwen3.5 VL系列，其输出价格比Gemini 3.5 Flash便宜22倍，读图能力相当。作者使用的具体模型是qwen/qwen3.5-flash，价格为$0.1/$0.4，支持多模态图片+视频，上下文窗口达1M。

🚨 AI News | TestingCatalog@testingcatalog · 6月6日48

GOOGLE 🔥: NotebookLM will soon be able to generate files in many different formats from your sources, based on this teaser. There is a high chance that this release will be coupled with Gemini 3.5 Flash upgrade as well. A huge list of formats referenced in the code. ["pdf","txt","md","docx","csv","pptx","epub","3g2","3gp","aac","aif","aifc","aiff","amr","au","avi","cda","m4a","mid","mp3","mp4","mpeg","ogg","opus","ra","ram","snd","wav","wma","avif","bmp","gif","ico","jp2","png","webp","tif","tiff","heic","heif","jpeg","jpg","jpe"] https://x.com/NotebookLM/status/2063005289885155439/video/1

译Google 的 NotebookLM 即将支持从用户资料生成多种格式的文件，包括 pdf、txt、md、docx、csv、pptx、epub 以及大量音视频与图片格式（如 mp3、mp4、wav、jpg、png、heic 等）。此次更新很可能与 Gemini 3.5 Flash 模型升级一同发布。

AYi@AYi_AInotes · 6月6日57

今天刷到Google裁掉整个工程教育团队的消息，心里咯噔了一下不只是裁几个人，整个负责10万+工程师培训的部门连根拔了最戳我的是评论区有人提了一句，以后Google厕所的隔间里再也不会有那张印着最佳实践的小纸片了😭 老程序员应该都懂那个叫"Testing on the Toilet"的东西曾经是Google工程文化的图腾从2006年坚持到现在一张A4纸，写清楚一个代码坑全世界的工程师都跟着学现在连教你怎么写好代码的人都被AI替代了，其实这件事最可怕的地方不是Google裁了一个团队它还释放了一个信号连全世界最重视工程文化的公司都觉得培养人这件事不如AI划算那以后是不是真的不会有公司花几年时间慢慢培养一个新人了不会有人把自己踩过的坑整理成手册教给你了再也不会有那种 "师傅带徒弟"式的成长了以后的职场规则可能会变成你进来就得会干活不会就自己问AI 干不好就走人没人有义务教你这是最好的时代也是最坏的时代会用AI武装自己的人会自己萃取知识会自己建知识库的人会跑得比谁都快等着公司给你铺好路等着别人喂你吃饭的人会被甩得连尾灯都看不见

译近日 Google 裁掉整个工程教育团队，该团队曾负责 10 万+工程师的培训。标志性的“Testing on the Toilet”项目（自 2006 年起在厕所隔间张贴最佳实践纸片）随之消失。推文指出，此举释放信号：连最重视工程文化的 Google 也认为培养人不如 AI 划算，未来可能不再有公司花几年时间培养新人，“师傅带徒弟”式的成长或成历史。@GergelyOrosz 确认全员被裁。

小互@xiaohu · 6月6日69

根据 SpaceX 公布的一份文件 Google与其签订了一份协议，从 2026 年10月至 2029 年6月止，每月支付9.2 亿美元购买算力，具体包括大约 110,000 个 NVIDIA GPU、CPU、内存以及其他组件。此前 Anthropic也向SpaceX 每月支付 12.5 亿美元购买算力... 算下来每年有 260 亿美元的收入，躺赚啊... 日了狗了，赚钱还是得看老马...

译SpaceX公布文件显示，Google与其签订协议，从2026年10月至2029年6月，每月支付9.2亿美元购买算力，具体包括约110,000个NVIDIA GPU、CPU、内存及其他组件。此前Anthropic也已向SpaceX每月支付12.5亿美元购买算力。两项协议合计每年带来约260亿美元收入。