兄弟们，Google最新论文直接把时间序列预测的底层逻辑翻了个个儿。过去所有模型都在死磕历史数据：曲线怎么走，就怎么预测。 Nexus却说：预测需要的不只是历史，而是“事件上下文”。数字背后的真正原因——政策、突发事件、宏观趋势、局部冲击——必须和数字互相解释。他们用多agent框架把这件事拆得清清楚楚：一个agent从海量文本里提炼事件时间线，一个读宏观政权，一个盯局部冲击，最后一个合成器把所有信息和历史误差校准后给出最终预测。真实测试里，用Claude驱动的Nexus版本，在Zillow数据集上把平均MAPE直接砍了86.6%。不是小幅提升，是降维打击。以前模型只会“看懂模式”，现在它开始“理解因果”。这篇论文真正厉害的地方不是某个数字，而是把预测从“统计外推”彻底变成了“多agent推理”。

译Google论文提出的Nexus框架颠覆了传统时间序列预测仅依赖历史数据的模式，强调“事件上下文”的核心作用。该框架采用多智能体协作架构：分别从文本中提取事件时间线、解读宏观态势、追踪局部冲击，最终通过合成器整合信息并校准误差。在Zillow数据集测试中，基于Claude的版本将平均预测误差（MAPE）大幅降低86.6%，实现了从“识别模式”到“理解因果”的范式转变。这标志着预测方法正从统计外推转向结构化推理，为未来预测系统指明了新方向。

Berryxia.AI@berryxia · 5月18日18

我要的是Gemini App UI 升级吗？我是想让Google 大善人早一点推出新模型啊！我看我的Pro会员也马上到期了……

AYi@AYi_AInotes · 5月17日49

这绝对是是今年最典型的认知战样本，国宴上穿红旗袍的女孩一没戴耳机，二没做记录，三没有任何异常动作，人家只是是眼神太专注，站得太直，就被这个日本账号配上碟中谍的配乐，暗示说是间谍在偷听，然后英推很多推友就疯了🤣 有意思的是我准备把碟中谍音乐换成特朗普的专属音乐的时候，发现日本账号用的照片是@Gemini 生成的🤣🤣🤣 真的忍不住跟大家科普下，首先中国不会蠢到用顶级外事人才站旁边竖耳朵偷听，这就相当于让航天工程师去送外卖，真正的情报机构也绝对不会这么蠢，中国更不会，那问题就变成了，为什么这么多人看到同样一段视频，第一反应不是服务员很专业，而是间谍，首先CIA自己就是这么招人的，美国情报史上有大量招募酒店、餐饮、清洁人员做线人的记录，所以他们天然假设对方也会这么干，典型的镜像偏见，用自己的剧本，编对方的故事，中国高端外事服务业的基因是零失误、零情绪外露、极致专注，周恩来时代定下的规矩至今没变，结果极致的专业被镜头语言把严肃专注自动翻译成了冷酷监听，服务文化差异被剪辑成了威胁信号，就挺荒诞的😅

译一日本账号将中国国宴上神情专注、站姿端正的女性服务员，通过配乐和AI生成图片暗示为“间谍”，引发英文推特热议。分析指出，这种指控源于典型的“镜像偏见”——美国情报机构历史上常招募服务行业人员为线人，因而推定他国行为模式相同。实际上，中国高端外事服务秉承零失误、极致专注的专业传统，却被曲解为“监听”。事件揭示认知战中，文化差异与预设剧本如何将专业行为扭曲为威胁信号。

Rohan Paul@rohanpaul_ai · 5月17日61

So much possibilities for on-device small models. Here @adrgrondin is running Google’s Gemma 4 E2B on iPhone 17 Pro. ~40tk/s with MLX optimized for Apple Silicon SOTA coding & math on mobile with 128K context. Fully offline with thinking mode.

译设备端小模型拥有如此多的可能性。这里 @adrgrondin 正在 iPhone 17 Pro 上运行 Google 的 Gemma 4 E2B。针对 Apple Silicon 优化的 MLX 实现约 40tk/s 的速度在移动端实现 SOTA 编程与数学能力，支持 128K 上下文。完全离线运行并具备思考模式。

Rohan Paul@rohanpaul_ai · 5月17日64

New Google paper: A forecast needs context, not just history. Some patterns are caused by events, not time. Nexus reframes forecasting as a reasoning problem, where events and numbers have to explain each other. Nexus argues that forecasting improves when models read the world around the numbers, not just the numbers themselves. In the Zillow tests, one Claude-based version cut average MAPE by 86.6% versus direct chain-of-thought prompting. That matters because most time series models are fluent in pattern, but mute about cause. A housing inventory curve can reflect seasonality, mortgage pressure, migration, layoffs, and local supply, while a stock price can be bent by earnings, regulation, hype, and fear. Nexus separates those jobs instead of asking one prompt to do everything. One agent turns messy historical text into a clean event timeline, one reads the broad regime, another tracks local shocks, and a synthesizer reconciles them with calibration from past errors. The interesting result is not merely that context helps, but that structure helps the language model use context without losing the time series. The evidence is still narrow: Zillow counts, seven equities, post-cutoff data, and single-run evaluations, so this is not a universal law of forecasting. But the direction is clear: future forecasters will not only extrapolate curves; they will argue about what made the curve move. ---- Paper Link – arxiv. org/abs/2605.14389 Paper Title: "Nexus : An Agentic Framework for Time Series Forecasting"

译谷歌新论文提出Nexus框架，将预测重构为推理问题，强调结合事件背景而非仅依赖历史数据。该框架采用多智能体分工：一个从文本中提取清晰事件时间线，一个分析宏观态势，另一个追踪局部冲击，最后由合成器结合时间序列进行校准。在Zillow的测试中，基于Claude的某个版本将平均绝对百分比误差降低了86.6%。研究表明，结构化的上下文能帮助语言模型有效利用信息而不丢失时间序列特性。尽管当前证据仅涵盖房地产数据和少数股票，但方向明确：未来预测不仅会推断曲线，还将解释曲线变动的原因。

Rohan Paul@rohanpaul_ai · 5月17日58

Google CEO Sundar Pichai on current frontier model's ability to break the security of almost all current software. "These models are definitely, like really gonna break pretty much all software out there, maybe already, we don't know."

译谷歌CEO Sundar Pichai谈当前前沿模型破解几乎所有现有软件安全的能力。 "这些模型几乎肯定会破解现有的所有软件，也许已经做到了，我们还不确定。"

Chubby♨️@kimmonismus · 5月17日25

2026 has been the craziest - and honestly the best - year of my life so far. - I got to attend NVIDIA GTC and speak on camera with two NVIDIA VPs about some of the most exciting topics in AI: with Ming-Yu Liu about world models, and with Kari Briski about Nemotron. I also got to experience autonomous driving powered by NVIDIA’s “Alpamayo.” - A month later, I traveled to China for the first time and visited XPeng, where I saw their humanoid robots, learned more about their autonomous driving efforts, and had some truly fascinating conversations. - On Monday, I’m heading back to California for Google I/O. And I hope I’m allowed to say this much already: it looks like I’ll have the chance to do some very exciting interviews with people from Google, which I’ll share afterwards. - One week later, I’ll be back in the US again for Microsoft Build, my third trip to the States in just a few months, to cover the event and see what Microsoft is about to unveil. I’ve only just started editing and uploading the conversations, vlogs, and behind-the-scenes footage from all of this. I really hope you’ll enjoy watching them. I never thought I would ever get to do something like this. It is, without a doubt, the most amazing and exciting thing I’ve ever done. The only downside: every time I leave, I have to say goodbye to my 10-month-old son for a week. And honestly, that part is really hard. Thank you all for being part of this journey! Seriously! I’ll keep you posted - especially starting Monday. :)

译作者回顾2026年密集参与的全球顶级科技活动。在NVIDIA GTC期间，与副总裁探讨世界模型和Nemotron等AI前沿话题，并体验了NVIDIA Alpamayo自动驾驶系统。随后首次访问中国小鹏汽车，考察其人形机器人及自动驾驶进展。即将启程参加Google I/O和微软Build大会，计划进行深度采访并报道最新技术发布。作者正整理多场对话、幕后影像，坦言旅程唯一遗憾是与幼子的短暂分别。

宝玉@dotey · 5月17日57

Writing -> Opus 4.6 is the best Translation -> Gemini 3.1 Pro is the best

译写作 -> Opus 4.6 是最佳的翻译 -> Gemini 3.1 Pro 是最佳的

🚨 AI News | TestingCatalog@testingcatalog · 5月17日45

GOOGLE 🔥: Traces of Gemini 3.2 Flash-lite-live have been spotted on Google Cloud Console. Even cheaper real-time model? 👀

译GOOGLE 🔥：在谷歌云控制台上发现了Gemini 3.2 Flash-lite-live的踪迹。难道是更便宜的低延迟模型？👀

Chubby♨️@kimmonismus · 5月16日17

Veo 4 would be almost more exciting than Gemini 3.5. It's surprising how long Seedance 2.0 has remained state of the art. Oh and maybe an update to Genie, googles world model. Google i/o can’t come fast enough

译Veo 4 可能比 Gemini 3.5 更令人兴奋。 Seedance 2.0 能长期保持领先地位实在令人惊讶。对了，或许还有谷歌世界模型 Genie 的更新。谷歌 I/O 大会快点到来吧。

ginobefun@hongming731 · 5月16日46

#BestBlogs 早报 2026-05-16 AI 当编程助理已经不算新鲜，更值得看的是把它当成思考伙伴的方式。 Google 的 Julie Qiu 谈如何在九语言客户端库里和 AI 一起读懂、试验、再设计； Abridge 用八千万次问诊把环境抄写做成医疗智能层； OpenAI 在 Podcast 第 19 期复盘 Imagen 2.0 的字渲染、多语言与 Creative Agents 路线。三篇都不爆炸，但都耐看。

译本期早报探讨了AI从编程助理向“思考伙伴”的演进。案例包括Google工程师在多语言客户端开发中与AI协同理解与设计系统；Abridge公司利用海量问诊数据构建医疗智能理解层；以及OpenAI复盘Imagen 2.0在文本渲染和多语言支持上的进展，并展望“创意智能体”的未来。这些实践展示了AI正以更深入、融合的方式参与专业协作。

Google AI Developers@googleaidevs · 5月16日22

We want to see your build in action! Share a screen recording of your project below. We can’t wait to see what’s cooking 🍳 ↓

译我们想看看你的实际构建成果！请在下方分享你的项目录屏。我们迫不及待想看看正在酝酿什么 🍳 ↓

Chubby♨️@kimmonismus · 5月15日61

The 10-year US Treasury just hit 4.568%, highest in 10 months. The 30-year is back above 5%. Inflation is re-accelerating, markets have fully priced out any Fed rate cut this year, and some are now betting on a hike. Meanwhile, the AI industry is running the largest debt issuance cycle in modern capital markets history. Hyperscaler capex is set to cross $600B this year. Free cash flow for the top five US tech spenders is turning negative for the first time in 35 years. This buildout is funded by bonds. The problem: the gap between what Big Tech is spending on AI infrastructure (~$400B/year) and what AI is actually generating in revenue (~$100B) is massive. If yields stay elevated, refinancing is becoming a serious problem, and the whole bet starts compounding against itself. Alphabet raised $32B in bonds in under 24 hours. Oracle's credit default swaps have tripled since September. So watch the bonds closely.

译美国10年期国债收益率升至4.568%，30年期突破5%，市场已排除今年降息可能。与此同时，AI行业正进行现代资本市场史上最大规模的债务发行周期，超大规模企业资本支出将超6000亿美元，美国五大科技巨头的自由现金流35年来首次转负。核心问题在于，科技巨头每年约4000亿美元的AI基础设施支出与AI实际约1000亿美元的收入之间存在巨大缺口。若收益率持续高企，再融资将成严峻挑战，例如Alphabet在24小时内发行了320亿美元债券，而Oracle的信用违约互换自9月以来已翻三倍，债务风险值得密切关注。

Berryxia.AI@berryxia · 5月15日55

Google刚刚泄露了Gemini Spark的最新内部截图。新模型同时支持Agent模式和Chat模式，重点放在了高级工具使用和Skills创建流程上。我把截图仔细看完后，发现两个关键限制目前很明显： Skills只能通过复制粘贴MD文件的方式创建，没有直接导入选项。目前也没有任何Browser或Computer Use的痕迹，也就是说还无法直接控制用户的电脑。这波更新把Gemini的工具能力又往前推了一步，但也暴露了Google在落地Agent时的谨慎节奏。以前大家觉得Google会在工具使用上直接一步到位，现在看起来他们选择先把核心流程打磨扎实，再逐步开放更激进的功能。`

译泄露的Gemini Spark内部截图显示，新模型整合了Agent与Chat模式，重点提升高级工具使用和Skills创建流程。然而，当前Skills仅支持复制粘贴MD文件创建，缺乏直接导入选项，且未见Browser或Computer Use功能。这表明Google在推进AI工具能力时采取了渐进策略，优先打磨核心流程，而非一步到位开放激进功能。

Berryxia.AI@berryxia · 5月15日25

Gemini 3.5 Pro的 Three.js 构建的效果。看着挺像回事，实际效果拉不拉。等等吧… 应该就这1/2 周

🚨 AI News | TestingCatalog@testingcatalog · 5月15日66

GOOGLE 🔥: New Gemini Spark screenshots featuring advanced tool use and Skills creation flow. It seems like there won't be an option to import SKILL MD files besides copeing and pasting. There is also no evidence of Browser or Computer Use atm.

译GOOGLE 🔥：Gemini Spark新截图展示高级工具使用和技能创建流程。目前看来除了复制粘贴外，似乎没有导入SKILL MD文件的选项。目前也没有浏览器或计算机使用功能的迹象。

Rohan Paul@rohanpaul_ai · 5月15日39

"You're going to have a relatively small number of very large companies and a very large number of very small companies because you don't need as many people." ~ Eric Schmidt, Ex CEO of Google

译"未来将出现少数巨型企业与大量微型企业并存的现象，因为企业所需人力已大幅减少。" ~ Eric Schmidt, 谷歌前CEO

向阳乔木@vista8 · 5月15日63

哪个模型最牛逼？arena榜都被刷烂了。要看就看 Vercel的最新报告。 20万个项目，7个月十万亿个 token的消耗分析，有些结论有意思： 1. 按费用消耗 Anthropic 占 61% 居首，按 token 量排名 Google 占 38% 居首。 2. Claude Opus 贵但好用，用在重要任务。Gemini Flash 便宜量大。 3. B2B 只产生 29.7% 的 token 量，却占了 40.7% 的费用。 5. 场景越关键 Anthropic 份额越高，比如后台业务 Anthropic 占 87% ，近乎垄断，消费场景三家平分。 6. Agent 请求 6 个月翻近一倍，从 31.6% 涨到 58.9%，一次 Agent 请求消耗的 token 是普通聊天的 2.6 倍。 7. 大规模团队平均使用 35 个模型。原文见评论

译Vercel基于十万亿token消耗的分析显示，Anthropic在费用上占61%居首，而Google以38%的token量领先。Claude Opus用于关键任务，Gemini Flash则以低成本大用量见长。B2B业务贡献40.7%的费用却仅产生29.7%的token。Agent请求占比激增至58.9%，其token消耗是普通聊天的2.6倍。

AYi@AYi_AInotes · 5月15日67

Google下周要发布的Gemini Spark，应该是 AI Agent 时代真正到来的信号了🙂 我理解它既不是ChatGPT的直接竞品，也不是又一次模型参数的升级，更像一个Google正式把AI从你叫它才干活的工具，变成了24/7替你运行的个人操作系统级Agent，它不会再等你发prompt，会主动自己帮你筛选邮件，预约会议，跟进在线任务，甚至代你上网点按钮填表格，我觉得最核心的突破是它终于有了持久化的记忆和上下文，以前的AI每次对话都是全新的，用完就忘，现在它会持续从你的每一次操作里学习，越用越懂你，别人做代理还在拼谁的工具调用更全，Google直接掏出了别人永远复制不了的杀手锏，你的搜索历史，你的位置信息，你的日历邮件，你的所有Google服务数据，这些加起来就是一张关于你的完整全息图，我觉得这才是真正的护城河，当然风险也真实存在，它会保存你的登录凭证，会在必要时分享你的信息，甚至可能未经确认就直接购物， Google把这些警告都给你写的明明白白，但我想大多数人最终还是会选择便利，毕竟历史上每一次数据换便利的博弈，结果从来都没有变过，真正聪明的人不会全盘拒绝，也不会全盘接受，他们会把控制权握在自己手里，只开放必要的权限，定期清理数据，对重度依赖Google生态的人来说，这可能不是百分之十几的效率提升，可能是整个工作和生活流程的彻底重构，你睡觉的时候它在帮你处理邮件，你吃饭的时候它在帮你跟进项目，这才是AI Agent真正该有的样子， 5月19号的Google I/O，很可能会成为2026年Agentic AI真正的分水岭时刻，一起期待吧 #Gemini #AI代理 #GoogleIO

译Google即将发布的Gemini Spark标志着AI Agent时代的实质性进展。它并非单纯的聊天机器人或模型升级，而是演变为一个能24/7持续运行、拥有持久化记忆的个人操作系统级代理。其核心在于能主动处理邮件、预约会议、跟进任务，并持续从用户操作中学习。Google的独特优势在于整合了用户的搜索历史、位置、日历、邮件等全生态数据，构成了强大的护城河。尽管存在数据与隐私风险，但该产品有望彻底重构重度Google用户的工作与生活流程，使5月的Google I/O成为Agentic AI发展的关键节点。

🚨 AI News | TestingCatalog@testingcatalog · 5月15日62

Google is silently rolling out an updated Gemini experience for its mobile apps ahead of Google I/O. Its updated UI for Gemini Live features an interactive "bar" or a dynamic island that reacts to your taps and can wave back. It should get loads of superpowers soon 👀

译Google在Google I/O大会前正悄然为其移动应用推出更新的Gemini体验。其Gemini Live更新后的用户界面采用交互式“栏”或动态岛设计，可响应点击并回波动画。预计很快将获得大量超级功能 👀

SemiAnalysis@SemiAnalysis_ · 5月15日60

During their last Google Cloud Next conference in Las Vegas, Google unveiled their new inference-focused TPU, featuring a novel network topology called "Broadfly". By leveraging a high-radix design, Google can scale up to 1,152 TPUs in a single pod. Compared to Ironwood, this enables a 4.5x larger pod size while reducing network diameter and with a maximum of just 7 hops between any two chips. (1/3) 🧵

译在拉斯维加斯举行的最近一次Google Cloud Next大会上，谷歌发布了专注于推理的新型TPU，其采用名为"Broadfly"的新型网络拓扑结构。通过采用高基数设计，谷歌可在单个集群中扩展至1,152个TPU。与Ironwood相比，这使集群规模扩大4.5倍，同时减少网络直径，任意两芯片间最多仅需7次跳转。(1/3) 🧵

Rohan Paul@rohanpaul_ai · 5月15日59

Google is set to announce a new Gemini model at its annual I/O conference on Tuesday, with performance believed to be roughly matched with GPT-5.5.

译Google 准备在周二的年度 I/O 大会上宣布一个新的 Gemini 模型，其性能被认为大致与 GPT-5.5 匹配。

Chubby♨️@kimmonismus · 5月14日58

Rumors about the new Gemini Flash coming in. And holy, if true then big: 92% of GPT-5.5’s coding and reasoning performance, reportedly at 15–20x lower inference cost. And the latency? Sub-200ms for most queries. That would be nuts. no joke.

译传闻即将发布的Gemini 3.2 Flash模型在编码和推理任务上达到了GPT-5.5约92%的性能水平，同时推理成本降低了15至20倍。其延迟表现也极为出色，多数查询响应时间低于200毫秒。这主要得益于DeepMind的蒸馏和稀疏化技术，成功将前沿模型压缩为“Flash”变体，而避免了通常伴随的质量大幅下降。

Chubby♨️@kimmonismus · 5月14日58

Big leak ahead of Google i/o - Gemini Spark: an always-on agent that can use Gmail, Calendar, web sessions, location, tasks, and personal context to act on your behalf. T its Google's bet that the winning AI assistant will not be the smartest (empty) chatbot, but the agent with the deepest access to your real life.

译谷歌I/O大会前重大泄露——Gemini Spark：一个常驻智能体，可通过Gmail、日历、网页会话、位置、任务和个人情境数据代为执行操作。谷歌的赌注是：胜出的AI助手将不是最聪明（空洞）的聊天机器人，而是能深度接入你真实生活的智能代理。

🚨 AI News | TestingCatalog@testingcatalog · 5月14日47

GOOGLE 🔥: A new Gemini Spark Agent is about to be revealed during Google I/O. Gemini Spark will work as a 24/7 assistant that can learn from user behavior and work with connected apps and skills. > Let Gemini do more as your everyday AI agent, ready 24/7 to help with your inbox, online tasks, and more. > The more you use Gemini Spark, the better it understands you and what you want to accomplish. To work on your tasks, it uses your info from sources like Connected Apps, skills, chats, tasks, websites you’re logged into, Personal intelligence, location, and more. > To help you get things done efficiently, Gemini saves remote browser data, like login details and remote code execution data. You can clear this data and turn off Connected Apps and other Personal intelligence features in Settings.

译谷歌将在I/O大会上发布新的Gemini Spark智能体。它将作为全天候AI助手，通过连接应用、技能、聊天记录、位置等个人信息来学习用户行为，从而协助处理收件箱和在线任务等日常事务。用户使用越多，其理解能力越强。为提升效率，Gemini会保存远程浏览器数据（如登录信息），但用户可在设置中清除数据或关闭相关智能功能。

Chubby♨️@kimmonismus · 5月14日48

Lets go: Google’s next Gemini model is expected to compete with GPT-5.5 Google is reportedly preparing to unveil a new Gemini model at I/O, positioning it near OpenAI’s recent GPT-5.5 rather than the more elusive Anthropic Mythos. Google i/o got even more exciting

译让我们开始：Google 的下一个 Gemini 模型预计将与 GPT-5.5 竞争。据报道，Google 正准备在 I/O 上发布一个新的 Gemini 模型，将其定位接近 OpenAI 最近的 GPT-5.5，而不是更难以捉摸的 Anthropic Mythos。 Google I/O 变得更加令人兴奋了。

Yuchen Jin@Yuchenj_UW · 5月14日51

Google I/O is next week. Prediction: nobody lets Google have the stage alone. All of these models could drop next week: - GPT-5.6 - Mythos or Opus/Sonnet 4.8 - Gemini 3.5

译Google I/O 就在下周。预测：没人会让谷歌独占舞台。所有这些模型都可能在下周发布： - GPT-5.6 - Mythos 或 Opus/Sonnet 4.8 - Gemini 3.5

Berryxia.AI@berryxia · 5月14日56

Google Gemini 3.2 Pro 和Flash 已经蓄势待发了。每次都是这几个Case 真的烦了，能不能整点炸裂一点的Case。据说是就近期要发布，但是看着样子也是赶鸭子上架，应该放鸽子啥的也是常有的事儿。

swyx 🌉@swyx · 5月14日62

any time a model router company drops data, its worth browsing. here we learn that gemini leads in education and personal assistants (?!), ant leads in vibecoding and koding and back office (?!), and oai leads in recruiting outreach (?!) *for the subset that goes thru vercel gateway, which idk the market share

译每当有模型路由公司发布数据，都值得仔细浏览。从数据中我们看到，Gemini在教育和个人助手领域领先（？！），Ant在氛围编程、代码和后台办公领域领先（？！），而OpenAI在招聘外联领域领先（？！） *数据来自通过Vercel网关的子集，其市场份额未知

Berryxia.AI@berryxia · 5月14日23

Google I/O 大会会有什么好玩的，5/19 开启。拭目以待吧 http://io.google

阿绎 AYi@AYi_AInotes · 5月14日64

全网都在吹AI写代码，没人注意到Google刚刚放出的这个死亡警告吗 Google GTIG今天公开确认，全球第一个AI独立开发并实际部署的零日漏洞，已经在野外被检测到了。很多人都在说AI终于能写漏洞了，但他们其实并没看懂，这件事的恐怖程度，比他们想的要严重10倍。它找的不是内存破坏，也不是缓冲区溢出，是人类写代码时藏在骨子里的信任假设，这种高层语义逻辑漏洞，传统fuzzer和静态分析工具根本看不见。以前找零日，需要天才黑客熬几个月，现在，一个会写prompt的普通罪犯，喂进去代码，直接输出完整PoC。以前的网络战，是人类打人类，现在，是AI打AI。人类已经退到了后台。最讽刺的是，这次能拦住，全靠AI写的代码太像AI了，教科书式的风格，多余的注释，甚至编造了一个CVSS分数写进去。这可能是防守方最后的6-12个月，等模型学会写"像人类黑客一样脏的代码"，检测难度会指数级上升。我觉得从今天起，网络安全的游戏规则彻底变了吧🤔 #AI #网络安全

译Google GTIG公开确认，首次在野外检测到由AI独立开发并实际部署的零日漏洞。该漏洞并非传统内存破坏类型，而是攻击人类代码中深层的信任假设与高层语义逻辑，传统安全工具难以发现。这意味着生成完整漏洞利用（PoC）的门槛大幅降低，网络攻防可能进入AI对抗AI的新阶段。此次漏洞能被拦截，部分原因是AI生成的代码具有明显非人特征。安全专家警告，防守方可能仅有6-12个月的优势窗口，一旦AI学会编写更隐蔽的“人类风格”恶意代码，检测难度将指数级上升。

Ethan Mollick@emollick · 5月14日41

Really curious when Gemini is going to join the Cowork & Codex race to build a local app that isn’t just for developers. Antigravity hasn’t posted updates to X in a month, and remains very software focused. Meanwhile we see accelerated updates and releases from OpenAI & Anthropic

译很好奇Gemini何时会加入Cowork & Codex的竞赛，开发一款不仅面向开发者的本地应用。Antigravity已经一个月没在X上发布更新，且仍非常专注于软件。与此同时我们看到OpenAI和Anthropic正在加速更新和发布。

Deedy@deedydas · 5月13日58

This is the single best read on World Models and one of the most important reads in AI. $10B has flowed into "world models" in the last 18mos, from Yann LeCun to FeiFei Li. The promise is, like LLMs, world models will provide the data it takes to scale robotics foundation models, and solve robotics. ..but the word has been abused to mean one of many things. This post unpacks: – What 5 traits makes a world model? – How do the different approaches stack up? – What is it used for within and beyond robotics? – Where is the opportunity? – Citations to research, news and blog posts Companies / products in the space include: – BigCo products: Google Genie, Tesla Optimus, Nvidia DreamDojo, DreamZero, Microsoft Muse – Pure world model: AMI Labs, World Labs, Runway, Rhoda, Decart, Spaitial, Odyssey, Embo, Dream Labs, OneWorld – Robot foundation model cos: Skild, Physical Intelligence, Figure, Mind Very likely one of the seminal technologies of the next decade.

译世界模型被视为AI继大语言模型后的关键新范式，过去18个月已获百亿美元投资，其核心承诺是通过规模化数据推动机器人基础模型发展。然而，该术语目前被广泛滥用，含义模糊。本文系统阐述了世界模型的五大特质，对比了不同技术路径，探讨了其在机器人及其他领域的应用与未来机遇。领域参与者包括谷歌Genie、特斯拉Optimus等巨头产品，以及众多专注世界模型或机器人基础模型的初创公司。它很可能成为未来十年的奠基性技术之一。

歸藏(guizang.ai)@op7418 · 5月13日62

谷歌昨天安卓 I/O 大会最大的跟 AI 相关的发布，是发布了 Gemini Intelligence 会先在三星 Galaxy 和 Pixel 手机上推出，后面会拓展到其他所有类型的安卓设备。具体功能上，首先它可以帮你自动完成在多个 App 上操作的繁琐任务，而且可以跨多个软件去操作。比如你备忘录里有一堆购物清单，然后你可以让它直接把这些清单加到购物车里。安卓的 Chrome 浏览器可以自动帮你操作浏览器去检索内容和总结内容，也可以帮你填写表单之类的。他们在新推出了一个语音输入功能，叫 Rambler，它可以自动将你的口语转换成文本语言，去掉一些语气词并重新排版，而且支持多语言混用。最显眼的是它支持你通过自然语言去生成你想要的任何桌面小组件。比如说你可以让它生成一个每周推荐食谱的小组件，它就会自定义 AI 帮你生成，然后固定到你的桌面上。或者说你只关心某些天气的属性，比如说风速和降雨，然后它就会自动生成一个只有这些数据的桌面组件。这个功能我在去年六七月的时候跟一个 AI 创业者提过，结果到现在谷歌自己出了。而且他们这次还发布了 Material 3 Expressive 的设计语言，跟苹果的液态玻璃区别挺大的。它会在没有交互的时候是实体的边界，非常明显的分隔线，就是组件边界。在 AI 开始交互的时候，组件的边界会发生虚化和高斯模糊，非常的漂亮。

译谷歌在I/O大会上发布Gemini Intelligence，将AI深度集成至安卓系统。该功能将率先登陆三星Galaxy和Pixel手机，并逐步覆盖所有安卓设备。其核心能力包括跨应用自动执行复杂任务（如在备忘录与购物应用间同步清单），以及使Chrome浏览器能自动检索、总结内容及填写表单。新推出的Rambler语音输入功能可将口语转化为精炼文本，并支持多语言混用。用户还能通过自然语言指令生成个性化桌面小组件，如定制食谱或特定天气数据组件。此外，全新的Material 3 Expressive设计语言会在AI交互时使组件边界呈现虚化与模糊效果，提升视觉体验。

ginobefun@hongming731 · 5月13日71

构建支持暂停、恢复且永不丢失上下文的长时间运行 AI 智能体（基于 ADK）大多数 Agent 教程的终点是一个无状态的聊天机器人，容器一重启，什么都忘了。但真实的企业工作流不可能在一次 API 调用里完成。HR 入职流程跨越两周，发票纠纷要等供应商回复几天，销售跟进序列拉开一个月。这些流程被大量「空闲等待」主导，无状态架构天然无法应对。 Google 博客通过一个「新员工入职协调 Agent」实例，展示了三项让 Agent 从 Demo 走向生产的架构转变。第一项是持久化状态机。不再靠对话历史追踪进度，而是定义显式的状态 schema：START、WELCOME_SENT、DOCUMENTS_SIGNED、IT_PROVISIONED、HARDWARE_DELIVERED、COMPLETED，六个明确节点。Agent 每次唤醒，从 session state 而非聊天记录里读取当前位置。这彻底解决了三个无状态架构的致命问题：对话历史在数百轮后充满过期噪音（上下文污染）、每次推理都要重放完整历史（token 成本爆炸）、长时间空闲后恢复时模型幻觉出从未发生过的中间步骤（推理幻觉）。第二项是事件驱动休眠门控。Agent 在等待人工签字时不再主动轮询，而是挂起自身，等到外部事件（如文件签署通知）到达后才被唤醒。零资源占用，不会因为长时间等待而消耗 token 或算力。第三项是多 Agent 委托。IT 账号配置这类专项任务，交给独立的 IT 子 Agent 完成，主 Agent 只负责协调和状态推进。这避免了单体 Agent 提示词膨胀，也让各子任务可以独立优化。完整示例代码已放在 GitHub 上。这套架构的核心洞察是：Context 与 State 解耦，才是 Agent 从实验室走进生产环境的关键一步。

译Google博客以“新员工入职协调Agent”为例，指出AI智能体从演示走向生产需完成三大架构转变，核心是上下文与状态解耦。首先，采用持久化状态机，通过明确进度节点替代对话历史记录状态，解决上下文污染、token成本爆炸和推理幻觉问题。其次，引入事件驱动休眠门控，使Agent在等待外部事件时挂起以零资源消耗。最后，通过多Agent委托机制，将专项任务交由独立子Agent处理，避免提示词膨胀并支持独立优化。完整示例代码已开源。

凡人小北@frxiaobei · 5月13日58

Google 之前是产品力不行，现在想象力也堪忧😮‍💨

译Google发布名为“Googlebook”的新产品，其核心是构建一个以Gemini为中心的AI Laptop平台，而非传统操作系统。关键创新在于将Gemini深度集成到鼠标指针中，使其能主动理解屏幕内容并提供操作建议。这标志着交互逻辑的根本转变：从“人打开应用并操作功能”的传统模式，转向“AI理解上下文并主动组织操作”的新范式。

Josh Woodward@joshwoodward · 5月13日29

Lots of Gemini news at #TheAndroidShow! More to come at I/O next week!

译在#TheAndroidShow上发布了大量Gemini相关消息！更多内容将在下周的I/O大会上揭晓！

ginobefun@hongming731 · 5月13日43

#BestBlogs 早报 2026-05-13 今日主题： - 从演示 Agent 到生产 Agent，最难的一步是解决空闲等待。今日精读聚焦 AI Agent 落地的三个层面：Google ADK 教程用持久化状态机替代对话历史、事件驱动替代轮询，让长流程 Agent 永不丢失上下文； - 小红书 QCon 实战还原 GUI Agent 测试的真实瓶颈，发现执行自动化只解决一半问题，业务理解才是核心； - PingCAP 黄东旭复盘 TiDB 为 Kimi K2.6 数千万站点提供 Agent 数据库支撑的细节，说明 Scale 数量才是 Infra 真正的考题。

译AI Agent落地聚焦技术、测试与基础设施三大层面。技术实现上，Google ADK通过持久化状态机和事件驱动机制，解决了长流程Agent的空闲等待与上下文丢失难题。测试环节中，小红书QCon实战揭示GUI Agent测试的真实瓶颈在于业务理解，而非仅靠执行自动化。基础设施方面，PingCAP复盘TiDB支撑Kimi海量站点的案例，说明处理规模是可扩展架构的核心考题。

Berryxia.AI@berryxia · 5月13日69

终于看到了点Google的新东西啊！就在昨晚👇🏻 Google DeepMind 把 50 年鼠标指针彻底 AI 化了实验演示：用户现在用手势 + 语音 + 自然简写，直接在屏幕任意位置指挥 Gemini，无需切换 App 或写长 prompt。体验入口：Google AI Studio ：（http://aistudio.google.com/apps/bundled/ai-pointer-create 和 ai-pointer-find），已集成 Chrome Gemini，未来或进 Googlebook。核心能力拆解： • 指向 PDF 说“生成邮件 bullet points” → 即时输出要点 • 悬停表格说“转成 pie chart” → 自动可视化 • 高亮食谱说“double these ingredients” → 食材翻倍 • 指向涂鸦笔记说“转成 to-do list” 或视频帧说“生成 booking link” 技术细节：Gemini 多模态驱动，指针实时“看见”光标下文字/图片/代码块语义内容，结合 gesture（point/hover）+ speech + shorthand 实现上下文理解。把 pixels 转成 actionable entities，无需精确指令，模型自动懂“This/That”意图。输出直接作用当前界面。对 Agent 开发者、UI 设计师和 Gemini 重度用户最友好，标志交互范式从“坐标”到“意图”的升级。

译Google DeepMind近日发布了一项创新功能，将传统鼠标指针AI化。用户可通过手势（如指向、悬停）、语音及自然简写，在屏幕任意位置直接指挥Gemini模型，无需切换应用或编写复杂指令。该功能已集成于Google AI Studio和Chrome Gemini，能实时识别光标下的文字、图片、代码等内容语义，结合上下文理解用户意图，实现如将PDF内容转为邮件要点、表格转为图表等智能操作。这标志着人机交互从基于“坐标”的操控向基于“意图”的理解迈出了重要一步，尤其便于Agent开发者、UI设计师等用户提升效率。

Berryxia.AI@berryxia · 5月13日35

Google 发布的这个Google Intelligence 感觉就是一个换了皮的Gemini升级版，实际体验不知道到底有多好！