Some ideas for what comes next, May 2026 Gemini Flash 3.5, Mythos, open-closed balance, America's open-source surge, eme...
Some ideas for what comes next, May 2026 Gemini Flash 3.5, Mythos, open-closed balance, America's open-source surge, eme...
文章的核心论点是 Google 凭借其分发优势,在 AI 分发竞赛中占据了有利位置。目前 Gemini 拥有 9 亿用户,这主要归功于向 Android 用户进行的默认应用替换,以及向 Google 搜索用户推送的 AI 概览。其大语言模型 token 用量在 12 个月内从 480 万亿增长至 3.2 千万亿。为支撑此规模,Google 计划今年投入 1900 亿美元用于基础设施。Google 的关键优势在于能够利用庞大的 Android 设备基础,通过其搜索和 AI 模式免费向用户推广 Gemini。这一策略的部分成本优势源于自研的 TPU 芯片,使其在推理和训练上更独立,并能基于自身盈利补贴免费 AI 服务。尽管游戏远未结束,但 Google 的开局位置非常出色。
Meta、斯坦福等机构提出AutoResearchClaw,这是一个通过AI智能体进行自主研究的框架。其核心理念是将科研过程转化为一个受流程约束的循环,而非简单的生产线。系统整合了辩论、修复、验证、记忆和选择性的人类反馈,并将失败视为有效证据。在ARC-Bench基准测试中,该系统在结果分析等任务上性能比AI Scientist v2提升54.7%。人类协作实验显示:CoPilot模式(适时介入)接受率达87.5%,完全自主仅25%,逐步监督为50%。一个关键失败案例揭示了当所有交叉验证方法返回相同零偏差输出时,系统虽通过数值验证却失去了科学意义,凸显了人类判断的关键作用。
5 patterns for building long-running AI Agents 1. Checkpoint-and-Resume → Save progress in batches (like every 50 docume...
Google最新论文指出,LLM的幻觉问题核心在于模型在该犹豫时仍表现确定,而非单纯事实错误。论文将优化目标从追求完美的事实准确性,转向让模型能诚实地区分“我确知”与“我猜测”。作者提出了“忠实不确定性”概念,要求模型的表述与其内部置信度相符。文章还引入了“效用税”概念,解释了为何产品倾向自信但可能错误的回答。对于智能体而言,元认知能力至关重要,它决定了何时调用工具、何时信任信息源。
据报道,苹果为改造下一代Siri,正使用一个定制版、参数规模达1.2T的Google大模型作为其核心,这显著大于预估约300B参数的Gemini 3.5 Flash。该模型将驱动Siri的部分功能,其中简单查询预期会在本地设备运行。苹果面临的关键挑战是确保该大模型能够足够快速地响应日常问题。此外,下个月AI领域预计将有多项重要发布,包括WWDC上的Apple Intelligence与Gemini整合、GPT-5.6、可能的Sonnet 4.8/Opus 4.8,以及已确认的Gemini 3.5 Pro。
同一事件,精选展示《受 DMA 影响,Siri AI 在欧盟将随 iOS 27 和 iPadOS 27 延迟上线》We heard concerns that Antigravity consumes many tokens for simple tasks now. So, we're adding Gemini 3.5 Flash (Low) as...
早报精选10篇文章并精讲3篇:包括Google与OpenAI将AI商业竞争焦点转向部署落地,Anthropic研究PM揭秘下一代Claude的「dreaming机制」,以及关于“超级个体”是通过完整Closed-loop被激发而成的反直觉观点。
Salute to the Qwen team 🫡 We tested Qwen 3.7-Max, Gemini 3.5 Flash, GPT-5.5, and Claude Opus 4.7. The biggest shock cam...
谷歌研究院提出基础模型SensorFM,通过学习超过500万人产生的逾1万亿分钟可穿戴设备传感器数据,掌握了人类生理活动的一般性模式。该模型超越了将数据压缩为简单指标的传统方法,能够从数据中提取出有意义的结构并将其复用于多种健康预测任务。实验显示,模型规模和数据量越大性能越强,且其学习到的数据表征在35项预测任务中的34项上,均优于基于工程特征的基线方法。
谷歌宣布Gemini应用月活用户已突破9亿。在此次更新中,Gemini正从工具演变为更主动的个人AI代理。主要更新包括新一代模型Gemini 3.5 Flash、全新的“Neural Expressive”设计语言,以及能将提示转化为高质量视频的Gemini Omni模型。核心亮点是两项代理功能:“Daily Brief”提供个性化每日简报,“Gemini Spark”则作为24/7的个人代理,在用户授权下主动管理任务与数字生活。这些更新标志着AI助手向更主动、更整合的方向发展。
关联讨论 18 条Google Blog:AI(RSS)X:Sundar Pichai (@sundarpichai)Google DeepMind:Blog(RSS)The Verge:AI(RSS)X:Google DeepMind (@GoogleDeepMind)Google Developers Blog(RSS)The Decoder:AI News(RSS)IT之家(RSS)X:Berry Xia (@berryxia)X:Google AI (@GoogleAI)X:Jeff Dean (@JeffDean)X:Gemini (@GeminiApp)Hacker News 热门(buzzing.cc 中文翻译)X:Google AI for Developers (@googleaidevs)X:Rohan Paul (@rohanpaul_ai)X:Logan Kilpatrick (@OfficialLoganK)X:阿易 AI Notes (@AYi_AInotes)X:Kim (@kimmonismus)谷歌在I/O开发者大会宣布,系统性构建面向AI代理(Agent)的开发与部署工具链。核心更新包括:独立桌面应用Antigravity 2.0及其命令行工具、SDK面世;Google AI Studio新增Kotlin支持,可一键开发安卓应用并发布,同时推出移动端App。此外,Gemini API推出托管代理服务,实现一键部署;WebMCP作为开放标准在Chrome 149中推出,允许网页向代理暴露工具;Chrome DevTools也开放给AI代理以自动化调试。企业级客户可直接连接Google Cloud项目,而DeepMind的科学技能包则加速特定领域研究。此举标志着谷歌正全面打造从开发、接口到部署的完整AI代理生态系统。
同一事件,精选展示《Gemini 3.5:具备行动能力的前沿智能》谷歌CEO桑达尔·皮查伊透露,公司在2022年已基于LaMDA模型开发出接近ChatGPT的产品,但因输出内容存在毒性且不符合内部质量标准而未能广泛发布。皮查伊指出,公司存在“搜索质量偏见”,对产品的可靠性和安全性设有更高门槛。LaMDA模型并非仅停留在研究阶段,谷歌曾通过AI Test Kitchen进行有限测试。他补充道,从后视镜看,OpenAI的成功在当时并非显而易见,这使得谷歌的决策过程更为复杂。
An update: we're 3xing the rate limits for Gemini models across all paid tiers in Antigravity and resetting everyone's G...
Yesterday, we 3x'd limits on Antigravity and are seeing you build so much more. One thing we heard was people are worrie...
Yesterday, we 3x'd limits on Antigravity and are seeing you build so much more. One thing we heard was people are worrie...
Yesterday, we 3x'd limits on Antigravity and are seeing you build so much more. One thing we heard was people are worrie...
Google Gemini上线Daily Brief功能,能在早晨主动扫描用户的邮件、日历与最新动态,提炼出当日需优先处理的事项,生成一份简洁的待办清单,帮助用户快速把握全天重点。该功能目前面向Google AI Plus、Pro和Ultra用户在美国地区开放。
Get a head start on your day with Daily Brief. Gemini can now proactively flag what matters most in an easily digestible...
用户批评部分AI模型厂商在发布新模型时,未公开关键基本信息,如Qwen Max 3.7 Max的参数规模、定价,以及Gemini Omni的价格。这些基础信息缺乏公开透明,导致用户难以通过常规搜索获取,需额外花费时间查询官网,影响了信息获取效率与体验。
We're bringing agentic capabilities to @PomelliByGoogle to make it easier for businesses to create on-brand content. 🚀 ...
An update: we're 3xing the rate limits for Gemini models across all paid tiers in Antigravity and resetting everyone's G...
We believe our Labs experiments are at their best when they're helping you create whatever you can imagine. We had some ...
The Gemini app for iOS looks so much better than ChatGPT and Claude. Google absolutely COOKED with this one. 🔥
Sundar Pichai (@sundarpichai), Google CEO, on: 🔹Race to AGI 🔹Agents 🔹AI & Information Diet 🔹Open Source 🔹Cybersecur...
同一事件,精选展示《Gemini 3.5:具备行动能力的前沿智能》CapCut is partnering with @GeminiApp . Soon, users will be able to edit images and videos directly within the Gemini app...
Very excited that @GoogleAIStudio is coming to mobile (both Android and iOS) with native apps! We rebuilt the vibe codin...