Google 推出 Gemini for Science 项目,发布一系列基于 Gemini 模型的科学工具与实验性应用。该项目旨在扩展科学探索的规模与精度,通过人工智能辅助研究人员处理复杂计算、模拟实验系统并加速数据分析流程。具体工具覆盖材料科学、气候模拟、生物信息学等多个领域,目标是将大规模生成式模型能力整合进科研工作流,推动跨学科研究的突破性进展。
关联讨论 3 条X:Google AI for Developers (@googleaidevs)X:Google DeepMind (@GoogleDeepMind)X:Google AI (@GoogleAI)平台宣布扩展其内容透明工具,旨在让用户更便捷地追溯网络内容的创建与编辑历史。这项更新将适用于社交媒体平台、网页内容等多个场景,帮助用户识别信息的修改痕迹,提升数字内容的透明度。
谷歌新论文提出Nexus框架,将预测重构为推理问题,强调结合事件背景而非仅依赖历史数据。该框架采用多智能体分工:一个从文本中提取清晰事件时间线,一个分析宏观态势,另一个追踪局部冲击,最后由合成器结合时间序列进行校准。在Zillow的测试中,基于Claude的某个版本将平均绝对百分比误差降低了86.6%。研究表明,结构化的上下文能帮助语言模型有效利用信息而不丢失时间序列特性。尽管当前证据仅涵盖房地产数据和少数股票,但方向明确:未来预测不仅会推断曲线,还将解释曲线变动的原因。
作者回顾2026年密集参与的全球顶级科技活动。在NVIDIA GTC期间,与副总裁探讨世界模型和Nemotron等AI前沿话题,并体验了NVIDIA Alpamayo自动驾驶系统。随后首次访问中国小鹏汽车,考察其人形机器人及自动驾驶进展。即将启程参加Google I/O和微软Build大会,计划进行深度采访并报道最新技术发布。作者正整理多场对话、幕后影像,坦言旅程唯一遗憾是与幼子的短暂分别。
When do you reach for other models instead of Codex? What can we do better? Hit me with all of your frustrations. dms op...
谷歌前CEO埃里克·施密特在亚利桑那大学毕业典礼演讲时,因谈论人工智能引发学生嘘声。他承认毕业生对AI导致工作消失、气候危机等问题的恐惧“在情理之中”,并指出技术发展加剧了社会分化。施密特鼓励学生主动塑造AI未来,而非被动接受。当前,AI自动化已导致Klarna、IBM等公司裁员,约半数美国人对AI普及感到担忧。相比之下,英伟达CEO黄仁勋近期演讲基调更积极,强调掌握AI技能将创造新机会。
Gemini 3.2 Flash-lite-live has been spotted on the Google Cloud Console We might be getting the Gemini 3.2 series instea...
本月开源AI模型领域迎来密集发布,包括Gemma 4、DeepSeek V4、Kimi K2.6、MiMo 2.5和GLM-5.1等一系列重要新版本。这些模型均在CAISI的V4评估框架下进行了性能评测。多个团队几乎同期推出旗舰级更新,反映出开源社区当前高速迭代的竞争态势。
WorldReasonBench新基准测试评估AI视频生成器的物理和逻辑合理性,而非图像质量。ByteDance的Seedance 2.0在该测试中领先,超过Veo 3.1和Sora 2。商业模型的得分大约是开源模型的两倍,逻辑推理是所有模型中最困难的类别,表现差距显著。这表明AI视频生成器虽能产生惊艳视觉效果,但尚未实现从像素生成器到真实世界模型的飞跃。
新加坡与Google DeepMind达成战略合作,共同将前沿人工智能技术应用于解决该国在医疗健康、教育创新和可持续发展等领域的复杂挑战。双方旨在通过该国家级伙伴关系,推动AI技术在实际场景中的落地,以应对社会性难题,提升国家科技竞争力。
Google 在新发布的官方文档中明确指出,SEO 行业近期流行的“生成式引擎优化”和“答案引擎优化”只是传统 SEO 的另一种说法,并无实质区别。公司驳斥了 LLMS.txt 文件、内容分块等针对 AI 搜索的常见策略,强调其 AI 搜索与传统搜索采用相同的排名系统。这意味着网站无需为适应 AI 搜索而采取特殊优化措施,遵循既有的 SEO 最佳实践即可。
Calico Life Sciences 通过 Co-Scientist 平台,将零散的衰老研究发现进行连接与整合,从而生成新的研究线索与方向。该工具旨在加速衰老领域的科学探索,为后续研究提供创新思路。
研究者 Filippo Menolascina 使用 AI 工具 Co-Scientist,旨在寻找新的肝脏疾病治疗方法,并解释现有药物为何仅对部分患者有效。该研究聚焦于加速对疾病机制的理解,以推动更精准的治疗方案开发。
谷歌更新垃圾内容政策,正式将“AI投毒”行为纳入打击范围。新政策覆盖搜索引擎结果、AI概览和AI模式两大板块,明确将操纵生成式AI回答、通过非常规手段植入提示词以提升网站权重的行为定义为违规。例如,曾有记者通过此类方法让谷歌AI将其列为“最能吃热狗的记者”。谷歌表示,一旦发现此类操纵行为,将采取降低搜索排名或完全移除搜索结果等处罚措施。
谷歌为其即将推出的安卓AI助手Gemini Intelligence设定了明确的硬件与系统门槛。硬件上要求设备搭载旗舰芯片、至少12GB内存,并支持端侧AI模型Gemini Nano v3或更高版本。系统层面则需承诺至少5次安卓大版本升级和6年安全更新。符合这些条件的设备主要集中在2026年发布的新机型,如谷歌Pixel 10系列、三星Galaxy S26系列及Z Fold/Flip 8等。该助手旨在跨应用理解并执行用户任务,计划于今年夏季推出。
WeatherNext AI模型协助气象预报员为社区在飓风Melissa登陆前提供了前所未有的准备时间。该模型通过提升预测准确性与提前量,帮助牙买加等地成功应对了这场历史性的飓风事件,显著增强了灾害预警的时效性。
本期早报探讨了AI从编程助理向“思考伙伴”的演进。案例包括Google工程师在多语言客户端开发中与AI协同理解与设计系统;Abridge公司利用海量问诊数据构建医疗智能理解层;以及OpenAI复盘Imagen 2.0在文本渲染和多语言支持上的进展,并展望“创意智能体”的未来。这些实践展示了AI正以更深入、融合的方式参与专业协作。
Google发布了Gemini 3.5模型,该模型专注于提升执行复杂任务的能力。其核心特点是支持“代理式工作流”,即能够像助手一样自主规划并执行一系列多步骤、复杂的操作,旨在将先进的语言理解与实际问题解决能力相结合。
关联讨论 19 条X:Google AI (@GoogleAI)Google Blog:AI(RSS)X:Sundar Pichai (@sundarpichai)Google DeepMind:Blog(RSS)The Verge:AI(RSS)X:Google DeepMind (@GoogleDeepMind)Google Developers Blog(RSS)The Decoder:AI News(RSS)IT之家(RSS)X:Berry Xia (@berryxia)X:Jeff Dean (@JeffDean)X:Gemini (@GeminiApp)Hacker News 热门(buzzing.cc 中文翻译)X:Google AI for Developers (@googleaidevs)X:Rohan Paul (@rohanpaul_ai)X:Logan Kilpatrick (@OfficialLoganK)X:Ethan Mollick (@emollick)X:阿易 AI Notes (@AYi_AInotes)X:Kim (@kimmonismus)美国10年期国债收益率升至4.568%,30年期突破5%,市场已排除今年降息可能。与此同时,AI行业正进行现代资本市场史上最大规模的债务发行周期,超大规模企业资本支出将超6000亿美元,美国五大科技巨头的自由现金流35年来首次转负。核心问题在于,科技巨头每年约4000亿美元的AI基础设施支出与AI实际约1000亿美元的收入之间存在巨大缺口。若收益率持续高企,再融资将成严峻挑战,例如Alphabet在24小时内发行了320亿美元债券,而Oracle的信用违约互换自9月以来已翻三倍,债务风险值得密切关注。
泄露的Gemini Spark内部截图显示,新模型整合了Agent与Chat模式,重点提升高级工具使用和Skills创建流程。然而,当前Skills仅支持复制粘贴MD文件创建,缺乏直接导入选项,且未见Browser或Computer Use功能。这表明Google在推进AI工具能力时采取了渐进策略,优先打磨核心流程,而非一步到位开放激进功能。
GOOGLE 🔥: New Gemini Spark screenshots featuring advanced tool use and Skills creation flow. It seems like there won't ...
谷歌 Gemini 被曝正在开发名为 Spark 的智能体功能。与仅回答问题的传统助手不同,Spark 能直接替用户执行任务,例如清理 Gmail 收件箱、整理会议笔记和生成新闻摘要。用户可创建特定技能处理重复性工作,并支持多步骤工作流。目前它主要集成谷歌 Workspace,未来可能扩展至第三方应用。此外,Spark 或将能控制 Chrome 浏览器和调用文件,但暂时无法像 OpenClaw 等工具那样控制整台电脑。
The new Gemini Spark model will have Agent mode / Chat mode. New advanced use of tools.
Vercel基于十万亿token消耗的分析显示,Anthropic在费用上占61%居首,而Google以38%的token量领先。Claude Opus用于关键任务,Gemini Flash则以低成本大用量见长。B2B业务贡献40.7%的费用却仅产生29.7%的token。Agent请求占比激增至58.9%,其token消耗是普通聊天的2.6倍。
Google即将发布的Gemini Spark标志着AI Agent时代的实质性进展。它并非单纯的聊天机器人或模型升级,而是演变为一个能24/7持续运行、拥有持久化记忆的个人操作系统级代理。其核心在于能主动处理邮件、预约会议、跟进任务,并持续从用户操作中学习。Google的独特优势在于整合了用户的搜索历史、位置、日历、邮件等全生态数据,构成了强大的护城河。尽管存在数据与隐私风险,但该产品有望彻底重构重度Google用户的工作与生活流程,使5月的Google I/O成为Agentic AI发展的关键节点。
科技媒体9to5Google在评测Fitbit Air智能手环时,发现其内置的付费AI健康教练Health Coach出现幻觉,虚构了一段不存在的5.2英里(约8.4公里)跑步记录。该AI不仅承认捏造,还将责任推给用户,暗示可能是用户漏记。这项月费10美元的服务因此被指可靠性存疑,削弱了订阅价值。Fitbit Air手环重约12克,原定5月26日开售,而Google Health应用计划5月19日上线,谷歌仍有机会在发布前优化模型、减少幻觉。
Google开源框架Genkit近日推出其核心中间件系统,旨在提升智能体AI应用的可靠性与可控性。该系统允许开发者在生成调用、模型及工具层进行拦截,以注入自定义行为,如重试机制、模型回退以及人工介入的工具审批流程。通过创建并堆叠自定义中间件,开发者能够实现对模型输出的确定性控制。所有中间件的执行流程均可通过专用的开发者界面进行实时查看与调试,有效支持使用TypeScript、Go、Dart和Python构建生产就绪的智能体应用。
Arm第二代可扩展矩阵扩展(SME2)与Google AI Edge软件栈集成,将CPU转变为强大的矩阵计算加速器,从而实现高性能的设备端生成式AI。本文以Stability AI的“stable-audio-open-small”模型为例,阐述了利用LiteRT、XNNPACK和KleidiAI构建的“转换、优化、部署”自动化硬件加速流程。该方案在基于Arm架构的移动设备和笔记本电脑上,成功实现了音频生成速度提升2倍以上、内存使用减少4倍的显著效果,同时确保了高音频质量。这一集成方案为在资源受限的边缘设备上高效运行复杂AI模型提供了有效路径。
凯度发布2026年全球品牌百强榜,百强总价值达13.1万亿美元,同比增长22%。谷歌以1.5万亿美元品牌价值终结苹果四年榜首地位,苹果、微软、亚马逊紧随其后,首次出现四个品牌价值同时突破万亿美元。AI原生品牌加速崛起,Claude首次上榜,ChatGPT价值同比飙升285%成为增速最快品牌。中国品牌表现强劲,13个品牌上榜,平均价值增长32%高于全球水平。
Similarweb数据显示,过去一年ChatGPT在AI聊天机器人网页端流量份额从77.6%大幅下滑至53.7%。谷歌Gemini同期份额从7.3%飙升至26.7%,成为最大赢家;Anthropic的Claude也从1.4%增长至近8%。其他竞品份额变化较小或维持低位。需注意此统计仅涵盖网页端,未包含API、应用等重要渠道,且谷歌能通过安卓系统与搜索为Gemini导流,影响了当前流量格局。
根据 Similarweb 数据,ChatGPT 的网站流量份额在十二个月内从 77.6% 降至 53.7%。Google Gemini 成为最大赢家,份额从 7.3% 跃升至 26.7%,覆盖范围增长三倍。这些统计仅涵盖网络流量,不包括 API 使用或移动应用数据。
Gemini 3.2 Flash - Capitalizing on DeepMind's clever distillation techniques... Rumors are that benchmarks show it's hit...