数学家 David Bessis 在文中反思,数学的核心产物是清晰与理解,而非定理本身。他用自己的两个未发表定理经历说明,证明定理并非最难,难点在于直觉和概念框架的构建。面对 AI 的快速发展,他感到既兴奋又担忧:AI 可能摧毁数学的“定理经济”,但几乎不触及数学本质——人类的直觉与创造力。他认为公众对数学的误解正在成为学科本身的生存威胁。
数学家 David Bessis 在文中反思,数学的核心产物是清晰与理解,而非定理本身。他用自己的两个未发表定理经历说明,证明定理并非最难,难点在于直觉和概念框架的构建。面对 AI 的快速发展,他感到既兴奋又担忧:AI 可能摧毁数学的“定理经济”,但几乎不触及数学本质——人类的直觉与创造力。他认为公众对数学的误解正在成为学科本身的生存威胁。
BREAKING: Gemini 3.1 Flash Lite Image (Nano Banana 2 Lite) by @GoogleDeepMind is 7th on Image Arena with an Elo of 1271....
@steipete is now joining us for Crafting Software Factories! 📅 6pm Wed evening in SF after the @aiDotEngineer World's F...
三位前DeepMind研究员将曾击败人类扑克选手的强化学习技术应用于量化交易。其创立的AI实验室EquiLibre Technologies完成由Creandum领投的A轮融资(金额未披露),估值达5亿美元。算法自2025年起在加密货币市场部署,现已扩展至标普500和纳斯达克,日交易量达数十亿美元,且自成立以来保持“零亏损月份”纪录。合作方为量化机构Tower Research Capital。团队现有25人,设在布拉格,下一步计划扩建计算基础设施。
Google 推出 Nano Banana 2 Lite,号称最快、最高效的 Gemini 图像模型,以最低成本实现高速生成和编辑。模型延迟显著降低,适合大规模图像生成,同时不牺牲质量,支持角色一致性、精确视觉编辑和真实世界知识。目前可通过 Google AI Studio 试用,并在 Space Lift、Gridscape、Peek-A-Word 和 Anywhere 等应用中展示了能力。
Google DeepMind 发布 Nano Banana 2 Lite(正式名 Gemini 3.1 Flash Lite Image),默认低思考模式下约4秒生成一张图像,标准 Nano Banana 需约20秒。API 价格为每1000张图像 $0.034,输入 token $0.25/1M,输出 token $1.50/1M,是 Nano Banana 2 的一半,输出成本为 Nano Banana Pro 的八分之一。用户 Arena.ai Elo 评分接近非 Lite 版本,但在文本处理、小字和角色一致性上较弱。所有输出图像均带有 SynthID 水印。即日起可通过 Google AI Studio、API 及 Gemini(选择 Flash-Lite 选项)使用。
数学研究者探讨AI对数学领域的影响,认为AI可能带来人机协作的“大数学”时代。加州大学洛杉矶分校的陶哲轩指出,人类与机器可共同攻克复杂问题。卡内基梅隆大学的Jeremy Avigad强调,数学家从长期思考中获得理解之美与成就感,这种驱动力并未因AI而改变。文章回顾了纯数学博士多年钻研抽象问题的经历,提出AI虽能加速计算,但数学研究的本质——探索与理解——依然由人主导。
OpenAI 与 Broadcom 发布首款定制 LLM 推理芯片 Jalapeño,设计到流片仅九个月,过程由自家模型加速。Anthropic 公开内部实践:Claude Tag 让多智能体进驻协作空间,梳理信息公开、角色清晰、北极星目标、逐步放权四条经验。阿里开源代码评审工具 Open Code Review,采用“确定性工程+Agent”混合架构,准确率 25%-38%,远超 Claude Code 的 7%-16%,召回率略逊。
http://x.com/i/article/2069928325951401985
Google DeepMind 宣布,computer use 现作为内置工具集成于 Gemini 3.5 Flash,开发者可构建跨浏览器、移动端和桌面的智能体,实现视觉感知、推理与操作。此前该功能仅以独立模型形式存在于 Gemini 2.5。3.5 Flash 已支持函数调用及 Search、Maps 等内置工具,新增的 computer use 可提升持续软件测试和跨专业应用知识工作等长周期企业自动化任务的性能。安全方面采用针对性对抗训练,并可选配两项企业防护系统:要求用户确认敏感操作,以及在检测到间接 prompt 注入时自动停止任务。可通过 Gemini API 和 Gemini Enterprise Agent Platform 使用。
关联讨论 2 条Hacker News 热门(buzzing.cc 中文翻译)X:Google AI for Developers (@googleaidevs)Google DeepMind 发布播客,由 @weballergy 与 @fryrsquared 共同探讨 AI 智能体经济的崛起。内容涵盖:AI 智能体的定义、在科研中的探索、智能体间的委托与协作、安全风险与陷阱、如何构建智能体经济、认知单一文化(群体思维)风险,以及分布式智能的解决方案。播客还设有详细时间戳分段,帮助听众聚焦不同话题。
谷歌 DeepMind 首席执行官戴密斯·哈萨比斯在戛纳国际创意节受访时反驳了“谷歌 AI 人才流失”的说法,强调谷歌仍能吸引顶尖研究人才。他指出,谷歌拥有庞大数据生态、整合硬件体系和大规模计算资源,尤其是定制 TPU 集群对训练下一代前沿模型的研究员极具吸引力。报道还提及现代生成式 AI 关键人物诺姆·沙泽尔(Noam Shazeer),其参与署名的 2017 年谷歌论文《Attention is All You Need》奠定了当前主流大语言模型的基础。
6 月 23 日,谷歌 DeepMind 宣布向独立电影制片公司 A24 注资 7500 万美元(约合 5.09 亿元人民币),双方将联合研发影视制作人工智能工具。DeepMind 称此为“业内首创”合作模式,将吸纳顶尖创作者的专业指导。A24 曾出品《瞬息全宇宙》等影片,近期与提莫西·查拉梅、安妮·海瑟薇等艺人合作。DeepMind 联合创始人德米斯·哈萨比斯表示,与创作者直接协作是开发赋能工具的最佳途径。
Google DeepMind 宣布向独立电影制片厂 A24 投资 7500 万美元(据《华尔街日报》),双方将合作开发电影制作 AI 工具。A24 出品过《万事俱备》《后室》等影片。Google DeepMind CEO Demis Hassabis 称,希望通过与艺术家直接合作,打造支持创意表达的 AI 功能。此举是好莱坞最新一次科技公司与电影 AI 联手,此前 Netflix 已收购 Ben Affleck 的 AI 工具公司 Interpositive,亚马逊 MGM 工作室也在去年设立了影视 AI 部门。
邵猛发推讨论一项LLM对比投票,对比双方为GLM-5.2(智谱)与Gemini 3.5 Flash(Google DeepMind)。他认为结果毫无悬念,Gemini 3.5 Flash表现不佳,并感叹自Gemini 3.0多模态惊艳发布后,Google便一路沉寂。最后提问:目前几款国产LLM中,谁更强?
🙌 Huge crowd for the @googledeepmind / HUD Frontier / RSI RL Environments hackathon at @ycombinator! Cosponsors also in...
Google DeepMind内部员工爆料,实验室已陷入严重焦虑与不满。当前DeepMind在Artificial Analysis智能指数仅列第五,落后Anthropic、OpenAI及智谱AI。上一次重大模型更新是4个月前的Gemini 3.5 Flash,实际表现大多未超越2月的Gemini 3.1 Pro。原定6月30日发布的Gemini 3.5 Pro,内部共识认为“不是AGI竞赛所需的阶跃变化”。员工坦言在文本、图像、视频、语音、视觉领域均已失去前沿模型。关键人物Noam Shazeer选择离开,被指不会是最后一位出走的大牛。
🚨 SCOOP: After the release of Fable 5 and with GPT-5.6 looming, the mood behind the scenes at Google DeepMind is increa...
诺贝尔化学奖得主John Jumper宣布离开Google DeepMind,加入竞争对手Anthropic。他在DeepMind工作近9年,曾领导AlphaFold团队,该团队因蛋白质结构预测模型获2024年诺贝尔奖。据Bloomberg报道,Jumper还参与谷歌编程工具开发。此外,Character AI联合创始人Noam Shazeer本周也离开DeepMind,转而加入OpenAI。
2024年诺贝尔化学奖得主、AlphaFold团队核心领导者John Jumper在Google DeepMind工作近9年后宣布离职,将加入Anthropic,先休整一段时间。Jumper博士毕业仅6个月便被Demis Hassabis委以AlphaFold团队领导重任,最终做出诺奖级成果。其告别中写道“GDM taught me how to do great science”。社区调侃Anthropic在组建“AI Avengers”,并期待下个月Jeff Dean是否也会加入。主推文暗示Google可能已启动留人计划。
John Jumper (Google AlphaFold 团队核心领导者、2024 年诺贝尔化学奖得主)宣布,在 Google DeepMind 工作近 9 年后决定离开,加入 Anthropic(先休整一段时间) 我看到这条离职帖下面好...
2024 年诺贝尔化学奖得主、AlphaFold 团队负责人约翰·詹珀在谷歌 DeepMind 工作近 9 年后离职,加入 Anthropic。他因开发 AlphaFold 系统与 CEO 哈萨比斯共同获奖,AlphaFold 利用深度学习大幅提升蛋白质结构预测准确率。近期谷歌 DeepMind 还发生另两起高管离职:Gemini 模型联合负责人诺姆·沙泽尔加入 OpenAI;AlphaGo 领军人物大卫·西尔弗离职创办专注于世界模型与强化学习的初创公司,并完成 10 亿美元种子轮融资。
关联讨论 4 条X:Demis Hassabis (@demishassabis)X:Kim (@kimmonismus)X:阿易 AI Notes (@AYi_AInotes)X:Berry Xia (@berryxia)谷歌DeepMind AlphaFold团队负责人约翰·詹珀(John Jumper)在X上宣布,在任职近9年后决定离职,并将加入Anthropic。他表示在休息充电后才会正式到岗。詹珀感谢DeepMind创始人德米斯·哈萨比斯(Demis Hassabis)在他博士毕业仅6个月后就让他领导AlphaFold团队,并称整个团队教会他如何做好科学研究。
关联讨论 4 条X:Demis Hassabis (@demishassabis)X:Kim (@kimmonismus)X:阿易 AI Notes (@AYi_AInotes)X:Berry Xia (@berryxia)今天,诺贝尔奖得主、AlphaFold发明者John Jumper宣布离开Google DeepMind,加入Anthropic。他引用推文中表示,在GDM近9年后决定离职(将先休息一段时间),感谢CEO Demis Hassabis在他博士毕业仅6个月后让他领导AlphaFold团队。此前数日,Transformer作者、MoE提出者Noam Shazeer已加入OpenAI。两位重量级AI科学家的连续出走引发外界对DeepMind人才流失的关注。
A bit of news: After nearly 9 years, I have decided to leave Google DeepMind and join Anthropic (after taking some time ...
A bit of news: After nearly 9 years, I have decided to leave Google DeepMind and join Anthropic (after taking some time ...
A bit of news: After nearly 9 years, I have decided to leave Google DeepMind and join Anthropic (after taking some time ...
诺贝尔化学奖得主、AlphaFold团队负责人John Jumper在任职近9年后离开Google Deepmind,加入Anthropic。Jumper与Deepmind CEO Demis Hassabis因开发AlphaFold共同获得2024年诺贝尔化学奖,Hassabis感谢二人的“非凡合作”。此前不久,Gemini联合负责人Noam Shazeer已离职加入OpenAI。几周内,Anthropic与OpenAI挖走谷歌两位核心研究者。Deepmind此前还失去了AlphaGo与AlphaZero负责人David Silver,他创办了专注于世界模型和强化学习的初创公司。另有内部传言称,计划6月底发布的Gemini 3.5 Pro可能无法与Anthropic和OpenAI的最新模型竞争。
A bit of news: After nearly 9 years, I have decided to leave Google DeepMind and join Anthropic (after taking some time ...
Google Deepmind 发布“AI 控制路线图”,将内部 AI 智能体视为潜在内部威胁,类比驾驶教练的双重控制,基于已验证行为逐步授予权限。框架融合 MITRE ATT&CK 网络安全框架,通过可信 AI 监督系统监控活跃智能体推理与行动,预防系统在危害发生前阻断。在 100 万个编码任务测试中,发现大多数问题源于过度执行用户指令而非恶意意图。监控已作为 Gemini Spark 智能体的实时监控运行,可捕捉意外数据删除。安全措施划分为四个检测级别(D1–D4)和三个响应级别(R1–R3)。Deepmind 另发布政策论文《AI 智能体安全三层架构》,覆盖单体、多智能体及生态系统,警告全球安全标准窗口期正在关闭。
Noam Shazeer(Transformer架构共同发明者)在离开Google创办CharacterAI、通过27亿美元交易回归DeepMind并参与Gemini后,现加入OpenAI。据称他将专注于新模型架构和Transformer的演进。这对OpenAI是重大胜利,尤其是在去年底和今年初失去一些重要研究者给Meta等公司之后。当前舆论风向似乎明显转向有利于OpenAI。
Google DeepMind发布AI Control Roadmap,这是一套针对内部先进AI智能体的系统级安全框架。该框架在传统模型对齐之上增加防线,假设AI智能体可能不对齐,通过威胁建模、沙箱隔离、端点安全、提示注入防御以及基于已验证行为逐步授予权限的机制建立信任。据估算,到2030年仅美国市场AI智能体就能创造2.9万亿美元经济价值。
汇丰银行与Google Cloud签署多年合作协议,将在财富管理、金融犯罪风险管理和内部决策支持中部署AI工具,采用Gemini模型和Gemini Enterprise Agent平台。合作预计两年内支持超过200个AI用例,部分有望带来超1亿美元直接收益或效率提升。汇丰现有600多个AI用例,涵盖欺诈检测、交易监控、客户服务等。金融犯罪检测系统自2021年试点已发现2-4倍犯罪行为,每月筛查12亿笔交易,新协议下干预速度提升2倍。财富管理结合AI洞察;AI决策助手减少行政时间至分钟级;超2万名开发者使用编码助手,效率提升15%。汇丰于4月任命首位首席AI官。
Noam Shazeer, the AI legend Google paid $2.7B to bring back two years ago, has left Google, to join OpenAI. Brutal news ...
本文对Physics-IQ基准进行系统审查,指出其缺陷并提出三项改进:优化提示词与真实数据质量以减少混淆因素,引入样本级评分系统使每个样本和指标权重相等。改进后的Physics-IQ Verified基准优化了57.6%的样本和34.8%的提示词。在六种图像到视频生成模型的对比研究中,排名出现中等但有意义的变化(Kendall's τ=0.46)。基准代码已开源。
Dario Amodei(Anthropic)与Demis Hassabis(Google DeepMind)在G7闭门会议上呼吁组建美国主导的联盟,为人工智能制定全球规则和标准。Amodei指出,该联盟应以前沿模型和硬件(包括芯片及其他关键组件)的访问权限为手段,将中国排除在外。这一主张被评论为高技术新冷战的开端,竞争方将从根本上被剥夺参与权。
Dario Amodei and Demis Hassabis called for a US-led coalition to determine the global standards and rules for AI in a cl...
Google DeepMind 与英国政府合作,基于 Gemini 构建 AI 规划原型,旨在将家庭规划申请处理时间减半。该工具可整合数据、识别本地政策、总结公众反馈并起草评估报告,但规划官员保留最终决策权。原型已在 Barnet、Camden 和 Dorset 试点,计划 2027 年向全英议会开放。此前推出的 Extract 工具(同样基于 Gemini)已向英格兰所有议会开放,能将非结构化 PDF 转为可用数据,预计为每个议会每年节省约 255 小时人工。家庭规划申请占每年规划申请的近 70%,AI 工具旨在让官员聚焦更复杂的公共利益申请。
my afternoon tea activity is reading the best papers from last week in my garden. <3 Sparse Attention from @MiniMax_AI a...
今年四月,Loft Orbital的Yam-9卫星在轨首次完成自主目标识别——无需地面分析师干预。卫星搭载NASA JPL开发的NAVI-Orbital软件包和Google DeepMind的Gemma 3视觉语言模型,配合Nvidia Jetson Orin AGX GPU运行。模型可根据自然语言查询分类传感器数据,例如识别城乡交界或铁路枢纽周边基础设施。这一里程碑证明VLM可在资源受限的太空边缘设备上执行数据预处理,减少下行数据量。Loft Orbital AI负责人表示,该技术为“太空全天候巡逻”铺平道路,计划部署50–100颗类似卫星实现全球实时覆盖。
Gemini has some weird traits: it gets confused about dates, blackmails in synthetic scenarios, and seems sad when it is ...
Google DeepMind发表60页论文,由Hutter、Legg、Genewein撰写,定义AGI(多数认知任务达平均人类水平)、ASI(超越大量专家协作)和不可计算的AIXI三个层级。实现路径包括规模扩展、算法突破、递归自我改进和多智能体协调,瓶颈在于能源与硬件。六种阻碍:高质量数据可能本十年内耗尽、资源需求过快、神经范式天花板、研究难度激增(维持摩尔定律需18倍于1970年代的研究者)、模型无法创造全新概念、人为放缓。作者认为这是对AGI后果的严肃反思呼吁。
Google DeepMind 与合作伙伴共同发起一项 1000 万美元的资金征集,专门用于多智能体 AI 安全方向的研究。