"We are only a few years away from AGI (...) we can start feeling it now. 2026,2027 is when it's starting." Demis Hassab...
"We are only a few years away from AGI (...) we can start feeling it now. 2026,2027 is when it's starting." Demis Hassab...
Google DeepMind 将其 Genie 3 世界模型与多年积累的街景图像数据相结合,推出了一项新功能。用户现在可以在地图上指定一个真实地点,系统便能生成一个基于该地点的、可供行走和探索的 AI 生成世界。这一整合不仅为创意演示提供了强大工具,更重要的是,海量的街景数据成为了训练 AI 代理和机器人的重要战略资源,为人工智能在模拟现实环境中的交互与导航能力开辟了新路径。
Google DeepMind 最新发布的 Gemini 3.5 Flash 模型在性能与速度的平衡上取得突破。其智能指数得分为 55,较上一代大幅提升,超越了 Grok 4.3 和 Claude Sonnet 4.6。模型在智能体任务和降低幻觉率方面进步显著,输出速度超过 280 tokens/s。然而,其 API 定价相比前代模型上涨约 3 倍,运行基准测试的成本更是达到 5.5 倍。这意味着 Gemini 3.5 Flash 在实现“更快更智能”的同时,也显著改变了 Flash 系列以往低成本的市场定位。
Google's new Gemini 3.5 Flash is the clear leader on the Intelligence vs Speed Pareto frontier and makes large gains on ...
谷歌DeepMind CEO哈萨比斯近期强烈批评“AI取代开发者”的论调,指出这是重大错误且别有用心。他认为企业应利用AI将工程师生产力提升3-4倍所带来的能量去扩展业务规模、探索更多创新,而非进行裁员。在谷歌I/O大会期间,公司发布了编程能力强大的Gemini 3.5 Flash模型及编程工具Antigravity,并宣布更强大的Gemini 3.5 Pro将于下月推出。这一系列动作旨在表明,AI的核心价值在于增强人类生产力,而非替代工作。
Google发布了原生多模态模型Gemini Omni。与传统模型需逐帧描述不同,它采用底层原生设计,支持以意图驱动生成视频,并能通过多轮对话进行编辑,每一步都基于上一结果,确保一致性。该模型融合了Gemini的世界知识与物理直觉,并能将图、文、音视频等任意参考物组合,实现跨模态叙事生成。其目标是“从任何东西创造任何东西”,并从视频生成起步。
We're dropping Gemini Omni: our first step towards a model that can create anything from anything - starting with video....
The results of the research happening in my team @GoogleDeepMind have convinced me that the next era of scientific disco...
在谷歌I/O 2026主题演讲的压轴环节,谷歌DeepMind首席执行官德米斯·哈萨比斯将当下称为“人类的深刻时刻”。他宣布发布Gemini 2.5 Pro和2.5 Flash模型,并介绍了“Project Astra”原型项目的最新进展。哈萨比斯宣称,谷歌尖端的AI研究将释放通用人工智能(AGI)的巨大潜力,成为人类创造力的“力量倍增器”,开启科学发现的新黄金时代,最终改善全球每个人的生活。在回顾展望时他表示,我们可能正处在“奇点”的初始阶段。
Google推出Gemini Omni,首个面向消费者的世界模型。它通过自然语言交互,将Gemini的智能与生成媒体系统结合,实现了对物理规律、历史、生物等世界的深刻理解。用户可以像编辑ChatGPT文本一样用单句指令编辑视频,实现人物一致性、风格迁移、角度调整等功能。它不是单纯生成像素,而是模拟连贯的物理与语义世界,标志着AI视频生成从拼接工具向智能创作系统的飞跃。
We're dropping Gemini Omni: our first step towards a model that can create anything from anything - starting with video....
谷歌发布新模型Gemini 3.5 Flash,其在智能指数上提升9分至55分,超越Grok 4.3和Claude Sonnet 4.6,尤其在代理任务和知识真实性(大幅减少幻觉)方面进步显著。输出速度超280 tokens/s,使其位于速度与智能的领先前沿。然而,模型运行成本相比前代增加5.5倍,主要由于输入令牌用量及定价上涨。此外,它在多模态评估MMMU-Pro中取得最高分,支持多模态输入,展现了谷歌的综合优势。
谷歌推出原生多模态AI模型Gemini Omni,能够整合视频、图像、音频和文本等多种输入,生成高质量视频内容。其核心能力是通过自然语言对话进行视频编辑,并能保持角色一致性、物理规律与场景连贯性。首个模型Gemini Omni Flash已上线,未来将支持图像和音频输出。Gemini Omni结合了对物理世界的直觉理解与丰富的知识库,支持从写实到叙事的创意生成,并可通过多轮对话持续编辑视频,而不丢失原始场景上下文。
同一事件,精选展示《Gemini 3.5:具备行动能力的前沿智能》谷歌宣布向全球的 Google AI Ultra 订阅者开放新的访问权限,并推出一项基于 Street View 数据驱动的全新功能。该功能能够模拟真实世界的地点与场景,标志着 AI 在结合地理信息与沉浸式体验方面迈出新步伐,为用户带来更具现实感的交互与探索可能性。
谷歌 DeepMind 创始人德米斯·哈萨比斯被披露为人工智能公司 Anthropic 的天使投资人。Anthropic 是谷歌的主要竞争对手,估值已达 9000 亿美元。此外,自 2021 年以来,前 DeepMind 科研人员创办的十余家公司累计融资至少 140 亿美元,包括哈萨比斯创立的 Isomorphic Labs 等。同时,多名 DeepMind 高层已调任谷歌关键岗位。这一系列动态突显了哈萨比斯的影响力以及 DeepMind 人才对 AI 行业的广泛推动作用。
Google 推出 Gemini for Science 项目,发布一系列基于 Gemini 模型的科学工具与实验性应用。该项目旨在扩展科学探索的规模与精度,通过人工智能辅助研究人员处理复杂计算、模拟实验系统并加速数据分析流程。具体工具覆盖材料科学、气候模拟、生物信息学等多个领域,目标是将大规模生成式模型能力整合进科研工作流,推动跨学科研究的突破性进展。
关联讨论 3 条X:Google AI for Developers (@googleaidevs)X:Google DeepMind (@GoogleDeepMind)X:Google AI (@GoogleAI)Google DeepMind论文指出,AI智能体的安全威胁不仅源于模型本身,更在于其实时交互的信息环境。研究首次系统阐述了如何将网络武器化以攻击自主智能体,并提出了针对感知、推理、记忆、行动等维度的“AI智能体陷阱”分类法。关键发现是,对智能体构成威胁的网页无需呈现恶意外观,因为它们可能解析人类不可见的隐藏内容。一旦引入RAG等记忆机制,潜伏的记忆污染攻击成功率可超过80%。研究强调,当智能体能在推理时摄取网络信息,每个页面、文档和记忆写入都成为了安全边界的一部分。
新加坡与Google DeepMind达成战略合作,共同将前沿人工智能技术应用于解决该国在医疗健康、教育创新和可持续发展等领域的复杂挑战。双方旨在通过该国家级伙伴关系,推动AI技术在实际场景中的落地,以应对社会性难题,提升国家科技竞争力。
Clare Bryant教授利用Co-Scientist这一工具,针对新兴传染病背后的基因触发因素进行研究,旨在揭示驱动这些疾病出现的分子开关机制。这项工作有望帮助快速识别潜在的新发传染病威胁,为疾病监测与早期预警提供新的技术路径。
Calico Life Sciences 通过 Co-Scientist 平台,将零散的衰老研究发现进行连接与整合,从而生成新的研究线索与方向。该工具旨在加速衰老领域的科学探索,为后续研究提供创新思路。
波士顿儿童医院与麻省理工学院的实验室达成合作,共同利用生物学工具包,探索基于RNA的肌萎缩侧索硬化症新疗法。这项跨机构合作旨在为这种神经退行性疾病开发创新治疗路径。
斯坦福大学遗传学家利用Co-Scientist工具,在现有药物中筛选用于治疗慢性肝病和肝纤维化的潜在疗法。这种方法专注于老药新用,旨在加速药物发现过程,为肝纤维化这一难治性疾病提供新的治疗思路。
WeatherNext AI模型协助气象预报员为社区在飓风Melissa登陆前提供了前所未有的准备时间。该模型通过提升预测准确性与提前量,帮助牙买加等地成功应对了这场历史性的飓风事件,显著增强了灾害预警的时效性。
Google发布了Gemini 3.5模型,该模型专注于提升执行复杂任务的能力。其核心特点是支持“代理式工作流”,即能够像助手一样自主规划并执行一系列多步骤、复杂的操作,旨在将先进的语言理解与实际问题解决能力相结合。
关联讨论 18 条X:Google AI (@GoogleAI)Google Blog:AI(RSS)X:Sundar Pichai (@sundarpichai)The Verge:AI(RSS)X:Google DeepMind (@GoogleDeepMind)Google Developers Blog(RSS)The Decoder:AI News(RSS)IT之家(RSS)X:Berry Xia (@berryxia)X:Jeff Dean (@JeffDean)X:Gemini (@GeminiApp)Hacker News 热门(buzzing.cc 中文翻译)X:Google AI for Developers (@googleaidevs)X:Rohan Paul (@rohanpaul_ai)X:Logan Kilpatrick (@OfficialLoganK)X:Ethan Mollick (@emollick)X:阿易 AI Notes (@AYi_AInotes)X:Kim (@kimmonismus)文章以AlphaGo为例,阐述了智能的基本构成要素。AlphaGo至今仍是最清晰、最完整的范例,它融合了三大核心基础:搜索技术、从经验中学习以及自我对弈。这三大要素共同构成了其实现超越人类棋艺的关键路径。
AlphaGo核心研究员David Silver提出一个思想实验:若将大语言模型置于一个普遍相信地平说的世界,且模型无法与现实世界互动,那么无论其代码如何优化,它都将永远是一个“地平论者”。这揭示了大型语言模型(如GPT、Claude、LLaMA等)真正的能力上限并非取决于算力或参数量,而在于其思维被严格限制在所“喂养”的数据框架之内,缺乏与现实交互以验证和更新认知的根本能力。
Deepmind 提出“指针工程”概念,旨在将鼠标光标转变为上下文工程中的关键变量。这一设想试图超越传统的提示词工程,通过光标在界面上的物理位置和移动轨迹来影响和引导 AI 模型的行为与输出。其目标是为人机交互开辟新范式,使光标成为与 AI 系统进行精细、动态交互的核心工具。
DeepMind重新构想人工智能时代的鼠标指针,将其从简单的图形符号转变为动态的、情境感知的AI交互界面。新指针能根据用户当前任务和屏幕内容智能变化形态与功能,例如在文本编辑时变为书写工具,在分析数据时可视化显示相关信息。这一设计旨在减少传统图形界面中的频繁窗口切换,通过指针直接提供上下文辅助,提升人机协作效率,标志着输入设备从被动工具向主动协作伙伴的演进。
Isomorphic Labs在Demis Hassabis领导下完成21亿美元B轮融资,旨在将AI用于药物发现以攻克所有疾病。Demis强调AI的首要应用应是改善人类健康,而非仅开发聊天机器人。其团队此前凭借AlphaFold2解决了蛋白质结构预测难题,现在目标是将药物研发从漫长、昂贵、高失败率的试错过程,转变为可预测、可迭代的工程,有望将研发周期从10-15年缩短至2-5年,并大幅降低成本。这被视为人类用AI向所有疾病宣战的关键行动,有望变革医疗领域。
I've always believed the No.1 application of AI should be to improve human health. That work started with AlphaFold, and...
Co-Scientist 是一款由 Gemini 构建的协作式 AI 助手,旨在帮助科研人员加速科学突破。它通过多智能体(multi-agent)的架构设计,作为研究人员的智能伙伴参与工作流程,以提升研究效率并推动创新发现。
谷歌DeepMind与Coursera合作推出的“Gemini for Developers”专项课程现已开放注册。该课程旨在指导开发者利用Gemini模型构建可用于生产环境的AI解决方案。其核心涵盖三大模块:“推理与行动”使AI应用能推理并执行复杂任务;“连接与自动化”通过函数调用将Gemini与现实世界工具集成;“规模化与信心”则专注于构建、测试和部署可扩展的AI系统。课程强调超越单纯文本生成,实现实际任务的自动化与系统集成,助力开发者快速上手。
DeepMind纪录片记录关键一幕:团队告知Demis Hassabis可在一个月内预测所有已知蛋白质序列时,他未纠结风险与回报,直接回应“Do it”。随后AlphaFold向世界免费开源,解决了生物学界50年难题。此举虽未直接盈利,却催生了估值数十亿美元的Isomorphic Labs,建立了信任与生态。推文借此批判当前AI圈空谈融资与参数却无实质成果的现象,强调真正改变世界在于解决难题并免费开放。Demis被赞为兼具远见与决断力的领导者。
Still incredible that the DeepMind documentary has footage of exact moment Demis is told that AlphaFold can "easily" pre...
2016年AlphaGo以第37手“神之一手”战胜李世石,其真正遗产在于让顶尖人类棋手承认AI拥有超越人类的创造力,打破了人类对自身智慧的千年傲慢。十年间,AI已从“登月”级突破演变为如Gemini般的日常工具。Demis与李世石重聚时指出,AlphaGo改变了棋手的思维方式,AI并未取代围棋,而是让棋手站在其肩膀上创新,使围棋技艺进入新境界。这揭示了AI与人类最理想的共生形态——提升而非取代。展望未来,今日的AI变革或许仅是漫长征程的起点。
Hard to believe it's been 10 years since AlphaGo! It was wonderful to catch up with Lee Sae Dol last week in Korea and j...
#AlphaGo WINS!!!! We landed it on the moon. So proud of the team!! Respect to the amazing Lee Sedol too
Some news: This week I am starting at @GoogleDeepMind as Director of AGI Economics on @shanelegg's team. I will be joini...
DeepMind的AI co-mathematician在FrontierMath Tier 4研究级数学问题得分48%,而基础模型Gemini 3.1 Pro仅19%。提升源于多代理架构的智能编排,包括并行代理相互审查证明、编写代码和搜索文献,而非模型本身更智能。评估绕过标准框架,使用48小时每问题、无令牌限制的自有基础设施,因此得分不能直接与其他模型比较。案例中,数学家Marc Lackenby与AI合作解决Kourovka Notebook开放问题,AI提供证明策略,审查代理发现缺陷,人类专家填补空白,展示了高效人机协作。系统存在“reviewer-pleasing bias”和“death spirals”等失败模式。对于Erdős型猜想或千年问题,AI仍缺乏创造性直觉,但能压缩从想法到验证的时间,加速文献搜索和计算验证。论文强调范式转变:系统设计以对实际研究重要的方式复合模型能力,推动数学向数学家与AI代理协作的未来发展。
The future of Math is mathematicians and AI agents working together. Very pleased to introduce @GoogleDeepMind's AI co-m...
Demis Hassabis明确AGI发展应分阶段进行,优先将其作为工具用于理解宇宙底层规律,而非过早赋予意识或代理能力。他强调这种务实路径能避免风险,先提升生产力,再处理更哲学和危险的问题。引用推文也指出AGI应先成为工具,再尝试赋予意识,先用于读懂宇宙语言。这一反向思维理顺了发展路线图,为AGI的下一步提供了稳健方向。
Demis Hassabis says AGI should become a tool before we try to make it conscious. First use it to read the language of th...
DeepMind发布了由Gemini驱动的编程代理AlphaEvolve。该代理能自动生成、测试和优化代码,显著提升了软件开发效率与质量。其影响已扩展至多个领域,包括科学研究和工业应用,在特定基准测试中展示了卓越的代码生成能力。该技术旨在通过自动化复杂编程任务,降低开发门槛并加速各行业的创新进程。
AlphaEvolve推出了基于Gemini大模型的编程智能体,其算法正驱动多个领域产生实际影响。该智能体在商业流程、基础设施优化与科学研究三个关键领域实现规模化应用,通过自动化代码生成与问题解决提升效率。具体实践表明,它能显著加速开发周期并处理复杂任务,标志着AI编程助手从辅助工具向核心生产力引擎的演进。
Google Deepmind 收购了太空大型多人在线游戏 EVE Online 背后开发商的部分股权,旨在将该游戏作为人工智能模型的测试平台。此举意味着 Google Deepmind 将利用 EVE Online 复杂且持续演化的虚拟宇宙环境,来训练和评估其 AI 系统的能力。