AIHOT
内容
精选全部 AI 动态AI 日报主题收藏
接入
Agent 接入
更多
关于更新日志反馈
内部员工登录
精选全部日报更多
内部员工登录
全部动态资讯 · 115 条
全部一手资讯X论文
标签「DeepMind」清除
5月16日周六
16:16Google DeepMind:Blog(RSS)42寻找新型传染病背后的分子开关
16:08Google DeepMind:Blog(RSS)41开辟衰老研究新路径
15:53Google DeepMind:Blog(RSS)32联合生物学工具包,探索ALS新疗法
15:40Google DeepMind:Blog(RSS)40揭开老药新用对抗肝纤维化的可能性
11:14Google DeepMind:Blog(RSS)43WeatherNext如何帮助美国国家飓风中心更好预测飓风Melissa在牙买加的历史性登陆
06:50Google DeepMind:Blog(RSS)75精选Gemini 3.5:具备行动能力的前沿智能
00:54Dwarkesh Patel:Podcast & Blog(RSS)55精选Eric Jang - 从零开始构建 AlphaGo
5月13日周三
17:43The Decoder:AI News(RSS)43From Prompt to Pointer Engineering: Deepmind 尝试为 AI 时代重塑鼠标光标
07:26Hacker News 热门(buzzing.cc 中文翻译)50为人工智能时代重新构想鼠标指针
5月12日周二
22:40Google DeepMind:Blog(RSS)57精选Co-Scientist:一个加速研究的多智能体AI伙伴
5月8日周五
01:06Hacker News 热门(buzzing.cc 中文翻译)58AlphaEvolve:由Gemini驱动的编程代理,在各领域产生广泛影响
5月7日周四
22:59Google DeepMind:Blog(RSS)66精选AlphaEvolve:我们由Gemini驱动的编程智能体如何跨领域扩展影响力
19:38The Decoder:AI News(RSS)52Google Deepmind 入股 EVE Online 开发商以测试 AI 模型
10:16IT之家(RSS)59谷歌 DeepMind 将借力《星战前夜》游戏,攻克 AI 长期规划难题
5月4日周一
12:13IT之家(RSS)45苹果机器人项目高级工程师离职,跳槽谷歌 DeepMind
5月1日周五
17:47The Decoder:AI News(RSS)60Google Deepmind的"AI协诊医生"在盲测中击败GPT-5.4,但仍落后于经验丰富的医师
4月30日周四
23:09Google DeepMind:Blog(RSS)34以AI联合临床医生开启医疗保健新模式
15:09Hacker News 热门(buzzing.cc 中文翻译)58如何构建未来:德米斯·哈萨比斯 【视频】
4月27日周一
17:19IT之家(RSS)51韩国政府与谷歌 DeepMind 达成合作,5 月启动国家科学 AI 研究中心
15:21Google DeepMind:Blog(RSS)56精选宣布我们与大韩民国的合作伙伴关系
4月22日周三
20:12Google DeepMind:Blog(RSS)与行业领导者合作加速 AI 转型
4月18日周六
17:36The Decoder:AI News(RSS)自我改进型AI初创公司Recursive Superintelligence成立仅四个月即融资5亿美元
03:02The Decoder:AI News(RSS)Google DeepMind 发布 Gemini Robotics-ER 1.6,提升机器人规划与感知精度
3月29日周日
18:50Google DeepMind:Blog(RSS)33为AI时代重新构想鼠标指针
3月26日周四
23:23Google DeepMind:Blog(RSS)Gemini 3.1 Flash Live:让语音 AI 更自然可靠
00:46Google DeepMind:Blog(RSS)保护人们免受有害操纵
00:01Google DeepMind:Blog(RSS)Lyria 3 Pro:支持更长音轨,扩展至更多平台
3月25日周三
08:00Google Developers Blog(RSS)84精选用 Agent 技能弥合知识鸿沟
3月23日周一
00:00Berkeley RDI:Blog(AI 安全与评测)OpenSage:自编程智能体生成引擎
3月17日周二
00:00Google Research:Blog(网页)Google Research 在 The Check Up 分享:从医疗创新到真实世界临床场景
3月9日周一
21:52Google DeepMind:Blog(RSS)从游戏到生物学乃至更远:AlphaGo 的十年影响
3月4日周三
01:00Google Blog:AI(RSS)精选在 Project Genie 中创建新世界的 4 个技巧
00:35Google DeepMind:Blog(RSS)Gemini 3.1 Flash-Lite:专为规模化智能构建
2月17日周二
21:42Google DeepMind:Blog(RSS)Google DeepMind 将 National Partnerships for AI 计划引入印度,以AI赋能科学教育加速探索
2月10日周二
00:12Google DeepMind:Blog(RSS)借助 Gemini Deep Think 加速数学与科学发现
1月30日周五
01:01Google DeepMind:Blog(RSS)Project Genie:探索无限交互世界
1月16日周五
18:39Google DeepMind:Blog(RSS)D4RT:教AI看见四维世界
12月16日周二
18:14Google DeepMind:Blog(RSS)Gemma Scope 2:助力 AI 安全社区深入理解复杂语言模型行为
12月10日周三
22:59Google DeepMind:Blog(RSS)深化与英国政府合作,支持 AI 时代的繁荣与安全
12月9日周二
19:29Google DeepMind:Blog(RSS)FACTS基准测试套件:系统评估大语言模型的事实准确性
全部 AI 动态
AI 相关资讯全量信息流
全部一手信源资讯推文
全部模型产品行业论文技巧
5月16日
16:16
Google DeepMind:Blog(RSS)
42
寻找新型传染病背后的分子开关

Clare Bryant教授利用Co-Scientist这一工具,针对新兴传染病背后的基因触发因素进行研究,旨在揭示驱动这些疾病出现的分子开关机制。这项工作有望帮助快速识别潜在的新发传染病威胁,为疾病监测与早期预警提供新的技术路径。

智能体DeepMind教程/实践
16:08
Google DeepMind:Blog(RSS)
41
开辟衰老研究新路径

Calico Life Sciences 通过 Co-Scientist 平台,将零散的衰老研究发现进行连接与整合,从而生成新的研究线索与方向。该工具旨在加速衰老领域的科学探索,为后续研究提供创新思路。

智能体DeepMindGoogle教程/实践
15:53
Google DeepMind:Blog(RSS)
32
联合生物学工具包,探索ALS新疗法

波士顿儿童医院与麻省理工学院的实验室达成合作,共同利用生物学工具包,探索基于RNA的肌萎缩侧索硬化症新疗法。这项跨机构合作旨在为这种神经退行性疾病开发创新治疗路径。

智能体DeepMind教程/实践
15:40
Google DeepMind:Blog(RSS)
40
揭开老药新用对抗肝纤维化的可能性

斯坦福大学遗传学家利用Co-Scientist工具,在现有药物中筛选用于治疗慢性肝病和肝纤维化的潜在疗法。这种方法专注于老药新用,旨在加速药物发现过程,为肝纤维化这一难治性疾病提供新的治疗思路。

DeepMind论文/研究
11:14
Google DeepMind:Blog(RSS)
43
WeatherNext如何帮助美国国家飓风中心更好预测飓风Melissa在牙买加的历史性登陆

WeatherNext AI模型协助气象预报员为社区在飓风Melissa登陆前提供了前所未有的准备时间。该模型通过提升预测准确性与提前量,帮助牙买加等地成功应对了这场历史性的飓风事件,显著增强了灾害预警的时效性。

DeepMindGoogle数据/训练现象/趋势
06:50
Google DeepMind:Blog(RSS)
精选75
Gemini 3.5:具备行动能力的前沿智能

Google发布了Gemini 3.5模型,该模型专注于提升执行复杂任务的能力。其核心特点是支持“代理式工作流”,即能够像助手一样自主规划并执行一系列多步骤、复杂的操作,旨在将先进的语言理解与实际问题解决能力相结合。

智能体DeepMindGoogle多模态
关联讨论 19 条X:Google AI (@GoogleAI)Google Blog:AI(RSS)X:Sundar Pichai (@sundarpichai)Google DeepMind:Blog(RSS)The Verge:AI(RSS)X:Google DeepMind (@GoogleDeepMind)Google Developers Blog(RSS)The Decoder:AI News(RSS)IT之家(RSS)X:Berry Xia (@berryxia)X:Jeff Dean (@JeffDean)X:Gemini (@GeminiApp)Hacker News 热门(buzzing.cc 中文翻译)X:Google AI for Developers (@googleaidevs)X:Rohan Paul (@rohanpaul_ai)X:Logan Kilpatrick (@OfficialLoganK)X:Ethan Mollick (@emollick)X:阿易 AI Notes (@AYi_AInotes)X:Kim (@kimmonismus)
推荐理由:Gemini 3.5 Flash 把前沿级智能体和编程能力塞进了极低延迟和成本,四倍于竞品速度的同时基准表现超过 3.1 Pro,这可能是今年对开发者最实用的基座模型之一。
00:54
Dwarkesh Patel:Podcast & Blog(RSS)
精选55
Eric Jang - 从零开始构建 AlphaGo

文章以AlphaGo为例,阐述了智能的基本构成要素。AlphaGo至今仍是最清晰、最完整的范例,它融合了三大核心基础:搜索技术、从经验中学习以及自我对弈。这三大要素共同构成了其实现超越人类棋艺的关键路径。

DeepMind大佬观点推理

推荐理由:Eric Jang 把 AlphaGo 的搜索、自对弈和价值网络拆解得非常通透,用现代工具复现让这个经典思路对今天的 RL 和自动研究都有直接启发,做 LLM 后训练的尤其该听听他对信用分配问题的解释。
5月13日
17:43
The Decoder:AI News(RSS)
43
From Prompt to Pointer Engineering: Deepmind 尝试为 AI 时代重塑鼠标光标

Deepmind 提出“指针工程”概念,旨在将鼠标光标转变为上下文工程中的关键变量。这一设想试图超越传统的提示词工程,通过光标在界面上的物理位置和移动轨迹来影响和引导 AI 模型的行为与输出。其目标是为人机交互开辟新范式,使光标成为与 AI 系统进行精细、动态交互的核心工具。

DeepMind论文/研究
07:26
Hacker News 热门(buzzing.cc 中文翻译)
50
为人工智能时代重新构想鼠标指针

DeepMind重新构想人工智能时代的鼠标指针,将其从简单的图形符号转变为动态的、情境感知的AI交互界面。新指针能根据用户当前任务和屏幕内容智能变化形态与功能,例如在文本编辑时变为书写工具,在分析数据时可视化显示相关信息。这一设计旨在减少传统图形界面中的频繁窗口切换,通过指针直接提供上下文辅助,提升人机协作效率,标志着输入设备从被动工具向主动协作伙伴的演进。

DeepMind多模态现象/趋势
5月12日
22:40
Google DeepMind:Blog(RSS)
精选57
Co-Scientist:一个加速研究的多智能体AI伙伴

Co-Scientist 是一款由 Gemini 构建的协作式 AI 助手,旨在帮助科研人员加速科学突破。它通过多智能体(multi-agent)的架构设计,作为研究人员的智能伙伴参与工作流程,以提升研究效率并推动创新发现。

智能体DeepMindGoogle产品更新

推荐理由:Google DeepMind 推出的科研助手,用多智能体框架帮科学家加速实验设计,如果做生物/材料领域研究,值得跟踪一下,但对其他领域暂时可能还是个概念。
5月8日
01:06
Hacker News 热门(buzzing.cc 中文翻译)
58
AlphaEvolve:由Gemini驱动的编程代理,在各领域产生广泛影响

DeepMind发布了由Gemini驱动的编程代理AlphaEvolve。该代理能自动生成、测试和优化代码,显著提升了软件开发效率与质量。其影响已扩展至多个领域,包括科学研究和工业应用,在特定基准测试中展示了卓越的代码生成能力。该技术旨在通过自动化复杂编程任务,降低开发门槛并加速各行业的创新进程。

智能体DeepMind产品更新编码
5月7日
22:59
Google DeepMind:Blog(RSS)
精选66
AlphaEvolve:我们由Gemini驱动的编程智能体如何跨领域扩展影响力

AlphaEvolve推出了基于Gemini大模型的编程智能体,其算法正驱动多个领域产生实际影响。该智能体在商业流程、基础设施优化与科学研究三个关键领域实现规模化应用,通过自动化代码生成与问题解决提升效率。具体实践表明,它能显著加速开发周期并处理复杂任务,标志着AI编程助手从辅助工具向核心生产力引擎的演进。

智能体DeepMindGoogle产品更新

推荐理由:DeepMind这次不只是秀参数,AlphaEvolve用Gemini驱动编码代理,已经开始在工业设计和科学发现里产生真实影响了,做自动化的可以盯着看。
19:38
The Decoder:AI News(RSS)
52
Google Deepmind 入股 EVE Online 开发商以测试 AI 模型

Google Deepmind 收购了太空大型多人在线游戏 EVE Online 背后开发商的部分股权,旨在将该游戏作为人工智能模型的测试平台。此举意味着 Google Deepmind 将利用 EVE Online 复杂且持续演化的虚拟宇宙环境,来训练和评估其 AI 系统的能力。

DeepMind行业动态
10:16
IT之家(RSS)
59
谷歌 DeepMind 将借力《星战前夜》游戏,攻克 AI 长期规划难题

谷歌DeepMind宣布收购Fenris Creations少数股权,并将在大型多人在线游戏《星战前夜》中训练AI,以攻克AI长期规划难题。这款运营了23年的游戏拥有复杂的科幻宇宙和高度社会模拟,要求玩家进行长期策略规划与政治博弈,正切中当前AI研究的薄弱环节。为确保不影响玩家体验,DeepMind初期将在隔离服务器上进行研究,游戏方也将利用其成果优化游戏。Fenris Creations近期刚以1.2亿美元现金及加密货币完成自我回购。

智能体DeepMind推理行业动态
5月4日
12:13
IT之家(RSS)
45
苹果机器人项目高级工程师离职,跳槽谷歌 DeepMind

苹果机器人团队高级工程经理伯努瓦・兰德里离职,跳槽至谷歌DeepMind。苹果正研发智能家居机器人,包括一款桌面机器人,外观类似加装机械臂的iPad,可执行基础任务并搭载全新Siri系统。苹果员工流失严重,机器人团队负责人去年已跳槽Meta,团队多名高级工程师相继离职,人才被Meta和谷歌以高薪挖走。

DeepMind具身智能行业动态
5月1日
17:47
The Decoder:AI News(RSS)
60
Google Deepmind的"AI协诊医生"在盲测中击败GPT-5.4,但仍落后于经验丰富的医师

Google Deepmind正在开发一款“AI协诊医生”系统以辅助医生诊疗。在模拟研究中,该系统表现优于GPT-5.4,但仍未达到经验丰富医师的水平。研究同时指出,类似ChatGPT语音模式的技术目前尚无法胜任严肃任务,更难以应用于医疗咨询场景。这项进展揭示了AI在专业医疗辅助领域的当前能力边界与发展潜力。

DeepMindGoogle推理论文/研究
4月30日
23:09
Google DeepMind:Blog(RSS)
34
以AI联合临床医生开启医疗保健新模式

研究团队正致力于开发一款AI联合临床医生,以探索AI增强医疗护理的路径。该研究旨在创建一种新型医疗模式,让AI作为临床医生的协同伙伴深度参与诊疗过程,共同提升医疗服务的质量和效率。这项工作标志着医疗保健领域正从辅助工具阶段,迈向AI作为核心协作者的新范式。

DeepMindGoogle论文/研究
15:09
Hacker News 热门(buzzing.cc 中文翻译)
58
如何构建未来:德米斯·哈萨比斯 【视频】

DeepMind联合创始人德米斯·哈萨比斯在视频中探讨了构建人工智能未来的愿景。他指出,通用人工智能(AGI)是核心目标,其发展将遵循从游戏AI(如AlphaGo、AlphaFold)到解决复杂科学问题的路径。哈萨比斯强调,AI的关键在于提升科学发现速度,应对气候变化、疾病治疗等全球性挑战。视频内容在Hacker News社区获得关注,获得了100点讨论热度。

DeepMind大佬观点
4月27日
17:19
IT之家(RSS)
51
韩国政府与谷歌 DeepMind 达成合作,5 月启动国家科学 AI 研究中心

韩国政府与谷歌旗下AI公司DeepMind签署谅解备忘录,将围绕AI联合研究、人才培养及负责任使用AI展开合作。双方将以5月启动的国家科学AI研究中心为核心,保障韩国创新项目“K-Moonshot”顺利实施。该项目旨在2035年前攻克生物、未来能源、物理AI等八大领域国家级难题,以提升韩国在AI领域的技术竞争力,应对中美主导地位。双方还将在生物科技、气象气候等领域深化合作,并通过成立工作组定期会议保持沟通。

DeepMindGoogle行业动态
15:21
Google DeepMind:Blog(RSS)
精选56
宣布我们与大韩民国的合作伙伴关系

Google DeepMind 与韩国政府建立合作伙伴关系,旨在利用前沿AI模型加速科学突破。此次合作将聚焦于将如Gemini、Claude、GPT-4等大型语言模型以及AlphaFold等科学AI工具,应用于关键研究领域,特别是生物技术和材料科学。目标是提升韩国的AI研发能力,计划在未来五年内培养超过1000名AI专家,并支持10个以上由AI驱动的大型科研项目。

DeepMindGoogle行业动态

推荐理由:韩国政府和 DeepMind 的合作意向,信号意义大于实质内容,目前没有具体项目披露,做 AI 地缘分析的可以留意,其他人可以先跳过。
4月22日
20:12
Google DeepMind:Blog(RSS)
与行业领导者合作加速 AI 转型

Google DeepMind 正与全球咨询公司建立战略合作,将前沿 AI 技术能力引入企业组织,加速全球范围内的 AI 转型进程。该合作旨在弥合尖端 AI 技术与企业应用之间的鸿沟,使各行业组织能够直接获取和应用最新的 AI 能力,推动业务创新与数字化变革。

DeepMind行业动态
4月18日
17:36
The Decoder:AI News(RSS)
自我改进型AI初创公司Recursive Superintelligence成立仅四个月即融资5亿美元

成立仅四个月的AI初创公司Recursive Superintelligence完成超5亿美元融资,投后估值达40亿美元。该公司由前Google DeepMind与OpenAI研究人员创立,核心目标是开发具备递归自我改进能力的AI系统。此次巨额融资创下早期AI公司估值纪录,反映出资本市场对下一代自主进化人工智能技术的强烈信心与激进押注。

智能体DeepMindOpenAI行业动态
03:02
The Decoder:AI News(RSS)
Google DeepMind 发布 Gemini Robotics-ER 1.6,提升机器人规划与感知精度

Google DeepMind 推出 Gemini Robotics-ER 1.6,显著提升机器人的规划与执行精度。新版本增强了环境感知与理解能力,新增识别并读取测量仪器的功能,使机器人能够在复杂任务场景中实现更精准的操作决策与行动控制。

DeepMind产品更新具身智能
3月29日
18:50
Google DeepMind:Blog(RSS)
33
为AI时代重新构想鼠标指针

Google DeepMind 将鼠标指针升级为可感知上下文的AI协作工具。这一革新旨在消除传统AI提示操作的繁琐性,在Chrome等平台实现直觉式交互。鼠标指针不再仅用于点击,而是能理解界面内容并主动提供智能辅助,标志着人机交互从“手动指令”向“情境协同”的范式转变。

DeepMindGoogle行业动态
3月26日
23:23
Google DeepMind:Blog(RSS)
Gemini 3.1 Flash Live:让语音 AI 更自然可靠

Gemini 推出 3.1 Flash Live 语音模型,通过提升精度、降低延迟,使语音交互更流畅自然且精准可靠。

DeepMindGoogle产品更新语音
00:46
Google DeepMind:Blog(RSS)
保护人们免受有害操纵

Google DeepMind 针对金融、健康等领域研究 AI 有害操纵风险,并推出新的安全措施。

DeepMind安全/对齐
00:01
Google DeepMind:Blog(RSS)
Lyria 3 Pro:支持更长音轨,扩展至更多平台

Lyria 3 Pro 发布,支持生成更长音轨并具备结构感知能力,同时将集成至更多 Google 产品和平台。

DeepMind产品更新多模态
3月25日
08:00
Google Developers Blog(RSS)
精选84
用 Agent 技能弥合知识鸿沟

Google DeepMind 开发出一项“Gemini API 开发者技能”,使智能体能够实时获取最新文档与 SDK 指导。评估结果显示,配备该技能后,gemini-3.1-pro-preview 模型的成功率从 28.2% 大幅跃升至 96.6%。这种轻量级方法通过赋予模型强大的推理能力并接入“事实来源”,有效解决了静态模型知识与快速演进的软件实践之间的脱节问题,显著消除了过时的编码模式。

智能体DeepMindGoogle产品更新

推荐理由:通过实时文档赋能模型,编码任务成功率飙升,开发者可借鉴优化AI工具。
3月23日
00:00
Berkeley RDI:Blog(AI 安全与评测)
OpenSage:自编程智能体生成引擎

OpenSage是新一代Agent开发工具包,推动智能体开发从人工设计转向AI自主编程范式。该系统支持LLM自动构建智能体拓扑、动态编写管理工具(具备沙箱隔离与异步执行),以及维护分层图结构记忆系统。与现有方案需人工设计不同,OpenSage实现了拓扑、工具和记忆的全面AI自动化生成,并内置软件工程与安全工具套件。

智能体DeepMind开源/仓库编码
3月17日
00:00
Google Research:Blog(网页)
Google Research 在 The Check Up 分享:从医疗创新到真实世界临床场景

Google Research 在 The Check Up 活动发布多项医疗 AI 进展。与 Fitbit 合作的 Personal Health Agent (PHA) 整合可穿戴设备数据提供个性化健康指导;乳腺癌检测 AI 在研究中识别出 25% 传统筛查漏检的间隔期癌症;多智能体系统 AMIE 已在 Beth Israel Deaconess Medical Center 开展临床测试,协助病史采集。同时推出 MedGemma 开放模型及 Health AI Developer Foundations (HAI-DEF) 赋能开发者,糖尿病视网膜病变筛查模型已服务超 100 万例,AI 正从实验室走向真实临床场景。

智能体DeepMindGoogle产品更新
3月9日
21:52
Google DeepMind:Blog(RSS)
从游戏到生物学乃至更远:AlphaGo 的十年影响

AlphaGo 诞生十周年,回顾其从围棋游戏拓展至生物学等科学领域的历程,探讨这项技术如何催化重大科学发现并为 AGI 铺平道路。

DeepMindGoogle现象/趋势
3月4日
01:00
Google Blog:AI(RSS)
精选
在 Project Genie 中创建新世界的 4 个技巧

Google DeepMind 分享 Project Genie 使用指南,提供 4 个提示词写作技巧,帮助用户通过自然语言描述生成可交互的虚拟世界。

DeepMindGoogle多模态教程/实践
关联讨论 1 条Google DeepMind:Blog(RSS)
推荐理由:Google DeepMind分享Project Genie提示词技巧,教你用AI生成可交互3D世界
00:35
Google DeepMind:Blog(RSS)
Gemini 3.1 Flash-Lite:专为规模化智能构建

Google 发布 Gemini 3.1 Flash-Lite,为 Gemini 3 系列中速度最快、成本效益最高的模型,面向大规模智能应用场景优化。

DeepMindGoogle模型发布端侧
2月17日
21:42
Google DeepMind:Blog(RSS)
Google DeepMind 将 National Partnerships for AI 计划引入印度,以AI赋能科学教育加速探索

Google DeepMind 在印度启动 National Partnerships for AI 计划,通过规模化应用AI技术推动科学研究和教育发展,加速探索发现。

DeepMindGoogle行业动态
2月10日
00:12
Google DeepMind:Blog(RSS)
借助 Gemini Deep Think 加速数学与科学发现

研究论文显示,Gemini Deep Think 在数学与科学等多个领域的影响力持续扩大,正加速科研发现进程。

DeepMindGoogle推理论文/研究
1月30日
01:01
Google DeepMind:Blog(RSS)
Project Genie:探索无限交互世界

Google 向美国 AI Ultra 订阅用户开放实验性原型 Project Genie 试用,支持实时创建并探索无限生成的交互式世界。

DeepMindGoogle产品更新多模态
1月16日
18:39
Google DeepMind:Blog(RSS)
D4RT:教AI看见四维世界

D4RT 实现统一高效的4D重建与追踪,速度较先前方法提升最高达300倍,为四维计算机视觉领域提供高效解决方案。

DeepMindGoogle多模态视频
12月16日
18:14
Google DeepMind:Blog(RSS)
Gemma Scope 2:助力 AI 安全社区深入理解复杂语言模型行为

Gemma Scope 2 正式发布,面向整个 Gemma 3 模型家族推出开放可解释性工具,助力 AI 安全社区深入理解复杂语言模型行为。

DeepMindGoogle安全/对齐开源/仓库
12月10日
22:59
Google DeepMind:Blog(RSS)
深化与英国政府合作,支持 AI 时代的繁荣与安全

深化与英国政府合作,支持 AI 时代的繁荣与安全。双方伙伴关系升级,共同推动人工智能经济发展与安全保障,确保技术革新与国家安全并重。

DeepMind安全/对齐行业动态
12月9日
19:29
Google DeepMind:Blog(RSS)
FACTS基准测试套件:系统评估大语言模型的事实准确性

本文推出FACTS基准测试套件,用于系统性评估大语言模型的事实准确性。该套件提供标准化评测工具,可检测模型生成内容中的事实性错误,助力评估模型真实性与可靠性。

DeepMind评测/基准
‹ 上一页
123
下一页 ›