5月20日

02:18

Google Blog：AI（RSS）

精选83

Gemini 3.5：前沿智能与行动能力相结合

Google 在 I/O 大会上正式发布了最新的 Gemini 3.5 模型系列。该系列模型将前沿的人工智能能力与执行操作的功能相结合，旨在提供更强的综合性能。作为 Google 最新推出的模型，它代表了其在大模型技术上的最新进展。

智能体 Google 多模态推理

推荐理由：Google 在 I/O 上甩出 Gemini 3.5，这次不只拼多模态，更强调‘行动’，是所有做 Agent 的团队必须对标的新基座。

02:18

Google Blog：AI（RSS）

精选89

I/O 2026：欢迎来到自主的 Gemini 时代

Google 在 I/O 2026 大会上宣布 Gemini 进入自主代理时代，新功能使其能够自动执行复杂任务，显著提升用户工作效率。大会展示了 Gemini 如何通过代理操作简化工作流程，实现自动化处理，例如自动管理邮件、安排日程或生成报告，帮助用户从重复性工作中解放出来，专注于创造性任务。这一更新基于先进机器学习模型，强调准确性与效率，标志着 AI 助手向更智能、更自主的方向发展。

智能体 Google 模型发布

推荐理由：谷歌 I/O 大会上 Sundar Pichai 亲自宣布 agentic Gemini 时代到来，这是把 Gemini 从对话助手升级成真正能自主执行任务的 agent，所有做 AI 应用的接下来都得重新看一遍技术选型。

02:11

Ars Technica：AI（RSS）

Gemini 3.5 Flash 可能足够快，让生成式AI真正实用起来

Google发布了更高效的Gemini 3.5 Flash模型。该公司表示，这款模型的效率提升是实现智能体式AI未来的关键所在，意味着生成式AI的应用将更为便捷和实用。

智能体 Google 模型发布

02:09

Google AI@GoogleAI

三年前，Gemini从理解世界开始。随着Gemini 2，模型学会了思考和推理。去年底，Gemini 3将任何想法变为现实。今天，我们继续这段旅程，推出Gemini 3.5系列，首先发布Gemini 3.5 Flash，为智能体和编程提供前沿性能。

智能体 Google 推理模型发布

02:06

🚨 AI News | TestingCatalog@testingcatalog

谷歌I/O大会🔥：Gemini 3.5 Flash已发布！ Gemini 3.5在人工智能分析智能基准测试中表现与Gemini 3.1 Pro相当，但速度更快。【引用 @GeminiApp】：Gemini 3.5 Flash来了，这是我们迄今为止在快速高效完成任务方面最好的模型。无论您需要日常任务帮助还是多步骤创意项目，Gemini 3.5 Flash都能应对现实世界的复杂性，助您采取行动。#GoogleIO

Google Gemini: Gemini 3.5 Flash is here and it's our best model yet for getting things done quickly and efficiently. Whether you need h...

Google 多模态模型发布

02:06

🚨 AI News | TestingCatalog@testingcatalog

GOOGLE I/O 🔥：Gemini 3.5 Flash现已在AI Studio上开放测试！你试过了吗？👀

🚨 AI News | TestingCatalog: GOOGLE I/O 🔥: GEMINI 3.5 FLASH HAS BEEN ANNOUNCED! Gemini 3.5 performs on par with Gemini 3.1 Pro on Artificial Analysi...

Google 模型发布

02:03

Artificial Analysis@ArtificialAnlys

速度智能兼得的新一代AI：谷歌Gemini 3.5 Flash发布

谷歌发布新模型Gemini 3.5 Flash，其在智能指数上提升9分至55分，超越Grok 4.3和Claude Sonnet 4.6，尤其在代理任务和知识真实性（大幅减少幻觉）方面进步显著。输出速度超280 tokens/s，使其位于速度与智能的领先前沿。然而，模型运行成本相比前代增加5.5倍，主要由于输入令牌用量及定价上涨。此外，它在多模态评估MMMU-Pro中取得最高分，支持多模态输入，展现了谷歌的综合优势。

智能体 DeepMind Google 多模态

02:00

Chubby♨️@kimmonismus

Gemini 3.5 Pro下月发布！！！

Chubby♨️: Gemini 3.5 Flash official! Insanely fast an capable model

Google 模型发布

02:00

Chubby♨️@kimmonismus

一个Flash模型的评测结果太疯狂了！Gemini 3.5 Flash对于其尺寸来说真的非常出色！

Chubby♨️: Gemini 3.5 Flash official! Insanely fast an capable model

Google 多模态模型发布

01:59

Jeff Dean@JeffDean

谷歌发布Gemini 3.5 Flash，专为复杂代理工作流设计

在Google I/O大会上，谷歌正式推出Gemini 3.5系列模型，首个发布的Gemini 3.5 Flash专为执行复杂、长周期的代理工作流而设计。该模型在Terminal-Bench和MCP Atlas等编程与代理基准测试中得分超越3.1 Pro，且运行速度可达其他前沿模型的4倍。若在Google Antigravity环境中使用，速度提升可高达12倍。它能高效部署协同工作的子代理，通过高频迭代循环来解决现实世界的大规模问题。

智能体 Google 模型发布编码

01:55

IT之家（RSS）

谷歌 Gemini Omni 全能模型发布：可从任意输入生成任意输出，一句话让 AI 修改视频

在2026年谷歌I/O开发者大会上，谷歌正式推出Gemini Omni模型。该模型代表了Gemini家族迄今最全面的能力，“Omni”意为全能，能够无缝处理文本、图像、音频和视频等多种信息模态，实现“从任何输入生成任何输出”。其核心亮点在于支持对话式编辑，用户可通过自然语言指令轻松修改视频元素。同时，谷歌发布了首款衍生模型Gemini Omni Flash，现已在Gemini App、Google Flow和YouTube Shorts中可用，后续将提供API服务。

Google 多模态模型发布视频

01:55

IT之家（RSS）

谷歌 Gemini 3.5 Pro 模型官宣下月登场：已在内部使用，进步超强

谷歌在2026年I/O开发者大会上宣布，新一代模型Gemini 3.5 Pro将于下月正式发布。该模型目前已在谷歌内部投入使用，官方表示其性能相比前代有显著提升。不过，具体的技术细节和性能指标尚未公开。

Google 模型发布

01:55

IT之家（RSS）

谷歌发布 Gemini 3.5 Flash 模型：AI 输出速度 4 倍于 GPT-5.5

谷歌在2026年I/O开发者大会上推出了Gemini 3.5 Flash模型。该模型在多项基准测试中性能超越前代，并实现了每秒289 tokens的输出速度，较Claude Opus 4.7和GPT-5.5 xhigh快约4倍。此外，谷歌团队使用Antigravity工具，在12小时内启动93个子智能体，生成26亿tokens，成功构建出一个可运行的操作系统核心，展示了模型的强大能力。

Google 推理模型发布

01:48

Google DeepMind：Blog（RSS）

同事件精选83

推出Gemini Omni多模态AI模型

谷歌推出原生多模态AI模型Gemini Omni，能够整合视频、图像、音频和文本等多种输入，生成高质量视频内容。其核心能力是通过自然语言对话进行视频编辑，并能保持角色一致性、物理规律与场景连贯性。首个模型Gemini Omni Flash已上线，未来将支持图像和音频输出。Gemini Omni结合了对物理世界的直觉理解与丰富的知识库，支持从写实到叙事的创意生成，并可通过多轮对话持续编辑视频，而不丢失原始场景上下文。

DeepMind Google 多模态模型发布

同一事件，精选展示《Gemini 3.5：具备行动能力的前沿智能》

推荐理由：Gemini Omni 把视频生成从画面堆砌推到了物理世界叙事，多轮自然语言编辑和世界知识融合是真正的代际升级，做视频内容的该重新理解工具的定义了。

01:41

Google DeepMind@GoogleDeepMind

我们推出Gemini Omni：这是迈向一个能从任何内容生成任何内容的模型的第一步--从视频开始。它结合了Gemini的智能与我们的生成式媒体系统--代表了在世界理解、多模态和编辑方面的飞跃🧵

DeepMind Google 多模态模型发布

01:41

Google DeepMind@GoogleDeepMind

智能体 Google 模型发布编码

01:37

Google Gemini@GeminiApp

Gemini 3.5 Flash现已推出，这是我们迄今为止在快速高效完成任务方面表现最佳的模型。无论您需要处理日常任务还是多步骤创意项目，Gemini 3.5 Flash都能应对现实世界的复杂性，助您采取行动。#GoogleIO

Google 推理模型发布

01:36

🚨 AI News | TestingCatalog@testingcatalog

谷歌I/O 🔥：Gemini 3.5 Flash 已开始在 Gemini 和 API 上推出！即将开始测试 👀

Google 多模态模型发布

01:36

🚨 AI News | TestingCatalog@testingcatalog

精选75

谷歌 I/O 🔥：GEMINI OMNI FLASH 已发布，现已在 GEMINI 和 GOOGLE FLOW 上可用。 GEMINI OMNI PRO 即将推出 🤩

Google DeepMind: Omni brings together an improved understanding of physics with Gemini's knowledge of history, biology, and culture, brid...

Google 多模态模型发布

推荐理由：Gemini Omni Flash 是 Google 对多模态生成的新尝试，把物理模拟和历史叙事揉在一起，做视频内容的人可以盯着看。

01:36

🚨 AI News | TestingCatalog@testingcatalog

谷歌I/O 🔥：GEMINI 3.5 FLASH 已发布！ Gemini 3.6 在人工智能分析智能基准测试中表现与 Gemini 3.1 Pro 相当，但速度更快。

Google Gemini: Gemini 3.5 Flash is here and it's our best model yet for getting things done quickly and efficiently. Whether you need h...

Google 模型发布

01:30

Chubby♨️@kimmonismus

精选77

"迈向AGI的进展"：Gemini Omni - 世界模型 -Gemini Omni官方发布！！它可以从任何输入创建任何内容！！！

Chubby♨️: Cap-ex at google is increasing at roughly 6x per year!

Google 多模态模型发布

推荐理由：Google 放出 Gemini Omni，从任何输入生成任何内容，这个能力宣言直接把生成式 AI 的边界推到极限。虽然细节还不明朗，但看这架势，模型竞赛又要烧一把火。

01:30

Chubby♨️@kimmonismus

Gemini 3.5 Flash官方发布！速度极快且能力强大的模型

Chubby♨️: "Progress towards AGI": Gemini Omni - world models -Gemini Omni official!! It can create anything from any input!!!

Google 多模态模型发布

00:18

小互@xiaohu

Google 全新Omni 模型 🫡

Google 多模态模型发布

00:09

歸藏(guizang.ai)@op7418

哇！谷歌新视频模型 Gemini Omni Flash 已经上线 FLow

Google 多模态模型发布视频

5月19日

23:18

Qwen：Blog Retrieval（API）

精选77

Qwen3.5-LiveTranslate：从声音到视觉，从词语到准确

Qwen3.5-LiveTranslate-Flash 是 Qwen 家族最新的同声传译模型，基于 Qwen3.5-Omni 架构，支持实时多模态翻译（音频、视频及视觉上下文）。语言覆盖大幅扩展：输入音频与输出文本从18种增至60种，输出音频从10种增至29种。采用 Readable Unit 技术，平均端到端每 token 延迟降至2.8秒，相比前代首 token 延迟降低3.45秒、每 token 延迟降低1.88秒。支持一句话启动的实时语音克隆和可动态配置的热词增强。在 FLEURS 和 CoVoST2 基准上翻译准确率超越主流商用大语音模型。

多模态模型发布语音

推荐理由：这个版本让同声传译从“能用”变成了“好用”，语言覆盖从 18 跃升 60，延迟压到 2.8 秒，加上视觉消除歧义，做国际业务和直播的人值得跟进。

23:09

歸藏(guizang.ai)@op7418

谷歌新的视频模型 Gemini Omni 已经开始放量了

Charlie L.: Gemini Omni is starting to rollout for some users!

Google 模型发布视频

23:01

Hugging Face：Blog（RSS）

精选60

引入 Ettin Reranker 系列

Hugging Face 发布六个 Ettin Reranker 重排序模型（17m、32m、68m、150m、400m、1b），基于 Ettin ModernBERT 编码器，蒸馏 self-mxbai-rerank-large-v2 分数训练，在 MTEB(eng, v2) Retrieval 达各自规模 SOTA。模型以 Sentence Transformers CrossEncoder 接口提供，三行代码可调用。同时发布 train-sentence-transformers Agent Skill（v5.5.0），允许 AI 编码智能体在用户数据上微调模型。训练配方、数据集和脚本已全部开源。

Hugging Face 检索增强开源/仓库搜索

推荐理由：从17M到1B的全尺寸reranker家族，每个量级都是SOTA，而且训练数据和代码全开放，做搜索和RAG的开发者可以无痛替换旧模型。

22:27

The Decoder：AI News（RSS）

Agora-1 将 N64 经典游戏《GoldenEye》转变为可供四人游玩的 AI 模拟

Odyssey 公司发布了世界模型 Agora-1，该模型允许最多四名玩家同时在 AI 生成的虚拟世界中进行行动。该技术已在经典游戏《GoldenEye》上得到验证，其核心是使用两个独立的模型分别实时处理游戏状态模拟与画面渲染。开发团队认为，这项技术未来在协作机器人和 AI 智能体训练领域具有应用潜力。

智能体多模态模型发布

21:27

Chubby♨️@kimmonismus

想象一下，OpenAI等待Google I/O大会，只为在周四用GPT-5.6进行反击。

송준 Jun Song: Seems like GPT-5.6 is dropping soon. Model catalog priority just has changed. You can check this info with your Codex.

OpenAI 大佬观点模型发布

20:52

AYi@AYi_AInotes

Damn it！SAM3绝逼要封神了！不但开源而且强的一批！最牛逼的地方是追踪能力，即使在篮球比赛这种复杂到爆炸的场景里也稳得一逼！！

Meta 开源生态模型发布视频

20:33

🚨 AI News | TestingCatalog@testingcatalog

精选76

谷歌I/O 🔥：我们今天将迎来 Gemini 3.5 Flash！ &gt； GEMINI &gt； GEMINI &gt； GEMINI &gt； GEM 👀 【引用 @AiBattle_】：Gemini 3.5 Flash 刚刚出现在 Google Cloud 控制台中它来了

AiBattle: Gemini 3.5 Flash just showed up in the Google Cloud Console It's coming

Google 推理模型发布

推荐理由：如果 Cloud Console 截图属实，今天 I/O 上 Gemini 3.5 Flash 就是板上钉钉，它能压到多低延迟比分数更重要，实时应用开发者该盯紧。

17:58

Rohan Paul@rohanpaul_ai

Gemini 3.5将在几小时后发布。🔥 【引用 @_anshulr】：Gemini Gemini Gemini Gem

Anshul Ramachandran: Gemini Gemini Gemini Gem

Google 模型发布

16:51

IT之家（RSS）

精选74

地平线开源 HoloMotion-1 4 亿参数机器人小脑大模型，可实现舞蹈、健身、搬箱子等动作

地平线机器人实验室发布了其开源的人形机器人全身控制模型 HoloMotion-1。这是一个拥有 4 亿参数的“小脑”大模型，通过 MoE 稀疏激活与 KV-cache 推理机制，在端侧实现了约 300FPS 的实时推理能力。该模型利用互联网视频、光学动捕、VR 遥操作等多种来源的动作数据进行训练，并在真实机器人上成功展示了舞蹈、爬行、健身、搬箱子等复杂动作的零样本迁移能力。相关代码与技术报告已公开。

具身智能开源生态模型发布

推荐理由：地平线开源的这个4亿参数模型，把机器人“小脑”拉到一个小模型级别，300FPS实时跑在端侧，零样本跳舞搬箱子，搞具身智能的该跟进看看了。