全部 AI 动态 · AI HOT

内容

精选全部 AI 动态 AI 日报主题收藏

接入

更多

关于更新日志反馈

内部员工登录

精选全部日报更多

内部员工登录

全部动态

全部一手资讯 X 论文

标签「模型发布」清除

5月20日周三

18:46SenseTime68同事件精选SenseNova U1：同时思考文本与图像的AI同一事件，精选展示《商汤发布信息图生成模型升级，增强多项核心能力》

18:41MarkTechPost（RSS）63英伟达AI发布Nemotron-Labs-Diffusion：单次前向传播生成Token数较Qwen3-8B提升6倍的三模式语言模型

16:09MarkTechPost（RSS）63阿里巴巴 Qwen 团队推出 Qwen3.5-LiveTranslate-Flash：实时多模态翻译模型支持60种语言

15:56IT之家（RSS）67AI 同传 2.8 秒延迟，阿里通义千问发布实时语音翻译模型 Qwen3.5-LiveTranslate

15:12MarkTechPost（RSS）68Google发布Gemini 3.5 Flash：在2026年I/O大会上推出一款更快速、更经济的AI智能体与编码模型

13:53公众号：通义实验室（千问）55Qwen3.5-LiveTranslate 发布：开口即同传

12:36Kling AI72Kling AI推出全球首个原生4K视频生成模型

11:55IT之家（RSS）76阿里千问最强智能体模型 Qwen3.7-Max 发布

11:34Rohan Paul73SenseNova U1开源发布，革新原生多模态生成

11:05Berryxia.AI73Google DeepMind 发布 Gemini 3.5 Flash：性能大幅提升，但成本显著增加

11:04公众号：通义实验室（千问）62同事件精选Qwen3.7-Max 重新定义 AI Agent 基座同一事件，精选展示《Qwen3.7-Max：面向智能体时代的最新专有模型》

10:49Qwen：Blog Retrieval（API）79精选Qwen3.7-Max：面向智能体时代的最新专有模型

10:04Rohan Paul74谷歌发布Gemini 3.5 Flash：速度更快、性价比更高的代理模型

09:55IT之家（RSS）62曝字节 Seedance 2.1 模型即将发布，系列已狂揽 AI 视频生成 80% 算力消耗

09:14meng shao64Gemini Omni 来了！Google 的优势，果然还是在多模态模型吧？！

09:08Demis Hassabis81Gemini 3.5 Flash性能与速度全面领先

09:04Rohan Paul69Gemini 3.5 Flash发布，性能强劲且免费

08:05Berryxia.AI71Google DeepMind发布Gemini Omni，迈向"生成万物"愿景

07:55IT之家（RSS）58IT早报 0520：小米 YU7 GT 破纽北 SUV 圈速纪录；特斯拉放弃印度建厂计划；谷歌发布 Gemini 3.5 Flash；DeepSeek 回应字符触发模型异常…

07:10Simon Willison 博客70Gemini 3.5 Flash：价格显著上涨，但谷歌计划将其全面应用

06:42karminski-牙医61Gemini-3.5-flash发布！价格直接翻三倍？

06:36Orange AI77Gemini Flash 3.5发布，性能价格双优势

06:03Rohan Paul67谷歌发布Gemini Omni全能AI模型，支持多模态输入与精准视频编辑

06:03Jeff Dean81谷歌发布Gemini 3.5 Flash，速度快且性能强

05:25Google Developers Blog（RSS）87Google I/O 2026：从辅助工具到独立智能体的战略转型

04:38Demis Hassabis79Gemini Omni实现多模态编辑与场景生成

04:29Hacker News 热门（buzzing.cc 中文翻译）80同事件精选Gemini Omni同一事件，精选展示《Gemini 3.5：具备行动能力的前沿智能》

04:11Josh Woodward31Gemini 3.5 Flash模型发布，速度惊人

03:40Google AI74Gemini Omni：从任意输入创造内容的新模型

03:29Sundar Pichai79Gemini Omni发布：物理推理与多模态生成新突破

03:08Google Gemini81谷歌发布Gemini Omni多模态生成模型

03:03Hugging Face：Blog（RSS）44OlmoEarth v1.1：更高效的地球观测模型家族

03:03OpenRouter82Gemini 3.5 Flash上线OpenRouter，性能价格双优

03:01Chubby♨️26Gemini 3.5 Flash性价比惊人，效率竞赛才刚开始

03:01Chubby♨️37Gemini助力医学黄金时代，治愈所有疾病

02:59Hacker News 热门（buzzing.cc 中文翻译）84Gemini 3.5 Flash：前沿智能，即刻行动

02:55AYi80Google Gemini Omni重新定义视频生成

02:30Chubby♨️81Gemini Omni：迈向AGI的世界模型

02:29Google AI Developers84Gemini 3.5发布：智能与行动结合的新模型家族

02:29Sundar Pichai90Gemini 3.5 Flash发布，性能与速度兼优

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

5月20日

18:46

SenseTime@SenseTime_AI

同事件精选68

将你的想法转化为激发故事的视觉画面 🧨 【引用 @Adamaestr0_】：大多数AI工具可以写作或生成图像。但这个能同时做这两件事。向你介绍 SenseNova U1。一个能同时思考文本和图像的AI。这改变了一切 🧵

Adam: La mayoría de las herramientas de IA pueden escribir o generar imágenes. Pero esta hace AMBAS cosas a la vez. Te present...

多模态模型发布

同一事件，精选展示《商汤发布信息图生成模型升级，增强多项核心能力》

推荐理由：商汤发了 SenseNova U1，主打文本和图像同时生成的「全模态」，但宣传语太简略，没给任何性能数据或技术细节，暂时看不出是真突破还是常规迭代，先标记关注。

18:41

MarkTechPost（RSS）

63

英伟达AI发布Nemotron-Labs-Diffusion：单次前向传播生成Token数较Qwen3-8B提升6倍的三模式语言模型

英伟达发布了Nemotron-Labs-Diffusion语言模型家族，其核心创新在于将自回归、基于扩散的并行解码以及自推测解码三种解码模式统一于单一架构。该模型提供3B、8B和14B三种参数规模，并包含基础版、指令微调版和视觉语言版本。相较于Qwen3-8B，其8B参数版本在单次前向传播中能够生成多达6倍的Token数量，显著提升了吞吐效率。

多模态推理模型发布

16:09

MarkTechPost（RSS）

63

阿里巴巴 Qwen 团队推出 Qwen3.5-LiveTranslate-Flash：实时多模态翻译模型支持60种语言

阿里巴巴 Qwen 团队发布了实时多模态翻译模型 Qwen3.5-LiveTranslate-Flash。该模型能同时处理音视频输入，支持60种语言的输入和29种语言的语音输出，端到端延迟低至2.8秒。相比前代，新增了实时说话人声音克隆、通过唇语和屏幕文字增强视觉理解，以及动态配置领域专业术语等能力。在 FLEURS 和 CoVoST2 基准测试中，性能超越主流商业模型。目前仅以 API 形式通过阿里云百炼平台提供服务，采用 WebSocket 协议通信。

多模态模型发布语音

15:56

IT之家（RSS）

67

AI 同传 2.8 秒延迟，阿里通义千问发布实时语音翻译模型 Qwen3.5-LiveTranslate

阿里通义千问团队发布了Qwen3.5-LiveTranslate-Flash实时语音翻译模型。该模型将支持的音频输入与文字输出语种从18种大幅提升至60种，输出音频语种从10种增加至29种。通过采用新的流式翻译技术，端到端字均延迟降低至2.8秒，同时支持实时音色克隆以保留说话人原声特征，并内置动态热词引擎以提升专业术语翻译准确性。模型在多个公开基准测试中表现优于前代及主流模型。

多模态模型发布语音

15:12

MarkTechPost（RSS）

68

Google发布Gemini 3.5 Flash：在2026年I/O大会上推出一款更快速、更经济的AI智能体与编码模型

Google在2026年I/O大会上发布了新一代模型Gemini 3.5 Flash。该模型在代码生成和AI智能体任务等基准测试中性能超越了此前的旗舰版本，同时运行速度提升四倍，推理成本降低一半。这一更新显著增强了模型在实际应用中的效率与经济性，特别面向需要快速响应和复杂任务处理的开发者场景。

智能体 Google 推理模型发布

13:53

公众号：通义实验室（千问）

55

Qwen3.5-LiveTranslate 发布：开口即同传

通义实验室（千问）发布 Qwen3.5-LiveTranslate，实现“开口即同传”——用户说话的同时即可获得翻译结果，支持实时语音同声传译。目前尚未公布模型参数规模、benchmark 分数、上下文长度等具体技术细节。

多模态模型发布语音

12:36

Kling AI@Kling_ai

72

Kling AI推出全球首个原生4K视频生成模型

4月23日，Kling AI正式推出全球首个原生4K视频生成模型，专为专业内容创作设计。该功能支持一键生成真4K画质视频，显著提升画面细节与制作效率。模型已获得好莱坞团队、动画工作室等多方采用。好莱坞制片人指出，这是其工作流中首个使用的原生4K基础模型；Wonder Studios强调，原生4K从底层生成避免了传统放大技术的角色变形问题，保持了画面一致性；动画导演则认为，该模型在保留艺术色调与复杂特效纹理方面优于同类产品。

多模态模型发布视频

11:55

IT之家（RSS）

76

阿里千问最强智能体模型 Qwen3.7-Max 发布

阿里云千问大模型今日正式发布新一代旗舰智能体模型 Qwen3.7-Max，定位为全能的智能体基座。该模型在编程、办公自动化及长周期自主任务方面能力突出，其中在一项持续35小时、超过1000次工具调用的内核优化实验中验证了其稳定的推理与执行能力。基准测试显示，Qwen3.7-Max 在 SWE-Pro、MCP-Mark、GPQA Diamond 等多项评测中成绩领先，其编程、通用智能体及推理能力已达到业界顶尖水平。该模型即将通过阿里云百炼 API 提供服务。

智能体推理模型发布

11:34

Rohan Paul@rohanpaul_ai

73

SenseNova U1开源发布，革新原生多模态生成

商汤科技SenseNova U1已开源发布。其核心创新在于原生多模态统一建模，将视觉、语言与图像生成视为一个统一问题，而非分立模块的链式处理，从而减少了信息损失。该模型采用MoT架构（38B-Active 3B MoE），在生成信息图、海报、漫画等结构复杂的密集图文内容时能保持高度一致性。详细的技术报告披露了其包括近无损视觉接口、联合训练策略在内的完整构建方案，为行业提供了前沿参考。

SenseTime: 🔥 New week, New SenseNova-U1 Drop - and this one goes Deep!🔥 📄 The full Technical Report is OUT - the most detailed d...

图像生成多模态开源生态模型发布

11:05

Berryxia.AI@berryxia

73

Google DeepMind 发布 Gemini 3.5 Flash：性能大幅提升，但成本显著增加

Google DeepMind 最新发布的 Gemini 3.5 Flash 模型在性能与速度的平衡上取得突破。其智能指数得分为 55，较上一代大幅提升，超越了 Grok 4.3 和 Claude Sonnet 4.6。模型在智能体任务和降低幻觉率方面进步显著，输出速度超过 280 tokens/s。然而，其 API 定价相比前代模型上涨约 3 倍，运行基准测试的成本更是达到 5.5 倍。这意味着 Gemini 3.5 Flash 在实现“更快更智能”的同时，也显著改变了 Flash 系列以往低成本的市场定位。

Artificial Analysis: Google's new Gemini 3.5 Flash is the clear leader on the Intelligence vs Speed Pareto frontier and makes large gains on ...

智能体 DeepMind 多模态模型发布

11:04

公众号：通义实验室（千问）

同事件精选62

Qwen3.7-Max 重新定义 AI Agent 基座

通义实验室推出 Qwen3.7-Max，定位为重新定义 AI 智能体基座的模型，侧重提升智能体的基础能力与架构。

智能体模型发布

同一事件，精选展示《Qwen3.7-Max：面向智能体时代的最新专有模型》

推荐理由：Qwen3.7-Max 是通义系列对 Agent 基座的一次关键升级，发布时间虽已过两周，但做 Agent 的开发者仍不能忽略，选型必看。

10:49

Qwen：Blog Retrieval（API）

精选79

Qwen3.7-Max：面向智能体时代的最新专有模型

通义千问发布 Qwen3.7-Max，专为智能体时代设计。它具备从原型到复杂多文件工程的编码智能体能力，通过 MCP 和多智能体编排实现办公自动化，能自主执行超 1000 步工具调用（如 35 小时全自主内核优化）。兼容 Claude Code、OpenClaw、Qwen Code 等多框架。在多项基准测试中超越 Opus-4.6 Max 等模型：Terminal Bench 2.0 (69.7)、SWE-Verified (80.4)、GPQA Diamond (92.4)、HLE (41.4) 等。现已通过阿里云 Model Studio 提供 API 调用。

智能体推理模型发布编码

关联讨论 8 条X：通义千问 / Qwen (@Alibaba_Qwen)X：阿里云 / Alibaba Cloud (@alibaba_cloud)X：X.PIN (@thexpin)X：Rohan Paul (@rohanpaul_ai)Hacker News 热门（buzzing.cc 中文翻译）公众号：通义实验室（千问）X：OpenRouter (@OpenRouter)IT之家（RSS）

推荐理由：Qwen3.7-Max 把 agent 能力拉到了新高度，35 小时自主内核优化证明长程执行有真实生产力，做 coding agent 的团队该认真测一下。

10:04

Rohan Paul@rohanpaul_ai

74

谷歌发布Gemini 3.5 Flash：速度更快、性价比更高的代理模型

谷歌推出Gemini 3.5 Flash模型，其输出速度提升至四倍，在终端基准测试等多项高难度任务中超越了Gemini 3.1 Pro。该模型以高速度与低成本，成为适合日常工作的强大代理工具。它已登陆Gemini应用、搜索AI模式及企业级产品等平台。配合升级的Antigravity工具，Gemini 3.5 Flash可驱动协作子代理，大规模并行处理代码审查、重写与测试等复杂任务，实现高效自动化工作流。

Rohan Paul: Gemini 3.5 in few more hours. 🔥

智能体 Google 推理模型发布

09:55

IT之家（RSS）

62

曝字节 Seedance 2.1 模型即将发布，系列已狂揽 AI 视频生成 80% 算力消耗

字节跳动即将发布AI视频生成模型Seedance 2.1，其生成质量较当前2.0版本提升约20%，改进重点在于提升视频时间一致性与物理场景模拟效果。该模型预计将整合至剪映等字节系内容创作工具中。目前，Seedance系列已占据AI视频生成领域日均超80%的算力消耗份额，主要竞争对手包括可灵与万相。与此同时，谷歌于近期大会发布了Gemini Omni模型，加剧了该领域的竞争。

模型发布视频

09:14

meng shao@shao__meng

64

Gemini Omni 来了！Google 的优势，果然还是在多模态模型吧？！

Google发布了原生多模态模型Gemini Omni。与传统模型需逐帧描述不同，它采用底层原生设计，支持以意图驱动生成视频，并能通过多轮对话进行编辑，每一步都基于上一结果，确保一致性。该模型融合了Gemini的世界知识与物理直觉，并能将图、文、音视频等任意参考物组合，实现跨模态叙事生成。其目标是“从任何东西创造任何东西”，并从视频生成起步。

Google DeepMind: We're dropping Gemini Omni: our first step towards a model that can create anything from anything - starting with video....

DeepMind Google 多模态模型发布

09:08

Demis Hassabis@demishassabis

81

Gemini 3.5 Flash 太棒了！ - 在编码和智能体任务上表现优于 3.1 Pro - 速度比其他前沿模型快 4 倍 - 在 @antigravity 中快 12 倍 - 达到 800 tokens/sec！ - 成本通常不到一半 Pro 版本即将到来… 在 @antigravity、@GeminiApp 等平台体验吧 - 享受吧！

智能体 Google 模型发布编码

09:04

Rohan Paul@rohanpaul_ai

69

Google Gemini 3.5 Flash 是其类别中非常强大的模型。在众多基准测试中超越了 Gemini 3.1 Pro。这是一个代理模型，每秒处理的令牌速度快4倍。 @aimlapi 刚刚将 Gemini 3.5 Flash 添加到其 API 中，并且在24小时内免费提供。设置说明见评论。

AI/ML API: .@Google : "We're releasing Gemini 3.5 Flash" Us: *We're offering it for free* free for 24hrs via our API find instructi...

Google 多模态模型发布

08:05

Berryxia.AI@berryxia

71

Google DeepMind发布Gemini Omni，迈向"生成万物"愿景

Google DeepMind在I/O大会上发布了Gemini Omni模型，旨在迈出“从任何东西生成任何东西”的第一步。该模型将Gemini的智能与生成媒体系统深度融合，在世界理解、多模态和编辑能力上实现飞跃。其核心特点在于生成的视频能保持角色、光影等逻辑一致性，并支持通过自然语言进行实时编辑和风格调整，将视频转变为可动态演进的“世界素材”。该模型目前已在部分应用上线并即将开放API，不过其实际效果，尤其是在中文生成方面，仍存在一些讨论。

Google DeepMind: We're dropping Gemini Omni: our first step towards a model that can create anything from anything - starting with video....

Google 多模态模型发布视频

07:55

IT之家（RSS）

58

IT早报 0520：小米 YU7 GT 破纽北 SUV 圈速纪录；特斯拉放弃印度建厂计划；谷歌发布 Gemini 3.5 Flash；DeepSeek 回应字符触发模型异常…

小米YU7 GT以7分34秒931刷新纽北SUV圈速纪录，车手任周灿成为首个获官方认证的中国车手。特斯拉宣布放弃在印度建厂的计划。谷歌发布Gemini 3.5 Flash模型，称其输出速度是GPT-5.5的4倍。DeepSeek就“”字符触发模型异常回应，称属于幻觉，不涉及安全或隐私。此外，月之暗面Kimi获国资机构入股，浙江联通将于6月15日全面退出3G服务。

DeepSeek 产品更新模型发布行业动态

07:10

Simon Willison 博客

70

Gemini 3.5 Flash：价格显著上涨，但谷歌计划将其全面应用

谷歌在I/O大会上发布了Gemini 3.5 Flash模型，该模型跳过预览阶段直接正式发布，并已被集成到谷歌Gemini应用、搜索、开发者平台及企业解决方案等多项核心产品中。该模型价格显著上涨：输入价格为每百万令牌1.50美元，输出价格为9美元，分别是前代模型的3倍和6倍，已接近更高端的Gemini 3.1 Pro定价。技术上，它支持约100万输入令牌和约6.5万最大输出令牌。同时，谷歌推出了新的Interactions API测试版。这一价格上调趋势与OpenAI等公司近期策略相似，表明主要AI实验室正在试探API客户的价格承受能力。

Google 模型发布

06:42

karminski-牙医@karminski3

61

Gemini-3.5-flash发布！价格直接翻三倍？

在Google I/O大会上，Gemini-3.5-flash模型正式发布，其定价从上一代的$0.5/$3大幅上涨至$1.5/$9。实测显示，其性能介于Gemini-3.0-Pro与Gemini-3.1-Pro之间，但稳定性有所不足。此举被视为Google借鉴Anthropic的产品分层策略，计划用flash-lite、新flash和Pro形成梯队。其中新flash主打在百万级上下文内不设阶梯定价，以承接Pro模型溢出的用户。此次调价也可能旨在配合新发布的Antigravity CLI工具，定位类似Claude Code中的Sonnet模型，从而构建其开发生态。

Google 推理模型发布编码

06:36

Orange AI@oran_ge

77

Gemini flash 3.5 昨晚发布，现已可用。 - 模型效果大幅超越 3.1 Pro，指标和 gpt 5.5 接近，比 gpt5.5 好的是 Agentic 和多模态。 - 价格只要 gpt5.5 的三分之一，缓存价格只要六分之一。 - API 定价 $1.50 / $9.00 per 1M token（输入/输出），缓存输入 $0.15。上下文窗口 1M token。 - 速度极快，是其他旗舰模型的4倍，非常适合 Agent 使用。官方介绍地址： https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-5/

智能体 Google 多模态模型发布

06:03

Rohan Paul@rohanpaul_ai

67

谷歌发布Gemini Omni全能AI模型，支持多模态输入与精准视频编辑

谷歌近日推出Gemini Omni，这是一款能处理视频、图像、音频、文本及草图等多种输入的全能型视频AI模型。用户可通过自然语言指令对已有视频进行添加角色、替换物体、调整动作、改变风格、同步音效及移动镜头等操作，且多次编辑后仍能保持场景一致性。该模型具备更强的世界理解能力，能更真实地模拟重力、流体等物理交互，使视频编辑更接近导演创作。输出内容将附带SynthID水印与C2PA内容凭证，以明确标识其AI生成属性。

Google 模型发布视频

06:03

Jeff Dean@JeffDean

81

谷歌发布了新模型Gemini 3.5 Flash，该模型强调速度与性能的出色结合。与Gemini 3.1 Pro相比，3.5 Flash在几乎所有基准测试上表现更优，尤其在编程能力方面有巨大进步。其核心优势在于极快的推理速度，比其他前沿模型快4倍。在智能水平与输出速度的坐标图中，该模型凭借其卓越表现独占右上角优势区域，代表了速度与能力的新标杆。

Sundar Pichai: Just off stage at #GoogleIO, some highlights from this morning 🧵 Gemini 3.5 Flash is available today for everyone in @a...

Google 模型发布编码

05:25

Google Developers Blog（RSS）

87

Google I/O 2026：从辅助工具到独立智能体的战略转型

在2026年开发者大会上，Google宣布其AI战略核心从辅助工具转向开发独立智能体。大会重点发布了Gemini 3.5系列模型，并对“反重力”智能体优先平台进行了重大更新。面向移动开发者，推出了Android CLI工具、评估排行榜及能将多种框架代码快速迁移至原生Kotlin的智能体。Web开发领域也迎来变革，包括专为智能体设计的Chrome DevTools、HTML-in-Canvas API，以及旨在让浏览器内AI智能体执行复杂任务的开放标准WebMCP提案。

智能体 Google 模型发布编码

04:38

Demis Hassabis@demishassabis

79

Gemini Omni在世界理解与多模态编辑方面实现了重大飞跃！它能处理照片、视频和音频，并构建全新的场景。随着时间的推移，它将能够处理任何输入和任何输出--从视频开始。你甚至可以提供自己的视频，并在此基础上迭代你的想法：

Google 多模态模型发布视频

04:29

Hacker News 热门（buzzing.cc 中文翻译）

同事件精选80

Google DeepMind 于 2026 年 5 月 19 日发布了新一代多模态大模型 Gemini Omni。该模型整合了文本、图像、音频与视频的理解与生成能力，旨在实现更自然的人机交互。在同期 Hacker News 讨论中获得 112 点赞，显示出技术社区对多模态融合趋势的持续关注。这标志着大模型从单模态向全模态感知与响应能力的进一步演进。

多模态模型发布视频

同一事件，精选展示《Gemini 3.5：具备行动能力的前沿智能》

推荐理由：Gemini Omni 把视频编辑变成自然语言对话，多轮编辑和物理理解让它从玩具变成创作工具，做视频的值得一试。

04:11

Josh Woodward@joshwoodward

31

Gemini 3.5 Flash是一款令人难以置信的模型，速度超快，今天就在Gemini中试试吧！

Google 大佬观点模型发布

03:40

Google AI@GoogleAI

74

到现在，你可能已经听说了 Gemini Omni，这是我们新推出的模型，旨在从任意输入（从视频开始）创造任何内容。但……这有什么大不了的？让我们来分解一下 🧵👇

Google 多模态模型发布视频

03:29

Sundar Pichai@sundarpichai

79

Gemini Omni不仅能构建逼真的场景，还能推理接下来应该发生什么。它结合了对物理的直观理解与Gemini在历史、科学和文化背景方面的知识。今日起，通过@Geminiapp + Google Flow和@YouTube Shorts，向全球Google AI Plus、Pro和Ultra订阅用户推出视频生成功能。

Google 多模态模型发布视频

03:08

Google Gemini@GeminiApp

81

介绍Gemini Omni，我们的新模型，可以从任何输入创建任何内容，首先从视频开始。借助Gemini Omni，您可以将图像、视频和文本作为输入组合，并生成基于Gemini现实世界知识的高质量视频。#GoogleIO

Google 多模态模型发布视频

03:03

Hugging Face：Blog（RSS）

44

OlmoEarth v1.1：更高效的地球观测模型家族

OlmoEarth v1.1 是新一代地球观测模型家族，将计算成本降低最多 3 倍，同时保持与 v1 相近的性能。通过将 Sentinel‑2 不同分辨率（10m、20m、60m）的 token 合并为单个 token，大幅缩短输入序列长度，从而减少预训练、微调和推理所需算力。提供 Base、Tiny、Nano 三种尺寸，权重与训练代码已开源。该模型已在红树林变化追踪、森林退化成因分类、国家级作物图绘制等任务中得到验证。

Hugging Face 开源/仓库数据/训练模型发布

03:03

OpenRouter@OpenRouter

82

来自@GoogleDeepMind的Gemini 3.5 Flash现已登陆OpenRouter！在编码、智能体任务和工具使用方面超越Gemini 3.1 Pro，同时保持Flash级别的价格和速度。支持100万上下文、6.5万最大输出、多模态。输入$1.50/百万token，输出$9/百万token。

Google 多模态模型发布

03:01

Chubby♨️@kimmonismus

26

感谢 Sundar - 第一次参加 I/O 就已感觉宾至如归。 Gemini 3.5 Flash 在这个价位上的表现确实令人印象深刻。效率竞赛才刚刚开始！

Sundar Pichai: Workhorse model! (and hope you're enjoying your first I/O)

Google 大佬观点模型发布

03:01

Chubby♨️@kimmonismus

37

Demis Hassabis谈到Gemini如何助力科学迈向医学黄金时代，使我们很快能治愈所有疾病。我激动得起了鸡皮疙瘩，兴奋之情无以言表。

Chubby♨️: "Progress towards AGI": Gemini Omni - world models -Gemini Omni official!! It can create anything from any input!!!

Google 模型发布行业动态

02:59

Hacker News 热门（buzzing.cc 中文翻译）

84

Gemini 3.5 Flash：前沿智能，即刻行动

谷歌于2026年5月19日发布了Gemini 3.5 Flash模型，这是Gemini系列的最新版本，主打“前沿智能，即刻行动”。该模型强调高效的实时响应与处理能力，适用于需要快速决策的场景。该发布在技术社区Hacker News上获得了116分的关注度，显示出开发者对其性能与应用潜力的浓厚兴趣。不过，目前关于该模型在速度、准确率等具体性能指标上的提升幅度，官方尚未提供详细数据。

Google 多模态推理模型发布

02:55

AYi@AYi_AInotes

80

Google Gemini Omni重新定义视频生成

Google推出Gemini Omni，首个面向消费者的世界模型。它通过自然语言交互，将Gemini的智能与生成媒体系统结合，实现了对物理规律、历史、生物等世界的深刻理解。用户可以像编辑ChatGPT文本一样用单句指令编辑视频，实现人物一致性、风格迁移、角度调整等功能。它不是单纯生成像素，而是模拟连贯的物理与语义世界，标志着AI视频生成从拼接工具向智能创作系统的飞跃。

Google DeepMind: We're dropping Gemini Omni: our first step towards a model that can create anything from anything - starting with video....

DeepMind Google 图像生成多模态

02:30

Chubby♨️@kimmonismus

81

真正的"哇"时刻是 Gemini Omni。一个迈向 AGI 的世界模型。它可以从任何输入创建任何内容。这太疯狂了。

Logan Kilpatrick: Introducing Gemini Omni 🔮........ Omni is our new model that can create anything from any input - starting with video (...

Google 多模态模型发布视频

02:29

Google AI Developers@googleaidevs

84

✨ 推出 Gemini 3.5，这是我们最新的模型家族，将前沿智能与行动能力相结合。该系列为智能体模型树立了新标准，它们不仅能推理，更能执行。

智能体 Google 推理模型发布

02:29

Sundar Pichai@sundarpichai

90

刚结束 #GoogleIO 活动，分享今早的一些亮点 🧵 Gemini 3.5 Flash 今日起面向所有用户开放，可在 @antigravity 及我们的产品和 API 中使用。与 3.1 Pro 相比，3.5 Flash 在几乎所有基准测试中表现更优，编程能力大幅提升。它性能可比肩顶尖模型，但速度极快（每秒生成 token 数是其他前沿模型的 4 倍）。从智能水平与输出速度的综合表现来看，它在右上象限独占鳌头。

Google 推理模型发布

1…23 242526 27…43