谷歌于2026年5月19日发布了Gemini 3.5 Flash模型,这是Gemini系列的最新版本,主打“前沿智能,即刻行动”。该模型强调高效的实时响应与处理能力,适用于需要快速决策的场景。该发布在技术社区Hacker News上获得了116分的关注度,显示出开发者对其性能与应用潜力的浓厚兴趣。不过,目前关于该模型在速度、准确率等具体性能指标上的提升幅度,官方尚未提供详细数据。
关联讨论 7 条Google DeepMind:Blog(RSS)X:Jeff Dean (@JeffDean)X:Google AI for Developers (@googleaidevs)X:Oran Ge (@oran_ge)X:Demis Hassabis (@demishassabis)X:阶跃星辰 StepFun (@StepFun_ai)X:Gemini (@GeminiApp)Google推出Gemini Omni,首个面向消费者的世界模型。它通过自然语言交互,将Gemini的智能与生成媒体系统结合,实现了对物理规律、历史、生物等世界的深刻理解。用户可以像编辑ChatGPT文本一样用单句指令编辑视频,实现人物一致性、风格迁移、角度调整等功能。它不是单纯生成像素,而是模拟连贯的物理与语义世界,标志着AI视频生成从拼接工具向智能创作系统的飞跃。
We're dropping Gemini Omni: our first step towards a model that can create anything from anything - starting with video....
关联讨论 7 条X:Gemini (@GeminiApp)Hacker News 热门(buzzing.cc 中文翻译)X:Demis Hassabis (@demishassabis)X:Google AI (@GoogleAI)X:Berry Xia (@berryxia)X:Ethan Mollick (@emollick)X:Sundar Pichai (@sundarpichai)Introducing Gemini Omni 🔮........ Omni is our new model that can create anything from any input - starting with video (...
Google 在 I/O 大会上正式发布了最新的 Gemini 3.5 模型系列。该系列模型将前沿的人工智能能力与执行操作的功能相结合,旨在提供更强的综合性能。作为 Google 最新推出的模型,它代表了其在大模型技术上的最新进展。
关联讨论 7 条Google DeepMind:Blog(RSS)X:Jeff Dean (@JeffDean)X:Google AI for Developers (@googleaidevs)X:Oran Ge (@oran_ge)X:Demis Hassabis (@demishassabis)X:阶跃星辰 StepFun (@StepFun_ai)X:Gemini (@GeminiApp)Google 在 I/O 2026 大会上宣布 Gemini 进入自主代理时代,新功能使其能够自动执行复杂任务,显著提升用户工作效率。大会展示了 Gemini 如何通过代理操作简化工作流程,实现自动化处理,例如自动管理邮件、安排日程或生成报告,帮助用户从重复性工作中解放出来,专注于创造性任务。这一更新基于先进机器学习模型,强调准确性与效率,标志着 AI 助手向更智能、更自主的方向发展。
Google发布了更高效的Gemini 3.5 Flash模型。该公司表示,这款模型的效率提升是实现智能体式AI未来的关键所在,意味着生成式AI的应用将更为便捷和实用。
Gemini 3.5 Flash is here and it's our best model yet for getting things done quickly and efficiently. Whether you need h...
关联讨论 7 条Google DeepMind:Blog(RSS)X:Jeff Dean (@JeffDean)X:Google AI for Developers (@googleaidevs)X:Oran Ge (@oran_ge)X:Demis Hassabis (@demishassabis)X:阶跃星辰 StepFun (@StepFun_ai)X:Gemini (@GeminiApp)GOOGLE I/O 🔥: GEMINI 3.5 FLASH HAS BEEN ANNOUNCED! Gemini 3.5 performs on par with Gemini 3.1 Pro on Artificial Analysi...
关联讨论 7 条Google DeepMind:Blog(RSS)X:Jeff Dean (@JeffDean)X:Google AI for Developers (@googleaidevs)X:Oran Ge (@oran_ge)X:Demis Hassabis (@demishassabis)X:阶跃星辰 StepFun (@StepFun_ai)X:Gemini (@GeminiApp)谷歌发布新模型Gemini 3.5 Flash,其在智能指数上提升9分至55分,超越Grok 4.3和Claude Sonnet 4.6,尤其在代理任务和知识真实性(大幅减少幻觉)方面进步显著。输出速度超280 tokens/s,使其位于速度与智能的领先前沿。然而,模型运行成本相比前代增加5.5倍,主要由于输入令牌用量及定价上涨。此外,它在多模态评估MMMU-Pro中取得最高分,支持多模态输入,展现了谷歌的综合优势。
关联讨论 7 条Google DeepMind:Blog(RSS)X:Jeff Dean (@JeffDean)X:Google AI for Developers (@googleaidevs)X:Oran Ge (@oran_ge)X:Demis Hassabis (@demishassabis)X:阶跃星辰 StepFun (@StepFun_ai)X:Gemini (@GeminiApp)Gemini 3.5 Flash official! Insanely fast an capable model
Gemini 3.5 Flash official! Insanely fast an capable model
在Google I/O大会上,谷歌正式推出Gemini 3.5系列模型,首个发布的Gemini 3.5 Flash专为执行复杂、长周期的代理工作流而设计。该模型在Terminal-Bench和MCP Atlas等编程与代理基准测试中得分超越3.1 Pro,且运行速度可达其他前沿模型的4倍。若在Google Antigravity环境中使用,速度提升可高达12倍。它能高效部署协同工作的子代理,通过高频迭代循环来解决现实世界的大规模问题。
关联讨论 7 条Google DeepMind:Blog(RSS)X:Jeff Dean (@JeffDean)X:Google AI for Developers (@googleaidevs)X:Oran Ge (@oran_ge)X:Demis Hassabis (@demishassabis)X:阶跃星辰 StepFun (@StepFun_ai)X:Gemini (@GeminiApp)在2026年谷歌I/O开发者大会上,谷歌正式推出Gemini Omni模型。该模型代表了Gemini家族迄今最全面的能力,“Omni”意为全能,能够无缝处理文本、图像、音频和视频等多种信息模态,实现“从任何输入生成任何输出”。其核心亮点在于支持对话式编辑,用户可通过自然语言指令轻松修改视频元素。同时,谷歌发布了首款衍生模型Gemini Omni Flash,现已在Gemini App、Google Flow和YouTube Shorts中可用,后续将提供API服务。
关联讨论 7 条X:Gemini (@GeminiApp)Hacker News 热门(buzzing.cc 中文翻译)X:Demis Hassabis (@demishassabis)X:Google AI (@GoogleAI)X:Berry Xia (@berryxia)X:Ethan Mollick (@emollick)X:Sundar Pichai (@sundarpichai)谷歌在2026年I/O开发者大会上宣布,新一代模型Gemini 3.5 Pro将于下月正式发布。该模型目前已在谷歌内部投入使用,官方表示其性能相比前代有显著提升。不过,具体的技术细节和性能指标尚未公开。
谷歌在2026年I/O开发者大会上推出了Gemini 3.5 Flash模型。该模型在多项基准测试中性能超越前代,并实现了每秒289 tokens的输出速度,较Claude Opus 4.7和GPT-5.5 xhigh快约4倍。此外,谷歌团队使用Antigravity工具,在12小时内启动93个子智能体,生成26亿tokens,成功构建出一个可运行的操作系统核心,展示了模型的强大能力。
关联讨论 7 条Google DeepMind:Blog(RSS)X:Jeff Dean (@JeffDean)X:Google AI for Developers (@googleaidevs)X:Oran Ge (@oran_ge)X:Demis Hassabis (@demishassabis)X:阶跃星辰 StepFun (@StepFun_ai)X:Gemini (@GeminiApp)谷歌推出原生多模态AI模型Gemini Omni,能够整合视频、图像、音频和文本等多种输入,生成高质量视频内容。其核心能力是通过自然语言对话进行视频编辑,并能保持角色一致性、物理规律与场景连贯性。首个模型Gemini Omni Flash已上线,未来将支持图像和音频输出。Gemini Omni结合了对物理世界的直觉理解与丰富的知识库,支持从写实到叙事的创意生成,并可通过多轮对话持续编辑视频,而不丢失原始场景上下文。
关联讨论 7 条X:Gemini (@GeminiApp)Hacker News 热门(buzzing.cc 中文翻译)X:Demis Hassabis (@demishassabis)X:Google AI (@GoogleAI)X:Berry Xia (@berryxia)X:Ethan Mollick (@emollick)X:Sundar Pichai (@sundarpichai)Omni brings together an improved understanding of physics with Gemini's knowledge of history, biology, and culture, brid...
关联讨论 1 条Simon Willison 博客Gemini 3.5 Flash is here and it's our best model yet for getting things done quickly and efficiently. Whether you need h...
Cap-ex at google is increasing at roughly 6x per year!
"Progress towards AGI": Gemini Omni - world models -Gemini Omni official!! It can create anything from any input!!!
Qwen3.5-LiveTranslate-Flash 是 Qwen 家族最新的同声传译模型,基于 Qwen3.5-Omni 架构,支持实时多模态翻译(音频、视频及视觉上下文)。语言覆盖大幅扩展:输入音频与输出文本从18种增至60种,输出音频从10种增至29种。采用 Readable Unit 技术,平均端到端每 token 延迟降至2.8秒,相比前代首 token 延迟降低3.45秒、每 token 延迟降低1.88秒。支持一句话启动的实时语音克隆和可动态配置的热词增强。在 FLEURS 和 CoVoST2 基准上翻译准确率超越主流商用大语音模型。
Gemini Omni is starting to rollout for some users!
Hugging Face 发布六个 Ettin Reranker 重排序模型(17m、32m、68m、150m、400m、1b),基于 Ettin ModernBERT 编码器,蒸馏 self-mxbai-rerank-large-v2 分数训练,在 MTEB(eng, v2) Retrieval 达各自规模 SOTA。模型以 Sentence Transformers CrossEncoder 接口提供,三行代码可调用。同时发布 train-sentence-transformers Agent Skill(v5.5.0),允许 AI 编码智能体在用户数据上微调模型。训练配方、数据集和脚本已全部开源。
Odyssey 公司发布了世界模型 Agora-1,该模型允许最多四名玩家同时在 AI 生成的虚拟世界中进行行动。该技术已在经典游戏《GoldenEye》上得到验证,其核心是使用两个独立的模型分别实时处理游戏状态模拟与画面渲染。开发团队认为,这项技术未来在协作机器人和 AI 智能体训练领域具有应用潜力。
Gemini 3.5 Flash just showed up in the Google Cloud Console It's coming
关联讨论 7 条Google DeepMind:Blog(RSS)X:Jeff Dean (@JeffDean)X:Google AI for Developers (@googleaidevs)X:Oran Ge (@oran_ge)X:Demis Hassabis (@demishassabis)X:阶跃星辰 StepFun (@StepFun_ai)X:Gemini (@GeminiApp)Gemini Gemini Gemini Gem
地平线机器人实验室发布了其开源的人形机器人全身控制模型 HoloMotion-1。这是一个拥有 4 亿参数的“小脑”大模型,通过 MoE 稀疏激活与 KV-cache 推理机制,在端侧实现了约 300FPS 的实时推理能力。该模型利用互联网视频、光学动捕、VR 遥操作等多种来源的动作数据进行训练,并在真实机器人上成功展示了舞蹈、爬行、健身、搬箱子等复杂动作的零样本迁移能力。相关代码与技术报告已公开。
Agora-1是一个新发布的多智能体世界模型,旨在为人工智能系统提供对复杂环境进行协同模拟与推理的能力。该模型聚焦于让多个AI智能体在共享的虚拟世界中互动、规划和协作,可能应用于机器人控制、游戏AI或复杂场景仿真等前沿领域。其发布标志着多智能体系统与环境建模技术融合的一个新进展。
In the Vision Arena, Qwen3.7 Plus Preview makes @Alibaba_Qwen the #5 lab, ranking #16 overall.
关联讨论 10 条X:OpenRouter (@OpenRouter)X:Rohan Paul (@rohanpaul_ai)X:阿里云 / Alibaba Cloud (@alibaba_cloud)Hacker News 热门(buzzing.cc 中文翻译)Qwen:Blog Retrieval(API)IT之家(RSS)X:通义千问 / Qwen (@Alibaba_Qwen)X:X.PIN (@thexpin)X:Kim (@kimmonismus)X:opencode (@opencode)