3月11日

00:00

LMSYS：Blog（Chatbot Arena 团队）

SGLang 宣布首日支持 NVIDIA Nemotron 3 Super，助力构建高效多智能体系统

SGLang 首日支持 NVIDIA Nemotron 3 Super 开源模型。该模型采用 120B 总参数、12B 激活参数的混合 MoE 架构，支持 1M token 超长上下文，专为多智能体协作设计。相比前代，吞吐量提升 5 倍，在 Artificial Analysis 智能指数上准确率提高 2 倍。集成 Transformer-Mamba 架构与多 Token 预测技术，兼容 B200、H100 等 GPU，提供完全开放的权重与数据集，适用于代码生成、工具调用等复杂推理场景。

智能体模型发布部署/工程

3月10日

11:54

公众号：腾讯混元

混元世界模型再进化：开源首个面向世界模型的强化学习后训练框架WorldCompass

多模态开源生态模型发布

3月9日

18:00

公众号：小红书技术（dots.llm）

REDSearcher：30B参数深度搜索Agent超越GPT-5，低成本可扩展

REDSearcher是一个30B参数的深度搜索Agent，性能超越GPT-5，同时实现低成本与可扩展性。

智能体搜索模型发布

3月8日

20:41

公众号：小红书技术（dots.llm）

小红书 FireRed-Image-Edit v1.1 发布：OOTD元素融合、人像一致性大幅提升

小红书 Super Intelligence 团队在 FireRed-Image-Edit 1.0 发布不到一个月后推出 v1.1 版本，主要提升包括 OOTD（穿搭）元素融合、人像一致性大幅改进以及更强的社区友好特性。

图像生成多模态模型发布

00:27

Sam Altman@sama

精选

GPT-5.4 在编程、知识工作、计算机使用等方面表现出色，很高兴看到大家如此喜欢它。但它也是我最喜欢聊天的模型！我们在模型个性方面已经偏离目标有一段时间了，所以能朝着正确方向前进感觉特别好。

智能体 OpenAI 模型发布编码

推荐理由：GPT-5.4获Sam Altman盛赞，对话体验与Agent能力双双突破

3月7日

00:14

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/AReaL-tau2-merge-sft-235B 发布

inclusionAI 团队发布了 AReaL-tau2-merge-sft-235B 模型。该模型参数量达2350亿，采用合并与监督微调技术构建。其目标是推动人工智能技术发展并通过开源开放模式实现AI民主化，致力于让先进AI技术更广泛可及。

开源/仓库推理模型发布

3月6日

02:10

OpenAI@OpenAI

精选

GPT-5.4 Thinking 和 GPT-5.4 Pro 开始向 ChatGPT 用户推出，同时通过 API 和 Codex 开放。该版本将推理、编程与智能体工作流能力整合为单一前沿模型。

智能体 OpenAI 推理模型发布

推荐理由：GPT-5.4 正式发布，集推理、编程与 Agent 能力于一体，全平台上线

3月5日

18:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选

GPT-5.4 发布

OpenAI 推出 GPT-5.4，面向专业工作的最强高效前沿模型，支持 100 万 token 长上下文，具备顶尖编程、计算机使用与工具搜索能力。

智能体 OpenAI 模型发布编码

推荐理由：OpenAI 发布 GPT-5.4，支持 1M 上下文与增强 Agent 能力

18:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选

GPT-5.4 Thinking 系统卡

OpenAI 发布 GPT-5.4 Thinking 系统卡，披露新一代推理模型的架构细节、安全评估框架及能力边界。文档详述思维链优化机制、长上下文推理性能指标，明确数学推导与代码生成准确率数据，分析幻觉风险与偏见控制措施，并列出越狱攻击防护策略及企业级部署的安全限制建议。

OpenAI 推理模型发布

推荐理由：OpenAI 发布 GPT-5.4 Thinking 系统卡，详述模型安全与能力评估

13:56

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/ZwZ-4B-GGUF

inclusionAI发布了ZwZ-4B-GGUF模型。该模型基于开源与开放科学理念，旨在推动人工智能技术的进步与普及。其核心变化是提供了GGUF格式，这是一种高效且通用的模型文件格式，便于在不同硬件和推理框架上部署与运行。此举旨在降低大型语言模型的使用门槛，促进更广泛的研究与应用开发。

开源/仓库模型发布端侧

13:56

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI发布ZwZ-2B-GGUF模型

inclusionAI推出开源模型ZwZ-2B-GGUF，致力于通过开源与开放科学推动人工智能技术的进步与民主化。该举措旨在降低AI开发与应用的门槛，促进更广泛的社区参与和创新。模型以开放协作和科学共享为核心路径，强调技术普及与包容性发展。

开源/仓库模型发布端侧

10:55

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/AReaL-tau2-telecom-user-sft-30B

inclusionAI 团队发布了 AReaL-tau2-telecom-user-sft-30B 模型。这是一个拥有 300 亿参数、专门针对电信领域用户服务场景进行监督微调的大语言模型。该模型的发布旨在通过开源和开放科学的方式，推动人工智能技术的进步与普及，使其更易于获取和应用。

开源/仓库模型发布端侧

10:08

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/AReaL-tau2-telecom-sft-30B

inclusionAI团队发布了AReaL-tau2-telecom-sft-30B模型，这是一个拥有300亿参数、专门针对电信领域进行监督微调（SFT）的大型语言模型。该模型基于开源与开放科学理念构建，旨在推动人工智能技术的进步与普及。其核心变化在于针对电信行业的特定任务和数据进行了深度优化，以提升在该垂直领域的专业性能和应用效果。

开源/仓库模型发布端侧

09:01

公众号：阶跃星辰（Step）

创作一首新歌只需2秒！阶跃星辰开源 ACE-Step 1.5 收获开发社区好评

开源生态模型发布语音

00:53

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/AReaL-tau2-retail-sft-30B 发布

inclusionAI 发布了针对零售业优化的 AReaL-tau2-retail-sft-30B 模型，参数量达 300 亿，采用监督微调技术。该模型致力于通过开源与开放科学推动人工智能的进步与普及，旨在降低技术使用门槛，促进AI在零售领域的专业化应用与创新。

开源/仓库模型发布端侧

00:30

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/AReaL-tau2-airline-sft-30B 发布

inclusionAI团队发布了AReaL-tau2-airline-sft-30B模型。这是一个基于开源与开放科学理念开发的、参数规模达300亿的大型语言模型。该模型的发布旨在推动人工智能技术的进步与民主化，其具体训练数据与性能指标尚未在本次公告中详细披露。

开源/仓库模型发布部署/工程

3月4日

16:25

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/ZwZ-2B

inclusionAI 发布了 ZwZ-2B 模型，这是一个拥有 20 亿参数的开源语言模型。该模型旨在通过开源和开放科学的方式推动人工智能的进步与民主化。其上下文处理长度扩展至 128K，并在多项基准测试中性能显著提升，特别是在代码生成和数学推理任务上表现出色。ZwZ-2B 的发布为研究者和开发者提供了一个更易获取的高性能 AI 工具。

开源/仓库模型发布端侧

03:03

OpenAI@OpenAI

精选

官方暗示5.4版本发布时间将早于外界普遍预期，新版本即将到来。具体发布日期及新增功能细节有待后续正式公布，玩家可关注官方渠道获取最新动态。

OpenAI 推理模型发布

推荐理由：OpenAI官方预告GPT-5.4即将发布，暗示新模型上线在即引发热议

02:02

OpenAI@OpenAI

精选

GPT-5.3 Instant 现已向所有 ChatGPT 用户推出，响应准确性提升，且减少了令人尴尬的 AI 味。

OpenAI 模型发布

推荐理由：OpenAI 向所有用户开放 GPT-5.3 Instant，响应更快且回答更准确自然

00:35

Google DeepMind：Blog（RSS）

Gemini 3.1 Flash-Lite：专为规模化智能构建

Google 发布 Gemini 3.1 Flash-Lite，为 Gemini 3 系列中速度最快、成本效益最高的模型，面向大规模智能应用场景优化。

DeepMind Google 模型发布端侧

00:30

Nathan Lambert：Interconnects（RSS）

阿里巴巴 Qwen 3.5、智谱 AI GLM 5 与 MiniMax 2.5 近期集中发布，中国头部 AI 实验室通过开源策略持续推动技术边界。新一代模型在代码生成、多模态推理与复杂任务处理上实现显著性能跃升，参数规模与上下文窗口同步扩展，展现中国在全球开源 AI 生态中的前沿竞争力与快速迭代能力。

开源生态模型发布

3月3日

18:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选

GPT-5.3 Instant：日常对话更流畅、更实用

GPT-5.3 Instant 模型升级，针对日常对话场景优化响应流畅度与实用性。新版本在保持即时响应速度的同时，输出更顺滑自然，提升普通用户高频问答体验。

OpenAI 模型发布

推荐理由：OpenAI 发布 GPT-5.3 Instant，针对日常对话体验优化

18:00

OpenAI：官网动态（RSS · 排除企业/客户案例）

精选

GPT-5.3 Instant 系统卡

OpenAI 发布 GPT-5.3 Instant 系统卡，概述该快速响应模型的安全评估、能力边界及使用限制，明确低延迟场景下的技术规范与风险管控措施。

OpenAI 模型发布

推荐理由：OpenAI发布GPT-5.3 Instant系统卡，披露新模型能力与安全评估

3月2日

21:02

Google DeepMind@GoogleDeepMind

Nano Banana 2 让复杂的视觉创作更快、更便宜，且人人可及。🍌 点击每张照片查看详情 👀

DeepMind 图像生成模型发布端侧

3月1日

17:56

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/AReaL-SEA-235B-A22B

inclusionAI团队宣布推出AReaL-SEA-235B-A22B模型，致力于通过开源与开放科学推动人工智能技术的进步与民主化。该举措旨在降低AI研究与应用的参与门槛，促进全球开发者及研究者更广泛地获取和使用先进AI工具。模型规模达2350亿参数，体现了其在处理复杂任务方面的潜力，同时强调开放协作对加速AI创新与社会普惠的关键作用。

开源/仓库推理模型发布

2月27日

00:02

Google DeepMind@GoogleDeepMind

精选

我们推出 Nano Banana 2，基于最新的 Gemini Flash 模型构建。🍌 它在创建和编辑图像方面达到最先进水平，将专业级功能与闪电般的速度相结合。🧵

DeepMind 图像生成模型发布端侧

关联讨论 1 条

推荐理由：端侧手机本地实现Pro级图像生成与编辑，AI创作无需云端等待

2月25日

01:34

Jim Fan@DrJimFan

精选

SONIC：半个GPT-1规模的机器人全身控制模型

SONIC是一个4200万参数的Transformer模型（规模仅半个GPT-1），通过1亿+动作捕捉帧和50万+并行机器人在NVIDIA Isaac Lab中训练，以密集帧级监督替代手工奖励函数。训练3天后零样本迁移至真实G1机器人，在50种动作序列上达100%成功率。单一策略支持VR遥操作、视频动捕、文本指令、音乐响应及VLA模型控制。项目已完全开源。

智能体具身智能开源生态模型发布

推荐理由：42M小模型实现人形机器人全身控制，零样本迁移真实硬件且完全开源，开发者可复现

2月22日

17:39

公众号：智谱（GLM）

GLM-5技术报告：技术细节全公开

模型发布论文/研究

00:00

智谱：研究（网页内嵌数据）

精选

GLM-5技术报告

GLM-5参数规模达7440亿，训练Token 28.5万亿。核心创新包括DSA稀疏注意力机制降低算力开销，异步RL基础设施与异步Agent RL算法提升长周期交互与自主决策能力。全面原生适配华为昇腾、寒武纪等七大国产芯片平台，通过W4A8混合精度量化与定制融合算子实现高效部署。模型支持复杂软件工程、终端操作、PPT生成等长程Agent任务，提供交错思考、保留思考等多种推理模式。

智能体模型发布编码部署/工程

推荐理由：智谱发布744B参数GLM-5，全面适配七大国产芯片平台，Agent与编码能力突出

2月20日

00:06

Google DeepMind：Blog（RSS）

精选

Gemini 3.1 Pro：专为最复杂任务打造的更智能模型

Gemini 3.1 Pro 发布，专为无法通过简单回答解决的复杂任务设计，提供更智能的深度推理与处理能力。

Google 推理模型发布

关联讨论 1 条

推荐理由：Google 发布 Gemini 3.1 Pro，强化复杂任务推理能力

2月18日

09:20

公众号：蚂蚁百灵（Ling）

蚂蚁百灵发布 Ming-flash-omni-2.0 与 Ming-omni-tts 语音模型

百灵多模态团队于两天前发布 Ming-flash-omni-2.0，并基于其语音模块推出新模型 Ming-omni-tts。通过模型规模扩展（scale up），Ming-omni-tts 实现更强的语音生成效果。

模型发布语音

2月17日

07:32

Midjourney：Updates（RSS）

V8 评分活动更新

Midjourney 本周将再举办两场 V8 Rating Party，随后正式发布 V8 模型。用户可前往 midjourney.com/rank-v8 参与 Round 1 图片评分，当前反馈已直接用于模型优化。

图像生成模型发布

2月16日

09:52

公众号：蚂蚁百灵（Ling）

Ling-2.5-1T 开源发布：深度思考模型拉升智能上限，即时模型平衡效率与覆盖

蚂蚁百灵发布并开源 Ling-2.5-1T，包含深度思考模型（thinking model）与即时模型（instant model）两类。深度思考模型旨在拉高智能上限，即时模型则在效率与效果之间取得平衡，拓宽智能覆盖范围。该版本在模型架构、token 效率、偏好对齐等维度实现全面升级。

开源/仓库推理模型发布

2月15日

23:39

公众号：MiniMax（稀宇科技）

MiniMax M2.5-HighSpeed 上线：100 TPS，3 倍速推理

MiniMax 推出 M2.5-highspeed 模型，支持 100 TPS 极速推理，速度达到同类产品的 3 倍。Coding Plan 与 API 同步上线，Coding Plan 提供 Plus、Max、Ultra 三档套餐，邀请好友可享 9 折优惠。此前 M2.5 发布 48 小时内已有 50 余款国内外产品接入。

智能体推理模型发布

2月14日

15:48

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/Ling-2.5-1T

inclusionAI 发布了 Ling-2.5-1T 模型。该模型参数规模达到 1 万亿，是其 Ling 系列的最新版本。此次发布延续了通过开源和开放科学来推进人工智能民主化的使命，旨在让先进 AI 技术更广泛可及。新版本预计在语言理解与生成能力上有所提升，继续为全球研究社区提供强大的基础模型支持。

开源生态推理模型发布

00:00

字节 Seed：Research Feed（网页内嵌数据）

精选

Seed2.0 正式发布

Seed2.0系列正式发布，推出Pro、Lite、Mini三款通用Agent模型及专用Code模型，针对复杂多模态任务与长链路Agent场景优化。模型在视觉理解、数学推理与长上下文处理方面达SOTA水平，SuperGPQA分数超越GPT-5.2，并在ICPC、IMO、CMO测试中获金牌。支持科学研究级任务，token成本较顶尖模型降低约一个数量级。目前已上线豆包App、TRAE及火山引擎API。

智能体多模态模型发布编码

推荐理由：字节 Seed2.0 正式发布，Agent 与多模态能力全面升级，已接入豆包和 TRAE

2月13日

12:06

公众号：蚂蚁百灵（Ling）

Ring-2.5-1T，思更深，行更远

模型发布

08:00

公众号：智谱（GLM）

GLM-5 上线 24 小时获用户选择

GLM-5 上线 24 小时后，获得这些朋友选择。

模型发布行业动态