团队发布了其第二个“隐形”模型Optimus Alpha。该模型延续了此前“隐形”模型的保密策略，具体性能指标与架构细节未公开。此举旨在保持技术优势，避免在竞争激烈的AI模型领域过早暴露全部能力。Optimus Alpha的推出标志着团队在模型迭代上的持续进展，但核心改进方向与具体应用场景仍有待后续披露。

智能体产品更新模型发布

4月3日

08:00

OpenRouter：Announcements（RSS）

OpenRouter 发布首个"隐身"模型 Quasar Alpha

OpenRouter 宣布其首个“隐身”模型 Quasar Alpha。该模型是 OpenRouter 首次推出的隐藏身份/来源的模型，具体参数、性能、可用性等细节尚未公布。

模型发布

08:00

OpenRouter：Announcements（RSS）

OpenRouter 推出首个"隐身"模型 Quasar Alpha

OpenRouter 宣布推出其首个名为 Quasar Alpha 的“隐身”模型。

模型发布

08:00

OpenRouter：Announcements（RSS）

"隐形"模型：Quasar Alpha

公司首次发布了名为Quasar Alpha的“隐形”模型。这一新模型标志着其产品策略的转变，旨在以更隐蔽、不易被察觉的方式运行。Quasar Alpha的推出是其在人工智能模型领域的一次重要迭代，具体性能指标和细节尚未完全公开，但明确指向了增强模型的隐蔽性和适应性。

产品更新模型发布

3月25日

21:23

公众号：DeepSeek（深度求索）

同事件精选64

DeepSeek-V3 模型更新，各项能力全面进阶

DeepSeek-V3 新版已发布，关闭深度思考模式即可体验，模型权重同步开源。

DeepSeek 开源/仓库推理模型发布

同一事件，精选展示《DeepSeek-V3 正式发布》

推荐理由：DeepSeek-V3 发布时是开源模型的有力竞争者，但这条一年多前的旧闻如今毫无新意，对关注 AI 动态的你来说，可以直接跳过。

3月17日

00:00

Mistral AI：News（网页）

Mistral AI 发布 Mistral Small 3.1 开源模型

Mistral AI 于2025年3月17日发布 Mistral Small 3.1。该模型在 Mistral Small 3 基础上改进，支持最高 128k tokens 上下文窗口，推理速度达 150 tokens/秒，并支持多模态理解。官方称其性能超越了 Gemma 3 和 GPT-4o Mini 等同量级模型。Mistral Small 3.1 以 Apache 2.0 许可开源，基础模型与指令微调模型均已发布。模型轻量化，可在单张 RTX 4090 或配备 32GB RAM 的 Mac 上运行，适用于对话助手、函数调用、专业领域微调及构建推理模型等多种场景。

开源生态模型发布端侧

2月19日

00:00

xAI：News（网页）

精选

Grok 3 Beta 发布：推理智能体时代来临

Grok 3 Beta 正式发布，开启"推理智能体"时代。新版本强化深度推理与自主决策能力，支持复杂任务拆解和多步逻辑链处理，在数学、编程等推理密集型场景表现显著提升，标志着 AI 从简单问答向自主推理决策的范式转变。

智能体 xAI 推理模型发布

推荐理由：xAI发布Grok 3 Beta，主打推理智能体能力

2月17日

00:00

Mistral AI：News（网页）

Mistral AI 发布首个区域语言模型 Mistral Saba

Mistral AI 推出首个区域语言模型 Mistral Saba。这是一个参数量为 24B 的模型，基于来自中东和南亚的精选数据集进行训练。模型在提供比自身参数量大五倍的通用模型更准确的相关响应的同时，具备更快的速度和更低的成本。Mistral Saba 支持阿拉伯语及多种印度语言，在南印度语系如泰米尔语上表现尤为突出。它以 API 形式提供服务，同时也支持在客户的安全环境中进行本地部署。该模型轻量化，可在单 GPU 系统上运行，响应速度超过 150 tokens/秒。

模型发布

1月30日

00:00

Mistral AI：News（网页）

Mistral Small 3发布

Mistral AI 发布 Mistral Small 3，一款基于 Apache 2.0 开源、延迟优化的 24B 参数大语言模型。其性能可与 Llama 3.3 70B、Qwen 32B 等更大模型竞争，并作为 GPT-4o-mini 的开源替代。指令微调版本在代码、数学、通用知识等基准测试中表现出色，MMLU 准确率超 81%，推理速度达 150 tokens/s。该模型未使用强化学习或合成数据训练，提供预训练和指令微调两个检查点，适合本地部署，经量化后可在单块 RTX 4090 或 32GB 内存 MacBook 上运行。现已在 la Plateforme 平台提供，并与 Hugging Face、Ollama、Together AI 等合作推出。

开源生态推理模型发布

1月20日

20:10

公众号：DeepSeek（深度求索）

精选64

DeepSeek-R1 发布，性能对标 OpenAI o1 正式版

DeepSeek-R1 发布，性能对标 OpenAI o1 正式版。模型遵循 MIT License 开放 API，训练技术同步公开。

DeepSeek 推理模型发布

推荐理由：虽已是旧闻，但 DeepSeek-R1 作为首个开源对齐 o1 的模型，其训练技术至今仍有参考价值，做推理方向的值得回溯。

1月13日

00:00

Mistral AI：News（网页）

Mistral AI 发布 Codestral 25.01 代码生成模型

Mistral AI 推出了代码生成模型 Codestral 25.01。相比前代 Codestral-2405，该模型采用了更高效的架构并改进了分词器，使代码生成与补全速度提升约 2 倍。Codestral 25.01 的上下文长度为 256k。在多项基准测试中，它在 HumanEval 平均基准上得分 71.4%，在 HumanEvalFIM（填充中间）平均基准上得分 85.9%，成为同量级模型中代码生成，尤其是填充中间（FIM）任务的 SOTA。

模型发布编码

12月26日

19:17

公众号：DeepSeek（深度求索）

精选67

DeepSeek-V3 正式发布

深度求索正式发布 DeepSeek-V3 模型，性能比肩世界顶尖模型，速度跃升，价格更新。

DeepSeek 开源/仓库模型发布

关联讨论 1 条

推荐理由：DeepSeek-V3 是 2024 年底国产模型的一次真正跃迁，首次亮剑就逼近闭源顶尖，开源权重更是直接改变了开发者生态。时隔一年半回头看，它仍是理解 DeepSeek 路径的起点。

12月13日

20:14

公众号：DeepSeek（深度求索）

久等了，DeepSeek-VL2

DeepSeek 多模态模型发布

12月5日

08:00

OpenRouter：Announcements（RSS）

亚马逊推出全新Nova模型家族

亚马逊推出了全新的Nova模型家族。这是亚马逊最新发布的Nova系列模型，现已正式到来。

多模态模型发布

11月20日

19:59

公众号：DeepSeek（深度求索）

精选66

DeepSeek 推理模型预览版上线，推理性能媲美 o1-preview，公开完整思维链

DeepSeek 上线推理模型预览版，其推理性能与 OpenAI 的 o1-preview 相当，并公开了模型的完整思维链。

DeepSeek 推理模型发布

推荐理由：虽然已是旧闻，但 DeepSeek 首次公开推理模型完整思维链，对理解 o1 类模型的内部机制是个重要线索，做推理模型研究的值得回看。

11月18日