9月22日

21:15

公众号：DeepSeek（深度求索）

DeepSeek-V3.1 版本更新

DeepSeek-V3.1 版本更新发布，主要包括修复若干已知问题，Agent 能力进一步提升。这是本次版本更新的核心内容，旨在优化用户体验。

智能体 DeepSeek 模型发布

9月21日

16:54

美团 LongCat：HuggingFace 新模型

meituan-longcat 发布 LongCat-Flash-Thinking-FP8

meituan-longcat 开源发布 LongCat-Flash-Thinking-FP8 模型，采用 FP8 8位浮点精度格式优化计算效率与推理速度。该模型支持 Flash-Thinking 快速推理能力，致力于通过开源和开放科学推进人工智能的民主化。正文未披露具体参数规模、训练数据详情或基准测试指标。

Hugging Face 推理模型发布

9月19日

09:10

公众号：小米 MiMo

小米开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio

小米开源其首个原生端到端语音大模型 Xiaomi-MiMo-Audio，被定位为语音开源领域的“LLaMA 时刻”，对标此前语音闭源领域的“GPT-3 时刻”。该模型具体参数、评测分数及开源协议尚未披露。

多模态模型发布语音

9月4日

14:54

蚂蚁 inclusionAI：GitHub 新仓库

InclusionAI 开源 MoE 大语言模型 Ling-V2

InclusionAI 发布并开源了其混合专家大语言模型 Ling-V2。该模型采用 MoE 架构，旨在通过更高效的参数利用来提升模型性能。此次开源意味着研究者和开发者可以自由访问、使用并基于此模型进行进一步的创新与开发。

开源/仓库模型发布端侧

9月1日

00:00

LMSYS：Blog（Chatbot Arena 团队）

美团开源LongCat-Flash：基于SGLang的高效Agentic MoE模型

美团开源Agentic MoE模型LongCat-Flash，总参数量560B，每token仅激活27B。该模型基于SGLang框架，采用PD分离架构与SBO技术，通过四阶段流水线在单batch内实现计算与通信重叠，突破吞吐与延迟的权衡瓶颈。相比同类模型推理成本降低50%以上，在Agent任务中表现优异，适用于复杂实时智能体应用。

智能体模型发布部署/工程

8月29日

15:39

美团 LongCat：HuggingFace 新模型

meituan-longcat 发布 LongCat-Flash-Chat

meituan-longcat 发布 LongCat-Flash-Chat 项目，宣称将通过开源与开放科学推进人工智能技术的进步与民主化。该项目致力于打破技术壁垒，降低 AI 使用门槛，但目前尚未披露具体的技术架构、参数规模、性能基准测试数据及应用场景等详细信息。

Hugging Face 模型发布

8月28日

08:00

xAI：News（网页）

精选

xAI发布轻量级编程模型Grok Code Fast 1

xAI发布轻量级编程模型Grok Code Fast 1，采用全新架构，基于真实PR数据训练，精通grep、终端和文件编辑等工具。推理速度达190 tokens/秒，定价输入$0.20/百万tokens、输出$1.50/百万tokens，SWE-Bench-Verified得分70.8%。目前已在GitHub Copilot、Cursor、Cline等平台限时免费开放。

智能体 xAI 模型发布编码

推荐理由：xAI发布专为Agentic Coding优化的极速编程模型，已集成Cursor、Copilot等主流工具，价格极具竞争力

8月21日

14:25

公众号：DeepSeek（深度求索）

精选63

DeepSeek-V3.1 发布，迈向 Agent 时代的第一步

DeepSeek-V3.1 以混合推理模型形式开源，用户可一键切换思考模式，同时 Agent 智能体支持性能得到增强。

智能体 DeepSeek 开源生态推理

推荐理由：DeepSeek V3.1 不是小修小补，混合推理和 Agent 支持让它从‘对话模型’转向‘行动模型’，开源这一步让 Agent 开发有了新底座。

8月8日

20:11

公众号：小米 MiMo

小米发布 MiMo-VL-7B-2508 多模态模型</br>summary_zh：小米推出了 MiMo-VL-7B-2508 多模态模型。

多模态推理模型发布

8月7日

08:00

OpenRouter：Announcements（RSS）

同事件精选68

GPT-5 已在 OpenRouter 上线

GPT-5 现已登陆 OpenRouter 平台，具备长上下文能力，专为复杂推理和代码工作流设计。

OpenAI 推理模型发布编码

同一事件，精选展示《GPT-5 现已上线》

推荐理由：GPT-5 是 AI 史上的分水岭，长上下文和推理能力直接催生了一整代 agent 工具，哪怕过了快一年回头看，仍然值得搞清楚它改变了什么。

08:00

OpenRouter：Announcements（RSS）

精选68

GPT-5 现已上线

OpenRouter 平台已发布 GPT-5，该模型支持长上下文，专为复杂推理与代码工作流构建。

OpenAI 推理模型发布编码

关联讨论 1 条

推荐理由：这是 GPT-5 首次以大上下文和推理能力亮相，1M token 上下文让 code agent 直接从 demo 变成可用，现在看虽是旧闻，但节点意义不减。

7月31日

00:00

LMSYS：Blog（Chatbot Arena 团队）

精选

智谱发布 GLM-4.5 系列模型并原生支持 SGLang

智谱发布旗舰模型 GLM-4.5（355B/32B 激活）与 GLM-4.5-Air（106B/12B 激活），含 FP8 量化版本，即日起原生支持 SGLang 框架。采用 MoE 架构与 128k 上下文，在 12 项基准测试中分列第 3 与第 6。GLM-4.5 在 BrowseComp 网页浏览任务中以 26.4% 准确率超越 Claude 4 Opus，工具调用成功率达 90.6%，编程与数学推理能力突出。

智能体推理模型发布编码

推荐理由：国产大模型Agent与编码能力跻身第一梯队，为开发者提供Claude/GPT之外的高性价比替代方案

7月30日

00:00

Mistral AI：News（网页）

发布 Codestral 25.08 及 Mistral 完整企业编程方案栈

Mistral AI 发布了 Codestral 25.08 及其完整的企业编码解决方案栈。该方案旨在通过一个集成的系统，解决企业在采用 AI 编程工具时遇到的核心障碍，如部署限制、定制化不足和架构分散。新版 Codestral 25.08 的性能有所提升，其代码接受完成率提高30%，保留代码增加10%，失控生成减少50%。方案中的 Codestral Embed 是专为代码设计的嵌入向量模型，在代码检索基准测试中性能优于其他模型。整个解决方案支持部署在云端、VPC 或本地环境。

开源生态模型发布编码

7月15日

00:00

Mistral AI：News（网页）

Mistral AI 发布 Voxtral 开源语音理解模型

Mistral AI 发布了开源语音理解模型 Voxtral，提供 24B 和 3B 两个参数版本，均基于 Apache 2.0 协议开放。模型支持 32k token 上下文窗口，可处理最长 30 分钟的音频转录或 40 分钟的内容理解。其 API 提供了针对转录优化的 Voxtral Mini Transcribe 版本，在成本和延迟效率上表现突出。根据基准测试，Voxtral 在英语短文本及 Mozilla Common Voice 等多项指标上超越了 OpenAI Whisper 与 ElevenLabs Scribe，实现了同等性能下价格不到同类闭源 API 一半的优势。

开源生态模型发布语音

7月11日

00:00

Moonshot AI：Kimi Blog

精选

Kimi 发布 K2 模型

Kimi K2 采用混合专家（MoE）架构，拥有 320 亿激活参数和 1 万亿总参数，在非推理模型的前沿知识、数学和编程任务上达到 SOTA 性能。

推理模型发布编码

关联讨论 1 条

推荐理由：月之暗面发布 Kimi K2，万亿参数 MoE 架构，多基准 SOTA

7月10日

00:00

Mistral AI：News（网页）

Mistral AI 与 All Hands AI 合作发布新款 Devstral 模型

Mistral AI 与 All Hands AI 合作发布了新的 Devstral 模型，旨在增强 AI 智能体的编程能力。其中，Devstral Small 1.1 是一款开源模型（Apache 2.0 许可），仅有 24B 参数，在 SWE-Bench Verified 基准测试中达到 53.6% 的成绩，成为同类开源模型的新标杆。Devstral Medium 则通过 API 提供，在相同基准上取得 61.6% 的高分，性能超越 Gemini 2.5 Pro 和 GPT 4.1，且价格更具竞争力。两款模型均提供公共 API 访问。

智能体开源生态模型发布编码

7月9日

08:00

xAI：News（网页）

精选

Grok 4

xAI 正式发布 Grok 4，新一代大模型在数学推理和代码生成能力上大幅提升，延续实时获取 X 平台信息的特色。该版本支持更长上下文窗口和图像理解，即日起向 X Premium+ 订阅者开放。

xAI 推理模型发布

关联讨论 1 条

推荐理由：xAI正式发布Grok 4旗舰大模型，重要版本更新值得关注

7月1日

08:00

OpenRouter：Announcements（RSS）

精选55

OpenRouter 发布新隐身模型 Cypher Alpha

OpenRouter 宣布推出 Cypher Alpha，这是一款免费、通用型隐身模型，内置工具调用功能，用户可直接尝试。

智能体模型发布

推荐理由：OpenRouter 自家出的免费通用模型，带工具调用，去年夏天发的，现在看只能算个入门级 Agent 玩具，但免费试不亏。

08:00

OpenRouter：Announcements（RSS）

新型隐形模型：Cypher Alpha

Cypher Alpha 是一款免费、通用、隐形模型，自带工具调用功能。

智能体 MCP/工具模型发布

6月25日

21:59

Google DeepMind：Blog（RSS）

AlphaGenome：AI 助力深入理解基因组

推出统一 DNA 序列模型 AlphaGenome，提升调控变异效应预测能力，有望揭示基因组功能新机制。现已通过 API 开放使用。

DeepMind Google 模型发布

6月24日

22:00

Google DeepMind：Blog（RSS）

精选

Gemini Robotics On-Device 将 AI 引入本地机器人设备

Gemini Robotics On-Device 推出高效端侧机器人模型，具备通用灵巧操作与快速任务适应能力，支持本地设备直接部署运行。

DeepMind Google 具身智能模型发布

关联讨论 1 条

推荐理由：DeepMind 发布端侧机器人模型，支持本地部署与快速任务适应

6月10日

00:00

Mistral AI：News（网页）

Mistral AI 发布首个推理模型 Magistral

Mistral AI 发布了其首个推理模型 Magistral，包含开源版 Magistral Small（24B 参数）和企业版 Magistral Medium。在 AIME2024 上，Magistral Medium 得分为 73.6%，Magistral Small 为 70.7%。该模型核心特点是支持透明的多步推理，并能在 Le Chat 中以 10 倍于多数竞品的速度运行。Magistral 原生支持包括英语、法语、简体中文在内的多语言推理。开源版 Magistral Small 以 Apache 2.0 许可证发布。

开源生态推理模型发布

5月30日

09:32

公众号：小米 MiMo

Xiaomi MiMo-VL：通向Agent时代的推理基座，小米多模态大模型开源

小米开源多模态大模型Xiaomi MiMo-VL，该模型定位为Agent时代的推理基座，旨在为智能体时代提供基础推理能力。

智能体多模态模型发布

5月29日

20:06

公众号：DeepSeek（深度求索）

DeepSeek-R1 更新，思考更深，推理更强

DeepSeek-R1 更新，思考更深，推理更强。开启“深度思考”功能即可体验新版 R1 更加强大的思考与推理能力。

DeepSeek 推理模型发布

5月28日

00:00

Mistral AI：News（网页）

Mistral AI 发布代码专用嵌入模型 Codestral Embed

Mistral AI 发布首个专为代码设计的嵌入模型 Codestral Embed。该模型在代码检索任务上性能显著超越当前领先的 Voyage Code 3、Cohere Embed v4.0 和 OpenAI 大型嵌入模型。它支持输出不同维度和精度的嵌入向量，即使在 256 维度 int8 精度下仍优于竞品。模型通过 API 以 codestral-embed-2505 名称提供，定价为每百万 token 0.15 美元，批量 API 享五折优惠。最大上下文长度为 8192 tokens，推荐使用 3000 字符（含 1000 字符重叠）分块以优化检索效果。

检索增强模型发布编码

5月21日

00:00

Mistral AI：News（网页）

Devstral 面向软件工程的智能体大语言模型发布

Mistral AI 与 All Hands AI 合作推出 Devstral，一款专注于解决真实世界 GitHub 问题的智能体大语言模型。该模型需在 OpenHands 或 SWE-Agent 等代码智能体框架中运行。在 SWE-Bench Verified 基准测试中，Devstral 获得 46.8% 的分数，超越此前的开源最先进模型超过 6 个百分点。在相同测试框架下，其表现优于 DeepSeek-V3-0324 和 Qwen3 232B-A22B，并且比闭源的 GPT-4.1-mini 高出超过 20%。Devstral 以 Apache 2.0 许可证开源，可在单张 RTX 4090 或配备 32GB 内存的 Mac 上本地部署，亦可通过 API 调用。

智能体开源生态模型发布编码

5月20日

17:45

Google DeepMind：Blog（RSS）

精选

以全新生成式媒体模型与工具激发创意

发布新一代生成式媒体模型 Veo 3 与 Imagen 4，以及专为电影制作打造的工具 Flow，支持更高质量的视频与图像生成及专业影视创作流程。

DeepMind 图像生成模型发布视频

推荐理由：Google发布Veo 3与Imagen 4生成模型及电影制作工具Flow

17:45

Google DeepMind：Blog（RSS）

精选

Gemma 3n 预览版发布：强大、高效、移动优先的 AI

Gemma 3n 预览版发布，专为移动设备优化的开源多模态模型。采用 2-in-1 架构，支持音频理解，适用于实时交互和音频中心应用开发。

DeepMind Google 多模态模型发布

关联讨论 1 条

推荐理由：Google 发布端侧多模态模型 Gemma 3n，支持音频理解，面向移动设备优化

5月7日

00:00

Mistral AI：News（网页）

Medium is the new large.

Mistral AI 发布 Mistral Medium 3 模型，主打顶尖性能与高性价比。该模型在各项基准测试中达到或超过 Claude Sonnet 3.7 表现的90%，但成本显著更低（API 定价为 $0.4 / 百万输入 token 和 $2 / 百万输出 token）。其性能超越 Llama 4 Maverick 等开源模型及 Cohere Command A 等企业模型，成本也优于 DeepSeek v3。该模型擅长编码和多模态理解等专业任务，并支持混合或本地部署、定制微调及集成企业系统，现已可通过多个平台调用。

开源生态模型发布

5月6日

23:06

Google DeepMind：Blog（RSS）

精选

Gemini 2.5 Pro Preview 提前发布：编程性能进一步提升

鉴于开发者反馈积极，Google 提前两周发布 Gemini 2.5 Pro Preview 更新版本，编程性能进一步提升，现已开放获取。

DeepMind Google 推理模型发布

推荐理由：Gemini 2.5 Pro 提前发布更新版本，编码性能显著提升，开发者可即刻体验

4月30日

09:23

公众号：小米 MiMo

Xiaomi MiMo：为"Reasoning"而生！小米首个推理大模型开源

推理模型发布

4月14日

08:00

OpenRouter：Announcements（RSS）

Quasar Alpha 和 Optimus Alpha 亮相

Quasar Alpha 和 Optimus Alpha 是 OpenRouter 的早期测试版本，在测试期间均位居排行榜首位。

模型发布

08:00

OpenRouter：Announcements（RSS）

Quasar Alpha 与 Optimus Alpha 揭示

OpenRouter 公告显示，Quasar Alpha 与 Optimus Alpha 在测试期间均登顶排行榜，它们是早期测试阶段的模型版本。

模型发布

08:00

OpenRouter：Announcements（RSS）

Quasar Alpha 与 Optimus Alpha 发布

Quasar Alpha 和 Optimus Alpha 两个早期测试版本在测试期间均位居榜首。它们是某先进模型或系统的初期迭代，其测试表现优异，在相关评测中取得了领先的排名，显示出强大的潜力。此次发布揭示了这些早期版本的存在及其突出的基准测试结果。

OpenAI 模型发布行业动态

4月10日

08:00

OpenRouter：Announcements（RSS）

OpenRouter 推出第二个"隐身"模型 Optimus Alpha

OpenRouter 宣布推出其第二个“隐身”（stealth）模型 Optimus Alpha。该模型名称延续了“stealth”系列，但官方目前未公布具体技术参数、功能或应用细节。

模型发布部署/工程

08:00

OpenRouter：Announcements（RSS）

OpenRouter 发布第二个"stealth"模型 Optimus Alpha

OpenRouter 宣布推出其第二个“stealth”模型 Optimus Alpha，该模型为闭源产品，尚未公布参数规模、性能基准或价格等细节。

模型发布

08:00

OpenRouter：Announcements（RSS）

"隐形"模型：Optimus Alpha

团队发布了其第二个“隐形”模型Optimus Alpha。该模型延续了此前“隐形”模型的保密策略，具体性能指标与架构细节未公开。此举旨在保持技术优势，避免在竞争激烈的AI模型领域过早暴露全部能力。Optimus Alpha的推出标志着团队在模型迭代上的持续进展，但核心改进方向与具体应用场景仍有待后续披露。

智能体产品更新模型发布

4月3日

08:00

OpenRouter：Announcements（RSS）

OpenRouter 发布首个"隐身"模型 Quasar Alpha

OpenRouter 宣布其首个“隐身”模型 Quasar Alpha。该模型是 OpenRouter 首次推出的隐藏身份/来源的模型，具体参数、性能、可用性等细节尚未公布。

模型发布

08:00

OpenRouter：Announcements（RSS）

OpenRouter 推出首个"隐身"模型 Quasar Alpha

OpenRouter 宣布推出其首个名为 Quasar Alpha 的“隐身”模型。

模型发布