Mistral AI 发布了其首个推理模型 Magistral，包含开源版 Magistral Small（24B 参数）和企业版 Magistral Medium。在 AIME2024 上，Magistral Medium 得分为 73.6%，Magistral Small 为 70.7%。该模型核心特点是支持透明的多步推理，并能在 Le Chat 中以 10 倍于多数竞品的速度运行。Magistral 原生支持包括英语、法语、简体中文在内的多语言推理。开源版 Magistral Small 以 Apache 2.0 许可证发布。

开源生态推理模型发布

5月30日

09:32

公众号：小米 MiMo

Xiaomi MiMo-VL：通向Agent时代的推理基座，小米多模态大模型开源

小米开源多模态大模型Xiaomi MiMo-VL，该模型定位为Agent时代的推理基座，旨在为智能体时代提供基础推理能力。

智能体多模态模型发布

5月29日

20:11

DeepSeek@deepseek_ai

精选68

🚀 DeepSeek-R1-0528 现已发布！ 🔹 基准测试性能提升 🔹 前端能力增强 🔹 减少幻觉现象 🔹 支持 JSON 输出与函数调用 ✅ 立即试用：https://chat.deepseek.com/ 🔌 API 使用方式不变 - 文档在此：https://api-docs.deepseek.com/guides/reasoning_model 🔗 开源权重：https://huggingface.co/deepseek-ai/DeepSeek-R1-0528

DeepSeek 开源生态推理模型发布

关联讨论 1 条

推荐理由：DeepSeek-R1 的常规迭代，幻觉降低和 JSON 输出是实用改进，但距离代际跃迁还差得远。开源权重直接可用，做推理链产品的团队值得花半小时跑一下。

20:06

公众号：DeepSeek（深度求索）

DeepSeek-R1 更新，思考更深，推理更强

DeepSeek-R1 更新，思考更深，推理更强。开启“深度思考”功能即可体验新版 R1 更加强大的思考与推理能力。

DeepSeek 推理模型发布

5月28日

00:00

Mistral AI：News（网页）

Mistral AI 发布代码专用嵌入模型 Codestral Embed

Mistral AI 发布首个专为代码设计的嵌入模型 Codestral Embed。该模型在代码检索任务上性能显著超越当前领先的 Voyage Code 3、Cohere Embed v4.0 和 OpenAI 大型嵌入模型。它支持输出不同维度和精度的嵌入向量，即使在 256 维度 int8 精度下仍优于竞品。模型通过 API 以 codestral-embed-2505 名称提供，定价为每百万 token 0.15 美元，批量 API 享五折优惠。最大上下文长度为 8192 tokens，推荐使用 3000 字符（含 1000 字符重叠）分块以优化检索效果。

检索增强模型发布编码

5月21日

00:00

Mistral AI：News（网页）

Devstral 面向软件工程的智能体大语言模型发布

Mistral AI 与 All Hands AI 合作推出 Devstral，一款专注于解决真实世界 GitHub 问题的智能体大语言模型。该模型需在 OpenHands 或 SWE-Agent 等代码智能体框架中运行。在 SWE-Bench Verified 基准测试中，Devstral 获得 46.8% 的分数，超越此前的开源最先进模型超过 6 个百分点。在相同测试框架下，其表现优于 DeepSeek-V3-0324 和 Qwen3 232B-A22B，并且比闭源的 GPT-4.1-mini 高出超过 20%。Devstral 以 Apache 2.0 许可证开源，可在单张 RTX 4090 或配备 32GB 内存的 Mac 上本地部署，亦可通过 API 调用。

智能体开源生态模型发布编码

5月20日

17:45

Google DeepMind：Blog（RSS）

精选

以全新生成式媒体模型与工具激发创意

发布新一代生成式媒体模型 Veo 3 与 Imagen 4，以及专为电影制作打造的工具 Flow，支持更高质量的视频与图像生成及专业影视创作流程。

DeepMind 图像生成模型发布视频

推荐理由：Google发布Veo 3与Imagen 4生成模型及电影制作工具Flow

17:45

Google DeepMind：Blog（RSS）

精选

Gemma 3n 预览版发布：强大、高效、移动优先的 AI

Gemma 3n 预览版发布，专为移动设备优化的开源多模态模型。采用 2-in-1 架构，支持音频理解，适用于实时交互和音频中心应用开发。

DeepMind Google 多模态模型发布

关联讨论 1 条

推荐理由：Google 发布端侧多模态模型 Gemma 3n，支持音频理解，面向移动设备优化

5月7日

00:00

Mistral AI：News（网页）

Medium is the new large.

Mistral AI 发布 Mistral Medium 3 模型，主打顶尖性能与高性价比。该模型在各项基准测试中达到或超过 Claude Sonnet 3.7 表现的90%，但成本显著更低（API 定价为 $0.4 / 百万输入 token 和 $2 / 百万输出 token）。其性能超越 Llama 4 Maverick 等开源模型及 Cohere Command A 等企业模型，成本也优于 DeepSeek v3。该模型擅长编码和多模态理解等专业任务，并支持混合或本地部署、定制微调及集成企业系统，现已可通过多个平台调用。

开源生态模型发布

5月6日

23:06

Google DeepMind：Blog（RSS）

精选

Gemini 2.5 Pro Preview 提前发布：编程性能进一步提升

鉴于开发者反馈积极，Google 提前两周发布 Gemini 2.5 Pro Preview 更新版本，编程性能进一步提升，现已开放获取。

DeepMind Google 推理模型发布

推荐理由：Gemini 2.5 Pro 提前发布更新版本，编码性能显著提升，开发者可即刻体验

4月30日