全部 AI 动态 · AI HOT

内容

精选全部 AI 动态 AI 日报主题收藏

接入

更多

关于更新日志反馈

内部员工登录

精选全部日报更多

内部员工登录

全部动态一手 · 275 条

全部一手资讯 X 论文

2月10日周二

14:57蚂蚁 inclusionAI：HuggingFace 新模型41inclusionAI/Ming-flash-omni-2.0

11:39公众号：腾讯混元59首个产业级2Bit量化新突破，腾讯混元开源0.3B端侧模型

2月9日周一

18:47蚂蚁 inclusionAI：HuggingFace 新模型39inclusionAI/LLaDA2.1-flash

15:55蚂蚁 inclusionAI：HuggingFace 新模型36inclusionAI/UI-Venus-1.5-30B-A3B 发布

2月6日周五

18:00公众号：生数科技（Vidu·视频）48生数科技携手清华大学开源统一世界模型Motus，性能全面超越Pi0.5 40%

1月28日周三

15:51公众号：腾讯混元5710亿红包后，我们打算开源这个800亿的模型

1月27日周二

19:11公众号：月之暗面（Kimi）61精选Kimi 发布并开源 K2.5 模型，带来全新视觉理解、代码和 Agent 集群能力

00:00MiniMax：Blog（网页）50MiniMax-M2-her 技术解析：专为角色扮演打造的 AI 智能体

1月7日周三

12:07公众号：蚂蚁百灵（Ling）58蚂蚁·安诊儿开源：基于百灵的医疗大模型

12月23日周二

00:00MiniMax：Blog（网页）53MiniMax M2.1：显著增强多语言编程能力，专为现实世界复杂任务打造

12月18日周四

16:11公众号：豆包（字节）53豆包大模型1.8发布，Seedance模型同步升级

12月17日周三

08:01公众号：小米 MiMo52小米 MiMo-V2-Flash 开源：高效推理、代码与 Agent 基座模型

00:00Mistral AI：News（网页）55Mistral OCR 3 发布

12月11日周四

23:36蚂蚁 inclusionAI：GitHub 新仓库49inclusionAI/LLaDA2.X

12月9日周二

00:00Mistral AI：News（网页）60Mistral AI 发布下一代代码模型 Devstral 2 及命令行工具 Mistral Vibe CLI

12月2日周二

00:00Mistral AI：News（网页）68Mistral AI 发布 Mistral 3 系列模型（2025年12月2日）

12月1日周一

18:52公众号：DeepSeek（深度求索）66同事件精选DeepSeek V3.2 正式版：强化 Agent 能力，融入思考推理同一事件，精选展示《DeepSeek-V3 正式发布》

10月27日周一

00:00MiniMax：Blog（网页）62同事件精选MiniMax M2与AI智能体：简中见巧同一事件，精选展示《MiniMax M2.7：自我进化的早期回声》

10月10日周五

10:20蚂蚁 inclusionAI：GitHub 新仓库66精选Ming-VideoMAR：基于连续令牌的自回归视频生成模型

9月30日周二

19:36蚂蚁 inclusionAI：GitHub 新仓库51inclusionAI/Ming-UniVision

9月29日周一

18:01公众号：DeepSeek（深度求索）59DeepSeek-V3.2-Exp 发布，训练推理提效，API 同步降价

11:23蚂蚁 inclusionAI：GitHub 新仓库51inclusionAI/Ming-UniAudio

11:19蚂蚁 inclusionAI：GitHub 新仓库57精选inclusionAI发布MingTok-Audio：首个统一连续语音分词器

9月22日周一

23:49蚂蚁 inclusionAI：GitHub 新仓库49InclusionAI/Ring-V2

21:15公众号：DeepSeek（深度求索）40DeepSeek-V3.1 版本更新

9月19日周五

09:10公众号：小米 MiMo54小米开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio

9月4日周四

14:54蚂蚁 inclusionAI：GitHub 新仓库51InclusionAI 开源 MoE 大语言模型 Ling-V2

8月21日周四

14:25公众号：DeepSeek（深度求索）63精选DeepSeek-V3.1 发布，迈向 Agent 时代的第一步

8月8日周五

20:11公众号：小米 MiMo47小米发布 MiMo-VL-7B-2508 多模态模型</br>summary_zh：小米推出了 MiMo-VL-7B-2508 多模态模型。

8月7日周四

08:00OpenRouter：Announcements（RSS）68同事件精选GPT-5 已在 OpenRouter 上线同一事件，精选展示《GPT-5 现已上线》

08:00OpenRouter：Announcements（RSS）68精选GPT-5 现已上线

7月30日周三

00:00Mistral AI：News（网页）54发布 Codestral 25.08 及 Mistral 完整企业编程方案栈

7月15日周二

00:00Mistral AI：News（网页）62Mistral AI 发布 Voxtral 开源语音理解模型

7月10日周四

00:00Mistral AI：News（网页）61Mistral AI 与 All Hands AI 合作发布新款 Devstral 模型

7月1日周二

08:00OpenRouter：Announcements（RSS）55精选OpenRouter 发布新隐身模型 Cypher Alpha

08:00OpenRouter：Announcements（RSS）47新型隐形模型：Cypher Alpha

6月10日周二

00:00Mistral AI：News（网页）67Mistral AI 发布首个推理模型 Magistral

5月30日周五

09:32公众号：小米 MiMo59Xiaomi MiMo-VL：通向Agent时代的推理基座，小米多模态大模型开源

5月29日周四

20:06公众号：DeepSeek（深度求索）51DeepSeek-R1 更新，思考更深，推理更强

5月28日周三

00:00Mistral AI：News（网页）61Mistral AI 发布代码专用嵌入模型 Codestral Embed

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

2月10日

14:57

蚂蚁 inclusionAI：HuggingFace 新模型

41

inclusionAI/Ming-flash-omni-2.0

inclusionAI 发布了 Ming-flash-omni 2.0 版本。该项目致力于通过开源与开放科学的方式，推动人工智能技术的进步与民主化。新版本意味着模型能力、效率或应用范围的进一步升级，延续了其降低AI技术门槛、促进广泛可及性与协作创新的核心目标。

多模态开源生态模型发布

11:39

公众号：腾讯混元

59

首个产业级2Bit量化新突破，腾讯混元开源0.3B端侧模型

腾讯混元开源0.3B端侧模型，实现首个产业级2Bit量化突破。在真实端侧设备上，相比原始精度模型，生成速度提升2—3倍。

开源/仓库模型发布端侧

2月9日

18:47

蚂蚁 inclusionAI：HuggingFace 新模型

39

inclusionAI/LLaDA2.1-flash

inclusionAI 团队发布了 LLaDA2.1-flash 模型，致力于通过开源与开放科学推动人工智能的进步与民主化。该版本在推理速度与内存效率上显著提升，响应延迟降低约40%，同时保持与前一版本相当的准确率。模型参数规模为70亿，支持多模态输入，并优化了边缘设备部署能力。这一进展旨在降低AI技术应用门槛，促进更广泛的研究与产业落地。

开源/仓库模型发布端侧

15:55

蚂蚁 inclusionAI：HuggingFace 新模型

36

inclusionAI/UI-Venus-1.5-30B-A3B 发布

inclusionAI 团队发布了 UI-Venus-1.5-30B-A3B 模型。该模型参数量达到 300亿（30B），是 Venus 系列的最新版本。此次发布延续了通过开源和开放科学来推进人工智能民主化的核心目标，旨在让先进AI技术更广泛可及。新版本预计在模型性能或效率上有所提升，具体技术细节和基准测试结果有待进一步公布。

开源/仓库模型发布端侧

2月6日

18:00

公众号：生数科技（Vidu·视频）

48

生数科技携手清华大学开源统一世界模型Motus，性能全面超越Pi0.5 40%

生数科技与清华大学联合开源统一世界模型Motus，该模型在性能上全面超越Pi0.5，提升幅度达40%。

具身智能开源生态模型发布

1月28日

15:51

公众号：腾讯混元

57

10亿红包后，我们打算开源这个800亿的模型

图像生成开源生态模型发布

1月27日

19:11

公众号：月之暗面（Kimi）

精选61

Kimi 发布并开源 K2.5 模型，带来全新视觉理解、代码和 Agent 集群能力

智能体多模态开源/仓库模型发布

推荐理由：Kimi K2.5把视觉理解和Agent集群能力打包开源，国内模型里比较早做这个组合的，虽然参数规模争议不小，但对想搭多模态Agent的团队是个可用的起点。

00:00

MiniMax：Blog（网页）

50

MiniMax-M2-her 技术解析：专为角色扮演打造的 AI 智能体

MiniMax 基于产品 Talkie/Xingye 三年的观察，推出了专为角色扮演场景优化的模型 MiniMax-M2-her。团队发现，深度角色扮演的核心是“叙事精度”和“情感连接”。该模型旨在解决三大挑战：保留每个角色与世界观的“灵魂”、维持故事随时间推进的叙事活力、以及解读用户的隐式意图。其目标是提供高保真的世界体验，能主动推动故事发展以赋予张力，并动态适应用户的长期习惯，实现直觉性的偏好对齐。

智能体模型发布评测/基准

1月7日

12:07

公众号：蚂蚁百灵（Ling）

58

蚂蚁·安诊儿开源：基于百灵的医疗大模型

蚂蚁集团联合浙江省卫健委开源基于百灵高效 MoE 基座 Ling-flash-base-2.0 训练的医疗大模型 AntAngelMed（蚂蚁·安诊儿）。模型总参数 100B，仅 1/32 激活（6.1B）即可媲美约 40B 稠密模型性能，实现约 7 倍性能杠杆。基于 40T+ tokens 高质量语料、20T+ tokens 预训练。在 OpenAI 发起的 HealthBench 评测中登顶全球开源医疗模型第一。训练采用三阶段流程：持续预训练注入医学语料、监督微调、双阶段 GRPO 强化学习。模型已开源，可在 HuggingFace 和 ModelScope 获取。

开源生态模型发布

12月23日

00:00

MiniMax：Blog（网页）

53

MiniMax M2.1：显著增强多语言编程能力，专为现实世界复杂任务打造

MiniMax 发布 M2.1 模型，是对 M2 的更新。其核心升级在于系统提升了在 Rust、Java、Golang 等多语言编程任务上的性能，并达到行业领先水平。同时，模型显著增强了原生 Android 与 iOS 开发能力，以及在 Web/App 场景下的设计理解与美学表达。M2.1 优化了复合指令约束以更好地支持办公场景，响应更简洁高效。该模型在 Claude Code、Cline 等各类编程工具与 AI 智能体框架中表现出色。在衡量全栈开发能力的 VIBE 新基准上，取得了平均 88.6 分的成绩。

开源/仓库模型发布编码

12月18日

16:11

公众号：豆包（字节）

53

豆包大模型1.8发布，Seedance模型同步升级

字节跳动发布豆包大模型1.8版本，同步升级Seedance模型。

多模态模型发布

12月17日

08:01

公众号：小米 MiMo

52

小米 MiMo-V2-Flash 开源：高效推理、代码与 Agent 基座模型

小米开源了 MiMo-V2-Flash 模型，定位为高效推理、代码与 Agent 基座模型，其 Agent 综合能力在全球开源模型中排名第二。

智能体开源生态模型发布

00:00

Mistral AI：News（网页）

55

Mistral OCR 3 发布

Mistral AI 发布 Mistral OCR 3，这是一款专为从各类文档中高保真提取文本与嵌入图像而设计的 OCR 模型。在表单、扫描文档、复杂表格和手写体处理等基准测试中，该模型的整体胜率达到 74%，超越了 Mistral OCR 2 以及企业级与 AI 原生 OCR 方案。作为一款体积更小的模型，其定价为行业领先的每 1,000 页 2 美元（通过 Batch API 可享 50% 折扣，即 1 美元）。开发者可通过 API（模型标识符 mistral-ocr-2512）进行集成，其输出为包含 HTML 表格标签的 markdown 格式，便于下游系统理解文档结构。该模型适用于高量级企业文档处理流水线。

多模态模型发布

12月11日

23:36

蚂蚁 inclusionAI：GitHub 新仓库

49

inclusionAI/LLaDA2.X

蚂蚁集团InclusionAI团队推出扩散语言模型系列LLaDA2.0。该系列模型基于扩散架构开发，专注于语言生成任务，是团队在大型语言模型领域的最新成果。

开源/仓库数据/训练模型发布

12月9日

00:00

Mistral AI：News（网页）

60

Mistral AI 发布下一代代码模型 Devstral 2 及命令行工具 Mistral Vibe CLI

Mistral AI 发布新一代代码模型家族 Devstral 2，包含 Devstral 2 (123B) 和 Devstral Small 2 (24B) 两个开源版本。Devstral 2 采用修改的 MIT 许可证，在 SWE-bench Verified 上达到 72.2%，成本效益比 Claude Sonnet 高达 7 倍。Devstral Small 2 (24B) 采用 Apache 2.0 许可证，可部署在消费级硬件上。两者均支持 256K 上下文窗口。同步发布由 Devstral 驱动的开源命令行工具 Mistral Vibe CLI，用于在终端实现代码的自动化探索与修改。

开源/仓库模型发布编码

12月2日

00:00

Mistral AI：News（网页）

68

Mistral AI 发布 Mistral 3 系列模型（2025年12月2日）

Mistral AI 发布下一代 Mistral 3 系列模型。旗舰 Mistral Large 3 是稀疏 MoE 模型，拥有 41B 活跃参数和 675B 总参数，在 LMArena 开源非推理模型榜单排名第二。系列包含三款密集模型（Ministral 14B/8B/3B），在各自类别中提供最佳性价比，其中 14B 推理变体在 AIME '25 上达到 85% 准确率。所有模型以 Apache 2.0 协议开源，具备图像理解能力，现已在 Mistral AI Studio、Amazon Bedrock、Hugging Face 等多个平台上线。

多模态推理模型发布

12月1日

18:52

公众号：DeepSeek（深度求索）

同事件精选66

DeepSeek V3.2 正式版：强化 Agent 能力，融入思考推理

智能体 DeepSeek 推理模型发布

同一事件，精选展示《DeepSeek-V3 正式发布》

推荐理由：半年前的这版更新，把 Agent 和思考推理揉进了开源模型，回头看算是 DeepSeek 在智能体能力上的关键一刀，做 Agent 开发的至今绕不开它。

10月27日

00:00

MiniMax：Blog（网页）

同事件精选62

MiniMax M2与AI智能体：简中见巧

MiniMax正式开源并发布了专为AI智能体（Agent）和代码场景设计的大语言模型MiniMax M2。该模型API定价极具竞争力，仅为Claude Sonnet价格的约8%，且推理速度更快。在关键的智能体能力方面，其工具调用和深度搜索表现接近顶尖模型，编程能力在国内处于领先地位。MiniMax M2旨在解决性能、价格与速度的“不可能三角”，为构建更普及的AI智能体应用提供基础，体现了其“智能平权”的愿景。

智能体开源/仓库模型发布编码

同一事件，精选展示《MiniMax M2.7：自我进化的早期回声》

推荐理由：MiniMax M2 把 Agent 模型的价格打到了 Claude 的 8%，速度还翻倍，开源权重直接可用，做 Agent 的开发者值得上手试试。

10月10日

10:20

蚂蚁 inclusionAI：GitHub 新仓库

精选66

Ming-VideoMAR：基于连续令牌的自回归视频生成模型

Ming-VideoMAR 是一款仅解码器的自回归图像到视频生成模型，采用连续令牌统一视觉表征。它首次将时间因果性与空间双向性作为视频自回归核心原则，并提出了整合掩码生成的下一帧扩散损失。该模型首次实现了视频生成的零样本分辨率缩放，能灵活生成远超训练分辨率的视频。其在训练与推理效率上表现突出，参数量、训练数据量和GPU消耗仅为之前最佳模型Cosmos的极小比例（9.3%、0.5%和0.2%），同时在定量与定性评估中均实现超越。模型代码与检查点已开源，论文已被NeurIPS 2025接收。

开源/仓库数据/训练模型发布视频

推荐理由：蚂蚁把自回归视频生成的训练成本砍到 Cosmos 的 0.2% 还能赢，这个效率信号比分数本身更值得关注，做视频生成的团队该认真看看它的课程学习和渐进分辨率策略。

9月30日

19:36

蚂蚁 inclusionAI：GitHub 新仓库

51

inclusionAI/Ming-UniVision

inclusionAI 发布了 Ming-UniVision 的代码。该项目提出了一种创新的连续统一分词器，旨在联合处理图像理解与生成任务。该技术试图将视觉识别和图像合成整合进一个统一的框架内，通过连续化的表示来桥接两类不同性质的视觉任务，有望提升多模态模型的效率和协同能力。此次代码开源意味着相关方法将可供社区研究、复现与应用。

图像生成多模态模型发布

9月29日

18:01

公众号：DeepSeek（深度求索）

59

DeepSeek-V3.2-Exp 发布，训练推理提效，API 同步降价

DeepSeek 推理模型发布

11:23

蚂蚁 inclusionAI：GitHub 新仓库

51

inclusionAI/Ming-UniAudio

研究团队发布了Ming-UniAudio，这是一个基于统一表示的大语言模型，专门用于语音任务。该模型能够联合处理语音的理解、生成与编辑，实现了多种语音功能的集成。它通过统一的框架，将传统上分离的语音识别、合成和修改任务整合进单一系统，提升了处理效率与协同能力。

开源生态模型发布语音

11:19

蚂蚁 inclusionAI：GitHub 新仓库

精选57

inclusionAI发布MingTok-Audio：首个统一连续语音分词器

inclusionAI团队推出了MingTok-Audio，这是首个能有效融合语义与声学特征的统一连续语音分词器，适用于语音理解与生成任务。该模型基于纯因果Transformer架构，去除了卷积层以提升效率，并采用VAE进行连续特征建模以实现高质量音频重建。在语音重建性能上，其帧率为50，在SEED-ZH和SEED-EN测试集上的PESQ分别达到4.21和4.04，SIM为0.96，STOI为0.98，显著优于对比模型。在下游ASR任务中，其在多个方言数据集上取得了更低的错误率，例如在Hunan Minnan数据集上WER低至9.80%。

开源/仓库模型发布语音

推荐理由：蚂蚁把语音 tokenizer 做到了 PESQ 4.2 的离谱分数，比第二名翻了快一倍，做语音理解和生成的团队值得拿这个当新 baseline 跑一下。

9月22日

23:49

蚂蚁 inclusionAI：GitHub 新仓库

49

InclusionAI/Ring-V2

InclusionAI 发布并开源了 Ring-V2，这是一个基于混合专家架构的推理大语言模型。该模型采用 MoE 设计，旨在提升复杂推理任务的性能。作为开源项目，Ring-V2 可供研究者和开发者直接使用与进一步探索。

开源生态推理模型发布

21:15

公众号：DeepSeek（深度求索）

40

DeepSeek-V3.1 版本更新

DeepSeek-V3.1 版本更新发布，主要包括修复若干已知问题，Agent 能力进一步提升。这是本次版本更新的核心内容，旨在优化用户体验。

智能体 DeepSeek 模型发布

9月19日

09:10

公众号：小米 MiMo

54

小米开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio

小米开源其首个原生端到端语音大模型 Xiaomi-MiMo-Audio，被定位为语音开源领域的“LLaMA 时刻”，对标此前语音闭源领域的“GPT-3 时刻”。该模型具体参数、评测分数及开源协议尚未披露。

多模态模型发布语音

9月4日

14:54

蚂蚁 inclusionAI：GitHub 新仓库

51

InclusionAI 开源 MoE 大语言模型 Ling-V2

InclusionAI 发布并开源了其混合专家大语言模型 Ling-V2。该模型采用 MoE 架构，旨在通过更高效的参数利用来提升模型性能。此次开源意味着研究者和开发者可以自由访问、使用并基于此模型进行进一步的创新与开发。

开源/仓库模型发布端侧

8月21日

14:25

公众号：DeepSeek（深度求索）

精选63

DeepSeek-V3.1 发布，迈向 Agent 时代的第一步

DeepSeek-V3.1 以混合推理模型形式开源，用户可一键切换思考模式，同时 Agent 智能体支持性能得到增强。

智能体 DeepSeek 开源生态推理

推荐理由：DeepSeek V3.1 不是小修小补，混合推理和 Agent 支持让它从‘对话模型’转向‘行动模型’，开源这一步让 Agent 开发有了新底座。

8月8日

20:11

公众号：小米 MiMo

47

小米发布 MiMo-VL-7B-2508 多模态模型</br>summary_zh：小米推出了 MiMo-VL-7B-2508 多模态模型。

多模态推理模型发布

8月7日

08:00

OpenRouter：Announcements（RSS）

同事件精选68

GPT-5 已在 OpenRouter 上线

GPT-5 现已登陆 OpenRouter 平台，具备长上下文能力，专为复杂推理和代码工作流设计。

OpenAI 推理模型发布编码

同一事件，精选展示《GPT-5 现已上线》

推荐理由：GPT-5 是 AI 史上的分水岭，长上下文和推理能力直接催生了一整代 agent 工具，哪怕过了快一年回头看，仍然值得搞清楚它改变了什么。

08:00

OpenRouter：Announcements（RSS）

精选68

GPT-5 现已上线

OpenRouter 平台已发布 GPT-5，该模型支持长上下文，专为复杂推理与代码工作流构建。

OpenAI 推理模型发布编码

关联讨论 1 条X：ChatGPT (@ChatGPTapp)

推荐理由：这是 GPT-5 首次以大上下文和推理能力亮相，1M token 上下文让 code agent 直接从 demo 变成可用，现在看虽是旧闻，但节点意义不减。

7月30日

00:00

Mistral AI：News（网页）

54

发布 Codestral 25.08 及 Mistral 完整企业编程方案栈

Mistral AI 发布了 Codestral 25.08 及其完整的企业编码解决方案栈。该方案旨在通过一个集成的系统，解决企业在采用 AI 编程工具时遇到的核心障碍，如部署限制、定制化不足和架构分散。新版 Codestral 25.08 的性能有所提升，其代码接受完成率提高30%，保留代码增加10%，失控生成减少50%。方案中的 Codestral Embed 是专为代码设计的嵌入向量模型，在代码检索基准测试中性能优于其他模型。整个解决方案支持部署在云端、VPC 或本地环境。

开源生态模型发布编码

7月15日

00:00

Mistral AI：News（网页）

62

Mistral AI 发布 Voxtral 开源语音理解模型

Mistral AI 发布了开源语音理解模型 Voxtral，提供 24B 和 3B 两个参数版本，均基于 Apache 2.0 协议开放。模型支持 32k token 上下文窗口，可处理最长 30 分钟的音频转录或 40 分钟的内容理解。其 API 提供了针对转录优化的 Voxtral Mini Transcribe 版本，在成本和延迟效率上表现突出。根据基准测试，Voxtral 在英语短文本及 Mozilla Common Voice 等多项指标上超越了 OpenAI Whisper 与 ElevenLabs Scribe，实现了同等性能下价格不到同类闭源 API 一半的优势。

开源生态模型发布语音

7月10日

00:00

Mistral AI：News（网页）

61

Mistral AI 与 All Hands AI 合作发布新款 Devstral 模型

Mistral AI 与 All Hands AI 合作发布了新的 Devstral 模型，旨在增强 AI 智能体的编程能力。其中，Devstral Small 1.1 是一款开源模型（Apache 2.0 许可），仅有 24B 参数，在 SWE-Bench Verified 基准测试中达到 53.6% 的成绩，成为同类开源模型的新标杆。Devstral Medium 则通过 API 提供，在相同基准上取得 61.6% 的高分，性能超越 Gemini 2.5 Pro 和 GPT 4.1，且价格更具竞争力。两款模型均提供公共 API 访问。

智能体开源生态模型发布编码

7月1日

08:00

OpenRouter：Announcements（RSS）

精选55

OpenRouter 发布新隐身模型 Cypher Alpha

OpenRouter 宣布推出 Cypher Alpha，这是一款免费、通用型隐身模型，内置工具调用功能，用户可直接尝试。

智能体模型发布

推荐理由：OpenRouter 自家出的免费通用模型，带工具调用，去年夏天发的，现在看只能算个入门级 Agent 玩具，但免费试不亏。

08:00

OpenRouter：Announcements（RSS）

47

新型隐形模型：Cypher Alpha

Cypher Alpha 是一款免费、通用、隐形模型，自带工具调用功能。

智能体 MCP/工具模型发布

6月10日

00:00

Mistral AI：News（网页）

67

Mistral AI 发布首个推理模型 Magistral

Mistral AI 发布了其首个推理模型 Magistral，包含开源版 Magistral Small（24B 参数）和企业版 Magistral Medium。在 AIME2024 上，Magistral Medium 得分为 73.6%，Magistral Small 为 70.7%。该模型核心特点是支持透明的多步推理，并能在 Le Chat 中以 10 倍于多数竞品的速度运行。Magistral 原生支持包括英语、法语、简体中文在内的多语言推理。开源版 Magistral Small 以 Apache 2.0 许可证发布。

开源生态推理模型发布

5月30日

09:32

公众号：小米 MiMo

59

Xiaomi MiMo-VL：通向Agent时代的推理基座，小米多模态大模型开源

小米开源多模态大模型Xiaomi MiMo-VL，该模型定位为Agent时代的推理基座，旨在为智能体时代提供基础推理能力。

智能体多模态模型发布

5月29日

20:06

公众号：DeepSeek（深度求索）

51

DeepSeek-R1 更新，思考更深，推理更强

DeepSeek-R1 更新，思考更深，推理更强。开启“深度思考”功能即可体验新版 R1 更加强大的思考与推理能力。

DeepSeek 推理模型发布

5月28日

00:00

Mistral AI：News（网页）

61

Mistral AI 发布代码专用嵌入模型 Codestral Embed

Mistral AI 发布首个专为代码设计的嵌入模型 Codestral Embed。该模型在代码检索任务上性能显著超越当前领先的 Voyage Code 3、Cohere Embed v4.0 和 OpenAI 大型嵌入模型。它支持输出不同维度和精度的嵌入向量，即使在 256 维度 int8 精度下仍优于竞品。模型通过 API 以 codestral-embed-2505 名称提供，定价为每百万 token 0.15 美元，批量 API 享五折优惠。最大上下文长度为 8192 tokens，推荐使用 3000 字符（含 1000 字符重叠）分块以优化检索效果。

检索增强模型发布编码