4月29日

23:40

TestingCatalog News 🗞@testingcatalog

MISTRAL 🚨： Mistral AI 发布了 Mistral Medium 3.5，这是一个拥有 256k 上下文窗口和可配置推理算力的 128B 密集开放权重模型。 Mistral Medium 3.5 现已在 Mistral Vibe 和 Le Chat 上可用。

Mistral Vibe: Introducing remote agents in Vibe and Mistral Medium 3.5. You can now launch remote agents in the cloud, including from ...

开源生态推理模型发布

23:10

Artificial Analysis@ArtificialAnlys

IBM发布三款高效非推理模型Granite 4.1，采用Apache 2.0开源许可

IBM发布了三款采用Apache 2.0许可的Granite 4.1开源模型（30B、8B、3B）。其核心特点是极高的令牌效率，例如8B模型运行智能指数仅需4M输出令牌，远低于同类模型。在开放性指数上，三款模型均获得61分，领先多数同行。但高效率也带来了智能指数的相对折衷，其得分低于Qwen3.5、Gemma 4等竞品。不过，与上一代Granite 4.0系列相比，新模型的智能表现仍有提升。该系列模型拥有128K令牌的上下文窗口，主要面向企业和边缘部署，可通过WandB、Replicate和Hugging Face获取。

Hugging Face 开源生态模型发布

22:42

Ant Ling@AntLingAGI

此前在OpenRouter上备受喜爱的快速模型"elephant-alpha"现已永久保留并正式开源，命名为Ling-2.6-flash。该模型由novita_labs驱动，旨在提供稳健且高性价比的性能。它专为现实世界智能体工作流打造，拥有1040亿总参数和74亿活跃参数，并提供多种精度版本以适应不同部署需求。其核心优势包括高达每秒215个令牌的生成速度、仅需1500万令牌即可完成完整智能评估的高效令牌利用率，以及在编码、文档处理和轻量级智能体任务中的强大执行能力。同时，模型在中文切换和主流编码框架兼容性方面体验更佳。为庆祝发布，现提供20%的折扣。

Ant Ling: Ling-2.6-flash is now officially open-sourced! A fast, token-efficient Instruct model built for real-world agent workflo...

智能体开源生态模型发布

22:37

歸藏(guizang.ai)@op7418

Deepseek 的多模态模型全量了。目前可以在网页版的识图模式尝试，看起来是一个单独的多模态模型

DeepSeek 多模态模型发布

22:17

Tencent Hy@TencentHunyuan

精选67

腾讯开源Hy-MT1.5-1.8B-1.25bit翻译模型，440MB体积支持手机离线运行

腾讯开源了Hy-MT1.5-1.8B-1.25bit翻译模型，其参数量为18亿，经量化后仅440MB，可在手机上完全离线运行。该模型支持33种语言、5种方言及1056个翻译方向，包括藏语、蒙古语等少数语言。在标准测试中，其性能媲美商业翻译API和2350亿参数的大模型。通过量化至1.25比特，模型内存占用从FP16格式的3.3GB大幅降低，比之前的1.67比特方法体积缩小25%、速度提升约10%，且无精度损失。该模型已在国际机器翻译竞赛中获得30项第一，并部署于腾讯多个产品中。

Hugging Face 开源生态模型发布端侧

推荐理由：440MB的模型能在手机上跑33种语言翻译，还宣称比谷歌翻译强，这个量化技术让离线翻译不再是‘能看不能用’，出差党可以试试看。

22:10

TestingCatalog News 🗞@testingcatalog

SenseTime开源了基于NEO-Unify架构的多模态图像生成模型SenseNova-U1。该架构完全摒弃了传统视觉编码器和VAE，原生地将理解、推理和生成统一为一个系统。该系列模型（8B和A3B参数）在开源模型中效率领先，以紧凑尺寸提供商业级性能与出色成本效益。其特色功能包括原生生成图文交织内容，适用于制作指南等实用场景；并擅长高密度信息渲染，能生成知识插图、海报、PPT和漫画等丰富结构的布局。模型已在Hugging Face和GitHub等平台开源。

SenseTime: SenseNova U1 Lite Series is now open source! Built on the NEO-unify architecture, it natively unifies multimodal underst...

图像生成多模态开源生态模型发布

21:49

Xiaomi MiMo@XiaomiMiMo

精选60

小米MiMo-V2.5-Pro在最新Arena排行榜中实现多项突破

小米MiMo-V2.5-Pro模型在最新Arena排行榜中表现卓越。在Text Arena（Expert）榜单中，它位列全球第六，同时是开源模型与中文模型的双料第一，其所属实验室全球排名第三。该模型在Text Arena（Overall）总榜中排名开源全球第二，在Code Arena（WebDev）前端开发榜单中位列开源全球第三。此外，它在Text Arena的四个关键子类别（Hard Prompts、英文Hard Prompts、指令遵循与长查询）中均获得开源全球第一。这些成绩均基于真实用户偏好与社区盲投评估，体现了模型在复杂任务上的强大综合能力。

开源生态推理模型发布

推荐理由：小米MiMo-V2.5-Pro冲到Arena开源第一，虽然排名更新晚了几天，但这是国产模型在硬核评测里最好的成绩，做选型的现在该认真看看小米。

17:16

SenseTime@SenseTime_AI

感谢 @liuziwei7 与我们共同创造 #多模态智能的未来！

Ziwei Liu: 🔥Native Unified Multimodal Model Open Sourced🔥 🚀SenseNova U1🚀 is the first native multimodal model that unifies mult...

Hugging Face 多模态开源生态模型发布

17:11

小互@xiaohu

Deepseek 内测多模态能力现在可以识别图像对于Agent执行能力提升有很大帮助… 【引用 @PKUCXK】：Now， we see you. 👀

Xiaokang Chen: Now, we see you. 👀

智能体 DeepSeek 多模态模型发布

17:08

Chubby♨️@kimmonismus

Xiami mimo-v2.5 pro MIT许可证在竞技场上超越了Opus 4.5 了不起的成就。

开源/仓库模型发布评测/基准

17:08

Chubby♨️@kimmonismus

GPT-5.5 pro 在 Epoch 基准测试中实现了显著飞跃。然而更令人兴奋的是，GPT-5.5（非 pro 版）超越了 GPT-5.4 pro。【引用 @EpochAIResearch】：GPT-5.5 Pro 在 Epoch 能力指数上创下 159 分的新高分！ECI 是我们的统计工具，它将多个基准测试整合到一个统一的量表中。

Epoch AI: GPT-5.5 Pro achieves a new high score of 159 on the Epoch Capabilities Index! ECI is our statistical tool that combines ...

OpenAI 推理模型发布评测/基准

16:46

SenseTime@SenseTime_AI

精选65

是的，SenseNova U1 现已在 Hugging Face 和 GitHub 上发布！探索它如何以语义精确性和像素级保真度实现复杂的 #信息图创作。 Hugging Face： https://huggingface.co/collections/sensenova/sensenova-u1 GitHub： https://github.com/OpenSenseNova/SenseNova-U1 Discord： https://discord.gg/cxkwXWjp

AK: SenseNova U1 is out on Hugging Face https://huggingface.co/collections/sensenova/sensenova-u1

Hugging Face 图像生成多模态模型发布

推荐理由：SenseNova U1 开源了，能生成像素级精准的信息图，对于做电商和可视化的人是个直接可用的工具，值得跑一下看看实际表现。

14:49

Alibaba Cloud@alibaba_cloud

精选64

HappyHorse 1.0 现已在 @fal 上线。去构建吧。【引用 @fal】：Happy Horse 1.0 is live on fal， day 0 🐎 🎬 一流的运动质量 🎧 原生1080p，音频同步一步完成 🔗 音视频联合生成，非拼接 🔓 限制更少，商业用途更广 ⚡ 为生产规模而构建

fal: Happy Horse 1.0 is live on fal, day 0 🐎 🎬 Best-in-class motion quality 🎧 Native 1080p with synced audio in one pass �...

多模态模型发布视频

推荐理由：阿里云不声不响丢了个跟 Sora 对标的视频生成模型，音画同步一镜出片，直播带货团队可以立刻试试。

14:40

Ant Ling@AntLingAGI

服务好LLM是一项具有挑战性的任务，它需要工程智慧和良好的品味。感谢@Modular团队高水平的工程师们让这次合作成为现实。生态系统必胜！🤠👏

Modular: Ling-2.6-flash from @AntLingAGI is now open source, with day zero support on Modular Cloud! Fast MoE for agent workflows...

智能体开源生态模型发布

10:37

Chubby♨️@kimmonismus

Mistral Medium 即将到来。唯一相关的欧洲AI公司将发布另一个模型。

开源生态模型发布

09:38

ginobefun@hongming731

NVIDIA发布多模态模型Nemotron 3 Nano Omni

NVIDIA发布了多模态模型Nemotron 3 Nano Omni，专为处理长上下文设计，能够同时理解文本、图像、音频和视频。该模型在文档分析、自动语音识别、音视频理解以及智能体计算机使用等实际应用场景中表现优异。在多项基准测试中，Nemotron 3 Nano Omni均展现出领先的准确性和效率。

多模态模型发布端侧

08:38

Berryxia.AI@berryxia

OpenBMB发布的MiniCPM-o 4.5是一个仅90亿参数的多模态模型，实现了从传统轮询交互到实时、原生全双工流式交互的范式突破。其Omni-Flow框架能在统一时间线上毫秒级同步处理视频、音频和文本流，无需外部语音检测即可同时感知与响应。该模型在多模态基准测试中表现接近Gemini 2.5 Flash，并专为边缘AI设计，支持完全离线运行，提供Windows/macOS一键安装（仅需12G显存），保障100%数据隐私，同时开源权重并提供免费社区API。

OpenBMB: 🚀 🚀Excited to announce the technical report of MiniCPM-o 4.5! MiniCPM-o 4.5 transitions #AI interaction from tradition...

GitHub 多模态开源生态模型发布

07:38

Berryxia.AI@berryxia

由前GitHub CTO Jason Warner创立的Poolside AI团队开源了其首个权重模型Laguna XS.2。该模型采用33B总参数、3B激活参数的MoE架构，专为Agentic Coding和长时序任务设计，可在单张GPU上运行，并采用Apache 2.0开源协议。团队同时发布了当前最强版模型Laguna M.1以及Agent Harness，标志着其在智能编码代理赛道成为新的竞争者。

poolside: Today we're releasing Laguna XS.2, Poolside's first open-weight model. It's a 33B total / 3B active MoE model built for ...

智能体开源生态模型发布编码

07:38

Berryxia.AI@berryxia

NVIDIA发布高效开源多模态模型Nemotron 3 Nano Omni

NVIDIA 重磅发布！🚀 Nemotron 3 Nano Omni 多模态开源模型来了！ 🔥 30B 参数 🔥 256K 超长上下文 🔥 最高效开放多模态模型（语言+视觉+语音+视频+音频一体化） 🔥 专为 subagents / Agentic 任务设计 🔥 完全开源（权重 + 数据 + 配方），领跑多项榜单可通过 NVIDIA NIM API 免费试用！完美驱动多代理工作流。

NVIDIA AI: Meet Nemotron 3 Nano Omni 👋 Our latest addition to the Nemotron family is the highest efficiency, open multimodal model...

智能体多模态开源生态模型发布

02:09

Epoch AI@EpochAIResearch

GPT-5.5 Pro 在 Epoch Capabilities Index 上创下 159 分的新高分！ECI 是我们的统计工具，它将多个基准测试整合到一个统一的量表中。

OpenAI 模型发布评测/基准

02:07

Chubby♨️@kimmonismus

NVIDIA发布Nemotron 3 Nano Omni，专为智能体感知层设计

NVIDIA推出Nemotron 3 Nano Omni模型，其定位并非通用聊天机器人，而是作为智能体系统中的轻量级感知模块。该模型采用30B-3B混合专家架构，在处理视觉、音频和文本多模态输入时，吞吐量可比同类开源全模态模型提升高达9倍。它旨在充当多智能体栈中的“眼睛和耳朵”，负责感知屏幕、文档和音频等信息，并将结构化上下文传递给如Nemotron Super（执行）和Ultra（规划）等推理层，从而优化大规模、高频率调用的智能体工作流。模型完全开源，现已登陆Hugging Face。

智能体开源生态模型发布

01:38

Ant Ling@AntLingAGI

推文感谢Hugging Face为开源模型的持续发展提供了重要平台。文中强调，token效率是构建实用、可持续协作系统的关键。AntLingAGI最新发布的Ling-2.6-flash模型已加入这场效率竞争，该模型采用MIT许可，具备104B/7.4B激活参数，并创新性地结合了1：7 MLA与Lightning Linear混合注意力机制。其性能表现突出：推理速度高达340 tok/s，并且仅需约1500万tokens即可完成完整的Artificial Analysis评测套件。这一效率显著高于通常需要5000万至1亿tokens的前沿模型，展现出其作为高效协作伙伴的潜力。

Adina Yakup: Token efficiency has become a major battleground, Ling-2.6-flash released by @AntLingAGI just enters the race 🔥 ✨ 104B/...

开源生态推理模型发布

01:35

阿绎 AYi@AYi_AInotes

蚂蚁发布Ling-2.6-1T模型，以token效率革新生产级AI

蚂蚁集团AGI团队发布Ling-2.6-1T模型，其核心创新在于聚焦token效率而非参数规模。该模型采用MoE架构，每次推理仅激活7.4B参数，结合Linear Attention与Multi-Token Prediction技术，在保持接近GPT-5.4非推理水平的高智能同时，将token成本降至可比模型的四分之一。在Artificial Analysis评测中以极低消耗获得高分，并在SWE-bench等硬核Agent场景领先。该模型专为处理海量真实生产请求设计，旨在为高频Agent应用提供高效、低成本的解决方案，并通过免费API策略加速生态布局，预示AI竞赛重心正向真实生产成本效率转移。

阿绎 AYi: 后续来了兄弟们,卧槽真的太炸了,同样的任务,同样的配置,速度比Claude Sonnet 4.6还快 6 倍,成本低约 50 倍, openrouter 和官方 API 均限时免费 1 周使用时间,白嫖的机会,冲啊兄弟们! 我上周那条讲E...

智能体模型发布部署/工程

01:08

AK@_akhaliq

SenseNova U1 已在 Hugging Face 发布 https://huggingface.co/collections/sensenova/sensenova-u1

Hugging Face 开源生态模型发布

01:03

Ant Ling@AntLingAGI

AntLingAGI宣布将其模型Ling-2.6-flash正式开源，该模型此前在OpenRouter平台上曾以"Elephant Alpha"为名提供API服务。目前，模型已在Hugging Face和ModelScope平台全面开放，供公众自由使用与构建。模型关键参数为总参数量1040亿，激活参数量74亿，在Artificial Analysis基准测试中输出速度约为每秒215个token，并支持BF16、FP8和INT4多种精度格式。此次开源得到了合作伙伴Novita Labs，以及lmsysorg的SGLang团队和vllm项目的技术支持。

Novita AI: Ling-2.6-flash is now officially open-sourced 🚀 (from @AntLingAGI) Was "Elephant Alpha" on OpenRouter. Now fully open f...

开源/仓库模型发布端侧

00:53

Ant Ling@AntLingAGI

vLLM项目团队宣布对Ling-2.6-flash模型提供Day-0首发支持，体现了开源生态系统构建者之间的高效协同。Ling-2.6-flash是一个专为需要快速响应和强大执行力的现实世界智能体设计的即时指令MoE模型。其核心特点包括：1040亿总参数与74亿激活参数的高度稀疏混合专家架构，结合了1：7 MLA与Lightning Linear注意力机制，支持262K上下文长度，并具备原生工具调用能力，可无缝接入Claude Code、Kilo Code、Qwen Code、Hermes、OpenClaw等主流框架。

vLLM: 🎉 Day-0 vLLM support for Ling-2.6-flash from @AntLingAGI! Ling-2.6-flash is an instant (instruct) MoE model built for r...

智能体开源生态模型发布

4月28日

23:51

Ant Ling@AntLingAGI

精选62

AntLingAGI与SGLang团队合作，正式推出Ling-2.6-flash（亦称Elephant-alpha）即时指令模型，并在SGLang平台上实现了首发支持。该模型总参数量达104B，但活跃参数仅7.4B，专为低延迟的智能体工作流优化，能够实现即时响应。它在编码、文档处理和智能体任务中展现出极高的token效率，所用token数量显著减少。尽管活跃参数较少，其模型质量仍与当前SOTA水平相当，兼具速度与执行力，适合需要快速响应的生产级智能体应用。团队强调，快速且稳定的推理是提升用户体验的关键。

LMSYS Org: 🎉 Meet Ling-2.6-flash from @AntLingAGI, an instant instruct model with 104B total params (7.4B active). Day-0 support i...

智能体模型发布部署/工程

推荐理由：104B 总参但只激活 7.4B，蚂蚁这步棋是冲着 Agent 场景的低延迟去的，做 Agent 产品的人值得跑一下看看实际体感。

23:19

Ant Ling@AntLingAGI

灵码2.6-flash模型正式开源，专为高效智能体工作流打造

灵码2.6-flash模型现已开源，这是一个专为现实世界智能体工作流构建的快速、高效的指令模型。该模型总参数量达1040亿，激活参数量为74亿，并提供BF16、FP8和INT4多种量化版本以适应不同部署需求。其核心优势包括：生成速度高达每秒215个token，在完整评估中仅消耗1500万token，效率突出；在代码、文档处理和轻量级智能体工作流等实际任务中表现强劲；同时，其中英文切换能力及与主流编程框架的兼容性也得到了进一步改善。

智能体开源/仓库模型发布编码

23:15

OpenRouter@OpenRouter

精选64

@poolsideai 的首批公开基础模型刚刚在 OpenRouter 上发布！ Laguna M.1 和 Laguna XS.2。专为智能体编码和长周期工作从头构建。限时免费 ⬇️

智能体模型发布编码

推荐理由：Poolside 终于把自家模型放出来了，主打长上下文 agentic coding，免费期是薅羊毛窗口。做 coding agent 的团队值得拿 Laguna 跑一轮自己的 benchmark，看看和 Claude、Codex 的真实差距。

20:36

Chubby♨️@kimmonismus

Microsoft 推出 "TRELLIS.2"：一个开源的、40亿参数的图像转3D模型，可生成高达15363的PBR纹理资产。基于原生3D VAES，具有16倍空间压缩能力，提供高效、可扩展、高保真的资产生成。说实话，相当酷！

Microsoft 多模态开源生态模型发布

20:25

SenseTime@SenseTime_AI

SenseNova U1 Lite系列开源，统一多模态理解与生成

SenseNova宣布开源其U1 Lite系列模型。该系列基于NEO-unify架构，原生统一了多模态理解与生成能力。其核心优势包括：在开源模型中具备领先的效率，紧凑的8B和A3B模型在保持商业级性能的同时实现了优异的成本效益；支持原生的图像-文本交织生成，单一模型即可在单次流程中生成连贯交织的图文内容，适用于制作指南等实用场景；并拥有高密度信息渲染能力，擅长为知识图解、海报、PPT、漫画等信息密集型格式生成结构丰富的版式。模型已在Hugging Face、GitHub等平台发布。

图像生成多模态开源/仓库模型发布

18:36

Berryxia.AI@berryxia

商汤开源多模态大模型SenseNova-U1，推动本地化部署

商汤发布开源可商用的多模态大模型SenseNova-U1，采用NEO-Unify架构统一处理视觉与语言。其核心功能包括图文交错生成、智能图像编辑与图表渲染。模型提供8B密集版和约3B活性参数的轻量版，适合个人显卡本地部署。现提供每日5小时及1500次免费调用额度，并即将推出办公场景应用功能。

图像生成多模态开源生态模型发布

13:33

Alibaba Cloud@alibaba_cloud

Qwen3.6全系列模型已在NetMind平台上线，专为不同生产场景的智能体应用设计。该系列包含三个模型：Qwen3.6-Plus专注于前沿推理和长上下文，适用于复杂编码任务；Qwen3.6-Flash强调速度、规模和成本效益，适合大规模实时编码辅助；Qwen3.6-35B-A3B提供开源权重和Apache 2.0许可，支持自主托管和微调。所有模型共享高效的混合架构，具备函数调用和推理能力，并运行在NetMind的低延迟基础设施上，提供统一的OpenAI兼容端点。平台还提供即用代码，便于开发者快速集成和使用。

NetMind.AI: We're thrilled to announce that the full Qwen3.6 family, built for real-world agents at every scale with benchmark-toppi...

智能体模型发布编码

10:45

歸藏(guizang.ai)@op7418

作者表示将尝试为Codepilot用户争取免费的Token补贴。这一考虑基于小米MiMo -V2.5系列模型的开源动态，该模型采用MIT协议，允许自由商用、二次训练与微调。同时，小米推出了Orbit 100T Token计划，包含面向AI builder的"百万亿Token创造者激励计划"和面向Agent框架团队的"Agent生态共建计划"。激励计划为通过申请的用户提供Token支持，如最高16亿Credits。作者意图借鉴此机制为Codepilot社区谋取福利。

歸藏(guizang.ai): 小米 MiMo -V2.5 系列模型全部开源采用宽松的 MIT 协议,允许自由商用、二次训练与微调,无需额外授权。同时他们还推出了Orbit 100T Token 计划。这个太牛批了!如果你有自己 Vibe Coding 一些东西可以...

开源/仓库模型发布

10:42

歸藏(guizang.ai)@op7418

精选74

小米 MiMo-V2.5 系列模型全部开源

小米正式开源MiMo-V2.5系列模型，采用宽松的MIT协议，允许自由商用、二次训练与微调。该系列包含两个支持100万token上下文窗口的模型：专为复杂Agent和编码任务设计、在多项评测领先的MiMo-V2.5-Pro，以及具备强大Agent能力的原生全模态模型MiMo-V2.5。同时，小米推出Orbit 100T Token计划，包含面向AI开发者的“百万亿Token创造者激励计划”，提供最高价值659元的Credits，以及面向Agent框架团队的“Agent生态共建计划”，为其用户提供MiMo token限免支持。

Xiaomi MiMo: Xiaomi MiMo-V2.5 is now officially open-sourced! MIT License, supporting commercial deployment, continued training, and ...

智能体开源/仓库模型发布端侧

推荐理由：小米把 MiMo-V2.5 全线 MIT 开源，Pro 版在 agent 和编码榜单冲到开源第一，百万亿 Token 激励计划更是直接送钱让你用，做 Vibe Coding 的人没理由不去薅一把。

09:45

meng shao@shao__meng

精选75

小米开源MiMo-V2.5系列大模型

小米正式开源MiMo-V2.5系列模型，包含专注于代码代理的1T参数MoE模型MiMo-V2.5-Pro，以及支持多模态代理的310B参数MoE模型MiMo-V2.5，两者均支持1M上下文长度。其架构核心采用混合注意力、多Token预测和稀疏MoE技术，以支撑万亿参数规模下的高效长文处理。后训练基于MOPD范式，通过多教师策略蒸馏提升模型综合能力。同时，小米推出100T Token的创造者激励计划，为开发者提供免费计算资源以鼓励创新。模型已在Hugging Face平台开源。

Fuli Luo: Just dropped two open-source models: MiMo-V2.5-Pro (Code Agent, 1T total) and MiMo-V2.5 (Multimodal Agent, 310B total). ...

智能体开源/仓库模型发布端侧

推荐理由：小米把万亿参数 MoE 做到开源且百万上下文，MTP 三层原生集成让推理速度翻三倍，这在国内大厂开源里是第一个真正敢放权重的万亿级模型，做 Agent 的值得认真看看。

07:23

Berryxia.AI@berryxia

小米开源MiMo-V2.5系列模型，支持百万token上下文

小米正式开源MiMo-V2.5系列模型，采用MIT许可证，允许商业部署、持续训练和微调。两个模型均支持100万token上下文窗口：MiMo-V2.5-Pro专为复杂Agent和编码任务设计，在开源模型的GDPVal-AA和ClawEval基准测试中排名第一；MiMo-V2.5是原生多模态模型，具备强大的Agent能力。小米强调，模型的价值不应仅由排行榜衡量，而应取决于其解决实际问题的能力。

Xiaomi MiMo: Xiaomi MiMo-V2.5 is now officially open-sourced! MIT License, supporting commercial deployment, continued training, and ...

智能体开源/仓库模型发布编码

04:26

AK@_akhaliq

小米 MiMo-V2.5 已在 Hugging Face 发布 https://huggingface.co/collections/XiaomiMiMo/mimo-v25

多模态开源/仓库模型发布

03:45

Fuli Luo@_LuoFuli

精选76

小米宣布开源两个大模型：专攻复杂智能体和编码任务的MiMo-V2.5-Pro，以及原生全模态模型MiMo-V2.5。两者均支持100万token的上下文长度，并采用允许商业部署和微调的MIT许可证。同时，小米为开发者和创作者提供了100万亿token的免费额度，鼓励基于此构建应用。模型的价值不仅在于其在GDPVal-AA和ClawEval等基准测试中的排名，更在于其解决实际问题的能力。

Xiaomi MiMo: Xiaomi MiMo-V2.5 is now officially open-sourced! MIT License, supporting commercial deployment, continued training, and ...

智能体开源/仓库模型发布编码

推荐理由：小米这次把 1T 参数的 Code Agent 模型直接 MIT 开源，还送 100T 免费 token，诚意拉满。做 coding agent 的团队值得认真看看，这可能是目前开源阵营里最强的代码智能体基座。

01:48

Xiaomi MiMo@XiaomiMiMo

精选71

小米开源MiMo-V2.5双模型，支持百万上下文与商用

小米正式开源MiMo-V2.5系列模型，采用MIT许可，支持商业部署、继续训练与微调。该系列包含两个支持100万令牌上下文窗口的模型：MiMo-V2.5-Pro专为复杂智能体和编码任务设计，在GDPVal-AA和ClawEval基准测试中位列开源模型第一；MiMo-V2.5则是具备强大智能体能力的原生全模态模型。官方强调，模型的价值不仅在于排名，更在于其解决实际问题的能力，并已公开模型权重与技术博客。

智能体开源生态模型发布编码

推荐理由：小米把 MiMo-V2.5 直接 MIT 开源且支持商用，1M 上下文 + Agent 能力在开源阵营里确实能打，做 Agent 产品的团队值得花半小时跑一下 benchmark 看看真实水平。