2月12日

16:52

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI 发布了 ZwZ-7B 模型，这是一个拥有70亿参数的开源大语言模型。该模型基于先进的 Transformer 架构，在多项基准测试中性能显著提升，尤其在代码生成和数学推理任务上表现突出。其上下文窗口扩展至 128K 令牌，并采用了分组查询注意力等高效技术。模型权重已完全开源，旨在通过开放科学推动人工智能技术的民主化与普及。

开源生态模型发布

16:52

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/ZwZ-8B

inclusionAI发布了ZwZ-8B模型，这是一个拥有80亿参数的开源人工智能模型。该模型旨在通过开源和开放科学的方式，推动人工智能技术的进步与普及。此举是inclusionAI推进AI民主化进程的一部分，致力于让更广泛的社区能够访问和利用先进的AI技术。

开源/仓库模型发布端侧

12:18

公众号：豆包（字节）

豆包视频生成模型Seedance 2.0上线

字节跳动旗下豆包推出视频生成模型Seedance 2.0，该模型已上线。

多模态模型发布视频

00:00

MiniMax：Blog（网页）

精选67

MiniMax 发布 MiniMax M2.5 模型，专为现实世界生产力打造

MiniMax 最新发布的大语言模型 M2.5，通过在数十万个复杂现实环境中进行强化学习训练，在编码、智能体工具调用、搜索和办公工作等多项任务上达到 SOTA。模型推理效率高，完成 SWE-Bench Verified 评估的速度比前代 M2.1 快 37%，与 Claude Opus 4.6 相当。定价方面，以 100 tokens/秒运行时每小时成本仅 1 美元。M2.5 在超过 10 种编程语言和 20 多万个真实环境中训练，具备从系统设计到测试的全流程能力。

智能体搜索模型发布编码

推荐理由：MiniMax M2.5 把 SWE-bench 拉到 80.2%，成本只有 Claude Opus 4.6 的十分之一，速度还翻倍，对做 agent 的团队来说是个高性价比选择。

00:00

字节 Seed：Research Feed（网页内嵌数据）

精选

Seedance 2.0 正式发布

Seedance 2.0 视频生成模型正式发布，综合性能达业界 SOTA 水平。新版本支持多模态输入，可同时参考 9 张图片、3 段视频、3 段音频及文本指令，精准迁移构图、动作、运镜与音效。模型支持 15 秒高质量多镜头生成，集成双声道立体声技术，并新增视频延长与编辑功能，可定向修改片段、角色及剧情。目前已在即梦 AI、豆包及火山方舟平台上线，适用于影视、广告、电商等工业级内容创作场景。

多模态模型发布视频

关联讨论 1 条

推荐理由：字节Seedance 2.0发布，支持多模态输入与物理稳定生成，已上线豆包即梦

00:00

智谱：研究（网页内嵌数据）

精选

GLM-5开源：从代码到工程，Agentic Engineering时代最好的开源模型

GLM-5 开源，参数规模达 744B（激活 40B），预训练数据 28.5T，集成 DeepSeek Sparse Attention 降低部署成本。Coding 能力对齐 Claude Opus 4.5，Agent 能力支持 SOTA 级长程任务执行，兼容国产芯片。同步推出 OpenClaw、AutoGLM、Z Code 及 Excel 插件等工具链，覆盖端到端开发、办公自动化等场景。

智能体模型发布编码

推荐理由：智谱开源744B参数GLM-5，主打Agentic Engineering与编码能力，支持国产芯片推理

2月11日

20:18

蚂蚁 inclusionAI：GitHub 新仓库

inclusionAI/Ming-omni-tts

inclusionAI 发布了 Ming-omni-tts，这是一个能够统一生成语音、音乐和声音的模型。该模型的核心特点是结构简单高效，并实现了对生成内容的精确控制。它通过一个统一的框架处理多种音频模态，简化了传统上需要不同模型分别处理语音、音乐和音效的流程。这一进展为跨模态音频内容的创作与编辑提供了更便捷、可控的工具。

开源生态模型发布语音

19:00

公众号：蚂蚁百灵（Ling）

百灵全模态 Ming-flash-omni-2.0 发布：感知无界，创造有形

蚂蚁百灵推出全模态模型 Ming-flash-omni-2.0，融合感知与创造能力，旨在通过多模态交互焕新生活体验。具体技术参数和性能数据暂未披露。

多模态模型发布

18:52

蚂蚁 inclusionAI：GitHub 新仓库

精选65

inclusionAI发布新一代即时大模型Ling-2.5-1T

inclusionAI推出新一代旗舰即时模型Ling-2.5-1T，其总参数量达1T，活跃参数为63B，预训练语料扩展至29T tokens。该模型采用混合线性注意力架构，支持1M tokens上下文长度，并通过结合“正确性”与“过程冗余”的复合奖励机制，在相近的token效率下，其推理能力显著超越前代，接近前沿思维模型水平。经双向RL反馈和智能体验证等对齐策略优化，模型在创意写作和指令遵循任务上表现提升。它已兼容主流智能体平台，并在通用工具调用基准BFCL-V4上取得领先的开源性能。

开源/仓库推理模型发布部署/工程

推荐理由：蚂蚁把 1T 参数的即时模型开源了，63B 活跃参数加 1M 上下文，主打效率而非堆算力，对国内做开源推理模型的团队来说是个值得对标的基线。

18:52

蚂蚁 inclusionAI：GitHub 新仓库

精选78

inclusionAI发布全球首个开源万亿参数思维模型Ring-2.5-1T

inclusionAI发布了全球首个基于混合线性注意力架构的开源万亿参数思维模型Ring-2.5-1T。该模型通过高效的1:7 MLA与闪电线性注意力提升了推理速度与探索能力，并借助扩展的强化学习训练增强了深度思考和长程任务执行能力。其在IMO 2025和CMO 2025数学竞赛中均达到了金牌级别的性能。模型支持128K上下文长度，并可通过YaRN技术扩展至256K，现已于Hugging Face和ModelScope平台开源。部署方面，已支持SGLang，并提供了多GPU节点的服务器启动示例。

开源/仓库推理模型发布部署/工程

推荐理由：蚂蚁把万亿参数的开源 thinking model 放出来了，混合线性注意力架构是真新路线而非换皮，IMO/CMO 金牌级数学推理说明这不是纯堆参数。做开源大模型部署的团队值得认真看看它的架构选择。

11:12

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/Ming-omni-tts-tokenizer-12Hz

inclusionAI团队发布了Ming-omni-tts-tokenizer-12Hz开源项目，这是一个面向文本转语音（TTS）的通用分词器。该模型支持12Hz的高采样率，旨在提升语音合成的自然度与表现力。项目基于开源与开放科学的理念推进，致力于让人工智能技术更加普及和易得。

开源生态模型发布语音

11:10

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/Ming-omni-tts-0.5B

inclusionAI 发布了 Ming-omni-tts-0.5B，这是一个参数规模为 0.5B（5亿）的文本转语音模型。该模型旨在通过开源和开放科学的方式，推动人工智能技术的进步与普及。发布标志着在语音合成领域，一个中等规模、可公开访问的模型正式加入开源生态。

开源生态模型发布语音

10:49

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/Ming-omni-tts-16.8B-A3B

inclusionAI发布了开源文本转语音模型Ming-omni-tts-16.8B-A3B，参数量达168亿。该模型采用创新的A3B混合专家架构，在语音自然度、多语言支持和情感表现方面实现显著提升。项目遵循开源开放科学理念，旨在推动人工智能技术的民主化进程。

开源生态模型发布语音

08:00

蚂蚁百灵：Developer Blog（网页）

精选83

感知无界·创造有形：百灵全模态 Ming-flash-omni-2.0 焕新生活想象

百灵全模态大模型Ming-flash-omni-2.0正式发布。该模型基于MoE架构，在视觉、语音、图像等全模态能力上实现代际跃迁，其核心突破在于一个统一模型同时具备了强大的通用泛化能力和特定模态的专家级表现。具体特色包括：视觉百科能精准识别万物并关联知识；语音生成可控制情绪、方言，提供百种音色，并能统一生成语音、音效与背景音乐；图像创作可实现氛围重构、场景合成与智能擦除。技术层面通过亿级数据细粒度感知、知识对齐及超低帧率音频表征等创新实现性能飞跃。模型已在多个平台开源。

图像生成多模态模型发布

关联讨论 1 条

推荐理由：国产全模态模型开源，多模态能力达领先水准，开发者可直接体验或集成。

2月10日