4月29日

15:33

IT之家（RSS）

科大讯飞星火 X2-Flash 模型发布：基于华为昇腾 910B 集群训练，最大 256K 上下文

科大讯飞正式发布星火 X2-Flash 模型并开放API。该模型采用MoE架构，总参数300亿，支持256K上下文，基于华为昇腾910B集群训练。其在智能体、代码等能力上大幅提升，在深度研究报告、Skill管理等多项任务上效果接近业界万亿参数模型，而整体token消耗不到主流大尺寸模型的三分之一。通过结合DSA与MTP技术，模型在国产芯片上的训练效率从同规模A800集群的20%提升至90%，并解决了长交互场景采样效率低的问题，为大规模强化学习训练扫清障碍。AstronClaw、Loomy等已率先接入。

MCP/工具推理模型发布

14:49

Alibaba Cloud@alibaba_cloud

精选64

HappyHorse 1.0 现已在 @fal 上线。去构建吧。【引用 @fal】：Happy Horse 1.0 is live on fal， day 0 🐎 🎬 一流的运动质量 🎧 原生1080p，音频同步一步完成 🔗 音视频联合生成，非拼接 🔓 限制更少，商业用途更广 ⚡ 为生产规模而构建

fal: Happy Horse 1.0 is live on fal, day 0 🐎 🎬 Best-in-class motion quality 🎧 Native 1080p with synced audio in one pass �...

多模态模型发布视频

推荐理由：阿里云不声不响丢了个跟 Sora 对标的视频生成模型，音画同步一镜出片，直播带货团队可以立刻试试。

14:40

Ant Ling@AntLingAGI

服务好LLM是一项具有挑战性的任务，它需要工程智慧和良好的品味。感谢@Modular团队高水平的工程师们让这次合作成为现实。生态系统必胜！🤠👏

Modular: Ling-2.6-flash from @AntLingAGI is now open source, with day zero support on Modular Cloud! Fast MoE for agent workflows...

智能体开源生态模型发布

11:25

公众号：阶跃星辰（Step）

阶跃 Step Image Edit 2 上线！小身材、大能力、快响应

图像生成模型发布

11:19

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/Ling-2.6-1T

inclusionAI 发布了 Ling-2.6-1T 模型，这是一个包含 1 万亿参数的大型语言模型。该模型基于开源与开放科学理念构建，旨在推动人工智能技术的进步与民主化。新模型在多项基准测试中展现出更强的语言理解与生成能力，同时提供了更高效的推理性能。这一发布标志着开源社区在规模化 AI 模型开发上的重要进展，为研究者和开发者提供了可访问的高性能工具。

Hugging Face 开源生态模型发布

10:37

Chubby♨️@kimmonismus

Mistral Medium 即将到来。唯一相关的欧洲AI公司将发布另一个模型。

开源生态模型发布

09:38

ginobefun@hongming731

NVIDIA发布多模态模型Nemotron 3 Nano Omni

NVIDIA发布了多模态模型Nemotron 3 Nano Omni，专为处理长上下文设计，能够同时理解文本、图像、音频和视频。该模型在文档分析、自动语音识别、音视频理解以及智能体计算机使用等实际应用场景中表现优异。在多项基准测试中，Nemotron 3 Nano Omni均展现出领先的准确性和效率。

多模态模型发布端侧

09:33

IT之家（RSS）

蚂蚁集团百灵大模型开源 Ling-2.6-flash，提供 BF16、FP8、INT4 等版本

蚂蚁集团百灵大模型宣布开源Ling-2.6-flash，提供BF16、FP8、INT4等多个版本供开发者灵活选用。该模型总参数量104B，激活参数7.4B，是一款Instruct模型。官方基于开发者反馈优化了中英文切换及主流编程框架适配效果。其核心优势包括：采用混合线性架构，在4卡H20上推理速度最快达340 tokens/s；通过Token效率优化，在评测中消耗的tokens仅为同类模型的约1/10；针对Agent场景增强了工具调用与任务执行能力，在多项评测中达到先进水平。模型已在Hugging Face和ModelScope平台开源。

智能体开源生态模型发布

09:00

公众号：蚂蚁百灵（Ling）

Ling-2.6-flash 正式开源

Ling-2.6-flash 今日正式开源，同步提供 BF16、FP8、INT4 等多个版本。该模型两周前以匿名身份登陆 OpenRouter，一周前正式发布并开放为期一周的免费 API 调用服务。过去两周内，团队基于开发者反馈进行多轮优化，改善了中英文自然切换能力，并提升了主流 Coding 框架的适配效果。开发者可通过 Hugging Face 和 ModelScope 获取模型。

开源/仓库开源生态模型发布

08:38

Berryxia.AI@berryxia

OpenBMB发布的MiniCPM-o 4.5是一个仅90亿参数的多模态模型，实现了从传统轮询交互到实时、原生全双工流式交互的范式突破。其Omni-Flow框架能在统一时间线上毫秒级同步处理视频、音频和文本流，无需外部语音检测即可同时感知与响应。该模型在多模态基准测试中表现接近Gemini 2.5 Flash，并专为边缘AI设计，支持完全离线运行，提供Windows/macOS一键安装（仅需12G显存），保障100%数据隐私，同时开源权重并提供免费社区API。

OpenBMB: 🚀 🚀Excited to announce the technical report of MiniCPM-o 4.5! MiniCPM-o 4.5 transitions #AI interaction from tradition...

GitHub 多模态开源生态模型发布