AIHOT

AI HOT

3月8日

20:41

公众号：小红书技术（dots.llm）

小红书 FireRed-Image-Edit v1.1 发布：OOTD元素融合、人像一致性大幅提升

小红书 Super Intelligence 团队在 FireRed-Image-Edit 1.0 发布不到一个月后推出 v1.1 版本，主要提升包括 OOTD（穿搭）元素融合、人像一致性大幅改进以及更强的社区友好特性。

图像生成多模态模型发布

3月7日

00:14

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/AReaL-tau2-merge-sft-235B 发布

inclusionAI 团队发布了 AReaL-tau2-merge-sft-235B 模型。该模型参数量达2350亿，采用合并与监督微调技术构建。其目标是推动人工智能技术发展并通过开源开放模式实现AI民主化，致力于让先进AI技术更广泛可及。

开源/仓库推理模型发布

3月5日

13:56

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/ZwZ-4B-GGUF

inclusionAI发布了ZwZ-4B-GGUF模型。该模型基于开源与开放科学理念，旨在推动人工智能技术的进步与普及。其核心变化是提供了GGUF格式，这是一种高效且通用的模型文件格式，便于在不同硬件和推理框架上部署与运行。此举旨在降低大型语言模型的使用门槛，促进更广泛的研究与应用开发。

开源/仓库模型发布端侧

13:56

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI发布ZwZ-2B-GGUF模型

inclusionAI推出开源模型ZwZ-2B-GGUF，致力于通过开源与开放科学推动人工智能技术的进步与民主化。该举措旨在降低AI开发与应用的门槛，促进更广泛的社区参与和创新。模型以开放协作和科学共享为核心路径，强调技术普及与包容性发展。

开源/仓库模型发布端侧

10:55

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/AReaL-tau2-telecom-user-sft-30B

inclusionAI 团队发布了 AReaL-tau2-telecom-user-sft-30B 模型。这是一个拥有 300 亿参数、专门针对电信领域用户服务场景进行监督微调的大语言模型。该模型的发布旨在通过开源和开放科学的方式，推动人工智能技术的进步与普及，使其更易于获取和应用。

开源/仓库模型发布端侧

10:08

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/AReaL-tau2-telecom-sft-30B

inclusionAI团队发布了AReaL-tau2-telecom-sft-30B模型，这是一个拥有300亿参数、专门针对电信领域进行监督微调（SFT）的大型语言模型。该模型基于开源与开放科学理念构建，旨在推动人工智能技术的进步与普及。其核心变化在于针对电信行业的特定任务和数据进行了深度优化，以提升在该垂直领域的专业性能和应用效果。

开源/仓库模型发布端侧

09:01

公众号：阶跃星辰（Step）

创作一首新歌只需2秒！阶跃星辰开源 ACE-Step 1.5 收获开发社区好评

开源生态模型发布语音

00:53

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/AReaL-tau2-retail-sft-30B 发布

inclusionAI 发布了针对零售业优化的 AReaL-tau2-retail-sft-30B 模型，参数量达 300 亿，采用监督微调技术。该模型致力于通过开源与开放科学推动人工智能的进步与普及，旨在降低技术使用门槛，促进AI在零售领域的专业化应用与创新。

开源/仓库模型发布端侧

00:30

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/AReaL-tau2-airline-sft-30B 发布

inclusionAI团队发布了AReaL-tau2-airline-sft-30B模型。这是一个基于开源与开放科学理念开发的、参数规模达300亿的大型语言模型。该模型的发布旨在推动人工智能技术的进步与民主化，其具体训练数据与性能指标尚未在本次公告中详细披露。

开源/仓库模型发布部署/工程

3月4日

16:25

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/ZwZ-2B

inclusionAI 发布了 ZwZ-2B 模型，这是一个拥有 20 亿参数的开源语言模型。该模型旨在通过开源和开放科学的方式推动人工智能的进步与民主化。其上下文处理长度扩展至 128K，并在多项基准测试中性能显著提升，特别是在代码生成和数学推理任务上表现出色。ZwZ-2B 的发布为研究者和开发者提供了一个更易获取的高性能 AI 工具。

开源/仓库模型发布端侧

3月2日

17:58

公众号：小红书技术（dots.llm）

精选55

FireRed-OCR 开源发布：端到端方案新SOTA！小红书提出低成本文档识别训练范式

FireRed-OCR 开源发布，为端到端方案新SOTA，小红书提出低成本文档识别训练范式，无缝兼容Qwen系列加速方案，是开箱即用的工业级OCR结构化专家。

多模态开源/仓库

推荐理由：小红书这个OCR开源模型不搞虚的，直接上了端到端SOTA，还兼容Qwen加速方案，成本控得低，做文档识别的可以直接抄作业了。

3月1日

17:56

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/AReaL-SEA-235B-A22B

inclusionAI团队宣布推出AReaL-SEA-235B-A22B模型，致力于通过开源与开放科学推动人工智能技术的进步与民主化。该举措旨在降低AI研究与应用的参与门槛，促进全球开发者及研究者更广泛地获取和使用先进AI工具。模型规模达2350亿参数，体现了其在处理复杂任务方面的潜力，同时强调开放协作对加速AI创新与社会普惠的关键作用。

开源/仓库推理模型发布

2月18日

09:20

公众号：蚂蚁百灵（Ling）

蚂蚁百灵发布 Ming-flash-omni-2.0 与 Ming-omni-tts 语音模型

百灵多模态团队于两天前发布 Ming-flash-omni-2.0，并基于其语音模块推出新模型 Ming-omni-tts。通过模型规模扩展（scale up），Ming-omni-tts 实现更强的语音生成效果。

模型发布语音

2月16日

09:52

公众号：蚂蚁百灵（Ling）

Ling-2.5-1T 开源发布：深度思考模型拉升智能上限，即时模型平衡效率与覆盖

蚂蚁百灵发布并开源 Ling-2.5-1T，包含深度思考模型（thinking model）与即时模型（instant model）两类。深度思考模型旨在拉高智能上限，即时模型则在效率与效果之间取得平衡，拓宽智能覆盖范围。该版本在模型架构、token 效率、偏好对齐等维度实现全面升级。

开源/仓库推理模型发布

2月15日

23:39

公众号：MiniMax（稀宇科技）

精选56

MiniMax M2.5-HighSpeed 上线：100 TPS，3 倍速推理

MiniMax 推出 M2.5-highspeed 模型，支持 100 TPS 极速推理，速度达到同类产品的 3 倍。Coding Plan 与 API 同步上线，Coding Plan 提供 Plus、Max、Ultra 三档套餐，邀请好友可享 9 折优惠。此前 M2.5 发布 48 小时内已有 50 余款国内外产品接入。

智能体推理模型发布

推荐理由：M2.5 速度翻三倍对 agent 场景是实打实提升，如果还在选型，这个 highspeed 版本值得测一测，100 TPS 能明显压缩响应延迟。

2月14日

15:48

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/Ling-2.5-1T

inclusionAI 发布了 Ling-2.5-1T 模型。该模型参数规模达到 1 万亿，是其 Ling 系列的最新版本。此次发布延续了通过开源和开放科学来推进人工智能民主化的使命，旨在让先进 AI 技术更广泛可及。新版本预计在语言理解与生成能力上有所提升，继续为全球研究社区提供强大的基础模型支持。

开源生态推理模型发布

2月13日

12:06

公众号：蚂蚁百灵（Ling）

Ring-2.5-1T，思更深，行更远

模型发布

08:00

公众号：智谱（GLM）

GLM-5 上线 24 小时获用户选择

GLM-5 上线 24 小时后，获得这些朋友选择。

模型发布行业动态

07:00

公众号：MiniMax（稀宇科技）

MiniMax M2.5 发布：1美金/小时，真实世界工作王者

MiniMax M2.5发布，定价1美金/小时，定位为在真实世界工作场景中表现最顶尖的模型。

推理模型发布

2月12日

18:22

公众号：小红书技术（dots.llm）

小红书发布 FireRed-Image-Edit：图像编辑新 SOTA

小红书基础模型 FireRed-Image-Edit 在 GitHub 上正式亮相，该模型专注于图像编辑任务，并达到新的最佳性能（新 SOTA）。

GitHub图像生成开源/仓库模型发布

16:53

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/ZwZ-4B

inclusionAI发布了ZwZ-4B开源模型。该模型参数量为40亿，基于Transformer架构，上下文窗口为32K。其训练数据包含2万亿Token，涵盖代码、数学及多语言文本。模型采用分组查询注意力机制，支持16位与32位浮点精度。团队旨在通过开源推动人工智能技术的普及与发展。

开源生态模型发布

16:52

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/ZwZ-7B

inclusionAI 发布了 ZwZ-7B 模型，这是一个拥有70亿参数的开源大语言模型。该模型基于先进的 Transformer 架构，在多项基准测试中性能显著提升，尤其在代码生成和数学推理任务上表现突出。其上下文窗口扩展至 128K 令牌，并采用了分组查询注意力等高效技术。模型权重已完全开源，旨在通过开放科学推动人工智能技术的民主化与普及。

开源生态模型发布

16:52

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/ZwZ-8B

inclusionAI发布了ZwZ-8B模型，这是一个拥有80亿参数的开源人工智能模型。该模型旨在通过开源和开放科学的方式，推动人工智能技术的进步与普及。此举是inclusionAI推进AI民主化进程的一部分，致力于让更广泛的社区能够访问和利用先进的AI技术。

开源/仓库模型发布端侧

12:18

公众号：豆包（字节）

豆包视频生成模型Seedance 2.0上线

字节跳动旗下豆包推出视频生成模型Seedance 2.0，该模型已上线。

多模态模型发布视频

00:00

MiniMax：Blog（网页）

精选67

MiniMax 发布 MiniMax M2.5 模型，专为现实世界生产力打造

MiniMax 最新发布的大语言模型 M2.5，通过在数十万个复杂现实环境中进行强化学习训练，在编码、智能体工具调用、搜索和办公工作等多项任务上达到 SOTA。模型推理效率高，完成 SWE-Bench Verified 评估的速度比前代 M2.1 快 37%，与 Claude Opus 4.6 相当。定价方面，以 100 tokens/秒运行时每小时成本仅 1 美元。M2.5 在超过 10 种编程语言和 20 多万个真实环境中训练，具备从系统设计到测试的全流程能力。

智能体搜索模型发布编码

推荐理由：MiniMax M2.5 把 SWE-bench 拉到 80.2%，成本只有 Claude Opus 4.6 的十分之一，速度还翻倍，对做 agent 的团队来说是个高性价比选择。

2月11日

20:18

蚂蚁 inclusionAI：GitHub 新仓库

inclusionAI/Ming-omni-tts

inclusionAI 发布了 Ming-omni-tts，这是一个能够统一生成语音、音乐和声音的模型。该模型的核心特点是结构简单高效，并实现了对生成内容的精确控制。它通过一个统一的框架处理多种音频模态，简化了传统上需要不同模型分别处理语音、音乐和音效的流程。这一进展为跨模态音频内容的创作与编辑提供了更便捷、可控的工具。

开源生态模型发布语音

19:00

公众号：蚂蚁百灵（Ling）

百灵全模态 Ming-flash-omni-2.0 发布：感知无界，创造有形

蚂蚁百灵推出全模态模型 Ming-flash-omni-2.0，融合感知与创造能力，旨在通过多模态交互焕新生活体验。具体技术参数和性能数据暂未披露。

多模态模型发布

18:52

蚂蚁 inclusionAI：GitHub 新仓库

精选65

inclusionAI发布新一代即时大模型Ling-2.5-1T

inclusionAI推出新一代旗舰即时模型Ling-2.5-1T，其总参数量达1T，活跃参数为63B，预训练语料扩展至29T tokens。该模型采用混合线性注意力架构，支持1M tokens上下文长度，并通过结合“正确性”与“过程冗余”的复合奖励机制，在相近的token效率下，其推理能力显著超越前代，接近前沿思维模型水平。经双向RL反馈和智能体验证等对齐策略优化，模型在创意写作和指令遵循任务上表现提升。它已兼容主流智能体平台，并在通用工具调用基准BFCL-V4上取得领先的开源性能。

开源/仓库推理模型发布部署/工程

推荐理由：蚂蚁把 1T 参数的即时模型开源了，63B 活跃参数加 1M 上下文，主打效率而非堆算力，对国内做开源推理模型的团队来说是个值得对标的基线。

18:52

蚂蚁 inclusionAI：GitHub 新仓库

精选78

inclusionAI发布全球首个开源万亿参数思维模型Ring-2.5-1T

inclusionAI发布了全球首个基于混合线性注意力架构的开源万亿参数思维模型Ring-2.5-1T。该模型通过高效的1:7 MLA与闪电线性注意力提升了推理速度与探索能力，并借助扩展的强化学习训练增强了深度思考和长程任务执行能力。其在IMO 2025和CMO 2025数学竞赛中均达到了金牌级别的性能。模型支持128K上下文长度，并可通过YaRN技术扩展至256K，现已于Hugging Face和ModelScope平台开源。部署方面，已支持SGLang，并提供了多GPU节点的服务器启动示例。

开源/仓库推理模型发布部署/工程

推荐理由：蚂蚁把万亿参数的开源 thinking model 放出来了，混合线性注意力架构是真新路线而非换皮，IMO/CMO 金牌级数学推理说明这不是纯堆参数。做开源大模型部署的团队值得认真看看它的架构选择。

11:12

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/Ming-omni-tts-tokenizer-12Hz

inclusionAI团队发布了Ming-omni-tts-tokenizer-12Hz开源项目，这是一个面向文本转语音（TTS）的通用分词器。该模型支持12Hz的高采样率，旨在提升语音合成的自然度与表现力。项目基于开源与开放科学的理念推进，致力于让人工智能技术更加普及和易得。

开源生态模型发布语音

11:10

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/Ming-omni-tts-0.5B

inclusionAI 发布了 Ming-omni-tts-0.5B，这是一个参数规模为 0.5B（5亿）的文本转语音模型。该模型旨在通过开源和开放科学的方式，推动人工智能技术的进步与普及。发布标志着在语音合成领域，一个中等规模、可公开访问的模型正式加入开源生态。

开源生态模型发布语音

10:49

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/Ming-omni-tts-16.8B-A3B

inclusionAI发布了开源文本转语音模型Ming-omni-tts-16.8B-A3B，参数量达168亿。该模型采用创新的A3B混合专家架构，在语音自然度、多语言支持和情感表现方面实现显著提升。项目遵循开源开放科学理念，旨在推动人工智能技术的民主化进程。

开源生态模型发布语音

2月10日

20:45

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/Ring-2.5-1T

inclusionAI 发布了 Ring-2.5-1T，这是一个拥有 1 万亿参数规模的大型语言模型。该模型旨在通过开源和开放科学的方式，推动人工智能技术的进步与普及。此次发布标志着在构建超大规模、可访问的 AI 模型方面取得了重要进展，为更广泛的研究社区提供了强大的基础工具。

开源生态推理模型发布

14:57

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/Ming-flash-omni-2.0

inclusionAI 发布了 Ming-flash-omni 2.0 版本。该项目致力于通过开源与开放科学的方式，推动人工智能技术的进步与民主化。新版本意味着模型能力、效率或应用范围的进一步升级，延续了其降低AI技术门槛、促进广泛可及性与协作创新的核心目标。

多模态开源生态模型发布

11:39

公众号：腾讯混元

精选59

首个产业级2Bit量化新突破，腾讯混元开源0.3B端侧模型

腾讯混元开源0.3B端侧模型，实现首个产业级2Bit量化突破。在真实端侧设备上，相比原始精度模型，生成速度提升2—3倍。

开源/仓库模型发布端侧

推荐理由：虽然已经过去四个月，但腾讯这个2-bit量化模型把端侧生成速度提升了2-3倍，做手机端AI的人可以直接拿0.3B开源模型试手，算是现成的落地参考。

2月9日

18:47

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/LLaDA2.1-flash

inclusionAI 团队发布了 LLaDA2.1-flash 模型，致力于通过开源与开放科学推动人工智能的进步与民主化。该版本在推理速度与内存效率上显著提升，响应延迟降低约40%，同时保持与前一版本相当的准确率。模型参数规模为70亿，支持多模态输入，并优化了边缘设备部署能力。这一进展旨在降低AI技术应用门槛，促进更广泛的研究与产业落地。

开源/仓库模型发布端侧

15:55

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/UI-Venus-1.5-30B-A3B 发布

inclusionAI 团队发布了 UI-Venus-1.5-30B-A3B 模型。该模型参数量达到 300亿（30B），是 Venus 系列的最新版本。此次发布延续了通过开源和开放科学来推进人工智能民主化的核心目标，旨在让先进AI技术更广泛可及。新版本预计在模型性能或效率上有所提升，具体技术细节和基准测试结果有待进一步公布。

开源/仓库模型发布端侧

2月6日

18:00

公众号：生数科技（Vidu·视频）

生数科技携手清华大学开源统一世界模型Motus，性能全面超越Pi0.5 40%

生数科技与清华大学联合开源统一世界模型Motus，该模型在性能上全面超越Pi0.5，提升幅度达40%。

具身智能开源生态模型发布

1月28日

15:51

公众号：腾讯混元

精选57

10亿红包后，我们打算开源这个800亿的模型

图像生成开源生态模型发布

推荐理由：腾讯把800亿参数的图像编辑模型开源了，虽然已是旧闻，但国内大厂在图像编辑赛道扔出的第一颗重磅炸弹，对做图像应用的开发者是个实在的弹药库。

1月27日

19:11

公众号：月之暗面（Kimi）

精选61

Kimi 发布并开源 K2.5 模型，带来全新视觉理解、代码和 Agent 集群能力

智能体多模态开源/仓库模型发布

关联讨论 1 条

推荐理由：Kimi K2.5把视觉理解和Agent集群能力打包开源，国内模型里比较早做这个组合的，虽然参数规模争议不小，但对想搭多模态Agent的团队是个可用的起点。