AIHOT

4月20日

17:31

蚂蚁 inclusionAI：GitHub 新仓库

精选69

DR-Venus 是一个仅用1万条开放数据训练的40亿参数深度研究智能体，基于Qwen3-4B-Thinking-2507架构，支持200步工具调用和超20万tokens的上下文。它通过监督微调与强化学习两阶段训练，在BrowseComp、GAIA等多个深度研究基准上树立了小模型性能新标杆。其SFT版本已超越多数同类开源模型，而RL版本进一步将长程任务可靠性和工具使用校准度提升2-3个百分点。项目已全面开源模型、代码与训练流程。

智能体开源/仓库推理模型发布

关联讨论 1 条

推荐理由：4B 参数、仅用 1 万条公开数据就能在多个 deep research benchmark 上碾压 8B 对手，蚂蚁 inclusionAI 这次证明了小模型做 Agent 的关键不在参数量而在数据管线，做端侧 Agent 的团队值得拆一下它的 SFT+RL 流程。

15:40

公众号：通义实验室（千问）

精选59

通义千问发布 Qwen3.6-Max-Preview

通义千问发布 Qwen3.6-Max-Preview 预览版，相比 Qwen3.6-Plus 在多项基准上显著提升：智能体编程（SkillsBench +9.9、SciCode +6.3、NL2Repo +5.0、Terminal-Bench 2.0 +3.8）、世界知识（SuperGPQA +2.3、QwenChineseBench +5.3）、指令遵循（ToolcallFormatIFBench +2.8）。新版本支持 preserve_thinking，可在消息中保留前序轮次思维内容，避免多步任务上下文丢失，官方推荐用于智能体开发。用户可登录 Qwen Studio 直接对话，或通过阿里云百炼（即将上线）调用 API。

智能体推理模型发布编码

关联讨论 1 条

推荐理由：虽然只是个预览版，但 Qwen 3.6 Max 在智能体编程上的提升很扎实，benchmark 跳了 5-10 点，而且支持保留思维链，是我觉得 Agent 开发者最值得立刻上手的新玩具。

4月19日

15:48

TestingCatalog News 🗞@testingcatalog

Grok 4.3（测试版）现已向 SuperGrok 和 X Premium+ 用户推出！测试时间 👀

xAI推理模型发布

4月17日

16:48

蚂蚁 inclusionAI：GitHub 新仓库

精选56

inclusionAI发布LLaDA2.0-Uni模型

LLaDA2.0-Uni是一个统一的多模态模型，具备对世界的理解与生成能力。该模型通过整合视觉、语言等多模态信息，实现了跨模态的语义理解和内容生成。其架构支持从图像理解到文本生成、跨模态检索等复杂任务，标志着多模态人工智能向更通用、统一的方向演进。

多模态开源生态模型发布

推荐理由：蚂蚁 inclusionAI 推出 LLaDA2.0-Uni，主打理解与生成统一架构，但距发布已过两周且信息极少，建议等官方技术报告出来再决定是否跟进。

4月16日

21:22

公众号：通义实验室（千问）

精选62

Qwen3.6-35B-A3B 开源！

开源/仓库模型发布

关联讨论 1 条

推荐理由：千问又推轻量 MoE 模型，35B 总参激活仅 3B，小团队能跑，但正文就一句宣传语，缺技术细节，先观望。

10:30

公众号：腾讯混元

腾讯混元3D世界模型2.0发布：无缝对接游戏工作流

多模态开源生态模型发布

00:07

AK@_akhaliq

NVIDIA 在 Hugging Face 上发布了 Lyra 2.0 可探索的生成式 3D 世界论文： https：//huggingface.co/papers/2604.13036 模型： https：//huggingface.co/nvidia/Lyra-2.0

多模态开源生态模型发布

4月15日

06:05

Tibo@thsottiaux

今天我们推出 GPT-5.4-Cyber 并扩展我们的网络安全可信访问（TAC）计划。 https：//openai.com/index/scaling-trusted-access-for-cyber-defense/

OpenAI安全/对齐模型发布

4月14日

22:15

NVIDIA Technical Blog（开发者技术博客 · RSS）

精选55

NVIDIA Ising 推出 AI 驱动的工作流，用于构建容错量子系统

NVIDIA 推出了 Ising 系列开放 AI 模型，专用于构建量子处理器。这是首个此类模型家族，首发包含 Ising Calibration 和 Ising Decoding 两个领域，共同应对量子计算中的根本挑战——量子比特固有的噪声问题，目前最先进的量子处理器每进行约一千次操作就会发生一次错误。

开源生态模型发布

推荐理由：NVIDIA 为构建容错量子系统开源了一组 AI 模型，这大概是头一次有芯片巨头把 AI 正儿八经地往量子纠错里塞，做量子硬件的团队值得跟踪下，看看这能不能成为标准范式。

4月13日

08:56

公众号：MiniMax（稀宇科技）

MiniMax M2.7 × Hermes Agent：开启自我进化的 Agent 工作流

MiniMax M2.7 与 Hermes Agent 结合，构建可自我进化的 AI 智能体工作流。

智能体模型发布

4月12日

21:30

公众号：MiniMax（稀宇科技）

精选57

MiniMax M2.7开源，携手全球伙伴加速AI生态繁荣

MiniMax 正式开源 M2.7 模型，并联合全球合作伙伴共同加速人工智能生态的繁荣发展。

开源生态模型发布

推荐理由：MiniMax M2.7 开源了，但官方只丢了个标题，没说比 Llama 强在哪，开源社区又多了一个「我也行」，开发者看一眼就好。

09:02

NVIDIA Technical Blog（开发者技术博客 · RSS）

精选56

MiniMax M2.7在NVIDIA平台上推进可扩展智能体工作流以支持复杂AI应用

MiniMax M2.7作为热门模型MiniMax M2.5的增强版本发布，专为智能体框架及推理、机器学习研究工作流、软件工程、办公工作等复杂用例构建。该模型的开源权重现已通过NVIDIA及开源推理生态系统提供。MiniMax M2系列属于稀疏混合专家模型。

智能体开源生态模型发布

关联讨论 2 条

推荐理由：MiniMax M2.7 作为开源 Agent 模型，重点优化了工具调用和推理效率，虽然已经不是新消息，但对自研 Agent 应用的团队仍有落地参考价值。

4月10日

21:30

公众号：MiniMax（稀宇科技）

MiniMax Music 2.6：我们想讲四个人的故事

MiniMax Music 2.6 版本发布，以“四个人的故事”为主题。

多模态模型发布

17:14

公众号：智谱（GLM）

精选59

GLM-5.1获LMArena代码榜开源第一、全球第三

GLM-5.1在LMArena Code Arena登顶开源第一、全球第三。它继承上一代的SOTA编码能力，并在长程任务突破：8小时构建Linux桌面、655次迭代优化向量数据库、1000轮工具调用优化机器学习模型。METR榜下，它是唯一达8小时级持续工作的开源模型（除Claude Opus 4.6外）。

开源生态模型发布编码

关联讨论 1 条

推荐理由：智谱GLM-5.1在LMArena代码榜拿下开源第一，长程任务能力甚至接近闭源顶尖模型，做开源的开发者和团队可以把它放进候选名单了。

4月9日

17:01

公众号：腾讯混元

腾讯Robotics X实验室联合混元推出2B具身模型：22项评测16项最佳

腾讯Robotics X实验室与混元联合推出2B参数规模的具身模型，在22项评测中取得16项最佳成绩。该模型旨在为真实世界AI智能体提供基础支撑。

具身智能模型发布

4月8日

14:06

蚂蚁 inclusionAI：HuggingFace 新模型

inclusionAI/TC-AE

inclusionAI团队发布了TC-AE项目，旨在通过开源与开放科学推动人工智能技术的进步与民主化。该项目致力于降低AI技术的使用门槛，促进更广泛的社区参与和创新。核心变化在于构建了一个可访问的AI开发框架，强调协作与知识共享。此举预期将加速AI工具在多元领域的应用，并推动技术发展的透明性与包容性。

开源/仓库模型发布

10:41

公众号：智谱（GLM）

精选62

GLM-5.1开源：一个独立工作8小时的模型

智谱推出开源模型GLM-5.1，支持独立工作长达8小时。模型可直接部署使用，无需人工频繁干预，适用于长周期自动化任务场景。

智能体开源生态模型发布

关联讨论 1 条

推荐理由：智谱把 GLM-5.1 开源，并且主打 8 小时独立工作，这个定位切中了 agent 场景下长任务执行的痛点，想做自动化流程的可以跑起来试试。

4月7日

19:32

公众号：蚂蚁百灵（Ling）

Ming-flash-omni：从看图到发文，打通全模态创作闭环

Ming-flash-omni 模型具备全模态创作能力，能够同时完成照片中路人干扰的识别、自动修图、修图效果自评，并最终生成一段社交媒体推文，实现从视觉理解到内容发布的完整闭环。

多模态模型发布

4月3日

08:29

Artificial Analysis@ArtificialAnlys

微软发布MAI-Transcribe-1语音转录模型，准确率达3.0%

微软AI超级智能团队发布了MAI-Transcribe-1语音转录模型。该模型在Artificial Analysis语音转文本排行榜的AA-WER指标上达到3.0%的词错误率，位列第四，仅次于Mistral Voxtral Small、Google Gemini 3.1 Pro High和ElevenLabs Scribe v2。其处理速度约为实时音频的69倍，属于高速高精度模型。模型支持包括英语、法语、阿拉伯语、日语和中文在内的25种语言，其API目前已在Microsoft Foundry的Azure Speech服务上提供公开预览。

Microsoft模型发布语音

4月2日