全部 AI 动态 · AI HOT

内容

精选全部 AI 动态 AI 日报主题收藏

接入

更多

关于更新日志反馈

内部员工登录

精选全部日报更多

内部员工登录

全部动态

全部一手资讯 X 论文

标签「开源/仓库」清除

2月10日周二

20:09公众号：小红书技术（dots.llm）54懂剪辑，更懂叙事：FireRed-OpenStoryline--首个开源具备导演思维的视频剪辑Agent

11:39公众号：腾讯混元59首个产业级2Bit量化新突破，腾讯混元开源0.3B端侧模型

2月9日周一

23:54Hacker News：AI 热帖精选Show HN：AI agents 通过 REST API 玩 SimCity

18:47蚂蚁 inclusionAI：HuggingFace 新模型39inclusionAI/LLaDA2.1-flash

15:55蚂蚁 inclusionAI：HuggingFace 新模型36inclusionAI/UI-Venus-1.5-30B-A3B 发布

08:00Hugging Face：Blog（RSS）76精选Transformers.js v4：现已在 NPM 上发布！

2月6日周五

00:52Hugging Face：Blog（RSS）60ServiceNow AI 发布 SyGra Studio：低代码知识图谱构建平台

2月5日周四

11:24蚂蚁 inclusionAI：GitHub 新仓库28inclusionAI/Ling 项目官网

2月4日周三

18:40公众号：腾讯混元55腾讯混元开源HPC-Ops算子库，推理吞吐提升30%

2月2日周一

21:03Nathan Lambert：Interconnects（RSS）最新开源模型（第18期）：Arcee 400B MoE、LiquidAI 被低估的 1B 模型、新版 Kimi，以及本月密集发布的预期

1月31日周六

08:18Jim Fan精选我还记得2023年Stanford Smallville发布时的兴奋。那是当时最大的多智能体模拟--没错，25个bot感觉已经很多了。今天是"Bigville"时刻。我们正在看到一个新生的、大规模的外星文明模拟实时展开：数量级更多的agent、高得多的IQ、不受限制的互联网接入，由全套MCPs提供支持。能出什么问题呢？【引用 @DrJimFan】：著名的Stanford Smallville正式开源！ 25个AI agent居住在一个数字版Westworld中，不知道自己生活在模拟里。他们上班、八卦、组织社交活动、结交新朋友，甚至坠入爱河。每个都有独特的个性和背景故事。 Smallville是2023年最鼓舞人心的AI agent实验之一。我们经常谈论单个LLM的涌现能力，但多智能体涌现在大规模下可能更加复杂和迷人。一个AI群体可以演绎整个文明的演化。前方有无限新的可能性。游戏将首先感受到影响。 Github： https://github.com/joonspk-research/generative_agents Paper： https://arxiv.org/abs/2304.03442 Authors： @joon_s_pk @joseph_c_obrien @carriejcai @merrierm @percyliang @msbernst

1月30日周五

15:55蚂蚁 inclusionAI：GitHub 新仓库61精选高效离线推理框架 Flood：吞吐量显著领先，支持多模态与量化

1月29日周四

00:00Qwen：Blog Retrieval（API）Qwen3-ASR 与 Qwen3-ForcedAligner 正式开源：鲁棒、流式、多语言！

1月27日周二

19:11公众号：月之暗面（Kimi）61精选Kimi 发布并开源 K2.5 模型，带来全新视觉理解、代码和 Agent 集群能力

1月22日周四

00:00Qwen：Blog Retrieval（API）Qwen3-TTS 系列现已开源：支持语音设计、克隆与生成！

00:00Moonshot AI：Kimi Blog精选Kimi 供应商验证器

1月19日周一

22:00VentureBeat：AI（RSS）65Claude Code月费高达200美元，开源替代Goose完全免费

1月16日周五

08:13Hacker News：AI 热帖Show HN：Gambit，开源 AI agent 框架，用类型化 deck 构建可靠工作流

00:00LMSYS：Blog（Chatbot Arena 团队）SGLang-Diffusion：发布两月进展综述

1月15日周四

08:00Hugging Face：Blog（RSS）80精选开放回应：你需要知道的事

00:00LMSYS：Blog（Chatbot Arena 团队）SGLang 优化 Pipeline Parallelism 支持百万 Token 超长上下文

1月12日周一

22:23Hacker News：AI 热帖精选Agent-of-empires：OpenCode 与 Claude Code 会话管理器

00:00LMSYS：Blog（Chatbot Arena 团队）SGLang EPD 分离架构：视觉语言模型的弹性编码器扩展

1月8日周四

04:00VentureBeat：AI（RSS）46Nous Research发布开源编程模型NousCoder-14B，直面Claude Code竞争

12月23日周二

00:00MiniMax：Blog（网页）53MiniMax M2.1：显著增强多语言编程能力，专为现实世界复杂任务打造

00:00LMSYS：Blog（Chatbot Arena 团队）SpecBundle与SpecForge v0.2发布：生产级投机解码模型与框架

12月19日周五

00:00LMSYS：Blog（Chatbot Arena 团队）SGLang实现扩散LLM框架：支持LLaDA 2.0-flash

12月18日周四

09:00公众号：蚂蚁百灵（Ling）32AEnvironment - 面向 Agentic RL 时代的环境系统，开箱即用，万物互联

08:00Hugging Face：Blog（RSS）73精选Transformers v5 中的分词：更简单、清晰与模块化

12月16日周二

18:14Google DeepMind：Blog（RSS）Gemma Scope 2：助力 AI 安全社区深入理解复杂语言模型行为

16:55蚂蚁 inclusionAI：GitHub 新仓库49inclusionAI/AEnvironment

00:01Hugging Face：Blog（RSS）83精选CUGA 登陆 Hugging Face：普及可配置的通用 AI 智能体

12月11日周四

23:47Hugging Face：Blog（RSS）76精选llama.cpp 服务器新增多模型管理功能

23:36蚂蚁 inclusionAI：GitHub 新仓库49inclusionAI/LLaDA2.X

08:00Hugging Face：Blog（RSS）28Codex 开源其 AI 模型

12月10日周三

00:00LMSYS：Blog（Chatbot Arena 团队）让张量飞起来 -- 用 R-Fork 加速大模型权重加载

12月9日周二

00:00Mistral AI：News（网页）60Mistral AI 发布下一代代码模型 Devstral 2 及命令行工具 Mistral Vibe CLI

12月5日周五

08:00Hugging Face：Blog（RSS）76精选介绍 swift-huggingface：完整的 Hugging Face Swift 客户端

12月4日周四

08:00Hugging Face：Blog（RSS）66DeepMath：一个基于 smolagents 的轻量级数学推理智能体

12月3日周三

21:45蚂蚁 inclusionAI：GitHub 新仓库63精选蚂蚁集团开源AState：面向强化学习的高性能状态管理系统

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

2月10日

20:09

公众号：小红书技术（dots.llm）

54

懂剪辑，更懂叙事：FireRed-OpenStoryline--首个开源具备导演思维的视频剪辑Agent

FireRed-OpenStoryline 今日正式开源，成为首个具备导演思维的视频剪辑Agent，将大模型能力从文本、图像拓展至视频剪辑领域。

智能体多模态开源/仓库视频

11:39

公众号：腾讯混元

59

首个产业级2Bit量化新突破，腾讯混元开源0.3B端侧模型

腾讯混元开源0.3B端侧模型，实现首个产业级2Bit量化突破。在真实端侧设备上，相比原始精度模型，生成速度提升2—3倍。

开源/仓库模型发布端侧

2月9日

23:54

Hacker News：AI 热帖

精选

Show HN：AI agents 通过 REST API 玩 SimCity

一款让 AI agents 担任市长的城市模拟器，支持通过 REST API 或 MCP 服务器进行程序化城市建造与管理。

智能体 MCP/工具开源/仓库

推荐理由：AI Agent 通过 MCP 协议玩模拟城市，有趣的 Agent 应用实践案例

18:47

蚂蚁 inclusionAI：HuggingFace 新模型

39

inclusionAI/LLaDA2.1-flash

inclusionAI 团队发布了 LLaDA2.1-flash 模型，致力于通过开源与开放科学推动人工智能的进步与民主化。该版本在推理速度与内存效率上显著提升，响应延迟降低约40%，同时保持与前一版本相当的准确率。模型参数规模为70亿，支持多模态输入，并优化了边缘设备部署能力。这一进展旨在降低AI技术应用门槛，促进更广泛的研究与产业落地。

开源/仓库模型发布端侧

15:55

蚂蚁 inclusionAI：HuggingFace 新模型

36

inclusionAI/UI-Venus-1.5-30B-A3B 发布

inclusionAI 团队发布了 UI-Venus-1.5-30B-A3B 模型。该模型参数量达到 300亿（30B），是 Venus 系列的最新版本。此次发布延续了通过开源和开放科学来推进人工智能民主化的核心目标，旨在让先进AI技术更广泛可及。新版本预计在模型性能或效率上有所提升，具体技术细节和基准测试结果有待进一步公布。

开源/仓库模型发布端侧

08:00

Hugging Face：Blog（RSS）

精选76

Transformers.js v4：现已在 NPM 上发布！

Transformers.js 发布第四个主要版本 v4，该版本现已通过 NPM 包管理器提供。这一更新延续了项目通过开源与开放科学推动人工智能技术进步与普及的使命，使开发者能够更便捷地获取并在项目中集成这一机器学习库。

Hugging Face 开源/仓库端侧部署/工程

推荐理由：浏览器和 Node.js 直接跑 HF 模型的大版本升级，前端开发者可零门槛接入 AI

2月6日

00:52

Hugging Face：Blog（RSS）

60

ServiceNow AI 发布 SyGra Studio：低代码知识图谱构建平台

ServiceNow AI 在 Hugging Face 上推出了 SyGra Studio，这是一个低代码平台，旨在简化知识图谱的构建、可视化与分析。该平台允许用户通过直观界面整合多源数据，并支持与 GPT、Claude 等大语言模型集成，以增强语义理解和推理能力，显著降低了领域专家构建知识图谱的技术门槛。

Hugging Face 开源/仓库部署/工程

2月5日

11:24

蚂蚁 inclusionAI：GitHub 新仓库

28

inclusionAI/Ling 项目官网

inclusionAI 正式推出 Ling 项目的官方网站，该网站约 95% 的内容和功能由人工智能技术构建完成。这一举措展示了 AI 在网站开发与内容生成领域的高度参与度，标志着项目在技术整合与应用层面的重要进展。

开源/仓库行业动态

2月4日

18:40

公众号：腾讯混元

55

腾讯混元开源HPC-Ops算子库，推理吞吐提升30%

腾讯混元开源生产级高性能LLM推理核心算子库HPC-Ops，可带来30%的推理吞吐提升。

开源/仓库推理部署/工程

2月2日

21:03

Nathan Lambert：Interconnects（RSS）

最新开源模型（第18期）：Arcee 400B MoE、LiquidAI 被低估的 1B 模型、新版 Kimi，以及本月密集发布的预期

本期开源模型动态涵盖 Arcee 400B MoE、LiquidAI 1B 及新版 Kimi 等实用小众模型。Arcee 发布 4000 亿参数 MoE 架构模型，LiquidAI 推出性能被低估的 10 亿参数方案，Kimi 迎来重要更新。业界预期本月将迎来密集的大模型发布潮，多款重要产品即将面世。

开源/仓库开源生态端侧

1月31日

08:18

Jim Fan@DrJimFan

精选

我还记得2023年Stanford Smallville发布时的兴奋。那是当时最大的多智能体模拟--没错，25个bot感觉已经很多了。今天是"Bigville"时刻。我们正在看到一个新生的、大规模的外星文明模拟实时展开：数量级更多的agent、高得多的IQ、不受限制的互联网接入，由全套MCPs提供支持。能出什么问题呢？【引用 @DrJimFan】：著名的Stanford Smallville正式开源！ 25个AI agent居住在一个数字版Westworld中，不知道自己生活在模拟里。他们上班、八卦、组织社交活动、结交新朋友，甚至坠入爱河。每个都有独特的个性和背景故事。 Smallville是2023年最鼓舞人心的AI agent实验之一。我们经常谈论单个LLM的涌现能力，但多智能体涌现在大规模下可能更加复杂和迷人。一个AI群体可以演绎整个文明的演化。前方有无限新的可能性。游戏将首先感受到影响。 Github： https://github.com/joonspk-research/generative_agents Paper： https://arxiv.org/abs/2304.03442 Authors： @joon_s_pk @joseph_c_obrien @carriejcai @merrierm @percyliang @msbernst

Jim Fan: The famed Stanford Smallville is officially open-source! 25 AI agents inhabit a digital Westworld, unaware that they are...

智能体开源/仓库开源生态

推荐理由：经典Agent实验首次开源，个人开发者可搭建AI虚拟社会观察涌现行为

1月30日

15:55

蚂蚁 inclusionAI：GitHub 新仓库

精选61

高效离线推理框架 Flood：吞吐量显著领先，支持多模态与量化

Flood 是一款面向离线应用的高效大语言模型推理框架。它采用流水线并行降低通信开销，并通过分段式KV缓存管理提升连续性。框架支持连续批处理、分块预填充、FP8/INT8量化及多模态模型推理。性能测试表明，其在多种模型和硬件上的吞吐量最高可达 vLLM 的 2.4 倍。其专用内核 SegmentAttention 在处理长序列时，解码速度较 FlashAttention 最高提升 3.16 倍。该项目于 2025 年 3 月开源并快速迭代，已支持前瞻解码等新特性。

开源/仓库推理部署/工程

推荐理由：蚂蚁的 FLOOD 框架用流水线并行替代张量并行来压通信开销，实测吞吐比 vLLM 高 1.4 到 2.4 倍，做离线推理部署的团队值得花半小时跑一下 benchmark 看看自家场景能不能吃这个红利。

1月29日

00:00

Qwen：Blog Retrieval（API）

Qwen3-ASR 与 Qwen3-ForcedAligner 正式开源：鲁棒、流式、多语言！

Qwen3-ASR 与 Qwen3-ForcedAligner 正式开源，具备鲁棒性、流式处理与多语言能力。Qwen Studio 同步集成聊天机器人、图像视频理解、图像生成、文档处理、网页搜索、工具调用及 Artifacts 等全栈功能。

开源/仓库开源生态语音

1月27日

19:11

公众号：月之暗面（Kimi）

精选61

Kimi 发布并开源 K2.5 模型，带来全新视觉理解、代码和 Agent 集群能力

智能体多模态开源/仓库模型发布

推荐理由：Kimi K2.5把视觉理解和Agent集群能力打包开源，国内模型里比较早做这个组合的，虽然参数规模争议不小，但对想搭多模态Agent的团队是个可用的起点。

1月22日

00:00

Qwen：Blog Retrieval（API）

Qwen3-TTS 系列现已开源：支持语音设计、克隆与生成！

Qwen Studio 功能全面，涵盖聊天机器人、图像与视频理解、图像生成、文档处理、网页搜索集成、工具调用及 artifacts 等模块。

开源/仓库语音

00:00

Moonshot AI：Kimi Blog

精选

Kimi 供应商验证器

Kimi 发布 K2.5 模型时开源 Kimi Vendor Verifier（KVV），用于验证第三方推理实现的准确性。针对开源模型部署渠道多样化导致的质量失控问题，KVV 提供六项关键基准测试，覆盖参数约束验证、多模态流水线、长输出压力测试、工具调用一致性及编程能力评估。项目与 vLLM/SGLang 社区合作修复根因，并提供预发布验证和实时更新的公开排行榜。完整评估在双 H20 8 卡服务器上约需 15 小时。

开源/仓库评测/基准部署/工程

推荐理由：Kimi开源Vendor Verifier，系统性解决开源模型第三方部署质量验证难题

1月19日

22:00

VentureBeat：AI（RSS）

65

Claude Code月费高达200美元，开源替代Goose完全免费

Anthropic旗下的AI编程代理Claude Code每月订阅费高达200美元，且其基于令牌的速率限制引发开发者不满。与此同时，Block公司推出的开源AI代理Goose提供了近乎相同的功能，可在本地机器上完全免费运行，无需订阅费或云端依赖，并能离线工作、保障数据隐私。该项目在GitHub上已获得超过2.6万颗星，成为Claude Code的热门替代选择。

智能体 Anthropic GitHub 开源/仓库

1月16日

08:13

Hacker News：AI 热帖

Show HN：Gambit，开源 AI agent 框架，用类型化 deck 构建可靠工作流

Gambit 是一款开源 AI agent 开发框架，通过组合小型、类型化的「deck」模块构建可靠 LLM 工作流，支持本地运行、流式跟踪与内置调试 UI。提供 REPL、场景模拟和评分等 CLI 工具，解决长提示词路由失控、上下文膨胀导致的高成本与幻觉问题，实现可离线测试的精细化编排。

智能体开源/仓库部署/工程

00:00

LMSYS：Blog（Chatbot Arena 团队）

SGLang-Diffusion：发布两月进展综述

SGLang-Diffusion 最新版本（lmsysorg/sglang:dev-pr-17247）性能较初始版本提升2.5倍，在NVIDIA GPU上较其他方案快5倍。新增Day-0支持Flux.2、Qwen-Image系列、Z-Image-Turbo等多款模型，完整支持LoRA格式与HTTP API，并推出ComfyUI集成插件。技术层面引入Layerwise Offload机制实现计算与权重加载重叠，支持SP/TP混合并行及SageAttention系列后端，兼容AMD、4090、5090及MUSA硬件。

图像生成开源/仓库部署/工程

1月15日

08:00

Hugging Face：Blog（RSS）

精选80

开放回应：你需要知道的事

OpenAI 正通过开源与开放科学推进人工智能的民主化进程。其核心目标是降低 AI 技术的门槛，促进更广泛的参与和创新。这一举措将推动研究透明化，加速技术迭代，并鼓励全球协作共同构建 AI 的未来。

产品更新开源/仓库开源生态

推荐理由：开源替代方案降低 AI API 依赖，开发者多一个免费可控的选择

00:00

LMSYS：Blog（Chatbot Arena 团队）

SGLang 优化 Pipeline Parallelism 支持百万 Token 超长上下文

SGLang 发布面向超长上下文推理的 Pipeline Parallelism（PP）优化实现，集成 Chunked PP、异步 P2P 通信与动态分块机制。在 H20 集群 PP4 TP8 配置下，DeepSeek-V3.1 的 Prefill Throughput 较 TP8 提升 3.31 倍，较 TP32 领先 30.5%，TTFT 降低 67.9%，强扩展效率达 82.8%。该方案兼容 PD 分离与 HiCache，为万亿参数模型百万 Token 上下文推理提供高效开源路径。

开源/仓库部署/工程

1月12日

22:23

Hacker News：AI 热帖

精选

Agent-of-empires：OpenCode 与 Claude Code 会话管理器

Agent-of-empires（AoE）是一款支持 Linux 与 macOS 的 AI 编码代理会话管理器，兼容 Claude Code、OpenCode 等 9 种主流 AI 工具。该工具基于 tmux 实现会话持久化，支持在多分支代码库上并行运行多个代理，提供 Docker 沙盒隔离、Git worktrees 管理及实时状态检测，并可通过 Web 仪表板或 Cloudflare 隧道从手机远程访问，解决多代理协作时的状态追踪与工作环境隔离问题。

智能体开源/仓库编码

推荐理由：同时管理多个AI编码代理，手机远程监控不再乱套

00:00

LMSYS：Blog（Chatbot Arena 团队）

SGLang EPD 分离架构：视觉语言模型的弹性编码器扩展

SGLang推出EPD（Encoder-Prefill-Decode）分离架构，将视觉编码与语言处理解耦，支持编码器独立横向扩展以替代低效的张量并行。该方案兼容现有PD分离，支持ZMQ、Mooncake等传输后端及视觉嵌入缓存。测试表明，在图像密集型场景（如多图输入）且1 QPS负载下，首token生成时间（TTFT）较同机部署降低约6–8倍；但在图像轻量场景中，网络开销可能导致性能下降。

多模态开源/仓库部署/工程

1月8日

04:00

VentureBeat：AI（RSS）

46

Nous Research发布开源编程模型NousCoder-14B，直面Claude Code竞争

开源AI公司Nous Research近日发布了编程模型NousCoder-14B。该模型基于Qwen3-14B，在LiveCodeBench v6评测中准确率达67.87%，较基础模型提升7.08个百分点。其最大特点是完全开源，不仅公开模型权重，还发布了完整的强化学习环境、基准测试套件和训练框架，使研究者能够复现其工作。模型仅用4天时间在48块NVIDIA B200 GPU上完成训练，性能可匹配或超越部分大型专有系统。此次发布正值Anthropic的Claude Code引发广泛讨论之际，凸显了AI编程助手领域的激烈竞争。

开源/仓库模型发布编码

12月23日

00:00

MiniMax：Blog（网页）

53

MiniMax M2.1：显著增强多语言编程能力，专为现实世界复杂任务打造

MiniMax 发布 M2.1 模型，是对 M2 的更新。其核心升级在于系统提升了在 Rust、Java、Golang 等多语言编程任务上的性能，并达到行业领先水平。同时，模型显著增强了原生 Android 与 iOS 开发能力，以及在 Web/App 场景下的设计理解与美学表达。M2.1 优化了复合指令约束以更好地支持办公场景，响应更简洁高效。该模型在 Claude Code、Cline 等各类编程工具与 AI 智能体框架中表现出色。在衡量全栈开发能力的 VIBE 新基准上，取得了平均 88.6 分的成绩。

开源/仓库模型发布编码

00:00

LMSYS：Blog（Chatbot Arena 团队）

SpecBundle与SpecForge v0.2发布：生产级投机解码模型与框架

SpecForge团队联合蚂蚁、美团、Nex-AGI与EigenAI发布SpecBundle第一阶段及SpecForge v0.2框架。SpecBundle提供基于大规模数据集训练的生产级EAGLE-3草稿模型，覆盖Llama-3.1/3.3/4、Qwen3、Kimi-K2等十余种主流架构，解决开源社区高质量草稿模型稀缺问题。SpecForge v0.2重构数据处理管道，数据再生速度提升10倍，并新增多后端支持，进一步增强系统可扩展性与生产就绪能力。

开源/仓库开源生态部署/工程

12月19日

00:00

LMSYS：Blog（Chatbot Arena 团队）

SGLang实现扩散LLM框架：支持LLaDA 2.0-flash

Ant Group DeepXPU团队与SGLang团队合作，在SGLang推理引擎中实现了扩散大语言模型（dLLM）框架，为100B参数的LLaDA 2.0-flash提供首日支持。该方案复用现有Chunked-Prefill机制适配Block Diffusion架构，通过修改prefill adder和chunked reqs组件实现多Diffusion Blocks批处理，无需改动SGLang核心即可继承生产级推理优化，并支持用户灵活定制扩散解码算法。

开源/仓库推理部署/工程

12月18日

09:00

公众号：蚂蚁百灵（Ling）

32

AEnvironment - 面向 Agentic RL 时代的环境系统，开箱即用，万物互联

AEnvironment 是专为 Agentic RL 打造的基础设施，将环境搭建从写脚本转变为调用服务，实现开箱即用和万物互联。

智能体开源/仓库部署/工程

08:00

Hugging Face：Blog（RSS）

精选73

Transformers v5 中的分词：更简单、清晰与模块化

Transformers v5 发布了全新的分词处理架构，核心变化是引入了更简单、统一的 API 设计，将分词器、后处理器和解码器模块化。新版移除了大量遗留代码，使代码库体积减少了约 40%，并显著提升了处理长文本和特殊 token 的灵活性。这一改进旨在降低开发者使用门槛，同时为各类大语言模型（如 GPT、Claude、LLaMA）提供更高效、一致的分词支持。

Hugging Face 开源/仓库数据/训练

推荐理由：Transformers库tokenization模块重构，开发者可更高效处理文本数据。

12月16日

18:14

Google DeepMind：Blog（RSS）

Gemma Scope 2：助力 AI 安全社区深入理解复杂语言模型行为

Gemma Scope 2 正式发布，面向整个 Gemma 3 模型家族推出开放可解释性工具，助力 AI 安全社区深入理解复杂语言模型行为。

DeepMind Google 安全/对齐开源/仓库

16:55

蚂蚁 inclusionAI：GitHub 新仓库

49

inclusionAI/AEnvironment

inclusionAI 发布了 AEnvironment，这是一个用于智能体 AI 开发的标准化环境基础设施。该平台旨在为 AI 智能体的构建、测试和部署提供统一、可复现的环境，解决开发过程中因环境差异导致的兼容性与一致性问题。它通过预配置的标准化设置，简化了开发流程，提升了协作效率与系统可靠性。

智能体开源/仓库部署/工程

00:01

Hugging Face：Blog（RSS）

精选83

CUGA 登陆 Hugging Face：普及可配置的通用 AI 智能体

开源可配置通用智能体 CUGA 现已集成至 Hugging Face Spaces，便于开发者便捷实验。该智能体在复杂任务基准测试中表现卓越，在包含 457 个 API、750 个真实任务的 AppWorld 基准排名第一，在 WebArena 基准也位居前列。其核心提供可配置的推理模式以平衡性能与成本，支持计算机使用与多工具无缝集成，并能与 Langflow 结合进行低代码工作流设计。采用 Apache 2.0 许可的 CUGA 支持多种开源模型，在高性能推理平台（如 Groq）上运行能显著提升效率。

智能体 Hugging Face MCP/工具开源/仓库

推荐理由：开源AI代理框架性能领先，集成Hugging Face和Langflow，开发者可快速构建复杂任务。

12月11日

23:47

Hugging Face：Blog（RSS）

精选76

llama.cpp 服务器新增多模型管理功能

llama.cpp 服务器新增了类似 Ollama 的多模型管理功能。该功能采用多进程架构，每个模型独立运行，确保单个模型崩溃不影响其他服务。系统支持自动发现本地 GGUF 模型文件、按需加载，并默认采用 LRU 机制管理最多同时加载4个模型。用户可通过请求中的模型字段路由到特定模型，并可使用 API 进行加载、卸载和列表查看。所有加载的模型可继承路由器的统一设置，也支持通过预设文件为每个模型单独配置参数。内置 Web UI 同样支持模型切换。

开源/仓库端侧部署/工程

推荐理由：本地跑模型终于能像 Ollama 一样热切换，开发调试效率大幅提升

23:36

蚂蚁 inclusionAI：GitHub 新仓库

49

inclusionAI/LLaDA2.X

蚂蚁集团InclusionAI团队推出扩散语言模型系列LLaDA2.0。该系列模型基于扩散架构开发，专注于语言生成任务，是团队在大型语言模型领域的最新成果。

开源/仓库数据/训练模型发布

08:00

Hugging Face：Blog（RSS）

28

Codex 开源其 AI 模型

Codex 宣布将开源其人工智能模型。这一举措旨在通过开源和开放科学的方式，推动人工智能技术的进步与民主化。公司表示，开源模型将允许更广泛的研究人员和开发者访问、使用并在此基础上进行创新，从而加速AI领域的发展。此举也呼应了当前AI社区对增加透明度与协作的呼声。

12月10日

00:00

LMSYS：Blog（Chatbot Arena 团队）

让张量飞起来 -- 用 R-Fork 加速大模型权重加载

蚂蚁集团 DeepXPU 团队与 SGLang 团队联合发布 Tensor R-Fork（Tensor Remote Fork）技术，通过 GPU-Direct RDMA 实现节点间设备到设备的零拷贝权重传输。该技术可将 Deepseek-R1 模型的加载时间从数分钟缩短至数秒，减少约 600GB 的本地磁盘与 DRAM 存储占用，并提供 NCCL 和 TransferEngine 两种后端方案，后者可在不干扰线上推理服务的情况下完成权重迁移。

DeepSeek 开源/仓库开源生态部署/工程

12月9日

00:00

Mistral AI：News（网页）

60

Mistral AI 发布下一代代码模型 Devstral 2 及命令行工具 Mistral Vibe CLI

Mistral AI 发布新一代代码模型家族 Devstral 2，包含 Devstral 2 (123B) 和 Devstral Small 2 (24B) 两个开源版本。Devstral 2 采用修改的 MIT 许可证，在 SWE-bench Verified 上达到 72.2%，成本效益比 Claude Sonnet 高达 7 倍。Devstral Small 2 (24B) 采用 Apache 2.0 许可证，可部署在消费级硬件上。两者均支持 256K 上下文窗口。同步发布由 Devstral 驱动的开源命令行工具 Mistral Vibe CLI，用于在终端实现代码的自动化探索与修改。

开源/仓库模型发布编码

12月5日

08:00

Hugging Face：Blog（RSS）

精选76

介绍 swift-huggingface：完整的 Hugging Face Swift 客户端

swift-huggingface 是一个全新的 Swift 客户端，旨在彻底解决旧库下载模型缓慢、不可靠且不支持断点续传的问题。它提供完整的 Hub API 覆盖，核心改进包括具备进度跟踪和断点续传的可靠下载、与 Python 生态共享缓存以避免重复下载，以及通过灵活的 TokenProvider 模式简化身份验证。该库现已独立发布，并将很快集成到 swift-transformers 中取代原有实现，未来还将支持 Xet 存储后端以实现更快的下载。

Hugging Face 开源/仓库部署/工程

推荐理由：Swift 开发者可无缝集成 Hugging Face 模型，下载更可靠且与 Python 共享缓存。

12月4日

08:00

Hugging Face：Blog（RSS）

66

DeepMath：一个基于 smolagents 的轻量级数学推理智能体

研究团队发布了 DeepMath，一个轻量级的数学推理智能体。该智能体基于 smolagents 框架构建，旨在提升模型解决复杂数学问题的能力。DeepMath 的设计强调轻量化，力求在保持高效推理性能的同时降低计算资源消耗。其发布是团队通过开源与开放科学推动人工智能技术发展与普及的举措之一。

智能体 Hugging Face 开源/仓库推理

12月3日

21:45

蚂蚁 inclusionAI：GitHub 新仓库

精选63

蚂蚁集团开源AState：面向强化学习的高性能状态管理系统

蚂蚁集团开源了AState，这是一个专为强化学习设计的高性能通用状态数据管理系统。它旨在解决RL训练与推理中的I/O效率低下、权重同步性能不足及状态恢复不鲁棒等核心挑战。系统采用三层架构：提供张量原生接口的API层、支持多种部署模式的服务层以及具备高效可扩展传输能力的基础层。其关键特性包括统一的张量级API、高性能权重同步和拓扑感知设计。在万亿参数规模下，AState能在约6秒内完成权重同步，远低于业界常见的分钟级延迟，目前已作为ASystem的关键组件在蚂蚁内部生产环境部署。

智能体开源/仓库部署/工程

推荐理由：蚂蚁把万亿参数 RL 训练的权重同步从分钟级压到 6 秒，这套 AState 系统是真刀真枪的工程解法，做大规模 RL infra 的团队值得拆一拆它的 RDMA P2P 架构。

1…21 222324 25