全部 AI 动态 · AI HOT

内容

精选全部 AI 动态 AI 日报主题收藏

接入

更多

关于更新日志反馈

内部员工登录

精选全部日报更多

内部员工登录

全部动态

全部一手资讯 X 论文

标签「开源生态」清除

2月25日周三

01:34Jim Fan精选SONIC：半个GPT-1规模的机器人全身控制模型

2月20日周五

08:00Hugging Face：Blog（RSS）86精选GGML 和 llama.cpp 加入 HF 以确保 Local AI 的长期进展

2月18日周三

01:27Nathan Lambert：Interconnects（RSS）精选开源模型的永无止境的追赶

2月14日周六

15:48蚂蚁 inclusionAI：HuggingFace 新模型44inclusionAI/Ling-2.5-1T

2月13日周五

16:03公众号：智谱（GLM）57GLM-5霸榜六大权威榜单

2月12日周四

16:53蚂蚁 inclusionAI：HuggingFace 新模型39inclusionAI/ZwZ-4B

16:52蚂蚁 inclusionAI：HuggingFace 新模型34inclusionAI/ZwZ-7B

2月11日周三

20:18蚂蚁 inclusionAI：GitHub 新仓库51inclusionAI/Ming-omni-tts

11:12蚂蚁 inclusionAI：HuggingFace 新模型32inclusionAI/Ming-omni-tts-tokenizer-12Hz

11:10蚂蚁 inclusionAI：HuggingFace 新模型39inclusionAI/Ming-omni-tts-0.5B

10:49蚂蚁 inclusionAI：HuggingFace 新模型37inclusionAI/Ming-omni-tts-16.8B-A3B

2月10日周二

20:45蚂蚁 inclusionAI：HuggingFace 新模型42inclusionAI/Ring-2.5-1T

15:55公众号：月之暗面（Kimi）49Kimi K2.5 已入驻阿里、腾讯、字节 AI 编程工具

14:57蚂蚁 inclusionAI：HuggingFace 新模型41inclusionAI/Ming-flash-omni-2.0

2月6日周五

18:00公众号：生数科技（Vidu·视频）48生数科技携手清华大学开源统一世界模型Motus，性能全面超越Pi0.5 40%

00:00字节 Seed：Research Papers（网页内嵌数据）Protenix-v1：迈向高精度开源生物分子结构预测

2月5日周四

02:00Nathan Lambert：Interconnects（RSS）精选Nvidia 为何构建开源模型：对话 Bryan Catanzaro

2月4日周三

08:00Hugging Face：Blog（RSS）76精选Community Evals：因为我们不再信任黑箱排行榜胜过社区

2月3日周二

23:03Hugging Face：Blog（RSS）80精选全球开源AI生态系统的未来：从 DeepSeek 到 AI+

00:00智谱：研究（网页内嵌数据）GLM-OCR发布：性能SOTA，搞定复杂文档

2月2日周一

21:03Nathan Lambert：Interconnects（RSS）最新开源模型（第18期）：Arcee 400B MoE、LiquidAI 被低估的 1B 模型、新版 Kimi，以及本月密集发布的预期

1月31日周六

08:18Jim Fan精选我还记得2023年Stanford Smallville发布时的兴奋。那是当时最大的多智能体模拟--没错，25个bot感觉已经很多了。今天是"Bigville"时刻。我们正在看到一个新生的、大规模的外星文明模拟实时展开：数量级更多的agent、高得多的IQ、不受限制的互联网接入，由全套MCPs提供支持。能出什么问题呢？【引用 @DrJimFan】：著名的Stanford Smallville正式开源！ 25个AI agent居住在一个数字版Westworld中，不知道自己生活在模拟里。他们上班、八卦、组织社交活动、结交新朋友，甚至坠入爱河。每个都有独特的个性和背景故事。 Smallville是2023年最鼓舞人心的AI agent实验之一。我们经常谈论单个LLM的涌现能力，但多智能体涌现在大规模下可能更加复杂和迷人。一个AI群体可以演绎整个文明的演化。前方有无限新的可能性。游戏将首先感受到影响。 Github： https://github.com/joonspk-research/generative_agents Paper： https://arxiv.org/abs/2304.03442 Authors： @joon_s_pk @joseph_c_obrien @carriejcai @merrierm @percyliang @msbernst

1月29日周四

15:35Steve Yegge：Medium（RSS）51Software Survival 3.0

00:00Qwen：Blog Retrieval（API）Qwen3-ASR 与 Qwen3-ForcedAligner 正式开源：鲁棒、流式、多语言！

1月28日周三

15:51公众号：腾讯混元5710亿红包后，我们打算开源这个800亿的模型

06:47Nathan Lambert：Interconnects（RSS）精选Arcee AI 全力投入在美国构建的开放模型

1月27日周二

23:01Hugging Face：Blog（RSS）83精选中国开源AI生态中的架构选择：构建超越DeepSeek的未来

16:03美团 LongCat：HuggingFace 新模型美团 LongCat 发布 LongCat-Flash-Lite

1月24日周六

06:40Saining Xie> "rae 无法扩展" > "rae 无法泛化到 imagenet 之外" > "rae 无法处理细节" > 没有在网上争论 > 学生们埋头苦干 > 在真正的 t2i 规模上尝试 > 结果出来了 > 看起来非常乐观 > 向 peter、boyang、austin > 以及所有交付成果的人致敬 > 代码、模型、数据 > 全部开源 👇 【引用 @TongPetersb】：去年十月，我们提出了 Representation Autoencoders （RAE），展示了在冻结的语义表示上训练扩散模型是可行的，并且在 ImageNet 上优于 VAEs。我们收到了很多问题：这能否扩展到像 T2I 这样的复杂场景？优势是否依然存在？答案是肯定的。🧵

1月23日周五

10:50美团 LongCat：HuggingFace 新模型美团 LongCat 发布 Flash-Thinking-ZigZag 模型

1月20日周二

00:00智谱：研究（网页内嵌数据）精选GLM-4.7-Flash开源、免费

1月15日周四

08:00Hugging Face：Blog（RSS）80精选开放回应：你需要知道的事

1月14日周三

00:00智谱：研究（网页内嵌数据）精选智谱联合华为开源首个国产芯片训练的多模态SOTA模型

1月7日周三

12:07公众号：蚂蚁百灵（Ling）58蚂蚁·安诊儿开源：基于百灵的医疗大模型

1月5日周一

17:16Hugging Face：Blog（RSS）73精选Introducing Falcon-H1-Arabic：以混合架构突破阿拉伯语AI的边界

12月23日周二

00:00LMSYS：Blog（Chatbot Arena 团队）SpecBundle与SpecForge v0.2发布：生产级投机解码模型与框架

12月17日周三

08:01公众号：小米 MiMo52小米 MiMo-V2-Flash 开源：高效推理、代码与 Agent 基座模型

12月16日周二

18:14Google DeepMind：Blog（RSS）Gemma Scope 2：助力 AI 安全社区深入理解复杂语言模型行为

12月11日周四

00:00智谱：研究（网页内嵌数据）精选GLM-TTS：基于多奖励融合强化学习，实现工业级语音合成

12月10日周三

00:00LMSYS：Blog（Chatbot Arena 团队）让张量飞起来 -- 用 R-Fork 加速大模型权重加载

全部 AI 动态

AI 相关资讯全量信息流

全部一手信源资讯推文

全部模型产品行业论文技巧

2月25日

01:34

Jim Fan@DrJimFan

精选

SONIC：半个GPT-1规模的机器人全身控制模型

SONIC是一个4200万参数的Transformer模型（规模仅半个GPT-1），通过1亿+动作捕捉帧和50万+并行机器人在NVIDIA Isaac Lab中训练，以密集帧级监督替代手工奖励函数。训练3天后零样本迁移至真实G1机器人，在50种动作序列上达100%成功率。单一策略支持VR遥操作、视频动捕、文本指令、音乐响应及VLA模型控制。项目已完全开源。

智能体具身智能开源生态模型发布

推荐理由：42M小模型实现人形机器人全身控制，零样本迁移真实硬件且完全开源，开发者可复现

2月20日

08:00

Hugging Face：Blog（RSS）

精选86

GGML 和 llama.cpp 加入 HF 以确保 Local AI 的长期进展

GGML 和 llama.cpp 团队正式加入 Hugging Face，以支持本地 AI 社区的长期扩展。创始人 Georgi Gerganov 及团队将全职维护 llama.cpp，保持 100% 技术自主权和社区领导力，项目继续 100% 开源和社区驱动。Hugging Face 提供长期可持续资源，助力项目增长。技术上将优化 transformers 库与 llama.cpp 的无缝集成，实现近乎“一键式”的模型部署，并改进基于 GGML 的软件打包和用户体验。长期愿景是构建高效本地推理堆栈，推动开源超级智能的普及。

开源生态端侧行业动态

推荐理由：本地推理核心引擎获得长期资源保障，端侧 AI 生态稳定性大幅提升

2月18日

01:27

Nathan Lambert：Interconnects（RSS）

精选

开源模型的永无止境的追赶

开源模型与闭源巨头（如 GPT、Claude）之间的能力差距持续存在，形成永无止境的追赶态势。文章探讨了知识蒸馏技术对缩小差距的作用，分析了开源与闭源模型在创新时间尺度上的差异，以及开源模型如何通过专业化模型在特定领域寻找获胜路径。同时指出当前开源生态在基础研究和资源投入上的缺失环节，并评估了这种追赶模式的可持续性。

大佬观点开源生态现象/趋势

推荐理由：开源与闭源鸿沟难越，但蒸馏与专业化或是破局关键

2月14日

15:48

蚂蚁 inclusionAI：HuggingFace 新模型

44

inclusionAI/Ling-2.5-1T

inclusionAI 发布了 Ling-2.5-1T 模型。该模型参数规模达到 1 万亿，是其 Ling 系列的最新版本。此次发布延续了通过开源和开放科学来推进人工智能民主化的使命，旨在让先进 AI 技术更广泛可及。新版本预计在语言理解与生成能力上有所提升，继续为全球研究社区提供强大的基础模型支持。

开源生态推理模型发布

2月13日

16:03

公众号：智谱（GLM）

57

GLM-5霸榜六大权威榜单

GLM-5发布后在六个权威榜单中表现突出：AA Intelligence Index全球第四、开源第一；AA Omniscience幻觉率全球最低（34%）；Code Arena与Text Arena均为开源第一；Design Arena全球第三。发布首日登顶Hugging Face全球趋势榜。

开源生态行业动态

2月12日

16:53

蚂蚁 inclusionAI：HuggingFace 新模型

39

inclusionAI/ZwZ-4B

inclusionAI发布了ZwZ-4B开源模型。该模型参数量为40亿，基于Transformer架构，上下文窗口为32K。其训练数据包含2万亿Token，涵盖代码、数学及多语言文本。模型采用分组查询注意力机制，支持16位与32位浮点精度。团队旨在通过开源推动人工智能技术的普及与发展。

开源生态模型发布

16:52

蚂蚁 inclusionAI：HuggingFace 新模型

34

inclusionAI/ZwZ-7B

inclusionAI 发布了 ZwZ-7B 模型，这是一个拥有70亿参数的开源大语言模型。该模型基于先进的 Transformer 架构，在多项基准测试中性能显著提升，尤其在代码生成和数学推理任务上表现突出。其上下文窗口扩展至 128K 令牌，并采用了分组查询注意力等高效技术。模型权重已完全开源，旨在通过开放科学推动人工智能技术的民主化与普及。

开源生态模型发布

2月11日

20:18

蚂蚁 inclusionAI：GitHub 新仓库

51

inclusionAI/Ming-omni-tts

inclusionAI 发布了 Ming-omni-tts，这是一个能够统一生成语音、音乐和声音的模型。该模型的核心特点是结构简单高效，并实现了对生成内容的精确控制。它通过一个统一的框架处理多种音频模态，简化了传统上需要不同模型分别处理语音、音乐和音效的流程。这一进展为跨模态音频内容的创作与编辑提供了更便捷、可控的工具。

开源生态模型发布语音

11:12

蚂蚁 inclusionAI：HuggingFace 新模型

32

inclusionAI/Ming-omni-tts-tokenizer-12Hz

inclusionAI团队发布了Ming-omni-tts-tokenizer-12Hz开源项目，这是一个面向文本转语音（TTS）的通用分词器。该模型支持12Hz的高采样率，旨在提升语音合成的自然度与表现力。项目基于开源与开放科学的理念推进，致力于让人工智能技术更加普及和易得。

开源生态模型发布语音

11:10

蚂蚁 inclusionAI：HuggingFace 新模型

39

inclusionAI/Ming-omni-tts-0.5B

inclusionAI 发布了 Ming-omni-tts-0.5B，这是一个参数规模为 0.5B（5亿）的文本转语音模型。该模型旨在通过开源和开放科学的方式，推动人工智能技术的进步与普及。发布标志着在语音合成领域，一个中等规模、可公开访问的模型正式加入开源生态。

开源生态模型发布语音

10:49

蚂蚁 inclusionAI：HuggingFace 新模型

37

inclusionAI/Ming-omni-tts-16.8B-A3B

inclusionAI发布了开源文本转语音模型Ming-omni-tts-16.8B-A3B，参数量达168亿。该模型采用创新的A3B混合专家架构，在语音自然度、多语言支持和情感表现方面实现显著提升。项目遵循开源开放科学理念，旨在推动人工智能技术的民主化进程。

开源生态模型发布语音

2月10日

20:45

蚂蚁 inclusionAI：HuggingFace 新模型

42

inclusionAI/Ring-2.5-1T

inclusionAI 发布了 Ring-2.5-1T，这是一个拥有 1 万亿参数规模的大型语言模型。该模型旨在通过开源和开放科学的方式，推动人工智能技术的进步与普及。此次发布标志着在构建超大规模、可访问的 AI 模型方面取得了重要进展，为更广泛的研究社区提供了强大的基础工具。

开源生态推理模型发布

15:55

公众号：月之暗面（Kimi）

49

Kimi K2.5 已入驻阿里、腾讯、字节 AI 编程工具

Kimi K2.5 是月之暗面迄今最智能且最全能的模型，在 Agent、代码、图像、视频及通用智能任务上取得开源 SOTA 表现。原生多模态架构同时支持视觉与文本输入、思考与非思考模式、对话与 Agent 任务。发布后在 OpenRouter 上周调用量达 1.3 万亿 tokens，超越 Gemini 3、Claude Sonnet 4.5，成为全球开发者调用量最大的模型。

产品更新开源生态编码

14:57

蚂蚁 inclusionAI：HuggingFace 新模型

41

inclusionAI/Ming-flash-omni-2.0

inclusionAI 发布了 Ming-flash-omni 2.0 版本。该项目致力于通过开源与开放科学的方式，推动人工智能技术的进步与民主化。新版本意味着模型能力、效率或应用范围的进一步升级，延续了其降低AI技术门槛、促进广泛可及性与协作创新的核心目标。

多模态开源生态模型发布

2月6日

18:00

公众号：生数科技（Vidu·视频）

48

生数科技携手清华大学开源统一世界模型Motus，性能全面超越Pi0.5 40%

生数科技与清华大学联合开源统一世界模型Motus，该模型在性能上全面超越Pi0.5，提升幅度达40%。

具身智能开源生态模型发布

00:00

字节 Seed：Research Papers（网页内嵌数据）

Protenix-v1：迈向高精度开源生物分子结构预测

基于提供的GitHub仓库元数据，Protenix-v1是一个开源生物分子结构预测项目，其技术报告以PDF形式发布（PTX_V1_Technical_Report）。该仓库已获得1.8k星标和262个分支，显示社区关注度较高。但受限于提供的正文仅为文件列表界面，未包含技术报告实际章节，无法提取模型在基准测试中的具体准确率数值、参数规模、训练数据量或架构创新细节等关键技术指标。

开源生态论文/研究

2月5日

02:00

Nathan Lambert：Interconnects（RSS）

精选

Nvidia 为何构建开源模型：对话 Bryan Catanzaro

Interconnects 第17期访谈中，Nvidia 副总裁 Bryan Catanzaro 系统回顾了 Nemotron 开源模型项目的技术演进与战略定位。访谈涵盖该系列模型从研发初期到当前版本的迭代历程，剖析了英伟达在开源 AI 领域的布局逻辑，并披露了 Nemotron 在合成数据生成与模型训练效率方面的最新进展及未来规划。

大佬观点开源生态数据/训练

推荐理由：NVIDIA副总裁亲述开源模型战略，揭示芯片巨头如何通过开放生态锁定行业标准

2月4日

08:00

Hugging Face：Blog（RSS）

精选76

Community Evals：因为我们不再信任黑箱排行榜胜过社区

LMSys 推出了社区驱动的评估框架 Community Evals，旨在通过开源和开放科学推进人工智能民主化。该框架允许社区贡献和审查评估案例，以透明、可复现的方式测试模型。此举旨在改变依赖少数机构“黑箱”排行榜的现状，让更广泛的社区参与定义和衡量AI模型的能力与价值。

Hugging Face 开源生态评测/基准

推荐理由：Hugging Face 推社区评测挑战黑盒排行榜，开源生态评测标准可能改变

2月3日

23:03

Hugging Face：Blog（RSS）

精选80

全球开源AI生态系统的未来：从 DeepSeek 到 AI+

Hugging Face 在其官方博客发布文章，展望了全球开源人工智能生态系统的发展路径与未来趋势。文章以 DeepSeek 等代表性开源模型为例，探讨了开源社区如何推动技术民主化与创新加速。核心观点指向一个更加开放、协作的“AI+”未来生态，其中开源框架、模型和工具将深度融入各行各业，降低开发门槛并促进多样化应用场景的涌现。

DeepSeek Hugging Face 开源生态现象/趋势

推荐理由：开源AI核心平台对生态走向的判断，直接影响开发者技术选型和投资方向

00:00

智谱：研究（网页内嵌数据）

GLM-OCR发布：性能SOTA，搞定复杂文档

GLM-OCR 开源发布，0.9B 参数规模在 OmniDocBench V1.5 以 94.6 分取得 SOTA，擅长手写体、复杂表格、印章等场景结构化识别。兼容 vLLM、SGLang 和 Ollama 部署，推理延迟低，适合高并发与边缘计算，提供完整 SDK 支持一行命令调用。

多模态开源生态模型发布端侧

2月2日

21:03

Nathan Lambert：Interconnects（RSS）

最新开源模型（第18期）：Arcee 400B MoE、LiquidAI 被低估的 1B 模型、新版 Kimi，以及本月密集发布的预期

本期开源模型动态涵盖 Arcee 400B MoE、LiquidAI 1B 及新版 Kimi 等实用小众模型。Arcee 发布 4000 亿参数 MoE 架构模型，LiquidAI 推出性能被低估的 10 亿参数方案，Kimi 迎来重要更新。业界预期本月将迎来密集的大模型发布潮，多款重要产品即将面世。

开源/仓库开源生态端侧

1月31日

08:18

Jim Fan@DrJimFan

精选

我还记得2023年Stanford Smallville发布时的兴奋。那是当时最大的多智能体模拟--没错，25个bot感觉已经很多了。今天是"Bigville"时刻。我们正在看到一个新生的、大规模的外星文明模拟实时展开：数量级更多的agent、高得多的IQ、不受限制的互联网接入，由全套MCPs提供支持。能出什么问题呢？【引用 @DrJimFan】：著名的Stanford Smallville正式开源！ 25个AI agent居住在一个数字版Westworld中，不知道自己生活在模拟里。他们上班、八卦、组织社交活动、结交新朋友，甚至坠入爱河。每个都有独特的个性和背景故事。 Smallville是2023年最鼓舞人心的AI agent实验之一。我们经常谈论单个LLM的涌现能力，但多智能体涌现在大规模下可能更加复杂和迷人。一个AI群体可以演绎整个文明的演化。前方有无限新的可能性。游戏将首先感受到影响。 Github： https://github.com/joonspk-research/generative_agents Paper： https://arxiv.org/abs/2304.03442 Authors： @joon_s_pk @joseph_c_obrien @carriejcai @merrierm @percyliang @msbernst

Jim Fan: The famed Stanford Smallville is officially open-source! 25 AI agents inhabit a digital Westworld, unaware that they are...

智能体开源/仓库开源生态

推荐理由：经典Agent实验首次开源，个人开发者可搭建AI虚拟社会观察涌现行为

1月29日

15:35

Steve Yegge：Medium（RSS）

51

Software Survival 3.0

作者基于对AI指数级发展的预测，于2025年末构建了Gas Town项目，以验证软件编排（orchestration）的早期形态。文章指出，在未来AI能编写几乎所有软件的“Software 3.0”时代，选择压力将遵循一条核心法则：节省认知资源的软件更可能生存。由于推理（Inference）消耗Token，而Token、能源与成本相互关联且受限，因此最小化认知支出（可量化为Token消耗）成为关键。作者主张，系统应优先使用能完成任务的最小模型，并通过编排将任务分配给合适的模型层，以节约能源与成本。

智能体大佬观点开源生态

00:00

Qwen：Blog Retrieval（API）

Qwen3-ASR 与 Qwen3-ForcedAligner 正式开源：鲁棒、流式、多语言！

Qwen3-ASR 与 Qwen3-ForcedAligner 正式开源，具备鲁棒性、流式处理与多语言能力。Qwen Studio 同步集成聊天机器人、图像视频理解、图像生成、文档处理、网页搜索、工具调用及 Artifacts 等全栈功能。

开源/仓库开源生态语音

1月28日

15:51

公众号：腾讯混元

57

10亿红包后，我们打算开源这个800亿的模型

图像生成开源生态模型发布

06:47

Nathan Lambert：Interconnects（RSS）

精选

Arcee AI 全力投入在美国构建的开放模型

Arcee AI 发布开源大模型 Trinity Large，标志着其全面投入在美国本土构建开放模型的战略布局。该发布作为 Interconnects 第16期访谈的核心内容，彰显该公司对开源生态与数据主权的承诺。Trinity Large 的推出代表 Arcee AI 在本土 AI 基础设施建设上的关键进展，强调模型训练与开发的地理合规性及技术自主性。

开源生态模型发布

推荐理由：开源模型Trinity Large发布，美国本土训练的企业级合规新选择

1月27日

23:01

Hugging Face：Blog（RSS）

精选83

中国开源AI生态中的架构选择：构建超越DeepSeek的未来

Hugging Face发布博客文章，探讨中国开源人工智能生态系统的核心架构选择与发展路径。文章聚焦于如何构建一个超越现有模型（如DeepSeek）的可持续技术体系，分析了中国开发者在模型架构、训练框架、部署工具和社区协作等方面的关键决策。文中指出，中国开源社区正致力于打造独立且互操作的技术栈，以应对大规模模型训练与推理的独特挑战，并推动全球AI生态的多元化发展。

DeepSeek 开源生态现象/趋势

推荐理由：揭示中国开源AI架构演进，帮助开发者把握生态趋势与选型方向。

16:03

美团 LongCat：HuggingFace 新模型

美团 LongCat 发布 LongCat-Flash-Lite

美团 LongCat 团队发布开源模型 LongCat-Flash-Lite，致力于通过开源与开放科学推进人工智能技术的普及与民主化。该项目旨在降低 AI 应用门槛，为开发者社区提供轻量级技术基础设施，助力先进人工智能能力的广泛获取与开放协作。

Hugging Face 开源生态模型发布端侧

1月24日

06:40

Saining Xie@sainingxie

> "rae 无法扩展" > "rae 无法泛化到 imagenet 之外" > "rae 无法处理细节" > 没有在网上争论 > 学生们埋头苦干 > 在真正的 t2i 规模上尝试 > 结果出来了 > 看起来非常乐观 > 向 peter、boyang、austin > 以及所有交付成果的人致敬 > 代码、模型、数据 > 全部开源 👇 【引用 @TongPetersb】：去年十月，我们提出了 Representation Autoencoders （RAE），展示了在冻结的语义表示上训练扩散模型是可行的，并且在 ImageNet 上优于 VAEs。我们收到了很多问题：这能否扩展到像 T2I 这样的复杂场景？优势是否依然存在？答案是肯定的。🧵

Peter Tong: Last October, we introduced Representation Autoencoders (RAE), showing that training diffusion on frozen semantic repres...

图像生成开源生态论文/研究

1月23日

10:50

美团 LongCat：HuggingFace 新模型

美团 LongCat 发布 Flash-Thinking-ZigZag 模型

美团 LongCat 团队发布 Flash-Thinking-ZigZag 模型，延续通过开源与开放科学推进人工智能民主化的技术路线。该项目致力于降低 AI 应用门槛，以开源方式使先进技术更广泛地惠及开发者社区，推动 AI 技术的普及与可持续发展。

Hugging Face 开源生态推理模型发布

1月20日

00:00

智谱：研究（网页内嵌数据）

精选

GLM-4.7-Flash开源、免费

GLM-4.7-Flash 开源并免费开放 API，支持通过 Hugging Face 和魔搭社区部署。上一代 GLM-4.5-Flash 将于 2026 年 1 月 30 日下线，届时相关请求将自动路由至新版。

开源生态模型发布端侧

推荐理由：智谱开源轻量模型GLM-4.7-Flash，免费API助力个人开发者快速上手

1月15日

08:00

Hugging Face：Blog（RSS）

精选80

开放回应：你需要知道的事

OpenAI 正通过开源与开放科学推进人工智能的民主化进程。其核心目标是降低 AI 技术的门槛，促进更广泛的参与和创新。这一举措将推动研究透明化，加速技术迭代，并鼓励全球协作共同构建 AI 的未来。

产品更新开源/仓库开源生态

推荐理由：开源替代方案降低 AI API 依赖，开发者多一个免费可控的选择

1月14日

00:00

智谱：研究（网页内嵌数据）

精选

智谱联合华为开源首个国产芯片训练的多模态SOTA模型

智谱联合华为开源多模态生成模型GLM-Image，为首款基于国产昇腾芯片与MindSpore框架全流程训练的SOTA模型。采用9B自回归与7B扩散解码器混合架构，在CVTG-2K复杂视觉文字生成和LongText-Bench长文本渲染榜单均位列开源第一，支持1024×1024至2048×2048多分辨率生成。API调用成本0.1元/张，代码已开源至GitHub、Hugging Face及魔搭社区。

图像生成开源生态模型发布部署/工程

推荐理由：首个国产昇腾芯片训练的SOTA多模态模型开源，文字渲染能力开源第一，生成一张图仅需0.1元

1月7日

12:07

公众号：蚂蚁百灵（Ling）

58

蚂蚁·安诊儿开源：基于百灵的医疗大模型

蚂蚁集团联合浙江省卫健委开源基于百灵高效 MoE 基座 Ling-flash-base-2.0 训练的医疗大模型 AntAngelMed（蚂蚁·安诊儿）。模型总参数 100B，仅 1/32 激活（6.1B）即可媲美约 40B 稠密模型性能，实现约 7 倍性能杠杆。基于 40T+ tokens 高质量语料、20T+ tokens 预训练。在 OpenAI 发起的 HealthBench 评测中登顶全球开源医疗模型第一。训练采用三阶段流程：持续预训练注入医学语料、监督微调、双阶段 GRPO 强化学习。模型已开源，可在 HuggingFace 和 ModelScope 获取。

开源生态模型发布

1月5日

17:16

Hugging Face：Blog（RSS）

精选73

Introducing Falcon-H1-Arabic：以混合架构突破阿拉伯语AI的边界

阿联酋技术创新研究院在Hugging Face发布了Falcon-H1-Arabic模型。该模型采用创新的混合架构，融合了自回归与自编码技术，专门针对阿拉伯语进行优化。其目标是通过提升对阿拉伯语复杂语法和丰富形态的理解与生成能力，显著推进阿拉伯语人工智能的发展。这一发布标志着阿拉伯语大语言模型在技术架构上取得了重要进展。

开源生态模型发布

推荐理由：阿拉伯语AI新模型发布，推动多语言AI应用发展

12月23日

00:00

LMSYS：Blog（Chatbot Arena 团队）

SpecBundle与SpecForge v0.2发布：生产级投机解码模型与框架

SpecForge团队联合蚂蚁、美团、Nex-AGI与EigenAI发布SpecBundle第一阶段及SpecForge v0.2框架。SpecBundle提供基于大规模数据集训练的生产级EAGLE-3草稿模型，覆盖Llama-3.1/3.3/4、Qwen3、Kimi-K2等十余种主流架构，解决开源社区高质量草稿模型稀缺问题。SpecForge v0.2重构数据处理管道，数据再生速度提升10倍，并新增多后端支持，进一步增强系统可扩展性与生产就绪能力。

开源/仓库开源生态部署/工程

12月17日

08:01

公众号：小米 MiMo

52

小米 MiMo-V2-Flash 开源：高效推理、代码与 Agent 基座模型

小米开源了 MiMo-V2-Flash 模型，定位为高效推理、代码与 Agent 基座模型，其 Agent 综合能力在全球开源模型中排名第二。

智能体开源生态模型发布

12月16日

18:14

Google DeepMind：Blog（RSS）

Gemma Scope 2：助力 AI 安全社区深入理解复杂语言模型行为

Gemma Scope 2 正式发布，面向整个 Gemma 3 模型家族推出开放可解释性工具，助力 AI 安全社区深入理解复杂语言模型行为。

DeepMind Google 安全/对齐开源/仓库

12月11日

00:00

智谱：研究（网页内嵌数据）

精选

GLM-TTS：基于多奖励融合强化学习，实现工业级语音合成

GLM-TTS 采用 GRPO 多奖励强化学习框架，融合字符错误率、相似度、情感及笑声奖励，实现 3 秒零样本音色克隆。在 seed-tts-eval 测试中 CER 低至 0.89% 达开源 SOTA，情感表达显著优于阿里、百度等商用模型。支持 15% 参数 LoRA 微调定制精品音色，通过 Phoneme-in 混合输入精准控制多音字发音，配合自研 2D-Vocos 声码器提升音质与音域覆盖。

开源生态模型发布语音

推荐理由：智谱开源GLM-TTS，3秒克隆任意音色并支持喜怒哀乐情感表达

12月10日

00:00

LMSYS：Blog（Chatbot Arena 团队）

让张量飞起来 -- 用 R-Fork 加速大模型权重加载

蚂蚁集团 DeepXPU 团队与 SGLang 团队联合发布 Tensor R-Fork（Tensor Remote Fork）技术，通过 GPU-Direct RDMA 实现节点间设备到设备的零拷贝权重传输。该技术可将 Deepseek-R1 模型的加载时间从数分钟缩短至数秒，减少约 600GB 的本地磁盘与 DRAM 存储占用，并提供 NCCL 和 TransferEngine 两种后端方案，后者可在不干扰线上推理服务的情况下完成权重迁移。

DeepSeek 开源/仓库开源生态部署/工程

1…32 333435 36