11月28日

02:07

Saining Xie@sainingxie

今天看似平常，却可能成为同行评审和开放科学史上最奇怪的时刻请、请、请善待我们的社区。它已经很脆弱了。不要让它消亡。【引用 @iclr_conf】：

大佬观点开源生态论文/研究

11月23日

00:00

LMSYS：Blog（Chatbot Arena 团队）

LMSYS 启动奖学金计划

LMSYS 宣布设立奖学金计划，资助对美国开源 AI 基础设施社区有重大贡献的全日制博士生。获奖者将在未来两年内获得最高 50,000 美元用于支付学费，申请窗口为 2025 年 11 月 23 日至 12 月 7 日。评选将基于研究影响力、开源贡献及与 LMSYS 兴趣领域的契合度，申请者需邮件提交申请陈述与简历。该项目由 Ying and Lianmin Giving Fund 捐赠支持。

开源生态行业动态

11月20日

08:00

Hugging Face：Blog（RSS）

精选83

介绍 AnyLanguageModel：为苹果平台提供本地与云端大语言模型的统一 API

AnyLanguageModel 是一个 Swift 包，旨在为苹果平台上的大语言模型集成提供统一解决方案。它作为苹果原生 Foundation Models 框架的替代品，允许开发者通过相同的 API 接口，灵活调用本地模型（如通过 Core ML、MLX、llama.cpp 运行）与云端服务（如 OpenAI、Anthropic）。该方案复用苹果精心设计的 API 作为基础，大幅降低了在不同模型提供商之间切换的代码修改成本，并利用 Swift 的包特性功能避免依赖膨胀，从而简化开发流程，鼓励对本地开源模型的探索。

开源/仓库开源生态部署/工程

推荐理由：Apple开发者可一键切换本地与云端模型，大幅降低AI应用开发门槛。

11月17日

08:00

Hugging Face：Blog（RSS）

精选73

使用Hugging Face轻松构建和共享ROCm内核

Hugging Face的kernels库简化了高性能深度学习内核的构建与共享，支持CUDA、ROCm等多种后端。本文以ROCm兼容内核为例，展示如何利用kernel-builder工具构建、测试并共享内核。以RadeonFlow的GEMM内核为具体案例，该内核是针对AMD Instinct MI300X GPU优化的FP8块状矩阵乘法实现，采用e4m3fnuz浮点格式和每块缩放因子以保持低精度计算准确性，并在2025年AMD开发者挑战赛中获最高奖。指南涵盖项目设置、构建配置及通过kernels社区分享的完整步骤。

Hugging Face 开源生态教程/实践部署/工程

推荐理由：AMD GPU开发者可快速上手构建高性能AI内核，提升部署效率。

11月13日

08:00

Hugging Face：Blog（RSS）

精选88

共建开放未来：Hugging Face与Google Cloud达成新合作

Hugging Face与Google Cloud宣布建立深度战略合作，旨在将Google Cloud打造为使用开放模型的最佳平台。双方将合作构建CDN网关，把Hugging Face上的模型和数据集直接缓存在Google Cloud上，显著提升下载速度并增强供应链稳定性。Google Cloud客户在Vertex AI、GKE等服务中部署模型时将获得更快的首次响应。同时，Hugging Face的1000万开发者将受益于更多新型计算实例、价格下降以及通过Google安全技术强化的模型安全性。此次合作还将推动TPU在开放模型开发中的普及应用。

Google Hugging Face 开源生态行业动态

推荐理由：开发者将享受更快的模型下载、TPU 原生支持和增强安全，简化 AI 部署流程。

10月26日

02:02

Google DeepMind：Blog（RSS）

精选

MedGemma：健康 AI 开发领域最强的开源多模态模型

谷歌 MedGemma 系列新增多模态模型，专为健康 AI 开发设计。作为该系列迄今最强的开源版本，新模型具备更强大的医疗场景理解能力，为开发者提供先进的医疗人工智能技术支持，助力构建更精准的健康医疗解决方案。

DeepMind 多模态开源生态模型发布

推荐理由：DeepMind发布最强开放医疗多模态模型，支持开发者微调构建健康AI应用

10月24日

15:16

蚂蚁 inclusionAI：GitHub 新仓库

inclusionAI/TwinFlow

该研究提出了一种名为“自对抗流”的新方法，旨在驯化大规模少步训练。该方法通过引入一种内部对抗机制来优化流模型在有限训练步数下的性能，有望解决大模型训练中计算成本高昂的挑战。相关工作已被顶级机器学习会议ICLR 2026接收。

开源生态数据/训练论文/研究

02:50

Google DeepMind：Blog（RSS）

精选

Gemma 3 270M 发布：专为超高效 AI 打造的轻量模型

Gemma 3 系列新增 270M 参数模型，仅 2.7 亿参数，定位紧凑型超高效 AI 专业工具。

DeepMind 开源生态模型发布端侧

推荐理由：Google 发布 270M 超小参数开源模型，端侧部署新选择