6月22日

23:54

Yann LeCun@ylecun

SandboxAQ 开源 SAIR 数据集，包含超500万个蛋白质-配体3D结构及结合亲和力标注，为目前最大规模开源结合亲和力数据集。基于NVIDIA DGX Cloud构建，现已在Google Cloud公开可用，旨在为药物发现AI模型提供训练与评估数据。

SandboxAQ: Today we're releasing SAIR, the Structurally Augmented IC50 Repository. SAIR is the Largest Open-Sourced Binding Affinit...

Google 开源/仓库数据/训练

6月20日

22:53

Yann LeCun@ylecun

SandboxAQ 发布开源数据集 SAIR（Structurally Augmented IC50 Repository），收录逾 500 万个共折叠蛋白质-配体 3D 结构及结合亲和力数据，为目前规模最大的开源结合亲和力数据集。数据由大型定量模型生成，旨在为药物发现 AI 模型提供高质量训练数据，弥合分子结构与药效预测间的鸿沟。该数据集基于 NVIDIA DGX Cloud 构建，现已在 Google Cloud Platform 公开发布，供全球研究人员下载使用。

SandboxAQ: Today we're releasing SAIR, the Structurally Augmented IC50 Repository. SAIR is the Largest Open-Sourced Binding Affinit...

Google 开源/仓库数据/训练

6月16日

00:00

LMSYS：Blog（Chatbot Arena 团队）

在GB200 NVL72上部署DeepSeek 671B：PD与大规模EP架构实现2.7倍解码加速

SGLang团队在GB200 NVL72集群部署DeepSeek 671B模型，采用预填充-解码分离（PD）与大规模专家并行（EP）架构，结合Blackwell专用优化组件（DeepGEMM、DeepEP等），实现单GPU解码吞吐7,583 tokens/秒。在2,000 token输入下，性能较H100提升2.7倍，整体加速比达2.5-3.4倍。系统利用NVLink全互联降低通信延迟，依托更大显存支持高批次处理，显著提升MoE模型推理效率。

DeepSeek 开源/仓库推理部署/工程

6月6日

04:00

EleutherAI：Blog

Common Pile v0.1 正式发布

Common Pile v0.1 正式发布，这是一个规模达 8TB 的文本数据集，专门收录公共领域及开放许可的文本内容。该数据集提供了海量可合法自由使用的语料资源，适用于大规模语言模型训练等需要合规数据源的场景，旨在解决 AI 训练中的数据版权合规问题。

开源/仓库数据/训练

5月22日

01:19

Hacker News：AI 热帖

精选

将Agent封装为MCP服务器示例

MCP Agent Server示例展示了将Agent工作流封装为MCP服务器的"Agent即服务"架构。提供asyncio（轻量级内存执行，适合开发测试）和Temporal（生产级持久化、支持暂停恢复）两种实现。通过装饰器暴露Agent能力，支持多Agent互操作，可与Claude Desktop等任意MCP客户端集成，实现复杂工作流的标准化封装与跨平台复用。

智能体 MCP/工具开源/仓库

推荐理由：展示 Agent 即 MCP 服务器新范式，支持多 Agent 协作与主流客户端集成

5月5日

00:00

LMSYS：Blog（Chatbot Arena 团队）

技术博客：在96块H100 GPU上通过PD分离与大规模专家并行部署DeepSeek

SGLang团队开源了基于96块H100 GPU（12节点×8卡）的DeepSeek推理系统实现，采用PD分离（Prefill-Decode Disaggregation）与大规模专家并行（EP）架构，集成DeepEP、DeepGEMM和EPLB完整功能，在2000 token输入序列下达成每节点每秒52.3k输入token和22.3k输出token的吞吐量。该方案较传统张量并行提升输出吞吐量5倍，将成本压缩至每百万输出token仅0.20美元，约为官方API价格的五分之一，是首个在开源实现中接近官方DeepSeek报告性能的大规模部署方案。

开源/仓库开源生态部署/工程

4月24日

11:27

Saining Xie@sainingxie

最近由 @TongPetersb、@DavidJFan 和 Meta FAIR 团队开源的项目。

Peter Tong: We are open-sourcing all the models in Web-SSL, from ViT-L to ViT-7B! It was super fun to train and play with these mass...

Meta 开源/仓库数据/训练

3月25日

21:23

公众号：DeepSeek（深度求索）

同事件精选64

DeepSeek-V3 模型更新，各项能力全面进阶

DeepSeek-V3 新版已发布，关闭深度思考模式即可体验，模型权重同步开源。

DeepSeek 开源/仓库推理模型发布

同一事件，精选展示《DeepSeek-V3 正式发布》

推荐理由：DeepSeek-V3 发布时是开源模型的有力竞争者，但这条一年多前的旧闻如今毫无新意，对关注 AI 动态的你来说，可以直接跳过。

3月21日

01:01

Hacker News：AI 热帖

Show HN： Hyperbrowser MCP Server - 通过浏览器将 AI agent 连接至网络

Hyperbrowser 发布 MCP Server，为 AI agent 提供网页抓取、结构化数据提取和爬取能力。支持集成 OpenAI CUA、Claude Computer Use 和 Browser Use 等浏览器自动化工具，兼容 Cursor、Windsurf 和 Claude Desktop，可通过 npx 一键安装，MIT 协议开源。

智能体 Anthropic MCP/工具 OpenAI

2月28日

09:06

DeepSeek@deepseek_ai

DeepSeek开源3FS并行文件系统与Smallpond框架

DeepSeek发布开源并行文件系统3FS（Fire-Flyer File System），专为现代SSD和RDMA网络优化。180节点集群可实现6.6 TiB/s聚合读取吞吐量，25节点GraySort测试达3.66 TiB/min，单节点KVCache查找峰值超40 GiB/s。采用分离式架构与强一致性语义，支持训练数据预处理、检查点存取及V3/R1推理的KVCache查找。同步开源Smallpond数据处理框架。

DeepSeek 开源/仓库数据/训练部署/工程

2月27日