# SandboxAQ 发布全新开源数据集 SAIR

- 来源：Yann LeCun (@ylecun)
- 发布时间：2025-06-22 23:54
- AIHOT 链接：https://aihot.virxact.com/items/cmnw1yxbf01mxslc36tgde9mc
- 原文链接：https://x.com/ylecun/status/1936814980906807639

## AI 摘要

SandboxAQ 开源 SAIR 数据集，包含超500万个蛋白质-配体3D结构及结合亲和力标注，为目前最大规模开源结合亲和力数据集。基于NVIDIA DGX Cloud构建，现已在Google Cloud公开可用，旨在为药物发现AI模型提供训练与评估数据。

## 正文

Awesome new dataset from @SandboxAQ

### 引用推文

> SandboxAQ：Today we're releasing SAIR, the Structurally Augmented IC50 Repository. SAIR is the Largest Open-Sourced Binding Affinity Dataset with Cofolded 3D Structures. I...
