# SandboxAQ 开源最大结合亲和力数据集 SAIR

- 来源：Yann LeCun (@ylecun)
- 发布时间：2025-06-20 22:53
- AIHOT 链接：https://aihot.virxact.com/items/cmnw1yxbf01myslc35yrcbbwu
- 原文链接：https://x.com/ylecun/status/1936074887367631199

## AI 摘要

SandboxAQ 发布开源数据集 SAIR（Structurally Augmented IC50 Repository），收录逾 500 万个共折叠蛋白质-配体 3D 结构及结合亲和力数据，为目前规模最大的开源结合亲和力数据集。数据由大型定量模型生成，旨在为药物发现 AI 模型提供高质量训练数据，弥合分子结构与药效预测间的鸿沟。该数据集基于 NVIDIA DGX Cloud 构建，现已在 Google Cloud Platform 公开发布，供全球研究人员下载使用。

## 正文

Awesome new dataset from @SandboxAQ

### 引用推文

> SandboxAQ：Today we're releasing SAIR, the Structurally Augmented IC50 Repository. SAIR is the Largest Open-Sourced Binding Affinity Dataset with Cofolded 3D Structures. I...
