AI 摘要
SandboxAQ 发布开源数据集 SAIR(Structurally Augmented IC50 Repository),收录逾 500 万个共折叠蛋白质-配体 3D 结构及结合亲和力数据,为目前规模最大的开源结合亲和力数据集。数据由大型定量模型生成,旨在为药物发现 AI 模型提供高质量训练数据,弥合分子结构与药效预测间的鸿沟。该数据集基于 NVIDIA DGX Cloud 构建,现已在 Google Cloud Platform 公开发布,供全球研究人员下载使用。
Awesome new dataset from @SandboxAQ
Today we're releasing SAIR, the Structurally Augmented IC50 Repository. SAIR is the Largest Open-Sourced Binding Affinity Dataset with Cofolded 3D Structures. I...