Hacker News:AI 热帖
Launch HN: Expanse (YC P26) - 解锁被浪费的GPU算力
AI 摘要
Expanse是YC孵化的HPC/GPU集群优化工具,通过分析作业代码和硬件遥测来预测实际资源需求。它指出数据中心有效利用率通常仅30%-40%,一个国家规模HPC集群中59%的计算被浪费,按云上价格计算约850万美元/月。该工具能提供提交时的资源预测(含置信区间)、实时可观测性和故障诊断。在基准测试中,其性能是通用模型的8倍。Expanse适配Kubernetes和SLURM,通过持续学习使模型随作业量增长而更精确。
该来源未收录可展示正文,站内仅提供摘要。
阅读原文news.ycombinator.com