# Open ASR 排行榜引入私有数据集以对抗基准过度优化

- 来源：Hugging Face：Blog（RSS）
- 发布时间：2026-05-06 08:00
- AIHOT 分数：47
- AIHOT 链接：https://aihot.virxact.com/items/cmotumesx00d9slt987z4gljo
- 原文链接：https://huggingface.co/blog/open-asr-leaderboard-private-data

## AI 摘要

Hugging Face 的 Open ASR Leaderboard 加入了来自 Appen Inc. 和 DataoceanAI 的高质量私有英语 ASR 数据集，涵盖多种口音及脚本式/会话式语音，总时长约 28.7 小时。数据集保持私有以降低 benchmaxxing（针对基准的过度优化）或测试集污染风险。默认平均 WER 仍基于公开数据集计算，用户可通过切换查看私有数据集影响。标准化采用基于 Whisper 的标准化器，UI 代码和评估脚本已开源。自 2023 年 9 月上线以来，该榜单访问量已超过 71 万次。

## 正文

这是一则列表来源，站内未收录完整正文。
