AI 摘要
一款新的开源OCR模型在olmocr基准测试中达到85.9%的SOTA性能。该模型参数量为40亿,由90亿参数精简而来,支持超过90种语言并附带基准测试。其核心能力包括保留完整的文档布局信息,能从图像和图表中提取并生成说明文字,同时对手写文本、数学公式、表单及表格具备强大的识别与解析支持。
每个人都在忽略这个新的 OCR 模型!
- 在 olmocr bench 上达到 85.9%(sota)
- 支持 90+ 种语言,附带基准测试
- 40 亿参数模型(从 90 亿参数减少)
- 完整布局信息
- 提取并为图像和图表添加说明
- 强大的手写、数学、表单、表格支持
100% 开源。