# 开源OCR模型性能突破，支持90余种语言与完整布局解析

- 来源：Berryxia.AI (@berryxia)
- 发布时间：2026-04-25 19:13
- AIHOT 分数：56
- AIHOT 链接：https://aihot.virxact.com/items/cmoegbsff00vmslxxutf1r1un
- 原文链接：https://x.com/berryxia/status/2047997439064555566

## AI 摘要

一款新的开源OCR模型在olmocr基准测试中达到85.9%的SOTA性能。该模型参数量为40亿，由90亿参数精简而来，支持超过90种语言并附带基准测试。其核心能力包括保留完整的文档布局信息，能从图像和图表中提取并生成说明文字，同时对手写文本、数学公式、表单及表格具备强大的识别与解析支持。

## 正文

每个人都在忽略这个新的 OCR 模型！

- 在 olmocr bench 上达到 85.9%（sota）
- 支持 90+ 种语言，附带基准测试
- 40 亿参数模型（从 90 亿参数减少）
- 完整布局信息
- 提取并为图像和图表添加说明
- 强大的手写、数学、表单、表格支持

100% 开源。
