飞桨发布了PaddleOCR-VL 1.6版本。该版本在OmniDocBench评测基准上取得了96.33%的新SOTA成绩,在该榜单及Real5-OmniDocBench上均排名第一。在表格、经典文本和稀有字符识别能力上均有显著提升,并增强了印章检测与图表理解能力。该版本与1.5版本架构完全兼容,实现了零迁移成本,方便直接部署使用,旨在为大语言模型和检索增强生成等系统提供更高质量的输入数据。
最近开发了一个OCR的 工具,疯狂给干法律的客户案例!
效果非常好,很合适~ 但也遇到有些错乱和不好的结果
金融合同、法律文件、研究报告、历史档案,这些东西里公式、表格、印章、稀有字符混在一起,传统工具经常认错或者直接漏掉,导致后续LLM输出质量直接拉低。
今天PaddlePaddle把PaddleOCR-VL 1.6正式发布了。
它在OmniDocBench上刷到96.33%的SOTA,把开源和商业方案同时甩在身后。
表格识别、经典文本、稀有字符都有明显提升,印章检测、图表理解也更稳。
最实用的是,它和1.5版本完全架构兼容,零迁移成本,拿来就能用。
以前大家总觉得RAG的瓶颈在模型参数或者检索算法,现在看,真正决定上限的往往是输入数据的干净程度。
这份高精度解析能力,直接把文档智能喂给LLM的门槛又往下拉了一大截。