Berryxia.AI@berryxia

2026-05-30 00:09·34天前

AI 摘要

飞桨发布了PaddleOCR-VL 1.6版本。该版本在OmniDocBench评测基准上取得了96.33%的新SOTA成绩，在该榜单及Real5-OmniDocBench上均排名第一。在表格、经典文本和稀有字符识别能力上均有显著提升，并增强了印章检测与图表理解能力。该版本与1.5版本架构完全兼容，实现了零迁移成本，方便直接部署使用，旨在为大语言模型和检索增强生成等系统提供更高质量的输入数据。

最近开发了一个OCR的工具，疯狂给干法律的客户案例！

效果非常好，很合适~ 但也遇到有些错乱和不好的结果

金融合同、法律文件、研究报告、历史档案，这些东西里公式、表格、印章、稀有字符混在一起，传统工具经常认错或者直接漏掉，导致后续LLM输出质量直接拉低。

今天PaddlePaddle把PaddleOCR-VL 1.6正式发布了。

它在OmniDocBench上刷到96.33%的SOTA，把开源和商业方案同时甩在身后。

表格识别、经典文本、稀有字符都有明显提升，印章检测、图表理解也更稳。

最实用的是，它和1.5版本完全架构兼容，零迁移成本，拿来就能用。

以前大家总觉得RAG的瓶颈在模型参数或者检索算法，现在看，真正决定上限的往往是输入数据的干净程度。

这份高精度解析能力，直接把文档智能喂给LLM的门槛又往下拉了一大截。

PaddlePaddle🚀PaddleOCR-VL 1.6 Officially Released! We are thrilled to announce the official release of PaddleOCR-VL 1.6 - this version has set a new SOTA record of 96.33% ...

多模态开源生态模型发布

在 X 查看原推导出 Markdown

Berryxia.AI@berryxia · X

69导出 Markdown