Berryxia.AI@berryxia

2026-06-26 21:36·6天前

AI 摘要

PaddleOCR发布PP-OCRv6完整端到端部署基准。A100上PP-OCRv6_tiny达0.13秒/图；Intel CPU上用OpenVINO，PP-OCRv6_medium比PP-OCRv5_server快5.2倍，PP-OCRv6_tiny比PP-OCRv5_mobile快3.9倍；Apple M4上用ONNX Runtime跑出0.35秒/图。提供Tiny、Small、Medium三种尺寸，Medium/Small均支持50种语言，PP-OCRv6_medium英文准确率88.4%，拉丁字母准确率88.0%。官方总结认为，在专用OCR任务上，轻量架构+高质量训练数据比单纯堆参数更实用，是对大模型“暴力scaling”路线的反向验证。

PaddleOCR的PP-OCRv6又扔了一波硬核部署数据。

他们在A100上做到0.13秒一张图，在Intel CPU上比PP-OCRv5快3.9倍到5.2倍。

Apple M4上用ONNX Runtime也能跑到0.35秒一张。

还提供了Tiny、Small、Medium三种尺寸，分别对应移动端、CPU文档系统和高并发API的不同场景。

最有意思的是他们最后总结的那句话：在专用OCR任务上，轻量架构 + 高质量训练数据，往往比单纯堆参数更实用。

这其实是把当前大模型"暴力scaling"的思路，在垂直领域做了一次反向验证。

从v5到v6，PaddleOCR在精度、速度、多语言和工程部署上持续迭代，这次把部署侧的数据拉得这么细。

等于把"怎么在真实生产环境里用好OCR"这件事讲透了。

PaddlePaddle🧵PP-OCRv6 Tech Deep Dive Ep.4:3.9x Faster on CPU, 0.13s per Image on A100 - PP-OCRv6 Deployment & Model Selection Guide How fast can OCR really get outside the...

GitHub开源生态模型发布部署/工程

在 X 查看原推

Berryxia.AI@berryxia · X

68导出 Markdown