PaddleOCR发布PP-OCRv6完整端到端部署基准。A100上PP-OCRv6_tiny达0.13秒/图;Intel CPU上用OpenVINO,PP-OCRv6_medium比PP-OCRv5_server快5.2倍,PP-OCRv6_tiny比PP-OCRv5_mobile快3.9倍;Apple M4上用ONNX Runtime跑出0.35秒/图。提供Tiny、Small、Medium三种尺寸,Medium/Small均支持50种语言,PP-OCRv6_medium英文准确率88.4%,拉丁字母准确率88.0%。官方总结认为,在专用OCR任务上,轻量架构+高质量训练数据比单纯堆参数更实用,是对大模型“暴力scaling”路线的反向验证。
PaddleOCR的PP-OCRv6又扔了一波硬核部署数据。
他们在A100上做到0.13秒一张图,在Intel CPU上比PP-OCRv5快3.9倍到5.2倍。
Apple M4上用ONNX Runtime也能跑到0.35秒一张。
还提供了Tiny、Small、Medium三种尺寸,分别对应移动端、CPU文档系统和高并发API的不同场景。
最有意思的是他们最后总结的那句话:在专用OCR任务上,轻量架构 + 高质量训练数据,往往比单纯堆参数更实用。
这其实是把当前大模型"暴力scaling"的思路,在垂直领域做了一次反向验证。
从v5到v6,PaddleOCR在精度、速度、多语言和工程部署上持续迭代,这次把部署侧的数据拉得这么细。
等于把"怎么在真实生产环境里用好OCR"这件事讲透了。