pxpipe：利用OCR将Fable 5长文本输入成本降低70%

AYi@AYi_AInotes · X

69导出 Markdown

2026-07-04 19:56·11小时前

在 X 看原推· x.com

AI 摘要

本地代理工具pxpipe将系统提示、工具文档、历史对话、代码文件等高密度文本打包成图片，发送给Fable 5进行OCR识别。由于图像按像素固定计费、与文本密度无关，一张1928×1928图片可容纳9.2万字符，仅消耗约4700个视觉token，成本约为纯文本的四折，总体降低60%–70%。该思路源自DeepSeek研究。编码任务准确率损失极小，但ID、哈希值、密钥等精确字符串易出现识别误差。目前对Fable 5适配最佳，其他模型效果有差异。

damn，真的离谱，Fable 5的成本居然能靠OCR直接砍掉70%？！🤔

原理特别简单，把Claude Code里的长上下文转成图片，扔给Fable 5做OCR识别就行。

本质就是吃了文本和图像的计费规则差，同样体量的内容，走图像通道的成本远低于纯文本输入，零额外门槛，复制粘贴就能用。

官方在前面收紧规则砍额度，民间在后面琢磨骚操作降成本，也算是另类的动态平衡了🤣