本地代理工具pxpipe将系统提示、工具文档、历史对话、代码文件等高密度文本打包成图片,发送给Fable 5进行OCR识别。由于图像按像素固定计费、与文本密度无关,一张1928×1928图片可容纳9.2万字符,仅消耗约4700个视觉token,成本约为纯文本的四折,总体降低60%–70%。该思路源自DeepSeek研究。编码任务准确率损失极小,但ID、哈希值、密钥等精确字符串易出现识别误差。目前对Fable 5适配最佳,其他模型效果有差异。
damn,真的离谱,Fable 5的成本居然能靠OCR直接砍掉70%?!🤔
原理特别简单,把Claude Code里的长上下文转成图片,扔给Fable 5做OCR识别就行。
本质就是吃了文本和图像的计费规则差,同样体量的内容,走图像通道的成本远低于纯文本输入,零额外门槛,复制粘贴就能用。
官方在前面收紧规则砍额度,民间在后面琢磨骚操作降成本,也算是另类的动态平衡了🤣