# PDF与Markdown喂AI的效率差异与最佳实践

- 来源：AYi (@AYi_AInotes)
- 发布时间：2026-05-24 21:11
- AIHOT 分数：62
- AIHOT 链接：https://aihot.virxact.com/items/cmpjsyao9018isl01hwto4djw
- 原文链接：https://x.com/AYi_AInotes/status/2058536443174158504

## AI 摘要

作者发现直接使用PDF文档喂给AI存在严重问题。AI处理PDF时并非进行“阅读”，而是在执行字符坐标识别、结构猜测等复杂任务，这不仅消耗更多Token，还容易导致数据错乱（如数字位置被调换）。相比之下，Markdown具有清晰的结构化标记，能直接被模型高效理解。经过咨询Claude和Grok，确认在大量RAG工程实践中，将PDF转换为Markdown再输入是标准流程。因此，建议对技术文档等非视觉主导内容，优先以Markdown格式创建，现有PDF可借助markitdown、LlamaParse等工具进行转换。

## 正文

http://x.com/i/article/2058505118186635264

# 我用了三年 PDF 喂AI，昨天才发现自己一直在干一件特别蠢的事

PDF 不是 AI 的母语，这句话我第一次看到的时候，直接愣了三秒。我一直觉得，喂 AI 文档这事 PDF 是默认最优解，排版精准、跨平台稳定、连律师签合同都用它，AI 既然号称什么都能读，PDF 当然也没问题。

结果我错了，而且错得相当离谱。

从 2023 年开始玩AI到现在也三年了，我自己电脑里躺着几百份 PDF 文档。

说实话，每次扔给 AI 总有那么几次得到的回答让我想砸键盘，漏段落、串数据、还能编造原文里压根不存在的句子。

最离谱的一次，是上个月，我让 Claude 帮我读一份产品调研报告，PDF 三十几页，里面有一组用户留存数据「7 日留存 38%、30 日留存 19%」。

Claude 给我返回的总结里，这两个数字直接被换了位置，38% 写成了 19%，19% 写成了 38%。

我盯着那段回答看了好几分钟，喵的差点把它发给老板。

那一刻我以为是模型抽风，直到昨天才反应过来，是我一直在用错的方式喂它。

一、你以为 PDF 是最优解，其实它是二手翻译

事情是这样，最近好几个粉丝私信我同一个问题，为什么 AI 读他们的 PDF 总是出错，是模型不够新吗，要不要升级到 Pro。

我本来想糊弄过去，让他们换个 Claude 试试。

但话到嘴边停住了，因为我自己也踩过一模一样的坑。

那种感觉你应该熟悉，你花二十分钟把一份几十页的产品文档传上去，让 AI 总结核心要点，它给你一段看起来很正经的回答，你一开始还挺满意，结果回头核对原文，发现关键的那个数据，它写错了。

不是漏掉，是写错。

我跑去问 Grok 和 Claude，问的就一个问题，PDF 和 Markdown 到底哪个更适合喂给你？

两个模型的答案出奇一致：Markdown。

更让我没想到的是 Claude 接着说的一句话--

> 大量 RAG 工程实践的标准流程，是先把 PDF 转成 Markdown 再喂给模型。

啥意思呢，就是真正做 AI 应用的那帮专业团队，他们自己都不直接用 PDF 喂模型，他们先转一道，转成 MD 再说。

对，你没看错。

这不是因为他们闲，是因为剥开来看，PDF 在 AI 眼里本来就不是一份"文档"，它是一张图加一堆坐标加一些字符，AI 得先把这堆东西重新拼回成"句子"才能开始读。

这一拼，损耗就来了。

打个比方，Markdown 就像别人直接把演讲稿递到你手里，每一个字都清清楚楚，PDF 呢，就像让一个同声传译先听一遍演讲、再凭记忆复述给你，他业务再熟练，也总会漏掉点什么。

我之前那个 38% 和 19% 被换位的故事，本质就是 AI 在"复述"的时候记混了数字。

差别就这么大。

二、AI 读 PDF 的时候，干的根本不是"读"这件事

这事最反直觉的地方在于，AI 读 PDF 的时候它真不是在"读"。

它在做一件很笨的活--识别每个字符在页面上的坐标，判断这一行和上一行是不是同一个段落，猜测这个表格的行列结构，还得把页眉页脚那些每页都重复出现的公司 logo 文字排除掉。

这些活本来应该排版软件干。

结果全甩给 AI 了。

而 Markdown 呢，标题就是 #，列表就是 -，加粗就是星号星号，结构是直接写在文本里的，AI 一眼就能看明白。

这就是为什么同一份文档，PDF 版本消耗的 Token 通常会比 Markdown 多出一截。

Token 是啥，你可以这么理解，AI 看东西、想东西、回答你，每一步都按字数收费，Token 就是它的算钱单位，你扔给它的格式越乱，它需要先"理顺"再"理解"，钱就花在理顺上了。

更狠的是，你为这些脏活付完钱，AI 还容易干错。

这买卖谁做谁亏。

三、那 PDF 就一无是处吗？也不是

我自己用下来，有三种情况 PDF 反而是更优解。

第一，文档里有大量图表、设计稿、流程图，你希望 AI 直接看图说话，这时候 PDF 的多模态优势就出来了。

第二，需要严格保留原始版式和法律效力，比如合同、正式报告、盖章文件，别折腾，原样喂。

第三，你既要 AI 读懂文字、又要它理解视觉排版，比如分析一份产品宣传册的设计逻辑。

但说实话，我们日常喂给 AI 的，90% 都不是这些。

技术文档、学习笔记、论文、产品手册、内部知识库、周报月报，这些东西的最佳归宿，全是 Markdown。

四、我给自己定的三条规矩

研究完这件事，我做了三个调整。

第一，新文档全部 Markdown 起手。

Obsidian、Typora、VS Code、Notion 导出，工具一抓一大把，从源头上不给 AI 添麻烦。

第二，旧 PDF 先转再喂。

微软的 markitdown、老牌的 pandoc、专门给 LLM 优化的 LlamaParse，一键转完再喂，差距肉眼可见。

第三，重要文档双版本归档。

PDF 留着打印、签字、给人看，Markdown 专门拿来喂 AI、建知识库、做搜索。

说出来就是这么三条破规矩，但真改完之后，我自己的 AI 使用体验，肉眼可见地变好了。

最直接的反馈，就是上周我再读那份产品调研报告，先用 markitdown 转成 MD 再喂，那两个被换位的数字这次乖乖出现在了正确的位置。

五、输入决定输出

扯远了。

乱糟糟说了这么多，我想说的其实就一句--

AI 真正的能力上限，从来不取决于模型，取决于你喂给它什么。

这句话我在很多地方都看到过，但这次是自己踩了三年坑才真正记住的。

也是因为这次踩坑，我决定开一个新系列叫**「喂 AI 的艺术」**，今天这篇是第一集聊文档格式，后面还有 8 期，会继续挖那些容易被忽略、但一搞对就事半功倍的细节。

说实话，我也还在摸索。

你可以这么理解，用 AI 这件事就像养一盆植物，模型是种子，提示词是阳光，但你喂给它的格式，是土壤。种子再好，土壤板结，它也长不出你想要的样子。

每搞明白一件小事，就是给土壤松一锹土。

我们一起慢慢松。