# Karpathy提出AI交互新范式：以HTML输出提升人机沟通效率

- 来源：阿绎 AYi (@AYi_AInotes)
- 发布时间：2026-05-12 02:52
- AIHOT 分数：71
- AIHOT 链接：https://aihot.virxact.com/items/cmp1lqw0300n9sl8bg7q66t0f
- 原文链接：https://x.com/AYi_AInotes/status/2053911048877707443

## AI 摘要

Andrej Karpathy指出，当前AI发展的核心瓶颈并非模型能力，而是低带宽的文本交互方式。他建议在向大模型提问时要求“以HTML格式构建回答”，并在浏览器中查看结果。由于人类大脑约三分之一皮层专司视觉处理，HTML提供的丰富视觉呈现能带来远超Markdown的阅读效率与理解深度。他认为人机交互正从Markdown向HTML演进，虽然后者消耗更多token，但用少量成本换取人类时间效率是值得的交易。最终，给人消费的内容应优先采用HTML格式，而AI代理间则可用Markdown或JSON沟通。

## 正文

Damn，Karpathy这条帖子直接把我过去半年的AI工作流全推翻了🤯

大家都在死等更强的模型，
死等更大的上下文窗口，

但Karpathy说，你们全搞错方向了，
现在AI最大的瓶颈，根本不是模型不够聪明，
是我们还在用文本这种最低带宽的方式，跟它沟通。

他推荐了一个所有人今天就能用的trick，
在任何query的最后加一句：
"structure your response as HTML"
然后让Claude直接帮你打开，

出来的效果好到离谱，
不仅仅是多了点颜色和排版，
更像是你终于给AI打开了大脑里那片10车道的视觉超级高速公路，

同样的内容，HTML的阅读效率和理解深度，是Markdown的10倍以上，

这简直就是人机交互的真正下一代范式，因为人类的输入和输出偏好，天生就是完全不对称的，

输入最自然的是音频，说话比打字快4倍，思考也更连贯，
输出最擅长的是视觉，我们大脑1/3的皮层，全用来处理视觉信息，

而我们现在，却在用文本这种单车道的土路，双向跑所有的流量，

Karpathy画了一条清晰的演进路线：

原始文本 → Markdown → HTML → 交互式神经视频，

我们现在正站在Markdown到HTML的转折点上，

最令人兴奋的是，很多人说HTML费token，生成慢，

但你算一笔账就懂了，
多花2倍的token，换你10倍的阅读速度和理解深度，
这是全世界最划算的交易了吧哈哈，

可惜我们早就被省token的思维绑架了，却忘了人类的时间才是真正的稀缺资源，

还有一个更扎心的认知，
Markdown是给AI看的格式，
HTML是给人用的格式，

AI代理之间沟通，用Markdown甚至JSON都没问题，
但所有最终要给人类消费的东西，都应该切成HTML，
这才是最优的分工，

现在我已经把所有prompt的结尾，都加上了那行字，
做对比用并排表格，做分析用彩色标注，做原型用交互式滑块，
AI不再是给我甩一大段干巴巴的文字让我啃，
它直接给我造了一个可交互的视觉思考空间，

Karpathy说，人机的心智融合才刚刚开始，
我们根本不用等Neuralink那种脑机接口，
先把HTML用起来，就是当下能摘到的最大最甜的低垂果实🍒

#AI #Karpathy

### 引用推文

> Andrej Karpathy：This works really well btw, at the end of your query ask your LLM to "structure your response as HTML", then view the generated file in your browser. I've also ...
