Andrej Karpathy指出,当前AI发展的核心瓶颈并非模型能力,而是低带宽的文本交互方式。他建议在向大模型提问时要求“以HTML格式构建回答”,并在浏览器中查看结果。由于人类大脑约三分之一皮层专司视觉处理,HTML提供的丰富视觉呈现能带来远超Markdown的阅读效率与理解深度。他认为人机交互正从Markdown向HTML演进,虽然后者消耗更多token,但用少量成本换取人类时间效率是值得的交易。最终,给人消费的内容应优先采用HTML格式,而AI代理间则可用Markdown或JSON沟通。
Damn,Karpathy这条帖子直接把我过去半年的AI工作流全推翻了🤯
大家都在死等更强的模型, 死等更大的上下文窗口,
但Karpathy说,你们全搞错方向了, 现在AI最大的瓶颈,根本不是模型不够聪明, 是我们还在用文本这种最低带宽的方式,跟它沟通。
他推荐了一个所有人今天就能用的trick, 在任何query的最后加一句: "structure your response as HTML" 然后让Claude直接帮你打开,
出来的效果好到离谱, 不仅仅是多了点颜色和排版, 更像是你终于给AI打开了大脑里那片10车道的视觉超级高速公路,
同样的内容,HTML的阅读效率和理解深度,是Markdown的10倍以上,
这简直就是人机交互的真正下一代范式,因为人类的输入和输出偏好,天生就是完全不对称的,
输入最自然的是音频,说话比打字快4倍,思考也更连贯, 输出最擅长的是视觉,我们大脑1/3的皮层,全用来处理视觉信息,
而我们现在,却在用文本这种单车道的土路,双向跑所有的流量,