Karpathy指出,LLM的核心价值在于创造新可能性(如取代传统代码的MenuGen、.md技能和知识库),而非仅加速旧流程。模型能力呈现“锯齿状”分布,由任务可验证性和商业利益共同塑造。未来将进入“Agent原生”经济,基础设施需面向智能体设计,强调信息的可读性,Agentic Engineering成为新兴工种,神经计算可能主导任务处理,经典CPU退化为协处理器。
Karpathy 在 Sequoia Ascent 2026 的炉边对话,从 Vibe Coding 到 Agentic Engineering
这次对话相比一年前的 "vibe coding" 有一个明显跃迁:去年谈的是个体开发者如何驾驭 LLM,今年谈的是整个软件与经济体系如何围绕 agent 重构,有三条主线。
一、LLM 的价值不在"加速旧事物",而在"让新事物成立" 判断一个 AI 产品,不要问"它加速了什么",而要问"它让什么变得不必要、或第一次变得可能"。 三个样本: · MenuGen:整条 OCR+检索+渲染流水线被一次 prompt 吞掉。大量 AI 应用只是模型缺陷的临时包装,模型一进步,产品形态就消失。 · .md skill 取代 .sh script:软件分发的最小单位从"可执行指令"变成"写给 agent 的自然语言说明",由 LLM 按环境自适应、自调试。 · LLM 知识库:对非结构化知识做重组与再编译--这是经典代码根本做不到的计算。
二、Jaggedness:能力锯齿 = 可验证性 × 经济学 同一个模型能重构十万行代码,也会让你走路去洗车。原因是两层叠加: · 可验证性:RL 只能打磨有清晰奖励信号的领域(代码、数学、安全)。 · 经济学(本次新增):实验室按 TAM 决定把什么灌进 RL 数据分布。 在分布内,你在铁轨上飞驰;在分布外,你在丛林里挥砍刀。 模型能力不是平滑球体,而是商业利益塑形的轨道网--预测表现要同时看"难不难"和"值不值得训"。
三、Agent-native 经济:世界被拆成传感器 / 执行器 / 逻辑 下一层基础设施不是面向用户,而是面向 agent。推论: · 可读性是新基建:文档、API、权限、日志都要从"给人看"改写为"给 agent 消费"。 · Agentic engineering 成为新工种:分解、架构、编排、评估的权重,超过现场写代码;传统白板面试失效。 · 远景:神经计算承担大部分任务,经典 CPU 退化为协处理器。