LLM应用层产物形态从chat演进到agent,两者输出均受限于会话,每次运行都需冷启动、重输上下文并消耗token。KroWork推出第三步应用固化,通过将对话编译为本地可执行App,使后续运行完全避免token消耗,实现一次编译后多次调用,提升效率并降低成本。
LLM 应用层的产物形态走了三步: chat → agent → ? chat 给你 text,agent 给你一次 execution trace--但两者的产物都困在 session 里。同一个工作流跑第 100 次,依然是第 1 次的成本:冷启动、重喂上下文、token 重烧一遍。 KroWork 给的第三步答案是应用固化:把会话编译成一个本地可执行的App,而且沉淀为App后,后面再运行就完全不消耗token了,不需要焦虑反复消耗token。 一次对话,一次"编译",剩下的全是 invoke。