The Grid推出新的LLM推理平台,用实时供需市场定价取代传统的固定费率。它按任务难度分层:简单任务(如分类)用“standard”,常规生产任务(如RAG、智能体步骤)用“prime”,高难度任务(如长上下文推理)用“max”。应用将请求发送至The Grid,平台会自动匹配该层级当前最便宜的可用供应商。开发者仍使用单一API,但后端模型可动态切换。新账户享受前200 million tokens免费额度。文中以Hermes Agent集成为例,展示了如何通过“agent-prime”层级处理工单。