OpenRouter vs LiteLLM:如何选择 LLM 网关
OpenRouter 这份官方对比很坦诚,把成本、延迟、合规的权衡掰开了讲,自建 LiteLLM 和托管谁更划算的算术也给清楚了,做 LLM 网关选型的直接看这篇就够了。
OpenRouter 是托管在 Cloudflare 边缘的 LLM 网关,无需管理基础设施,收取 5.5% 平台费(前 100 万次请求免费),支持 70+ 提供商和自动故障转移。LiteLLM 是自部署代理(Docker/PostgreSQL/Redis),数据不离开内网,免费开源,但需承担基础设施成本(生产部署约数百美元/月)。当模型月支出超过约 $3,600(基础设施 $200/月)或 $9,100(基础设施 $500/月)时自托管更划算。LiteLLM 提供六种路由策略和自定义 Python 路由;OpenRouter 具备 SOC 2、GDPR 认证和零数据保留选项。两者可串联使用。
OpenRouter 对比 LiteLLM:哪个大语言模型网关适合你的技术栈?
OpenRouter · 2026年6月19日
- 决定路由层部署在哪里
- 每个网关的成本是多少
- 对比路由、故障转移和延迟
- 将合规需求匹配到合适的网关
- 两者都使用,或仅需几行代码切换
- 常见问题解答
如果你正在为生产环境网关在 OpenRouter 和 LiteLLM 之间做选择,关键在于路由层应该在哪里运行。
两者都为你提供跨多家提供商统一的 OpenAI 兼容 API。OpenRouter 替你运行路由层,因此无需运维任何基础设施。LiteLLM 在你自己的基础设施内部运行,因此你的数据停留在你的网络内,且无需支付平台费用,但代价是需要自行运维 PostgreSQL、Redis 和 Docker。
以下几种情况适合选择 LiteLLM:数据不能离开你的网络、你需要在自有基础设施内实现基于角色的访问控制,或者你的模型开销足够高,使得 5.5% 的平台费用超过了运行代理服务器的成本。其他大多数情况则倾向于选择托管方案。
决定路由层部署在哪里
OpenRouter 位于你的应用与 70 多家提供商之间,运行在 Cloudflare 边缘节点上。你的应用调用 https://openrouter.ai/api/v1,OpenRouter 执行路由和故障转移,并将请求转发给上游提供商。你无需管理服务器、数据库或各个提供商的凭证。
LiteLLM 是一个需要自行部署的代理服务器,以 Docker 容器或 Kubernetes Pod 形式运行。它在你网络内部暴露同样与 OpenAI 兼容的端点,将每个请求改写为提供商原生格式后转发。PostgreSQL 存储费用数据和密钥;Redis 在生产环境中处理缓存和速率限制。这三个组件都由你运维。
这个区别是合规团队最先会问的问题。使用 LiteLLM 时,请求数据在到达提供商之前永远不会离开你的网络。使用 OpenRouter 时,请求先经过一个托管层,因此有严格数据驻留规则的团队应审查可用的路由和零数据保留控制选项。
OpenRouter: app -> OpenRouter (Cloudflare edge) -> provider
LiteLLM: app -> LiteLLM proxy (your infra: Docker + PostgreSQL) -> provider 每个网关的成本是多少
OpenRouter 以零加价传递供应商价格,然后对按需付费的信用额度购买收取 5.5% 的平台费,每笔最低消费 0.80 美元。自带密钥可将费用降至 5%,且每月前 100 万次请求免收费用。失败请求不收费。
LiteLLM 可免费自托管。您只需为基础架构付费:PostgreSQL 数据库、可选的 Redis 以及计算资源,生产环境部署通常每月花费几百美元。LiteLLM 企业版增加了 SSO、SCIM、RBAC、审计日志和 Prometheus 指标,价格需联系销售团队。
临界点由算术决定。将您的月度基础设施成本除以 5.5% 的费率。若基础设施成本约为每月 200 美元,则当您的模型支出超过约每月 3,600 美元时,LiteLLM 变得更便宜;若基础设施成本为每月 500 美元,则该界限移至约每月 9,100 美元。低于该界限时,托管费用低于运行代理所需的工程时间成本。
对比路由、故障转移和延迟
OpenRouter 默认路由效果良好。其由 NotDiamond 驱动的自动路由器为每个提示词选择模型,而提供商级别的路由会降低最近 30 秒内出现过中断的提供商的优先级。您可以使用提供商对象来约束路由,该对象可根据价格、吞吐量、延迟、数据策略、ZDR 和量化进行过滤。
LiteLLM 提供更多策略和完全自定义逻辑。它内置六种路由模式:加权选择、基于延迟、感知速率限制、最少繁忙、最低成本以及一种您可以编写 Python 的自定义模式。回退列表允许代理在某个模型失败时尝试下一个模型。如果您需要在代理上实施按团队或按模型的规则,LiteLLM 提供了相应的接口。
延迟取决于您调优的程度。LiteLLM 报告在 4 个实例(每个实例 4 个 CPU 和 8 GB 内存)的部署中,针对模拟端点测试,中位开销约为 2 毫秒(P95 为 8 毫秒,P99 为 13 毫秒);缩减至 2 个实例时,中位开销升至约 12 毫秒(LiteLLM 自行报告的基准)。OpenRouter 在 Cloudflare 边缘节点上增加了一个网络跳转,您无法调优或扩展。一个是您拥有的可调节旋钮,另一个是您无法改变的常量。
将合规需求与合适的网关匹配
OpenRouter 引入第三方认证。它符合 SOC 2 Type 2 标准,完整报告可在 trust.openrouter.ai 查看,支持 GDPR,可按请求或账户范围启用零数据留存,并可针对企业账户路由至欧盟提供商。工作区功能在现有基础上增加了按团队组织、预算和成本归属。
LiteLLM 带来数据主权。由于由你自行托管,请求在到达提供商之前绝不会离开你的基础设施,因此你可以实施自己的控制措施。LiteLLM Enterprise 增加了 RBAC、SSO/JWT 认证、审计日志和按团队预算。它不持有独立的 SOC 2、ISO 27001 或 HIPAA 认证,因此你的部署需自行负责满足这些标准。
两者均可使用,或仅需几行代码即可切换
两者并非互斥。LiteLLM 可将 OpenRouter 作为上游提供商使用,这样你既能获得 LiteLLM 的本地 RBAC 与日志记录,又能由 OpenRouter 处理多提供商故障转移和模型广度。
model_list:
- model_name: or-claude
litellm_params:
model: openrouter/anthropic/claude-opus-4.6
api_key: "your-openrouter-key"
api_base: "https://openrouter.ai/api/v1"
- model_name: or-gpt4o
litellm_params:
model: openrouter/openai/gpt-4o
api_key: "your-openrouter-key"
api_base: "https://openrouter.ai/api/v1" 切换方向只需更改基础 URL 和密钥,因为两者都采用 OpenAI 格式。
from openai import OpenAI
# OpenRouter
client = OpenAI(
base_url="https://openrouter.ai/api/v1",
api_key="your-openrouter-key",
)
# LiteLLM
client = OpenAI(
base_url="http://your-litellm-host:4000",
api_key="your-litellm-master-key",
) 这样即可将两个网关置于同一客户端之后。如果你没有采用 OpenAI SDK 作为标准,OpenRouter 拥有自己的 SDK(Python 版为 `openrouter`,TypeScript 版为 `@openrouter/sdk`),可直接原生调用 OpenRouter 端,无需设置基础 URL。
from openrouter import OpenRouter
import os
with OpenRouter(api_key=os.environ["OPENROUTER_API_KEY"]) as client:
response = client.chat.send(
model="anthropic/claude-opus-4.6",
messages=[{"role": "user", "content": "Hello"}],
) 如果你正在权衡除这两者以外的更多选择,我们的 LLM 网关对比文档涵盖了 Portkey、Helicone、Cloudflare AI Gateway 等产品。
常见问题
LiteLLM 和 OpenRouter 一样吗?
它们都在多个提供商之间提供与 OpenAI 兼容的 API,但构建方式不同。LiteLLM 是一个你自行托管的开源代理;OpenRouter 是一个托管网关,运行在你无需运营的基础设施上。这种差异体现在数据驻地、运维开销和费用上。
我可以同时使用 LiteLLM 和 OpenRouter 吗?
可以。LiteLLM 支持将 OpenRouter 作为上游提供商,因此你可以通过本地 LiteLLM 路由以获取 RBAC 和审计日志,同时由 OpenRouter 处理多提供商故障转移和模型广度。
OpenRouter 是免费的吗?
OpenRouter 提供 20 多个免费模型用于评测。付费使用按供应商定价收取,0% 加价,另加充值金额 5.5% 的平台费。自带密钥可将费用降至 5%,且每月前 100 万次请求免费。
OpenRouter 会存储我的提示词吗?
默认情况下,不会。OpenRouter 不会保留提示词或响应。可通过请求头实现每次请求的零数据保留(Zero Data Retention),或在设置中开启账户全局零数据保留。
OpenRouter 相比 LiteLLM 延迟开销如何?
LiteLLM 报告称,在调优后的 4 实例部署中,针对模拟端点测试的中位数开销约为 2ms;2 实例部署则升至约 12ms。OpenRouter 在 Cloudflare 边缘网络上增加了一次网络跳转,而您无法自行调优或扩展该跳转。