OpenRouter MCP 服务器发布
阅读原文· openrouter.aiOpenRouter 这个 MCP 服务器让编码 agent 直接从编辑器里选模型、查价格、跑测试,省掉了切浏览器查资料的15分钟,做 AI 开发的值得立刻装上。它把模型选择变成了 agent 自己能完成的工作流,而不只是人工猜测。
OpenRouter 推出 MCP 服务器,为编程智能体提供实时模型数据、基准排名、定价和文档查询。开发者通过一键安装(支持 Claude Code、Codex CLI、Cursor 等客户端),即可在编辑器内完成模型筛选、价格对比和测试推理,无需切换标签页。服务器整合 Artificial Analysis、Design Arena 及 OpenRouter 自身排名数据,例如推荐 GLM-5.2 作为性价比最佳的编码模型。工具集包括 models-list、model-get、model-endpoints、benchmarks 等,支持通过 chat-send 发送测试提示,比较不同模型(如 Claude Opus 4.8、GPT-5.5、DeepSeek V4 Pro)的响应、成本和延迟。API 密钥附带 7 天有效期和 10 美元消费上限,可随时撤销。
OpenRouter MCP 服务器
OpenRouter ·2026年6月25日

- 一条命令安装
- 无需切换标签页即可选对模型
- 提交前先测试
- 不离开编辑器就能搜索文档
- 专用且带上限的密钥
- 工具箱里有什么
- 常见问题解答
你的编程智能体在编写代码方面非常出色。
但在选择合适的模型时——例如,既要用它来写代码,又不想一天就花光月度预算,或者要选一个最适合设计落地页的模型——它就非常吃力了。
你的智能体可以大致猜出哪个模型“最好”,但它只是基于几个月前的训练数据来猜测,完全不知道模型的实际成本、在特定任务上的表现如何、应该固定使用哪家供应商等信息。
这种局面到此为止。
今天,我们非常激动地宣布 OpenRouter MCP 正式发布。
OpenRouter MCP 服务器将实时模型数据、基准排名、定价、文档和测试推理直接呈现给你和你的智能体,帮助你做出关于选用最佳模型的正确决策。一条命令即可安装,你最喜欢的智能体就能利用 Artificial Analysis、Design Arena 以及 OpenRouter 自身模型排名的最新数据来回答“哪个模型最擅长写代码又不会让我破产”?提示:答案是 GLM-5.2。
立即接入 | 文档
一条命令安装
Claude Code:
claude mcp add --transport http openrouter https://mcp.openrouter.ai/mcp
claude mcp openrouter Codex CLI:
codex mcp add openrouter --url https://mcp.openrouter.ai/mcp
codex mcp openrouter Cursor:添加到 ~/.cursor/mcp.json:
{
"mcpServers": {
"openrouter": { "url": "https://mcp.openrouter.ai/mcp" }
}
} 请参阅接入指南,了解 OAuth 登录及所有支持的客户端。
无需切换标签页即可选对模型
你正在构建一个需要结构化 JSON 输出的功能,希望找一个速度快、价格低、而且在这方面真正擅长的模型。通常你会打开 OpenRouter 网站,浏览模型列表,对比基准测试结果,查看定价,也许还在 Playground 里跑几个测试提示词。这需要花 15 分钟来回切换上下文,连一行集成代码都还没写。
连接 MCP 服务器后,你可以在编程智能体中完成这一切:
You: "I need a model for structured JSON extraction from legal documents.
Fast, under $1/M input tokens, good at following schemas."
Agent: [calls models-list with filters] → [calls benchmarks] → [calls model-endpoints]
Agent: "google/gemini-3-flash-preview fits well: $0.10/M input,
138k context, strong structured output support. Here's the
endpoint with the lowest latency..." 智能体从实时模型目录中拉取数据,交叉参考 Artificial Analysis 智能评分和 Design Arena ELO 排名,并检查各家供应商的定价和延迟。推荐完全基于当前数据,而不是六个月前模型最后一次训练时的旧数据。
提交前先测试
chat-send 让你的智能体向任何模型发送测试提示词,并查看响应、成本以及由哪个提供商提供服务。你的智能体可以并排比较不同模型的回答:
You: "Compare how Claude Opus 4.8, GPT-5.5, and DeepSeek V4 Pro
handle this structured extraction prompt."
Agent: [sends the same prompt to all three via chat-send]
[calls generation-get for each to get cost breakdowns]
Agent: "All three produced valid JSON. Opus 4.8 nailed the edge
case in row 12. GPT-5.5 was 40% cheaper. DeepSeek V4 Pro
was fastest at 180ms TTFB." 模型别名支持后缀:`:online` 用于网页搜索,`:nitro` 用于速度,`:floor` 用于最低价格,`:free` 用于免费端点。你的智能体可以跨变体进行测试,无需你记忆语法。
无需离开编辑器即可搜索文档
你的智能体具备 docs-search 功能,可在 OpenRouter 文档中进行全文搜索。“如何将模型固定到特定提供商?”“工具调用的格式是什么?”“提示缓存如何工作?”你的智能体找到答案并应用,一气呵成。
这正是 MCP 服务器作为开发助手发挥价值之处。你的智能体可以查找所需的确切 API 参数,检查正确的请求格式,并将其集成到你的代码中,无需你亲自查找和阅读文档页面。
专用的、有上限的密钥
该服务器是远程的(本地无需安装任何内容),首次登录会运行 OAuth 流程,生成一个专用的 API 密钥,有效期为 7 天,消费上限为 10 美元(可在审批屏幕上编辑)。该密钥与你其他密钥分开,并显示在你的密钥仪表板上。你可以随时撤销它。
请参阅连接指南,了解如何在 OpenCode、Claude Desktop 以及所有其他受支持的客户端中进行设置。
工具箱里有什么
| 工具 | 功能说明 |
|---|---|
| models-list | 使用筛选条件搜索实时模型目录:价格范围、上下文长度、模态、提供商、模型系列等 |
| model-get | 一个模型的完整详情:能力、定价、上下文窗口、支持的参数 |
| model-endpoints | 按提供商细分:价格、延迟、吞吐量、数据政策 |
| benchmarks | 来自 Artificial Analysis 和 Design Arena 的第三方质量评分 |
| rankings-daily | 按 token 使用量统计哪些模型最常用且正在流行 |
| chat-send | 向任何模型发送测试提示词,获取响应和成本 |
| generation-get | 特定生成的成本、token 数量和提供服务的提供商 |
| docs-search | 跨 OpenRouter 文档的全文搜索 |
| credits-get | 你的账户剩余信用额度 |
| providers-list | 可用于路由偏好的提供商列表 |
| app-rankings | 按类别统计哪些应用带来了最多的 OpenRouter 流量 |
除 chat-send 以外的所有工具均为只读查找操作。chat-send 会使用你 MCP 密钥的余额发起一次计费推理调用。
常见问题
这会取代 OpenRouter API 吗?
不会。MCP 服务器是供你的编码智能体使用的开发助手。它能拉取实时的 OpenRouter 数据,并可以发送测试消息,从而让你的智能体在构建过程中做出明智决策。你的应用仍应直接调用 OpenRouter API。
身份验证是如何工作的?
你的 MCP 客户端会触发一个 OAuth 流程,在你的浏览器中打开 OpenRouter 的授权页面。你批准后,系统会生成一个专用 API 密钥,有效期为 7 天,消费上限为 10 美元。该密钥与你其他的密钥相互独立,你可以随时在控制面板中将其断开。
我的源代码会被发送到任何地方吗?
不会。这些工具是对 OpenRouter API 的只读查找操作。唯一的例外是 chat-send,它只会将你显式传递给它的消息发送给模型。除非你将源代码包含在 chat-send 调用中,否则任何源代码都不会离开你的机器。
立即尝试:连接你的智能体并询问“对我的使用场景来说,哪个模型最好?”