如何将 SillyTavern 连接到 OpenRouter(2026 指南)
如果你用 SillyTavern 玩角色扮演,这篇官方教程能让你五分钟接上 300+ 模型,但本身只是基础操作指南,没给出新认知。
一个 OpenRouter API 密钥即可在 SillyTavern 的下拉菜单中解锁 300 多个模型,其中许多免费。指南包含五步连接流程、推荐尝试的角色扮演模型以及常见错误的修复方法。
如何将 SillyTavern 连接到 OpenRouter(2026 年指南)
OpenRouter · 2026 年 6 月 18 日
- 五步将 SillyTavern 连接到 OpenRouter
- 免费模型与 10 美元信用额度规则
- 值得尝试的角色扮演模型
- 重要设置与路由
- 保持角色扮演聊天私密
- 修复最常见错误
- 常见问题解答
通常,在 SillyTavern 中使用多个 AI 模型需要分别注册 Anthropic、Google、Mistral 等多家服务商,每个服务商都有各自账号,通常还要支付每月 20 美元的订阅费。而一个 OpenRouter 密钥即可替代这一切——只需一个信用额度余额,就能在 SillyTavern 的下拉菜单中使用来自 70 多家服务商的 300 多个模型。许多模型可以免费开始使用,大约五分钟就能开始聊天。
本指南涵盖连接步骤、值得尝试的角色扮演模型、真正重要的设置,以及 SillyTavern 用户最常遇到的错误修复方法。
五步将 SillyTavern 连接到 OpenRouter
在 SillyTavern 的“API 连接”面板中进行操作。目标是将 SillyTavern 指向 OpenRouter,验证你的密钥,选择一个模型,并在开始长对话前发送一条测试消息。
- 打开“API 连接”面板(顶栏中的插头图标),将 API 类型设置为 Chat Completion。
- 将 Chat Completion Source(聊天补全来源)设置为 OpenRouter。
- 点击“Authorize”通过 OAuth 流程创建密钥,或者访问 openrouter.ai/settings/keys 生成一个密钥,然后粘贴到 API 密钥字段中。
- 点击“Connect”,等待 SillyTavern 验证密钥。
- 从下拉菜单中选择一个模型,然后点击“Test Message”。
在开始长时间会话之前,先发送那条测试消息。成功的连接仅证明 SillyTavern 能验证你的密钥。如果模型不可用、服务商路由无法处理请求、slug 错误、你的账户无法访问该模型,或者你的提示词超过了模型的上下文窗口,生成仍然可能失败。
几乎所有场景都应使用聊天补全功能。图片内联和工具调用仅能通过聊天补全实现,这与当前 OpenRouter 模型对提示词的期望方式一致。文本补全为高级用户提供了对原始提示格式更精细的控制,但并非入门选择。如果你在所用版本的 OpenRouter 仅显示在聊天补全来源中,这是正常情况。完整配置详情请查阅 SillyTavern OpenRouter 文档。
免费模型与 10 美元积分规则
标记为 :free 的模型按每个 token 零成本收费,但仍有请求限制,这一点常让人措手不及。
| 账户状态 | 每日 :free 上限 | 每分钟上限 |
|---|---|---|
| 积分不足 10 美元 | 50 次请求/天 | 20 次请求/分钟 |
| 积分达 10 美元或以上 | 1000 次请求/天 | 20 次请求/分钟 |
这 10 美元是一次性积分购买,并非订阅,且可用于付费模型。OpenRouter 在供应商定价上不附加任何加价,因此目录价格即为你所支付的费用,失败的请求不会计费。如果你已直接向某供应商付费并希望保留那份合同,可以改用自备密钥的方式。
“免费”模型上出现收费几乎总是意味着按 token 计费与请求限制二者被搞混了。请检查你是否实际选择了付费模型、启用了付费回退路由,或使用了不以 :free 结尾的模型标识。达到免费模型上限是一个限制问题,并非免费模型在向你收费。
值得尝试的角色扮演模型
DeepSeek V3.2 是处理长场景时廉价、可靠的默认选择。想要更具表现力、过滤更少的文本,可以试试 Euryale 微调模型。当角色卡包含模型必须遵循的复杂指令时,Hermes 4 405B 的表现优于大多数模型。
| 模型标识 | 上下文长度 | 输入/输出(每百万 token) | 免费变体 | 最佳适用场景 |
|---|---|---|---|---|
| deepseek/deepseek-v3.2 | 131K | $0.23 / $0.34 | 无 | 适合长时间会话的廉价、连贯默认选择 |
| deepseek/deepseek-r1-0528 | 164K | $0.50 / $2.15 | 无 | 推理密集型场景与策划 |
| sao10k/l3.3-euryale-70b | 131K | $0.65 / $0.75 | 无 | 长窗口下富有角色性的 RP 文本 |
| gryphe/mythomax-l2-13b | 4K | $0.06 / $0.06 | 无 | 经典预算级主力,上下文极短 |
| aion-labs/aion-rp-llama-3.1-8b | 32K | $0.80 / $1.60 | 无 | 专为角色扮演调优的轻量模型 |
| nousresearch/hermes-4-405b | 131K | $1.00 / $3.00 | 无 | 复杂卡牌、严格遵循指令 |
| z-ai/glm-4.6 | 203K | $0.43 / $1.74 | 无 | 强大的通用模型 |
| mistralai/mistral-large-2512 | 262K | $0.50 / $1.50 | 否 | 精致的付费选项,过滤较少 |
价格和上下文窗口已于2026年6月16日根据 OpenRouter 目录核实。每 token 费率会变化,因此在长时间会话前请到模型页面确认。
免费变体时有增减,模型本身并不改变,且它们运行的上下文窗口通常小于付费版本。这就是角色卡在对话中途开始遗忘的常见原因。在围绕任何免费模型搭建配置之前,请查看 openrouter.ai/models?q=free 并确认具体的 :free slug 仍然有效。
重要的设置与路由
先从能让对话保持稳定的设置入手,等连接稳定后再进行调优。
- 开启流式传输,这样回复会随着模型生成而实时显示。
- 将上下文长度滑块设置为上表中该模型的实际窗口大小。免费变体的窗口更小,所以请查阅目录页面,而非第三方指南。
- 保留备用提供商(fallback providers)以保障可靠性。仅当您需要精确控制由哪个提供商处理请求时才禁用它们。
- 对需要长时间运行、带有大型系统提示词或反复使用 lorebook 上下文的角色,使用提示词缓存(prompt caching)。这不会让请求变免费,但能降低多轮对话中重复输入的成本。
两个路由后缀会附加在模型 slug 的末尾。`:nitro` 定向到最快的提供商;`:floor` 定向到最便宜的提供商。两者均对应 OpenRouter 的提供商路由排序选项。对于使用固定角色卡的长时间会话,`:floor` 加提示词缓存能显著降低成本。对于时效性要求高的生成任务,请使用 `:nitro`。
关于流式传输的计费说明:只有在支持取消功能的提供商上,中止流式传输才会停止处理并停止计费。有些提供商不支持此功能,包括 AWS Bedrock、Groq、Google、Google AI Studio、Minimax 和 Mistral。对于这些提供商,或对于非流式请求,模型可能继续运行至完成,并对完整响应进行计费。
将角色扮演对话设为私密
OpenRouter 的隐私保护分为两个层面:一是 OpenRouter 存储了什么,二是处理你请求的提供商存储了什么。OpenRouter 不会存储提示词或回复,除非你选择开启日志记录,但它会保留使用元数据,如 token 数量和延迟。下游提供商有自己的数据保留策略,这就是路由控制重要的原因。
启用零数据保留,即可将请求仅路由到不存储提示词或回复的提供商(可按请求级别或账户级别设置)。OpenRouter 可能会为选择开启提示词和补全日志的用户提供小幅折扣;大多数角色扮演用户应关闭此功能,以免角色卡和聊天历史暴露在日志中。
OpenRouter 本身不进行内容过滤,但它会将请求路由到执行自身政策的提供商,因此称其设置为“无审查”有些夸大。如果某个模型持续拒绝或截断场景,那是提供商的审核机制在起作用。请切换到过滤更少的模型或提供商。信任中心有详细信息。
修复最常见的错误
大多数 SillyTavern 和 OpenRouter 的问题集中在几种模式上。从具体的错误信息入手,然后应用相应的修复方法。
“无法验证 OpenRouter token。”这是一个常见错误,错误信息具有误导性。密钥几乎总是正常的;真正的原因是 DNS 或网络问题导致 SillyTavern 无法访问 openrouter.ai,因此请求从未得到验证。请在密钥页面确认密钥处于激活状态,重新粘贴密钥(确保末尾无空格),如果使用 OAuth 则重新授权,然后重启。如果问题仍然存在,将 DNS 解析器切换到 8.8.8.8 或 1.1.1.1,然后重启。大多数情况下,DNS 就是解决方案。
401 错误。这意味着 OpenRouter 拒绝了 SillyTavern 发送的密钥。请重新生成密钥,再次粘贴时确保末尾无空格,如果调用的是付费模型,请确认账户有足够的积分。
OpenRouter 未出现在源列表中。请先将 API 类型设置为 Chat Completion,因为它在其他类型下不会显示。更新并重启 SillyTavern。仅在老旧或非常规安装中才编辑 config.yaml,且其中 show_openrouter_api: true 是作为临时解决方案存在,并非默认设置。更改前请查阅相关的 SillyTavern 问题。
空模型下拉菜单。账户通常是正常的;SillyTavern 未能加载列表。刷新连接并重启。如果仍然失败,请从模型页面手动输入确切的模型 slug。
连接成功,但生成失败。连接仅证明密钥有效。切换到另一个模型并测试,确认账户有付费模型的额度,检查 slug,如果大卡片、知识书或历史记录超出上下文窗口,则降低上下文长度。
常见问题
如何将 OpenRouter 连接到 SillyTavern?
打开 API 连接面板,将 API 类型设置为 Chat Completion,选择 OpenRouter 作为来源,点击 Authorize 获取 OAuth 密钥或从 openrouter.ai/settings/keys 粘贴一个,点击 Connect,选择一个模型,然后发送一条测试消息。
OpenRouter 对 SillyTavern 真的免费吗?
对于标记为 :free 的模型,是的,有限制。免费模型的使用上限为每天 50 次请求,每分钟 20 次。一次性购买 $10 的额度可将每日上限提高到 1000 次请求,而每分钟上限保持不变。这不是订阅,额度可用于付费模型。
最适合 SillyTavern 角色扮演的免费模型是什么?
meta-llama/llama-3.3-70b-instruct:free 是一个强劲的选择,当可用时具有 131K 的上下文。免费模型的可用性经常变化,因此在围绕它构建设置之前,请确认确切的 :free slug 在 openrouter.ai/models?q=free 上是否可用。
如何修复“无法验证 OpenRouter token”?
这通常是 DNS 或网络问题,而不是密钥本身的问题。将 DNS 切换为 8.8.8.8(Google)或 1.1.1.1(Cloudflare),确认密钥处于活动状态,重新粘贴时注意不要有尾部空格,然后重启 SillyTavern。
为什么我的生成提前停止?
首先检查响应的 finish reason,因为同样的症状有多种原因:提供方审查、最大 token 数限制、上下文长度问题或流式行为。如果某个提供方不断截断场景,请尝试另一个模型或提供方,然后如果回复仅仅是结束得太早,则提高最大输出设置。
为 SillyTavern 使用 OpenRouter 还是单一提供方密钥?
如果你只使用一个提供商,并且希望计费最简单,那么请使用直接密钥。如果你希望一个设置适配多种模型、提供商路由、路由故障时自动回退、免费模型供实验,以及统一的积分池,那么请使用 OpenRouter。