OpenRouter推出统一图像API
阅读原文· openrouter.aiOpenRouter 把 30+ 图像模型收进一个 API,参数自动发现和流式预览让频繁切换模型的开发者省去不少适配麻烦,尤其对 Agent 工作流很友好。
OpenRouter推出统一图像API,整合Google、OpenAI、Black Forest Labs、Recraft、ByteDance、Sourceful、Microsoft、xAI等30+模型。新API提供标准化请求格式,通过/api/v1/images/models端点返回每个模型的分辨率、宽高比、输出数量、输入参考图数量、种子等能力描述;通过/api/v1/images/models/{id}/endpoints端点获取具体服务商的定价与参数支持(如Seedream 4.5每张$0.04、FLUX.2 Pro每百万像素$0.03、GPT-5.4 Image 2按token计费)。OpenAI的GPT 5系列图像模型支持SSE流式预览,启用"stream": true即可边生成边返回预览。新图像模型将仅添加至专用API,建议现有用户切换。
统一图像 API 发布
布莱恩·托马斯 · 2026 年 6 月 23 日

- 了解每个模型的能力
- 按提供商细粒度控制
- 同一请求格式,任意模型
- GPT 图像模型的流式预览
- 常见问题
现在,OpenRouter 上的图像生成拥有专属 API,可统一访问 30 多个模型。
与我们所有的媒体生成 API 一样,我们标准化了接口以便轻松切换模型,允许透传以支持各模型的独特能力,并提供编程方式以发现每个模型的详细能力。我们支持来自 Google、OpenAI、Black Forest Labs、Recraft、字节跳动、Sourceful、Microsoft 和 xAI 的模型,并且还在不断添加更多。
浏览图像模型 | API 文档 | 在 Playground 中试用
了解每个模型的能力
图像模型之间的差异会导致请求失败。Seedream 4.5 支持 18 种宽高比;Gemini 3.1 Flash Image 支持 14 种(有重叠,但不完全相同)。有些模型每次调用最多生成 10 张图片;其他模型上限为 1 张。有些模型接受 16 个输入参考;其他模型只接受 4 个。
`/api/v1/images/models` 端点会为每个模型返回带类型的能力描述信息:
{
"id": "bytedance-seed/seedream-4.5",
"supported_parameters": {
"resolution": { "type": "enum", "values": ["1K", "2K", "4K"] },
"aspect_ratio": { "type": "enum", "values": ["1:1", "16:9", "9:16", "..."] },
"n": { "type": "range", "min": 1, "max": 10 },
"input_references": { "type": "range", "min": 0, "max": 14 },
"seed": { "type": "boolean" }
},
"supports_streaming": false
} 你的代码可以适应任何模型,无需硬编码提供商差异,也不用因不接受的参数而遭遇 400 错误。
这对 AI 智能体尤其有用。将 `/api/v1/images/models` 的响应提供给你的编程智能体,它就能获得选择模型、验证输入并生成图像所需的全部信息,无需反复试错。
按提供商细粒度控制
每个模型可能由多个提供商提供服务。每个端点的记录(`/api/v1/images/models/{id}/endpoints`)会为你提供每个提供商的确切信息:该特定端点接受哪些参数、允许哪些透传键、是否支持流式传输以及细粒度的定价。
curl "https://openrouter.ai/api/v1/images/models/google/gemini-3.1-flash-image/endpoints" 每个端点还会返回一个定价数组,包含精确的计费结构。不同的提供商采用不同的计费单位:
"pricing": [
{ "billable": "output_image", "unit": "image", "cost_usd": 0.04 }
] Seedream 4.5 按每张图片固定 $0.04 收费。FLUX.2 Pro 按每百万像素 $0.03 计费(因此分辨率影响成本)。GPT-5.4 Image 2 和 Gemini 3.1 Flash Image 按 token 计费。不再需要猜测某次生成花费了多少;每个响应中的 usage 对象都会包含以美元计的确切成本。
同一请求格式,任意模型
API将碎片化的图像生成世界统一为单一模式:
curl -X POST "https://openrouter.ai/api/v1/images" \
-H "Authorization: Bearer $OPENROUTER_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "bytedance-seed/seedream-4.5",
"prompt": "a red panda astronaut floating in space, studio lighting",
"resolution": "2K",
"aspect_ratio": "16:9"
}' 分辨率、宽高比、质量、输出格式、背景透明度、输入参考、流式传输:全部在所有提供商之间实现标准化。当您需要提供商特定功能(如Black Forest Labs的steps或guidance)时,可通过provider.options传递,并按照端点API中提供商slug的键名进行设置。
GPT图像模型的流式预览
OpenAI的GPT Image模型(GPT-5 Image、GPT-5 Image Mini、GPT-5.4 Image 2)通过Image API支持原生SSE流式传输。设置"stream": true后,您将在渲染过程中接收到部分图像预览,使用户能够看到进度,而无需等待完整生成。检查任意端点的supports_streaming字段即可查看是否支持该功能。
常见问题
通过聊天补全生成的图像会怎样处理?
此前,我们通过completions和responses支持图像生成。所有现有图像模型继续在此受支持,但新增图像模型将仅添加到专用的Image API中。
如果您正在使用openai/gpt-5-image、openai/gpt-5-image-mini或openai/gpt-5.4-image-2,我们建议切换到专用图像模型。GPT 5和5.4版本通过大语言模型生成图像,因此无法访问完整的受支持参数集,并且可能产生额外的推理成本。
能否使用提供商特定功能?
可以。每个端点会公开一个allowed_passthrough_parameters列表。您可以在provider.options下按提供商slug的键名传递提供商特定的键。端点API会明确告知哪些键被接受。
定价如何运作?
每个端点会返回详细的定价行,包含计费单位、美元成本以及可选的变体层级(例如基于分辨率的定价)。每个响应中的usage对象都包含精确成本。
欢迎在Discord的#feedback频道告诉我们您的想法以及您希望接下来增加哪些模型。