开源大模型推理,
比同行低 20%。

最热门的三款开源大模型 — DeepSeek V3、DeepSeek R1、Qwen3.5-35B-A3B — 通过 OpenAI 兼容 API 提供。价格低于所有同类代理商。只需改一行代码。

无订阅费

兼容 OpenAI

按量付费

python

# 只改一行，就这么简单。
from openai import OpenAI

client = OpenAI(
    base_url="https://api.quicksilverpro.io/v1",
    api_key="your-api-key",
)

价格

最便宜的开源模型推理

每百万 token · 对标 OpenRouter、Together AI、Fireworks

模型	上下文	输入	输出	节省
Qwen3.5-35B-A3B qwen3.5-35b 适合长上下文 RAG、摘要	262K	$0.13 $0.16	$1.00 $1.25	−20%
DeepSeek V3 默认 deepseek-v3 适合对话、代码、结构化输出	128K	$0.24 $0.30	$0.70 $0.88	−20%
DeepSeek R1 推理 deepseek-r1 适合数学、多步推理、逻辑	128K	$0.40 $0.50	$1.70 $2.15	−20%

对标 OpenRouter、Together AI、Fireworks AI。价格以 2026 年 4 月为准。

思考模型（Qwen3.5-35B-A3B、DeepSeek R1）：每次请求内部会消耗"推理 tokens"（通常 500–8,000 个），按输出价计费。max_tokens 只限制可见的 content，不限制推理过程。DeepSeek R1 将推理内容放在 message.reasoning_content；Qwen3.5-35B-A3B 默认隐藏（与 OpenRouter 一致）。一次性简单任务推荐用 deepseek-v3。

我们凭什么便宜 20%（不是套路）

我们是推理基础设施公司，不是中间商。这 20% 的差价来自工程，不是压缩利润 — 而且随着我们把更多技术栈自建，差价会继续扩大。

当下：自建 GPU 容量上线前的过渡阶段

一种过渡策略，让用户今天就省 20%。我们实时对比各大开源推理提供商的价格与健康状态，每个请求发送到当下最便宜的可用上游。只专注三款模型让路由表保持精简、维护成本低 — 省出来的直接给用户。第二阶段才是永久方案。

下一步：在自有 GPU 上部署推理栈

我们正在自建基于 H100/H200 的推理服务层（先 Vast.ai，后期迁至托管机房），使用 SGLang + 连续批处理、EAGLE-3 投机解码、DeepGEMM FP8 量化、SageAttention / ThunderMLA 自研 kernel。这些技术都是公开的，我们正在做工程整合和生产化。目标：DeepSeek V3 再降 30-50%。

为什么只有开源模型走得通

权重公开 — 我们才能真正地运行和优化。闭源模型（GPT-4、Claude）不开放权重，再多的基础设施工作也无法让它们便宜。所以我们的目录只有三款能验证、能路由、将来能自托管的开源模型 — 而不是 150 款里有一半我们无法把控的转售杂烩。

新命令行

`qsp` 命令行工具

为终端和 AI 代理而生。每个命令都支持 --json 输出 + 稳定的退出码 — Claude Code、Cursor、Aider 等代理可以直接调用，无需解析 HTML。

PyPI GitHub 🍺 Homebrew

# 安装 — macOS / Linux

$ brew install machinefi/qspro/qspro

# 或任意 Python 环境

$ pipx install quicksilverpro

# 登录并开始使用

$ qsp init

$ qsp chat "写一首俳句"

$ qsp balance

$ qsp models

# 代理友好 — 管道 + JSON

$ qsp chat "..." --json | jq .usage.cost

即插即用的 OpenAI 替代

兼容所有 OpenAI SDK。只需改一下 base_url — 就这样。

用多少付多少

按需预付，额度不过期。按 token 计费，无起充门槛。

生产就绪

自动重试、流式输出、速率限制。提供实时状态和企业 DPA。

常见问题

Common questions

QuickSilver Pro 是什么？

一个兼容 OpenAI 接口的 HTTP API，面向三款最热门的开源大模型 — DeepSeek V3、DeepSeek R1、Qwen3.5-35B-A3B。只要把官方 OpenAI SDK 指向我们的 base URL，就能使用相同的 chat-completions 接口，比同类代理商便宜 20%。

支持哪些模型？

DeepSeek V3（通用对话、代码、严格 JSON）、DeepSeek R1（推理、数学、逻辑）、Qwen3.5-35B-A3B（3B 激活 MoE、262K 上下文、长文档 RAG）。三款均为完全开源，且是 OpenRouter 上最受欢迎的三款开源模型。

比 OpenRouter / OpenAI 便宜多少？

在相同开源模型上，比 OpenRouter、Together AI、Fireworks AI、DeepInfra 的公开每 token 价格低 20%。DeepSeek V3：$0.24 输入 / $0.70 输出，每百万 token。DeepSeek R1：$0.40 / $1.70。Qwen3.5-35B-A3B：$0.13 / $1.00。我们不提供闭源模型（GPT-4、Claude）。

真的可以直接替代 OpenAI 吗？

是的。在官方 openai Python / Node / Swift SDK 中把 base_url 改为 https://api.quicksilverpro.io/v1 即可。流式、工具调用、json_schema 严格模式、usage.cost 账单都原生支持。详见快速上手里的代码片段。

能用在 Aider、Cline、Cursor、LangChain、Vercel AI SDK 吗？

都能用 — 任何接受自定义 OpenAI base URL 的工具都兼容：Aider、Cline、Cursor、Continue、LangChain、LlamaIndex，以及 Vercel AI SDK（通过 @ai-sdk/openai-compatible）。指向 https://api.quicksilverpro.io/v1，配上你的 QSP API 密钥即可。

从 OpenRouter 迁移怎么做？

两行搞定。把 base_url 从 openrouter.ai/api/v1 改为 api.quicksilverpro.io/v1，换上新 API 密钥。模型 ID 去掉提供方前缀：deepseek/deepseek-chat → deepseek-v3，deepseek/deepseek-r1 → deepseek-r1，qwen/qwen3.5-35b-a3b → qwen3.5-35b。

有免费额度吗？

新账户注册送 $1 免费额度 — 足够进行约 500-700 次真实的 DeepSeek V3 调用来评估服务。之后按量付费，起充 $5，无订阅费。

谁在运营 QuickSilver Pro？

QuickSilver Pro 由 MachineFi Inc.（特拉华注册的 C-Corp，总部位于美国加州门洛帕克）运营。我们在为开源 AI 构建推理基础设施 — 下一步计划请见路线图（自有 H100/H200 GPU 配合 SGLang + EAGLE-3 + FP8）。

今天就开始节省推理成本

注册账户、充值、获取 API 密钥，30 秒搞定。

获取 API 密钥

开源大模型推理, 比同行低 20%。