精选开源大模型 · 比同行便宜 20%

开源大模型推理,
比同行低 20%。

最热门的三款开源大模型 — DeepSeek V3、DeepSeek R1、Qwen3.5-35B-A3B — 通过 OpenAI 兼容 API 提供。价格低于所有同类代理商。只需改一行代码。

无订阅费
兼容 OpenAI
按量付费
python
# 只改一行,就这么简单。
from openai import OpenAI

client = OpenAI(
    base_url="https://api.quicksilverpro.io/v1",
    api_key="your-api-key",
)
价格

最便宜的开源模型推理

每百万 token · 对标 OpenRouter、Together AI、Fireworks

模型 上下文 输入 输出 节省
Qwen3.5-35B-A3B
qwen3.5-35b
适合 长上下文 RAG、摘要
262K $0.13 $0.16 $1.00 $1.25 −20%
DeepSeek V3
默认
deepseek-v3
适合 对话、代码、结构化输出
128K $0.24 $0.30 $0.70 $0.88 −20%
DeepSeek R1 推理
deepseek-r1
适合 数学、多步推理、逻辑
128K $0.40 $0.50 $1.70 $2.15 −20%

对标 OpenRouter、Together AI、Fireworks AI。价格以 2026 年 4 月为准。

思考模型(Qwen3.5-35B-A3B、DeepSeek R1):每次请求内部会消耗"推理 tokens"(通常 500–8,000 个),按输出价计费。max_tokens 只限制可见的 content,不限制推理过程。DeepSeek R1 将推理内容放在 message.reasoning_content;Qwen3.5-35B-A3B 默认隐藏(与 OpenRouter 一致)。一次性简单任务推荐用 deepseek-v3

我们凭什么便宜 20%(不是套路)

我们是推理基础设施公司,不是中间商。这 20% 的差价来自工程,不是压缩利润 — 而且随着我们把更多技术栈自建,差价会继续扩大。

1
当下:自建 GPU 容量上线前的过渡阶段
一种过渡策略,让用户今天就省 20%。我们实时对比各大开源推理提供商的价格与健康状态,每个请求发送到当下最便宜的可用上游。只专注三款模型让路由表保持精简、维护成本低 — 省出来的直接给用户。第二阶段才是永久方案。
2
下一步:在自有 GPU 上部署推理栈
我们正在自建基于 H100/H200 的推理服务层(先 Vast.ai,后期迁至托管机房),使用 SGLang + 连续批处理、EAGLE-3 投机解码、DeepGEMM FP8 量化SageAttention / ThunderMLA 自研 kernel。这些技术都是公开的,我们正在做工程整合和生产化。目标:DeepSeek V3 再降 30-50%。
3
为什么只有开源模型走得通
权重公开 — 我们才能真正地运行和优化。闭源模型(GPT-4、Claude)不开放权重,再多的基础设施工作也无法让它们便宜。所以我们的目录只有三款能验证、能路由、将来能自托管的开源模型 — 而不是 150 款里有一半我们无法把控的转售杂烩。
命令行

qsp 命令行工具

为终端和 AI 代理而生。每个命令都支持 --json 输出 + 稳定的退出码 — Claude Code、Cursor、Aider 等代理可以直接调用,无需解析 HTML。

# 安装 — macOS / Linux
$ brew install machinefi/qspro/qspro
# 或任意 Python 环境
$ pipx install quicksilverpro
# 登录并开始使用
$ qsp init
$ qsp chat "写一首俳句"
$ qsp balance
$ qsp models
# 代理友好 — 管道 + JSON
$ qsp chat "..." --json | jq .usage.cost

即插即用的 OpenAI 替代

兼容所有 OpenAI SDK。只需改一下 base_url — 就这样。

用多少付多少

按需预付,额度不过期。按 token 计费,无起充门槛。

生产就绪

自动重试、流式输出、速率限制。提供 实时状态企业 DPA

常见问题

Common questions

QuickSilver Pro 是什么?

一个兼容 OpenAI 接口的 HTTP API,面向三款最热门的开源大模型 — DeepSeek V3DeepSeek R1Qwen3.5-35B-A3B。只要把官方 OpenAI SDK 指向我们的 base URL,就能使用相同的 chat-completions 接口,比同类代理商便宜 20%。

支持哪些模型?

DeepSeek V3(通用对话、代码、严格 JSON)、DeepSeek R1(推理、数学、逻辑)、Qwen3.5-35B-A3B(3B 激活 MoE、262K 上下文、长文档 RAG)。三款均为完全开源,且是 OpenRouter 上最受欢迎的三款开源模型。

比 OpenRouter / OpenAI 便宜多少?

在相同开源模型上,比 OpenRouter、Together AI、Fireworks AI、DeepInfra 的公开每 token 价格低 20%。DeepSeek V3:$0.24 输入 / $0.70 输出,每百万 token。DeepSeek R1:$0.40 / $1.70。Qwen3.5-35B-A3B:$0.13 / $1.00。我们不提供闭源模型(GPT-4、Claude)。

真的可以直接替代 OpenAI 吗?

是的。在官方 openai Python / Node / Swift SDK 中把 base_url 改为 https://api.quicksilverpro.io/v1 即可。流式、工具调用、json_schema 严格模式、usage.cost 账单都原生支持。详见 快速上手 里的代码片段。

能用在 Aider、Cline、Cursor、LangChain、Vercel AI SDK 吗?

都能用 — 任何接受自定义 OpenAI base URL 的工具都兼容:Aider、Cline、Cursor、Continue、LangChain、LlamaIndex,以及 Vercel AI SDK(通过 @ai-sdk/openai-compatible)。指向 https://api.quicksilverpro.io/v1,配上你的 QSP API 密钥即可。

从 OpenRouter 迁移怎么做?

两行搞定。把 base_urlopenrouter.ai/api/v1 改为 api.quicksilverpro.io/v1,换上新 API 密钥。模型 ID 去掉提供方前缀:deepseek/deepseek-chatdeepseek-v3deepseek/deepseek-r1deepseek-r1qwen/qwen3.5-35b-a3bqwen3.5-35b

有免费额度吗?

新账户注册送 $1 免费额度 — 足够进行约 500-700 次真实的 DeepSeek V3 调用来评估服务。之后按量付费,起充 $5,无订阅费。

谁在运营 QuickSilver Pro?

QuickSilver Pro 由 MachineFi Inc.(特拉华注册的 C-Corp,总部位于美国加州门洛帕克)运营。我们在为开源 AI 构建推理基础设施 — 下一步计划请见 路线图(自有 H100/H200 GPU 配合 SGLang + EAGLE-3 + FP8)。

今天就开始节省推理成本

注册账户、充值、获取 API 密钥,30 秒搞定。

获取 API 密钥