QuickSilver Pro vs DeepInfra
DeepInfra — самый бюджетный вариант среди посредников DeepSeek. QuickSilver Pro всё равно ниже: ~на 20% дешевле на выходе DeepSeek V3, ~на 22% дешевле на выходе DeepSeek R1. Если вы уже на DeepInfra из-за чувствительности к цене, дополнительная экономия накапливается. Тот же совместимый с OpenAI API, миграция в две строки.
Кратко
| Характеристика | QuickSilver Pro | DeepInfra |
|---|---|---|
| Фокус каталога | 3 открытых LLM | 60+ открытых моделей, vision, аудио |
| Цена выхода DeepSeek V3 | $0.70 / 1M | $0.88 / 1M |
| Цена выхода DeepSeek R1 | $1.70 / 1M | $2.19 / 1M |
| Скидка на кешированный ввод | Пока нет | Да (DeepSeek V3/V3.1) |
| Эмбеддинги · аудио · изображения | Нет | Да |
| Выделенные деплои | Нет | Да |
| Совместимый с OpenAI чат | Да | Да |
| Минимальное пополнение | $5 | $20 |
Цены (за миллион токенов, USD)
Публичные прайс-листы по состоянию на апрель 2026 года. DeepInfra также предлагает скидки на кешированный ввод (не показаны).
| Модель | QSP вход | QSP выход | DeepInfra вход | DeepInfra выход | Экономия на выходе |
|---|---|---|---|---|---|
| DeepSeek V3 | $0.24 | $0.70 | $0.28 | $0.88 | ~20% |
| DeepSeek R1 | $0.40 | $1.70 | $0.55 | $2.19 | ~22% |
| Qwen3.5-35B-A3B | $0.13 | $1.00 | Сопоставимо | — | |
На нагрузке DeepSeek V3 (1M вход + 300k выход в день) QuickSilver Pro обходится в $0.45/день против $0.54/день у DeepInfra. Разрыв меньше, чем против Together или Fireworks, но всё ещё ощутим на масштабе.
Миграция — две строки
from openai import OpenAI
client = OpenAI(
base_url="https://api.deepinfra.com/v1/openai",
api_key=os.environ["DEEPINFRA_KEY"],
)
r = client.chat.completions.create(
model="deepseek-ai/DeepSeek-V3",
messages=[{"role": "user", "content": "Hi"}],
)
from openai import OpenAI
client = OpenAI(
base_url="https://api.quicksilverpro.io/v1",
api_key=os.environ["QSP_KEY"],
)
r = client.chat.completions.create(
model="deepseek-v3",
messages=[{"role": "user", "content": "Hi"}],
)
deepseek-ai/DeepSeek-V3 → deepseek-v3deepseek-ai/DeepSeek-R1 → deepseek-r1Qwen/Qwen3.5-35B-A3B → qwen3.5-35bЧестные компромиссы
- ›Вы хотите минимальную прайс-лист цену за токен на DeepSeek V3 и R1.
- ›Ваша нагрузка мало выигрывает от кеш-скидки DeepInfra (низкая доля повторяющихся промптов).
- ›Вам нужен минимум $5 вместо $20.
- ›Вы полагаетесь на их скидку на кешированный ввод (>50% попаданий в кеш).
- ›Вы используете эмбеддинги, аудио Whisper или модели изображений.
- ›Нужны Llama, Mistral или другие открытые модели помимо DeepSeek и Qwen.
- ›Вам нужен serverless GPU под собственные кастомные модели (контейнерный хостинг, биллинг посекундно) — мы обслуживаем только три курируемые модели.
- ›Вы готовы терпеть задержку ради скидочного batch inference — у DeepInfra есть batch-эндпоинт, у нас только real-time.
- ›Ваше приложение выходит за пределы текста — vision / OCR / speech-to-text / TTS всё есть в каталоге DeepInfra и нет в нашем.
FAQ
Насколько дешевле?
По прайс-листу: ~на 14% дешевле вход + ~на 20% дешевле выход на DeepSeek V3. ~на 27% дешевле вход + ~на 22% дешевле выход на DeepSeek R1. Цены на кешированный ввод у DeepInfra могут менять арифметику; для нагрузок с высокой долей кеша сравнивайте эффективную стоимость запроса.
Как мигрировать?
Две строки: поменяйте base_url на api.quicksilverpro.io/v1, новый API-ключ, уберите префикс deepseek-ai/ или Qwen/.
Поддерживает ли QuickSilver Pro prompt caching?
Пока нет как отдельного тарифа. Скидка на кешированный ввод у DeepInfra может снизить эффективную стоимость входа на повторяющихся промптах. Сравните оба провайдера, если доля попаданий в кеш существенна для вашей нагрузки.
А что с эмбеддингами / аудио / изображениями?
Не предлагается. QuickSilver Pro — только chat-completions на трёх LLM. DeepInfra покрывает эти модальности.
Разбор месячных расходов
Смешанная нагрузка hobby / production SaaS — indie-приложение с V3 для обычного чата и R1 под фичу «объясни ход рассуждений», поделено поровну. Месячный профиль: 10M входных токенов и 3M выходных токенов, разделённых 50/50 между V3 и R1.
V3 5M × $0.24 = $1.20
V3 1.5M × $0.70 = $1.05
R1 5M × $0.40 = $2.00
R1 1.5M × $1.70 = $2.55
—————————————————————
Итого = $6.80/мес
V3 5M × $0.28 = $1.40 V3 1.5M × $0.88 = $1.32 R1 5M × $0.55 = $2.75 R1 1.5M × $2.19 = $3.29 ————————————————————— Итого = $8.76/мес
Это $1.96 экономии в месяц, ~22% меньше. В абсолюте разница выглядит скромно — потому что DeepInfra и так агрессивно цены держит — но форма экономии важна: R1 даёт ~$1.49 из $1.96, так что чем больше у вас reasoning-нагрузки, тем заметнее разрыв. Кеш-зависимые нагрузки на DeepInfra могут часть этого закрыть — сверяйте на реальном трафике перед переходом.
Аптайм и надёжность
QuickSilver Pro сейчас в переходной фазе: запросы маршрутизируются через несколько upstream-провайдеров инференса на одних и тех же открытых весах. Если у одного upstream отказ или кончается capacity, роутер переключается на следующий. Доступность по моделям, p50 / p95 латентность и история инцидентов публикуются на нашей статусной странице. Собственные GPU-мощности появятся в Q2 2026, и тогда форма маршрутизации изменится.
DeepInfra держит собственный GPU-флот, но на момент написания не публикует публичную статусную страницу или дашборд аптайма в реальном времени — мы не собираемся выдумывать цифры, которые не можем проверить. Сообщения об инцидентах у них идут через Discord-сообщество и статус-посты, а не по выделенному URL, на который можно сослаться. Если прозрачность аптайма критична для вашего решения, обе команды поделятся данными по недавним инцидентам по запросу; ни на чью PR-подачу полагаться не стоит.
Сравнения с другими посредниками
Попробуйте на $1 бесплатных кредитов
Миграция в две строки; пусть экономия на выходе говорит сама за себя.
Получить API-ключ