Главная / Сравнение / против DeepInfra
Сравнение

QuickSilver Pro vs DeepInfra

DeepInfra — самый бюджетный вариант среди посредников DeepSeek. QuickSilver Pro всё равно ниже: ~на 20% дешевле на выходе DeepSeek V3, ~на 22% дешевле на выходе DeepSeek R1. Если вы уже на DeepInfra из-за чувствительности к цене, дополнительная экономия накапливается. Тот же совместимый с OpenAI API, миграция в две строки.

Кратко

Характеристика QuickSilver Pro DeepInfra
Фокус каталога3 открытых LLM60+ открытых моделей, vision, аудио
Цена выхода DeepSeek V3$0.70 / 1M$0.88 / 1M
Цена выхода DeepSeek R1$1.70 / 1M$2.19 / 1M
Скидка на кешированный вводПока нетДа (DeepSeek V3/V3.1)
Эмбеддинги · аудио · изображенияНетДа
Выделенные деплоиНетДа
Совместимый с OpenAI чатДаДа
Минимальное пополнение$5$20

Цены (за миллион токенов, USD)

Публичные прайс-листы по состоянию на апрель 2026 года. DeepInfra также предлагает скидки на кешированный ввод (не показаны).

Модель QSP вход QSP выход DeepInfra вход DeepInfra выход Экономия на выходе
DeepSeek V3 $0.24 $0.70 $0.28 $0.88 ~20%
DeepSeek R1 $0.40 $1.70 $0.55 $2.19 ~22%
Qwen3.5-35B-A3B $0.13 $1.00 Сопоставимо

На нагрузке DeepSeek V3 (1M вход + 300k выход в день) QuickSilver Pro обходится в $0.45/день против $0.54/день у DeepInfra. Разрыв меньше, чем против Together или Fireworks, но всё ещё ощутим на масштабе.

Миграция — две строки

До · DeepInfra
from openai import OpenAI

client = OpenAI(
    base_url="https://api.deepinfra.com/v1/openai",
    api_key=os.environ["DEEPINFRA_KEY"],
)

r = client.chat.completions.create(
    model="deepseek-ai/DeepSeek-V3",
    messages=[{"role": "user", "content": "Hi"}],
)
После · QuickSilver Pro
from openai import OpenAI

client = OpenAI(
    base_url="https://api.quicksilverpro.io/v1",
    api_key=os.environ["QSP_KEY"],
)

r = client.chat.completions.create(
    model="deepseek-v3",
    messages=[{"role": "user", "content": "Hi"}],
)
Соответствие ID моделей:
deepseek-ai/DeepSeek-V3deepseek-v3
deepseek-ai/DeepSeek-R1deepseek-r1
Qwen/Qwen3.5-35B-A3Bqwen3.5-35b

Честные компромиссы

Выбирайте QuickSilver Pro, когда
  • Вы хотите минимальную прайс-лист цену за токен на DeepSeek V3 и R1.
  • Ваша нагрузка мало выигрывает от кеш-скидки DeepInfra (низкая доля повторяющихся промптов).
  • Вам нужен минимум $5 вместо $20.
Оставайтесь на DeepInfra, когда
  • Вы полагаетесь на их скидку на кешированный ввод (>50% попаданий в кеш).
  • Вы используете эмбеддинги, аудио Whisper или модели изображений.
  • Нужны Llama, Mistral или другие открытые модели помимо DeepSeek и Qwen.
  • Вам нужен serverless GPU под собственные кастомные модели (контейнерный хостинг, биллинг посекундно) — мы обслуживаем только три курируемые модели.
  • Вы готовы терпеть задержку ради скидочного batch inference — у DeepInfra есть batch-эндпоинт, у нас только real-time.
  • Ваше приложение выходит за пределы текста — vision / OCR / speech-to-text / TTS всё есть в каталоге DeepInfra и нет в нашем.

FAQ

Насколько дешевле?

По прайс-листу: ~на 14% дешевле вход + ~на 20% дешевле выход на DeepSeek V3. ~на 27% дешевле вход + ~на 22% дешевле выход на DeepSeek R1. Цены на кешированный ввод у DeepInfra могут менять арифметику; для нагрузок с высокой долей кеша сравнивайте эффективную стоимость запроса.

Как мигрировать?

Две строки: поменяйте base_url на api.quicksilverpro.io/v1, новый API-ключ, уберите префикс deepseek-ai/ или Qwen/.

Поддерживает ли QuickSilver Pro prompt caching?

Пока нет как отдельного тарифа. Скидка на кешированный ввод у DeepInfra может снизить эффективную стоимость входа на повторяющихся промптах. Сравните оба провайдера, если доля попаданий в кеш существенна для вашей нагрузки.

А что с эмбеддингами / аудио / изображениями?

Не предлагается. QuickSilver Pro — только chat-completions на трёх LLM. DeepInfra покрывает эти модальности.

Разбор месячных расходов

Смешанная нагрузка hobby / production SaaS — indie-приложение с V3 для обычного чата и R1 под фичу «объясни ход рассуждений», поделено поровну. Месячный профиль: 10M входных токенов и 3M выходных токенов, разделённых 50/50 между V3 и R1.

QuickSilver Pro
V3 5M   × $0.24 =  $1.20
V3 1.5M × $0.70 =  $1.05
R1 5M   × $0.40 =  $2.00
R1 1.5M × $1.70 =  $2.55
—————————————————————
Итого           =  $6.80/мес
DeepInfra
V3 5M   × $0.28 =  $1.40
V3 1.5M × $0.88 =  $1.32
R1 5M   × $0.55 =  $2.75
R1 1.5M × $2.19 =  $3.29
—————————————————————
Итого           =  $8.76/мес

Это $1.96 экономии в месяц, ~22% меньше. В абсолюте разница выглядит скромно — потому что DeepInfra и так агрессивно цены держит — но форма экономии важна: R1 даёт ~$1.49 из $1.96, так что чем больше у вас reasoning-нагрузки, тем заметнее разрыв. Кеш-зависимые нагрузки на DeepInfra могут часть этого закрыть — сверяйте на реальном трафике перед переходом.

Аптайм и надёжность

QuickSilver Pro сейчас в переходной фазе: запросы маршрутизируются через несколько upstream-провайдеров инференса на одних и тех же открытых весах. Если у одного upstream отказ или кончается capacity, роутер переключается на следующий. Доступность по моделям, p50 / p95 латентность и история инцидентов публикуются на нашей статусной странице. Собственные GPU-мощности появятся в Q2 2026, и тогда форма маршрутизации изменится.

DeepInfra держит собственный GPU-флот, но на момент написания не публикует публичную статусную страницу или дашборд аптайма в реальном времени — мы не собираемся выдумывать цифры, которые не можем проверить. Сообщения об инцидентах у них идут через Discord-сообщество и статус-посты, а не по выделенному URL, на который можно сослаться. Если прозрачность аптайма критична для вашего решения, обе команды поделятся данными по недавним инцидентам по запросу; ни на чью PR-подачу полагаться не стоит.

Сравнения с другими посредниками

Попробуйте на $1 бесплатных кредитов

Миграция в две строки; пусть экономия на выходе говорит сама за себя.

Получить API-ключ