Обновлено 28.04.2026 · 8 минут

Что такое токены в AI API и как они расходуются

Простое объяснение токенов в AI API: что считается расходом, почему длинные запросы дороже и как планировать лимит.

Связанная страница: Купить AI API-ключ без регистрации

Что считается токеном

Токен — это часть текста, которую модель использует при обработке запроса и генерации ответа. Это не всегда слово: короткое слово может быть одним токеном, а длинное — несколькими.

В расход обычно входят и prompt-токены, то есть ваш запрос, и completion-токены, то есть ответ модели.

Почему диалоги расходуют больше

Когда вы отправляете длинную историю переписки, модель обрабатывает больше текста. Поэтому один большой запрос может стоить заметно дороже нескольких коротких.

Для ботов и SaaS полезно ограничивать длину контекста и хранить только важную часть истории.

  • сокращайте системные инструкции
  • не отправляйте лишние документы
  • ограничивайте max_tokens
  • измеряйте средний расход на сценарий

Как выбрать пакет токенов

Для первой интеграции разумно начать со стартового пакета и замерить реальный расход. После этого проще понять, сколько токенов нужно на неделю или месяц работы.

Если сценарий уже понятен и нагрузка стабильна, можно брать больший пакет, чтобы реже выпускать новые ключи.

Частые вопросы

Токены списываются за ошибки?

Если запрос дошёл до модели и был обработан, часть токенов может быть учтена.

Что происходит при нуле токенов?

Ключ перестаёт обслуживать запросы, нужно купить новый пакет.

Можно ли заранее точно посчитать расход?

Точно — только после замеров, но можно оценить по длине запросов и ответов.

Полезные материалы

Готовы выбрать API-ключ?

Выберите OpenAI или Anthropic, укажите сумму покупки и оплатите в рублях. После оплаты ключ придёт на email.