🎯 Бесплатно: первая проверка AI-видимости за 5 минут, затем обновление раз в 7 днейПопробовать →

Блог
12 мин чтения

GigaChat API в 2026: инструкция — токен, endpoints, цены, примеры кода

Как подключить GigaChat API: регистрация в Sber Developers, OAuth-токен, endpoints чата и embeddings, тарифы, function calling, миграция с OpenAI.

GigaChatAPIразработкаSber
Владислав Пучков
Владислав Пучков
Основатель GEO Scout, эксперт по GEO-оптимизации

GigaChat API — это REST-интерфейс к нейросетям Сбера, доступный разработчикам через портал Sber Developers. В отличие от ChatGPT API, GigaChat работает из России без VPN, проходит 152-ФЗ compliance и сертификации Банка России — поэтому для финтех, медтех и госпроектов он часто единственный реалистичный выбор. По цене и функциональности GigaChat сопоставим с OpenAI и Anthropic, формат запросов совместим с OpenAI-стандартом — это упрощает миграцию.

В этой инструкции — пошаговый практический разбор: как зарегистрироваться, получить токен, отправить первый запрос, использовать function calling, мигрировать с OpenAI и оптимизировать стоимость.

GigaChat API: что это и зачем

GigaChat API — программный доступ к языковым моделям Сбера через REST-интерфейс. Используется для:

  • Чат-ботов в поддержку клиентов, корпоративные ассистенты, голосовых помощников.
  • Контент-генерации: описания товаров, рассылки, посты в соцсети, документы.
  • RAG-систем: семантический поиск по корпоративным базам знаний с использованием GigaChat Embeddings.
  • Классификации: обращений в поддержку, отзывов, документов.
  • Анализа документов: извлечение данных, суммаризация, перевод.
  • Function calling агентов: AI, который вызывает внешние API (CRM, базы данных, биллинг).
  • Image-генерации через интегрированный Kandinsky 4.0.

Главные причины выбрать GigaChat API вместо ChatGPT/Claude/DeepSeek:

  • Compliance с 152-ФЗ — критично для банков, страховых, медицины, госсектора.
  • Российская юрисдикция — данные не покидают РФ.
  • Доступ из РФ без VPN — стабильность для production-приложений.
  • Оплата в рублях по российскому договору — без проблем с международными платежами.
  • Качество русского — топ-1 среди российских моделей по бенчмаркам.

Регистрация в Sber Developers

Шаги регистрации в 2026 году:

  1. Открыть developers.sber.ru в любом браузере (открывается без VPN).
  2. Нажать ВойтиСоздать аккаунт. Регистрация через Сбер ID или email.
  3. Подтвердить email или номер телефона.
  4. Зайти в Личный кабинет → раздел GigaChat API.
  5. Создать проект: указать название, описание, выбрать тип (физическое лицо или юридическое).
  6. Принять оферту использования API.

Для физических лиц регистрация проще и быстрее: нужен только Сбер ID или email + телефон. Подходит для тестирования, обучения, личных пет-проектов.

Для юридических лиц дополнительно потребуется ИНН организации, указание ответственного лица, в некоторых случаях — подписание договора (для крупных корпоративных тарифов). Юрлицам доступны корпоративные опции: dedicated tenant, on-premise, расширенный SLA, договор о non-training.

Получение токена доступа (OAuth)

GigaChat API использует двухэтапную авторизацию:

Шаг 1: Authorization Key. В личном кабинете в проекте GigaChat → раздел Авторизационные данныеСгенерировать Authorization Key. Это base64-строка вида:

MWE1MWVmZjItZjUyNi00ZGUyLTlkZmYtZTIyMzQ1Njc4OTAwOmYxYzc...

Сохраните её — она показывается один раз и используется для получения временных access-токенов.

Шаг 2: Access Token. Перед каждым запросом (или раз в 30 минут) получайте временный токен:

curl -X POST 'https://ngw.devices.sberbank.ru:9443/api/v2/oauth' \
  -H 'Content-Type: application/x-www-form-urlencoded' \
  -H 'Accept: application/json' \
  -H 'RqUID: 6f0b1291-c7f3-43c6-bb2e-9f3efb2dc98e' \
  -H 'Authorization: Basic [ваш_Authorization_Key]' \
  -d 'scope=GIGACHAT_API_PERS'

Параметр scope:

  • GIGACHAT_API_PERS — для физических лиц.
  • GIGACHAT_API_B2B — для юридических лиц.
  • GIGACHAT_API_CORP — для корпоративных тарифов.

В ответе придёт JSON:

{
  "access_token": "eyJjdHkiOiJKV1QiL...",
  "expires_at": 1714493400000
}

Этот access_token живёт 30 минут и используется для всех последующих запросов к API в заголовке Authorization: Bearer.

В официальных SDK (Python, JavaScript, Java) обновление токена происходит автоматически — клиент сам отслеживает expires_at и обновляет токен перед истечением.

Endpoints

Основные endpoints GigaChat API на хосте https://gigachat.devices.sberbank.ru/api/v1/:

EndpointМетодНазначение
/chat/completionsPOSTЧат-комплитен (диалог, генерация текста)
/embeddingsPOSTВекторные эмбеддинги (1024 dim)
/tokens/countPOSTПодсчёт токенов до запроса
/filesPOSTЗагрузка файлов в диалог
/files/{id}GETПолучить информацию о файле
/files/{id}/contentGETСкачать файл
/modelsGETСписок доступных моделей
/balanceGETТекущий баланс (для PAYG-тарифов)

Image-генерация Kandinsky идёт через отдельный endpoint в формате chat-completion с указанием function_call для генерации изображения — модель вызывает встроенную функцию.

Минимальный пример: curl

Самый простой запрос к чат-комплитену:

curl -X POST 'https://gigachat.devices.sberbank.ru/api/v1/chat/completions' \
  -H 'Content-Type: application/json' \
  -H 'Authorization: Bearer [access_token]' \
  -d '{
    "model": "GigaChat",
    "messages": [
      {"role": "system", "content": "Ты помощник, отвечающий кратко и по делу."},
      {"role": "user", "content": "Напиши описание сервиса доставки еды на 50 слов."}
    ],
    "temperature": 0.7,
    "max_tokens": 200
  }'

В ответе придёт JSON в формате OpenAI:

{
  "choices": [{
    "message": {
      "role": "assistant",
      "content": "..."
    },
    "finish_reason": "stop"
  }],
  "usage": {
    "prompt_tokens": 25,
    "completion_tokens": 87,
    "total_tokens": 112
  },
  "model": "GigaChat:1.0.26.20"
}

Минимальный пример: Python

Установка официального SDK:

pip install gigachat

Минимальный код:

from gigachat import GigaChat
 
# credentials = ваш Authorization Key из ЛК
with GigaChat(
    credentials="MWE1MWVmZjItZjUyNi00ZGUyLTlkZmYt...",
    scope="GIGACHAT_API_PERS",  # или GIGACHAT_API_B2B
    verify_ssl_certs=False  # для тестов; в production — True + сертификаты Минцифры
) as giga:
    response = giga.chat({
        "messages": [
            {"role": "user", "content": "Напиши краткое описание AI-сервиса"}
        ],
        "temperature": 0.7
    })
    print(response.choices[0].message.content)

SDK автоматически получает access_token, обновляет его при истечении и возвращает удобные Pydantic-модели вместо сырого JSON.

Важно: для production-окружения нужны сертификаты Минцифры РФ (корневой сертификат для HTTPS-соединений с серверами Сбера). Инструкция по установке — в документации Sber Developers.

Лимиты и квоты

В 2026 году актуальные лимиты по тарифам:

ТарифRPMTPM (токенов в минуту)Параллельные запросы
Free6060 0005
Pay-as-you-Go600200 00050
Pro1 200500 000100
EnterpriseПо договоруDedicatedDedicated

При превышении лимитов API возвращает HTTP 429 (Too Many Requests) с заголовком Retry-After. Лучшая практика — реализовать exponential backoff с jitter в клиенте.

Для production-нагрузок (тысячи запросов в минуту) — обращайтесь в Sber для перехода на Pro или Enterprise. На корпоративных тарифах лимиты гибко настраиваются под нагрузку приложения.

Тарификация

Цены на API в апреле 2026 года:

МодельСтоимость, руб/1K токеновКэшированные токены
GigaChat Lite0.40.12
GigaChat Pro1.50.45
GigaChat MAX3.00.9
Embeddings0.05 за 1K токенов входа
Kandinsky (Image)5 руб за 1 изображение

Тарифы одинаковы для input и output токенов (в отличие от OpenAI, где output дороже в 4 раза). Это делает GigaChat выгоднее на задачах с длинными ответами (генерация статей, документов).

Free-tariff: при регистрации даётся 1 миллион токенов в подарок — этого хватает на полноценное тестирование в течение нескольких дней.

Корпоративные пакетные тарифы:

  • Light — от 1 500 руб/мес, фиксированный пакет токенов.
  • Standard — Pay-as-you-Go с авансовым пополнением и кешбеком.
  • Pro — от 25 000 руб/мес, расширенные лимиты, приоритетная поддержка.
  • Enterprise — индивидуальный договор, dedicated capacity, SLA, гарантии non-training.

Промпты и системные сообщения

GigaChat поддерживает стандартный формат messages с тремя ролями:

messages = [
    {"role": "system", "content": "Ты — эксперт по российскому налоговому праву. Отвечай со ссылками на статьи НК РФ."},
    {"role": "user", "content": "Какой НДС при экспорте товаров?"},
    {"role": "assistant", "content": "При экспорте товаров применяется НДС 0% (ст. 164 НК РФ, п. 1 пп. 1)..."},
    {"role": "user", "content": "А если экспорт в Беларусь?"}
]

System-промпт задаёт роль и стиль модели на весь диалог. Несколько практических советов для GigaChat:

  • Указывайте формат ответа явно: «Списком из 5 пунктов», «таблицей», «в двух абзацах».
  • Давайте контекст: «Я налоговый консультант», «целевая аудитория — главные бухгалтеры».
  • Для русскоязычных задач прямо указывайте: «Отвечай на русском, не вставляй английские термины без перевода».
  • Для деловой переписки — модель хорошо знает официально-деловой стиль, можно просить «составь в формате официального письма».

Подробнее о промпт-инжиниринге для бизнеса — в ChatGPT для бизнеса (принципы те же для GigaChat).

Streaming-ответы

Для чат-интерфейсов критично показывать ответ по мере генерации (UX, как в ChatGPT). GigaChat поддерживает streaming через параметр stream: true:

from gigachat import GigaChat
 
with GigaChat(credentials="...", verify_ssl_certs=False) as giga:
    for chunk in giga.stream({
        "messages": [{"role": "user", "content": "Расскажи про GEO-оптимизацию"}],
        "stream": True
    }):
        if chunk.choices[0].delta.content:
            print(chunk.choices[0].delta.content, end="", flush=True)

Сервер возвращает SSE (Server-Sent Events) поток с дельтами. Каждый chunk содержит частичный ответ — клиент собирает его в полное сообщение.

Streaming критичен для:

  • Чат-интерфейсов (нужно показать первые слова менее чем за 1 секунду).
  • Длинных ответов (не ждать 30 секунд полной генерации).
  • Voice-интерфейсов (озвучивать по мере генерации).

Function calling

GigaChat Pro и MAX поддерживают вызов внешних функций — это позволяет строить агентов, которые могут обращаться к CRM, базам данных, внешним API.

Пример: агент, который проверяет статус заказа в CRM.

functions = [
    {
        "name": "get_order_status",
        "description": "Получить статус заказа по номеру",
        "parameters": {
            "type": "object",
            "properties": {
                "order_id": {
                    "type": "string",
                    "description": "Номер заказа"
                }
            },
            "required": ["order_id"]
        }
    }
]
 
with GigaChat(credentials="...", verify_ssl_certs=False) as giga:
    response = giga.chat({
        "messages": [
            {"role": "user", "content": "Какой статус заказа №12345?"}
        ],
        "functions": functions
    })
 
    # Если модель решила вызвать функцию
    if response.choices[0].message.function_call:
        fc = response.choices[0].message.function_call
        # Выполняем функцию в нашем коде
        order_status = get_order_status_from_crm(fc.arguments["order_id"])
        # Возвращаем результат модели для финального ответа
        # ... вторая итерация диалога

Формат функций совместим с OpenAI на уровне JSON Schema — миграция кода с OpenAI function calling сводится к смене клиента.

Image-генерация Kandinsky через API

Kandinsky 4.0 интегрирован в GigaChat и доступен через API. Простейший путь — попросить GigaChat сгенерировать изображение в обычном чат-запросе:

response = giga.chat({
    "messages": [
        {"role": "user", "content": "Нарисуй абстрактную иллюстрацию для статьи про AI и финтех"}
    ],
    "function_call": "auto"  # GigaChat автоматически вызовет встроенную функцию image-генерации
})
 
# Ответ содержит ссылку на сгенерированное изображение
print(response.choices[0].message.content)

Поддерживаемые режимы:

  • text-to-image: генерация по текстовому промпту.
  • image-to-image: модификация загруженного изображения.
  • in-painting: дорисовывание/замена части изображения.
  • outpainting: расширение изображения за границы.

Цена: 5 рублей за 1 изображение в стандартном тарифе. Для массового использования (e-commerce, соцсети) есть пакетные тарифы.

Подробнее о Kandinsky и его конкурентах — в AI в маркетинге 2026.

Сравнение с OpenAI API: миграция

GigaChat API совместим с OpenAI на уровне 90% — это упрощает миграцию существующих приложений. Что одинаково:

АспектOpenAIGigaChatСовместимость
Структура messagesДаДа100%
Параметры (temp, max_tokens, stream)ДаДа100%
Function calling форматJSON SchemaJSON Schema100%
Streaming SSEДаДа100%
Embeddings форматДаДа95%
OAuth-flowAPI KeyOAuth с временным токеномРазличается
Endpoint URLapi.openai.comgigachat.devices.sberbank.ruРазличается
Имена моделейgpt-4o, gpt-5GigaChat, GigaChat-Pro, GigaChat-MaxРазличается

Шаги миграции с OpenAI на GigaChat:

  1. Зарегистрироваться в Sber Developers, получить Authorization Key.
  2. Установить SDK: pip install gigachat (вместо openai).
  3. Заменить инициализацию клиента:
    # Было
    client = OpenAI(api_key="sk-...")
    # Стало
    from gigachat import GigaChat
    client = GigaChat(credentials="...", verify_ssl_certs=False)
  4. Заменить имена моделей: gpt-4oGigaChat-Pro, gpt-5GigaChat-Max.
  5. Адаптировать формат вызова: client.chat.completions.create(...)client.chat({...}).
  6. Добавить установку сертификатов Минцифры для production.
  7. Протестировать промпты — некоторые могут требовать корректировки под особенности модели.

Для большинства приложений миграция занимает 1-4 часа разработки. Если используется LangChain или другой фреймворк — есть готовые интеграции с GigaChat.

Кейсы и шаблоны

Несколько типовых сценариев использования GigaChat API с примерами:

Чат-бот в Telegram для поддержки клиентов: GigaChat API + python-telegram-bot. Streaming-ответ + функция эскалации к живому оператору через function calling.

Генерация описаний товаров для e-commerce: загрузка списка SKU, генерация описаний через GigaChat Pro в batch-режиме, сохранение в базу. Кэшированные системные промпты экономят 70% стоимости.

RAG-система по корпоративной базе знаний: GigaChat Embeddings + векторная БД (PostgreSQL pgvector, Qdrant) + GigaChat MAX для финального ответа. Сценарий, где compliance с 152-ФЗ критичен.

AI-помощник для бухгалтера: GigaChat MAX с системным промптом «эксперт по 1С и НК РФ», function calling для запросов в базу данных учёта.

Классификация обращений в поддержку: GigaChat Lite (быстрый и дешёвый) для классификации входящего потока, маршрутизация по департаментам.

Генерация маркетинговых материалов: интеграция с CRM (Битрикс24/amoCRM) → GigaChat Pro → персонализированные предложения для клиентов.

Дальнейшие шаги

GigaChat API в 2026 — зрелая платформа для российских разработчиков и бизнеса. Для физлиц — простая регистрация и 1М токенов в подарок. Для юрлиц — corporate-тарифы, договор о non-training, dedicated tenant'ы и интеграции в Сбер-экосистему. По цене и функциональности сопоставим с OpenAI и Anthropic, по compliance — единственный реалистичный выбор для финтех, медицины и госсектора.

Если только начинаете изучать продукт — стартуйте с обзорного GigaChat от Сбера: полный гайд. Если планируете маркетинговое использование — AI в маркетинге 2026 и ChatGPT для бизнеса (применимо и к GigaChat).

Отдельный важный вопрос для бизнеса — что говорит сам GigaChat о вашем бренде. Когда пользователь Сбер-экосистемы спрашивает GigaChat «лучший [продукт]» или «какой [сервис] выбрать», модель синтезирует ответ из своего русскоязычного корпуса — и часто рекомендует не тех, кого вы ожидаете. Подробный анализ — в GigaChat: кого и как рекомендует.

GEO Scout интегрирован с GigaChat (наряду с ChatGPT, Claude, DeepSeek, Gemini, Perplexity, Алисой, YandexGPT, Grok и Google AI Overview): ежедневно фиксирует, какие бренды попадают в ответы GigaChat, на каких позициях, в каком контексте. Это превращает невидимый AI-канал Сбер-экосистемы в управляемый параметр маркетинговой стратегии — мониторинг GigaChat для брендов, работающих с российским рынком, не менее критичен, чем мониторинг ChatGPT для глобальных брендов.

Частые вопросы

Как получить доступ к GigaChat API?
Зарегистрируйтесь на developers.sber.ru через Сбер ID или email. Создайте проект GigaChat API в личном кабинете. В разделе Авторизационные данные сгенерируйте Authorization Key — это base64-строка вида MWE1MWVm... Сохраните её, она понадобится для получения access-токена. Подключите тариф Free (1 миллион токенов в подарок) или Pay-as-you-Go (оплата за факт). Для физических лиц подойдёт обычная регистрация, для бизнеса — корпоративный аккаунт с договором.
Как работает OAuth и получение токена в GigaChat API?
GigaChat использует временные access-токены, которые живут 30 минут. Чтобы получить токен, отправьте POST на https://ngw.devices.sberbank.ru:9443/api/v2/oauth с заголовком Authorization: Basic [ваш Authorization Key] и параметром scope=GIGACHAT_API_PERS (или GIGACHAT_API_B2B для корпоративных). В ответе придёт access_token и expires_at. Используйте этот токен в заголовке Authorization: Bearer для запросов к /chat/completions. Официальные SDK на Python, JavaScript, Java делают обновление токена автоматически.
Какие endpoints есть в GigaChat API?
Основные endpoints: POST /chat/completions для диалога и генерации текста (поддерживает streaming), POST /embeddings для векторных эмбеддингов размером 1024, POST /tokens/count для подсчёта токенов до запроса, POST /files для загрузки файлов в диалог, POST /images/generations для генерации изображений через Kandinsky. Все endpoints на хосте https://gigachat.devices.sberbank.ru/api/v1/. Формат запросов и ответов совместим с OpenAI API на уровне структуры — это упрощает миграцию.
Сколько стоит GigaChat API?
Тарификация в 2026: Free — 1 миллион токенов в подарок при регистрации. Pay-as-you-Go: GigaChat Lite — около 0.4 руб/1K токенов, GigaChat Pro — 1.5 руб/1K токенов, GigaChat MAX — 3 руб/1K токенов (одинаково для input и output). Кэшированные токены — 30% от обычной цены. Image-генерация Kandinsky — фиксированная цена за изображение от 5 руб. Корпоративные тарифы Standard, Pro, Enterprise — пакетные с предоплатой и скидками по объёму.
Поддерживает ли GigaChat function calling и streaming?
Да, оба. Function calling доступен для GigaChat Pro и MAX через параметр functions в запросе — формат JSON Schema, как в OpenAI API. Модель возвращает function_call с именем функции и аргументами; ваш код выполняет функцию и возвращает результат в следующем сообщении. Streaming-ответы работают через параметр stream: true — сервер возвращает SSE-поток с дельтами. Это позволяет показывать ответ пользователю по мере генерации, что критично для UX в чат-интерфейсах.
Как мигрировать с OpenAI API на GigaChat?
Совместимость GigaChat API с форматом OpenAI на уровне 90%. Базовая миграция: установить SDK gigachat (pip install gigachat), сменить инициализацию клиента с OpenAI на GigaChat, использовать модель GigaChat-Pro вместо gpt-4o. Структура messages (роли user/assistant/system), параметры temperature, max_tokens, stream — те же. Главные отличия: вместо API-ключа OpenAI — credentials Сбера (Authorization Key для OAuth), другой endpoint, для function calling формат функций идентичен. Большинство приложений мигрируют за 1-2 часа разработки.