OpenAI-совместимый API

Эндпоинты, параметры и формат ответа повторяют OpenAI API. Если ваш код уже работает с OpenAI — поменяйте base_url и ключ, остальное не трогайте.

Базовый URL и аутентификация

OpenAI-совместимый базовый URL: https://api.cheapai.io/v1
Anthropic-совместимый базовый URL: https://api.cheapai.io (клиент сам добавляет /v1/messages)
Аутентификация: заголовок Authorization: Bearer cai-.... Ключ — из раздела API-ключи.

Имя модели — из каталога: gpt-4o, claude-3-5-sonnet, gemini-1-5-pro и т. д. Шлюз сам направляет запрос к нужному провайдеру по имени модели.

Эндпоинты

Метод и путь	Назначение
`POST /v1/chat/completions`	Чат-комплишены — основной эндпоинт для диалоговых моделей. Поддерживает `stream`.
`POST /v1/embeddings`	Векторные представления текста.
`GET /v1/models`	Список доступных моделей и их идентификаторов.
`POST /v1/messages`	Anthropic-совместимый эндпоинт (его используют Claude Code и Anthropic SDK).

POST /v1/chat/completions

Основные параметры тела запроса:

Поле	Тип	Описание
`model`	string	Обязательно. Имя модели из каталога.
`messages`	array	Обязательно. Список сообщений .
`stream`	bool	Если `true` — ответ приходит по частям (SSE). По умолчанию `false`.
`temperature`	number	Степень случайности, обычно 0–2. По умолчанию — как у модели.
`max_tokens`	int	Ограничение на длину ответа в токенах.
`top_p`, `stop`, `presence_penalty`, `frequency_penalty`	—	Передаются провайдеру как есть, если он их поддерживает.

Запрос:

curl

curl https://api.cheapai.io/v1/chat/completions \
  -H "Authorization: Bearer $CHEAPAI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-4o",
    "messages": [
      {"role": "system", "content": "Отвечай кратко."},
      {"role": "user", "content": "Что такое токен в LLM?"}
    ]
  }'

OpenAI-совместимый API

Базовый URL и аутентификация

Эндпоинты

POST /v1/chat/completions

Стриминг

POST /v1/embeddings

Anthropic-совместимый эндпоинт

Учёт токенов

Лимиты и ошибки