Единая точка доступа к языковым моделям с защитой данных и поимённым учётом расхода.
Единая точка доступа
Прокси принимает запросы агентов и маршрутизирует к провайдерам по цепочке приоритета с паузой при отказе. Desktop-агент ходит через прокси как через провайдера — не зная ни ключей, ни реальных моделей.
OpenRouter, Cloud.ru, GigaChat, YandexGPT, Ollama, LM Studio. Конфигурация в БД, меняется из админки без рестарта.
Цепочка по приоритету с паузой на «нездоровый» провайдер — запрос уходит на резервный.
Заказчик выбирает модель сам: облачная, корпоративная или развёрнутая локально.
Учёт и бюджеты
Каждый запрос учитывается сразу в нескольких разрезах — это готовый сводный отчёт.
Объём запросов и ответов к модели с оценкой стоимости — для расчёта затрат по каждому провайдеру.
Какой ассистент сколько расходует.
Расход по конкретному пользователю (по его идентификатору).
Защита данных
Ответ на вопрос «не утекут ли персональные данные во внешнюю LLM?»: запрос проходит фильтр до отправки.