Модели, защита данных и учёт

Единая точка доступа

Прокси к языковым моделям с автопереключением

Прокси принимает запросы агентов и направляет их поставщикам моделей по цепочке приоритета. Персональный агент ходит через прокси как через поставщика — не зная ни ключей, ни реальных моделей.

Несколько поставщиков
OpenRouter, Cloud.ru, GigaChat, YandexGPT, Ollama, LM Studio. Конфигурация меняется в панели администратора без перезапуска.
Автопереключение
Недоступный поставщик временно исключается из цепочки — запрос уходит к резервному.
Свой / локальный
Администратор выбирает модель в настройках: облачная, корпоративная или развёрнутая локально.
Гибкость на уровне шага
В шаблоне конвейера каждый шаг может задать своего поставщика и модель — не меняя общей конфигурации организации.

Именованных конфигураций языковых моделей (LLMбольшая языковая модель (Large Language Model)) может быть несколько — с привязкой к агенту, специализации и шагу конвейера. Уровни моделей∗В разработке. Сроки — в дорожной карте развития. (сложная / средняя / простая задача) — в разработке.

Учёт и бюджеты

Расход считается по каждому сотруднику

Каждый запрос учитывается сразу в нескольких разрезах — сводный отчёт не нужно собирать вручную.

Поставщик и модель

Объём запросов и ответов к модели с оценкой стоимости — для расчёта затрат по каждому поставщику.

Агент

Какой ассистент сколько расходует.

Сотрудник

Расход по конкретному пользователю.

Бюджеты. Лимиты задаются на организацию, подразделение и сотрудника — дневные и месячные, по стоимости, с порогом предупреждения. При превышении лимита запросы блокируются, при приближении к порогу приходит оповещение.

Защита данных

Двухслойная защита данных (DLPпредотвращение утечек данных (Data Loss Prevention)) перед отправкой в модель

Не утекут ли персональные данные во внешнюю модель? Каждый запрос проходит фильтр до отправки.

Запросот агента

→

Слой 1 · нейросетьраспознаёт имена, организации, адреса

→

Слой 2 · шаблоны52 встроенных правила в 8 группах: карты, ИНН, СНИЛС, паспорт…

→

Действиемаскировать / блокировать / оповещать

Политики независимы для каждого заказчика, меняются без перезапуска; каждое срабатывание — в аудит с разбивкой по слою

Применяется на входящем трафике агентских запросов — данные не уходят в модель в исходном виде
Действие настраивается для каждого заказчика отдельно: маскирование, обратимая псевдонимизация или блокировка запроса; каждое срабатывание — в аудите
Персональный агент тоже имеет локальный DLP — клиент не обходит политику
При перегрузке нейросети — деградация на регулярные выражения без отказа запроса

Область действия. DLP фильтрует запросы агентов и ответы модели, включая потоковые ответы и аргументы инструментов, — к поставщику модели данные не уходят в исходном виде ни на одном ходу. Расширение фильтрации на конвейер загрузки данных и журналы разговоров — в дорожной карте.

Обратимая псевдонимизацияобратимая замена данных суррогатом с восстановлением на выходе — данные не уходят в модель

Чувствительные значения — ФИО, реквизиты, адреса, секреты — перед отправкой в модель заменяются на устойчивые суррогаты. Модель работает только с суррогатами, ни одного реального значения в неё не уходит. В ответе модели суррогаты автоматически восстанавливаются в исходные значения — поэтому пользователь и инструменты агента всё время видят и используют настоящие данные, подмена для них прозрачна.

Запросреальные данные сотрудника

→

Подстановкачувствительные значения → суррогаты

→

Модельвидит только суррогаты

→

Восстановлениесуррогаты → реальные значения

→

Ответпользователь и инструменты видят настоящие данные

Например: «Иванов И. И.» заменяется на обезличенный маркер вида «[ПЕРСОНА-7]» и восстанавливается обратно в ответе — подмену не видят ни пользователь, ни инструменты агента

В модель не уходит ни одного реального значения — только суррогаты
Восстановление работает и в тексте ответа, и в аргументах вызовов инструментов
Одно значение получает один и тот же суррогат в пределах беседы — модель сохраняет связность рассуждения
Таблица соответствия суррогат ↔ оригинал держится только в памяти сессии, недоступна модели и очищается по её завершении

Модели, защита данных и учёт

Прокси к языковым моделям с автопереключением

Несколько поставщиков

Автопереключение

Свой / локальный

Гибкость на уровне шага

Расход считается по каждому сотруднику

Поставщик и модель

Агент

Сотрудник

Двухслойная защита данных (DLPпредотвращение утечек данных (Data Loss Prevention)) перед отправкой в модель

Обратимая псевдонимизацияобратимая замена данных суррогатом с восстановлением на выходе — данные не уходят в модель

Читать дальше

Залог успеха внедрения ИИ →

Подключаемые инструменты →

Безопасность и контроль →