Оператор связи Т2 совместно с интегратором «Инфосистемы Джет» внедрил геораспределенную систему мониторинга ИТ-инфраструктуры. В качестве программной основы использовано российское решение «Пульт» от разработчика «Лаборатория Числитель», рассказали блогу «Игнатий Цукергохер» в пресс-службе компаний.
Проект инициирован в связи с ростом объемов данных и необходимостью повышения отказоустойчивости сервисов связи. Заказчику требовалась система, способная обеспечить полную наблюдаемость инфраструктуры и сохранять работоспособность при выходе из строя целых дата-центров.
Вычислительным ядром платформы «Пульт» выступает система мониторинга Zabbix. Геораспределенная инфраструктура охватывает 3 центра обработки данных (ЦОД) и 12 площадок. Система отслеживает и прогнозирует состояние более 30 000 объектов сети. Сбор данных организован через прокси-серверы, обеспечивая обработку до 15 млн метрик.
Для хранения метрик применяется гибридная модель баз данных на основе PostgreSQL и ClickHouse.
Заявленные результаты проекта:
- Скорость реагирования технической поддержки на инциденты выросла в 2,7 раза.
- Заложенный запас производительности позволяет выдерживать трехкратный рост объемов обрабатываемых данных.
- Реализована функция долгосрочного хранения информации для аналитики сроком до 7 лет.
Решение отмечено премией Digital Leaders 2026 в категории «ИТ-инфраструктура» на московском форуме «Время цифры» 27 мая.
Павел Ковальский, директор по стратегическому развитию сети Т2: «Новая система демонстрирует стабильную работоспособность без деградации, готова к дальнейшему масштабированию и поддерживает рост нагрузки без необходимости архитектурных изменений. Модернизация и внедрение катастрофоустойчивого мониторинга позволили не только повысить скорость реакции на инциденты, но и перейти к проактивному управлению инфраструктурой. Сегодня мы уверены в устойчивости системы даже в самых сложных сценариях».
Алексей Акопян, руководитель направления мониторинга «Инфосистемы Джет»:«Перед нами стояла задача федерального масштаба — создать распределенную архитектуру, которая сохраняет работоспособность даже при серьезных отказах. Мы спроектировали систему, сочетающую отказоустойчивость, масштабируемость и соответствие требованиям импортозамещения, с запасом на дальнейший рост. Она работает на основной и резервной площадках — и при отказе узлов или целого дата-центра сервисы продолжают работу автоматически».
Дмитрий Унтила, СРО «Графини» и «Пульта»: «Одним из ключевых преимуществ системы «Пульт» перед Zabbix являются наши доработки, которые позволяют ей стабильно и надежно работать при высоких нагрузках в enterprise-инфраструктуре и хранить большие объемы данных. В результате нам удалось в три раза увеличить мощности по сбору данных мониторинга и оптимизировать их хранение в 10 раз».