Оказывая телекоммуникационные и облачные услуги, «ВымпелКом» развивает фундамент своего ИТ-ландшафта — инфраструктуру. Наблюдаемость ландшафта, доступность сервисов, предсказание возникновения затруднений у клиентов, скорость диагностики и локализация нештатных ситуаций, влияние на клиентский опыт каждого потребителя для предоставления быстрой помощи — вот те новые задачи, которые призвана была решить создаваемая в «ВымпелКоме» система мониторинга. На первом этапе было инициировано построение единой системы мониторинга ИТ-инфраструктуры, поддерживающей бизнес-сервисы, включая и те, с которыми имеют дело клиенты оператора связи. Внедрение решения было доверено «Инфосистемы Джет».
На момент старта проекта в «ВымпелКоме» уже использовалось несколько систем мониторинга. Они оценивали состояние отдельных сервисов и фрагментов ИТ-инфраструктуры, не создавая общей картины. Команда ИТ «ВымпелКома» разработала архитектуру будущего целевого решения и совместно со специалистами «Инфосистемы Джет» объединили все фрагменты ИТ-инфраструктуры в единую систему на базе ПО Zabbix, включая системы хранения данных, сетевое оборудование, системы резервного копирования, серверы с различными операционными системами и пр. Опираясь на свой опыт и лучшие практики, инженеры ИТ-компании настроили способы сбора информации для нетипового оборудования, а также разработали «модель здоровья» — правила (триггеры), при достижении которых система сообщает о рисках сбоев.
Чтобы видеть состояние бизнес-сервисов, специалисты интегрировали систему мониторинга с существующей базой данных управления конфигурациями (CMDB). Это позволяет отслеживать влияние функционирования ИТ-компонентов на работу более 180 приложений и бизнес-сервисов. Например, работу личного кабинета, действий с балансом, предоставления абонентам различной информации — подключенных услуг, совершенных операций и пр. Так бизнес получил четкую картину о том, как дефицит емкостей и ресурсов влияет на конкретные бизнес-функции.
«Системы мониторинга ИТ-инфраструктуры обычно не используются за пределами ИТ-подразделения. Но не в нашем случае. Внедренное решение дает продуктовым командам и бизнесу понимание того, как работа инфраструктурного слоя и сервисов влияет на клиентский опыт наших потребителей, — отмечает Сергей Агеев, директор по развитию сервисов «ВымпелКом». — Теперь ИТ-команда при обосновании затрат опирается на реальные данные, сопоставляя их с приоритетами компании и конкретных продуктовых команд, а не на экспертные прогнозы».
Визуализация работы ИТ-мониторинга на основе ПО Grafana имеет трехуровневую структуру. Комплексный дашборд представляет обзор девяти основных направлений. На втором уровне отображается суммарная статистика по каждому направлению. Третий уровень дает сведения о конкретных устройствах, их промежуточных наблюдаемых состояний с визуализацией текущей и предыдущей нагрузки и динамики ее изменений. Так специалисты «ВымпелКома» в одной консоли контролируют состояние всей ИТ-инфраструктуры по ключевым параметрам и индикаторам от бизнес-сервиса до датчика работы вентилятора. Выход метрики за пределы нормативного диапазона фиксируется в предупреждающем или аварийном событии.
«Open source решение Zabbix в связке с Grafana позволяет построить комплексную и функционально богатую систему. Созданное у "ВымпелКома" решение ИТ-мониторинга инфраструктуры сделало быстрым обнаружение событий, влияющих на работу сервисов, и помогает оперативно устранять их. В итоге это повышает доступность сервисов для почти 50 млн абонентов оператора связи», — комментирует Алексей Акопян, руководитель направления ИТ-мониторинга «Инфосистемы Джет».