На страже ИТ-здоровья. Технологии ИТ-мониторинга, современные решения, опыт отечественных интеграторов, комментарии участников рынка

В мониторинге нуждается практически любая информационная система: ИТ-мониторинг заботится о ее работоспособности и надежности, защищая заказчика от неожиданных ударов по ИТ-бюджету. О лучших продуктах для ИТ-мониторинга, необходимых компетенциях ИТ-специалистов, о роли интеграторов в процессе создания систем мониторинга, а также о перспективах этого направления за круглым столом ICT-Online.ru беседуют представители компаний «Инфосистемы Джет», «ЛАНИТ-Интеграция» (входит в группу ЛАНИТ), «ФОРС – Центр разработки» (ГК ФОРС), STEP LOGIC, ТАЛМЕР, ICL Services, «Интерпроком» и OCS Distribution.

ICT-Online.ru: Какие сейчас имеются средства для организации мониторинга инфраструктуры, приложений, бизнес-процессов?

Руководитель направления мониторинга «Инфосистемы Джет» Алексей Акопян: Сейчас на рынке представлены разные виды систем мониторинга. Это и универсальные ИТ-инструменты, комплексно обеспечивающие мониторинг ИТ-инфраструктуры, приложений, бизнес-процессов. В то же время есть и специализированные решения, которые отдельно фокусируются на отслеживании параметров этих трех сегментов. Они более эффективны. Специализация их сильная и слабая сторона одновременно. Это особенно заметно в случаях, когда компания заинтересована организовать мониторинг приложений, а «под ним» есть серьезная ИТ-инфраструктура. Тогда появляется необходимость использовать дополнительно еще средства мониторинга ИТ-инфраструктуры. А следом встает вопрос интеграции нескольких продуктов. Состояние ИТ-инфраструктуры, приложений и бизнес-процессов связаны. Нельзя их отделять друг от друга, делать мониторинг одной сферы, не наблюдая другой.

 

Руководитель направления мониторинга «Инфосистемы Джет» Алексей Акопян

Руководитель направления мониторинга «Инфосистемы Джет» Алексей Акопян

 

Первый заместитель управляющего директора компании «ЛАНИТ-Интеграция» (входит в группу ЛАНИТ) Олег Головко: Рынок систем мониторинга сейчас переживает второе рождение. Многие отраслевые стартапы и инструменты с открытым исходным кодом выходят в корпоративный сегмент полноценных observability-платформ, постепенно охватывая новые функциональные области. Одной из самых перспективных и активно растущих областей на данный момент является Application Performance Monitoring (APM). Ведь именно APM позволяет показать, как именно ИТ влияют на бизнес-процессы. Многие вендоры на рынке IT Operations уже обзавелись таким инструментом в своем портфеле. Также из восходящих трендов можно отметить интеллектуальные зонтичные AIOps-платформы управления событиями, продвинутую автоматизацию управления инцидентами, а также системы класса Process Mining.

 

Первый заместитель управляющего директора компании «ЛАНИТ-Интеграция» (входит в группу ЛАНИТ) Олег Головко

Первый заместитель управляющего директора компании «ЛАНИТ-Интеграция» (входит в группу ЛАНИТ) Олег Головко

 

Руководитель группы инженеров службы внедрения и сопровождения компании «ФОРС – Центр разработки» (ГК ФОРС) Олег Константинов: На сегодняшний день ни одна серьезная информационная система не может обойтись без мониторинга. Для быстрой реакции на инциденты и проактивного отслеживания «состояния здоровья» системы, её работоспособности и надёжности используются современные решения, такие как Zabbix, Prometheus, Newrelic и так далее. С их помощью собираются и обрабатываются метрики с конечных узлов, а администраторы получают полную информацию о работе системы и в случае инцидента направляют соответствующие уведомления.

 

Руководитель группы инженеров службы внедрения и сопровождения компании «ФОРС – Центр разработки» (ГК ФОРС) Олег Константинов

Руководитель группы инженеров службы внедрения и сопровождения компании «ФОРС – Центр разработки» (ГК ФОРС) Олег Константинов

 

Наиболее популярными инструментами, которыми и мы тоже пользуемся, являются Zabbix и Prometheus, построенные на открытом исходном коде - они обладают всеми необходимыми компонентами для осуществления мониторинга. На текущий момент подход к мониторингу изменился. Если раньше было достаточно контролировать работу серверов физически, их доступность, загрузку по основным метрикам, то сейчас необходимо это делать и в отношении программных компонентов. Происходит это потому, что всё усложняется – и общая логика построения решений, и подход к их реализации. Все чаще используется микросервисная архитектура, что создаёт дополнительные требования к обеспечению производительности систем, вот почему классические системы мониторинга нам уже не подходят и мы используем те, о которых говорили выше.

Руководитель направления систем управления информационной безопасности STEP LOGIC Станислав Прищеп: В глубоко автоматизированной информационной среде современных предприятий и организаций средства мониторинга и анализа данных применяются в различных областях. Они не только выполняют вспомогательные задачи: мониторинг ИТ-инфраструктуры, информационной безопасности, но и используются для извлечения прибыли. Яркий пример такого применения -  онлайн-сервисы анализа покупательской способности или трекинга транспорта.

 

Руководитель направления систем управления информационной безопасности STEP LOGIC Станислав Прищеп

Руководитель направления систем управления информационной безопасности STEP LOGIC Станислав Прищеп

 

STEP LOGIC более 20 лет создаёт технические решения для мониторинга и оказывает сервисные услуги в данной области, за это время компании удалось реализовать ряд крупных проектов. Сейчас STEP LOGIC активно разрабатывает и внедряет решения на базе платформ анализа машинных данных. Об этом рассказывает руководитель направления систем управления информационной безопасности STEP LOGIC Станислав Прищеп (см. интервью раздела «STEP LOGIC» от 17 июня 2021 г.).

Производителей средств мониторинга и анализа машинных данных много. Можно поделить их на группы, исходя из подхода к внедрению и возможностей кастомизации. Первая группа - монофункциональные коробочные решения направлены на выполнение определённой прикладной задачи, например, мониторинг информационной безопасности, сети, производительности и так далее.

Вторая группа - решения для мониторинга, построенные на базе экосистемы Hadoop, могут выполнять одновременно несколько прикладных задач. Их использование позволяет проводить глубокий анализ данных разными алгоритмами и применять различные методы анализа. Однако развертывание такого решения занимает месяцы, а для извлечения из данных нужной информации потребуется помощь дата-сайентистов и дата-инженеров. Поэтому чаще всего экосистема Hadoop применяется при выполнении масштабных или узкоспециализированных задач.

Третья группа - платформы анализа машинных данных (Splunk, Elastic) позволяют пользователям и инженерам самостоятельно дополнять прикладную функциональность решения. В данном случае длительного внедрения не требуется: нужные компоненты уже интегрированы между собой вендором. За счёт использования единой программной платформы сразу под несколько прикладных задач, удаётся избежать дублирования данных и нерационального использования вычислительных ресурсов, как это происходит при использовании нескольких монофункциональных средств. Поэтому, на мой взгляд, решения на базе платформ анализа машинных данных являются сейчас наиболее перспективными для широкого применения.

Системный архитектор компании ТАЛМЕР Александр Блинов: Перечислить все решения по всем направлениям в рамках одного разговора невозможно. Сотни вендоров специализируются на мониторинге, плюс сами производители оборудования и программного обеспечения разрабатывают комплексы для мониторинга и управления своими продуктами. Из open source средств мониторинга инфраструктуры и приложений можно отметить Zabbix, который широко применяется в инфраструктурах практически любой сложности – он достаточно прост в настройке, доработке и позволяет эффективно отслеживать состояние как отдельных сервисов, так и инфраструктуры в целом. Если говорить про комплексы мониторинга enterprise-уровня, то здесь представлены мастодонты ИТ-рынка – IBM с платформой мониторинга и управления инфраструктурой Tivoli, Microsoft SCOM, HPE SIM и многие другие. Практически любая платформа виртуализации или контейнеризации сейчас имеет в комплекте встроенную систему отслеживания, предикции и реагирования. При выборе средств мониторинга нужно исходить из бизнес-задачи, которую необходимо решить, будь то снижение аварийности, монетизация пользовательского опыта, отчётность и аналитика для владельцев бизнеса.

 

Системный архитектор компании ТАЛМЕР Александр Блинов

Системный архитектор компании ТАЛМЕР Александр Блинов

 

Старший руководитель группы консалтинга по инфраструктуре ЦОД компании ICL Services Алексей Складчиков: Можно выделить два типа систем мониторинга инфраструктуры, приложений, бизнес-процессов: решения с СПО (свободно распространяемым ПО) и проприетарные системы. В зависимости от целей и задач бизнеса могут использоваться различные комбинации этих систем.

 

Старший руководитель группы консалтинга по инфраструктуре ЦОД компании ICL Services Алексей Складчиков

Старший руководитель группы консалтинга по инфраструктуре ЦОД компании ICL Services Алексей Складчиков

 

Если говорить про инструменты организации мониторинга, то одним из важнейших факторов, определяющих качество работы системы мониторинга, является процессная составляющая (управление инцидентами, управление активами, управление проблемами и так далее). К этому также следует добавить возможности интеграции системы мониторинга с различными информационными системами, приложениями, бизнес-процессами.

ИТ-директор компании «Интерпроком» Олег Слядников: Исходя из своего опыта, вне зависимости от специфики элементов ИТ-инфраструктуры, я бы поделил мониторинг на проактивный и реактивный. Когда элементы ИТ-инфраструктуры перестают работать и требуют срочного исправления, чтобы восстановить предоставленную услугу, реактивный мониторинг помогает как можно скорее узнать, что не так или не работает.

 

ИТ-директор компании «Интерпроком» Олег Слядников

ИТ-директор компании «Интерпроком» Олег Слядников

 

При этом каждый компонент ИТ-инфраструктуры требует регулярного обслуживания для работы с максимальной эффективностью, и проактивный мониторинг позволяет отслеживать определенные показатели работоспособности в системах и принятия мер, пока не стало слишком поздно. И здесь имеет смысл систематизировать и консолидировать всю информацию обо всех объектах ИТ-инфраструктуры на единой платформе и совместить мониторинг с организацией обслуживания и ремонта активов разной сложности.

Зачастую руководство компаний очень мало знают о том, из чего состоит и как на самом деле работает их ИТ-среда. Они знают об этом только тогда, когда случаются сбои и бизнес находится под угрозой. Мониторинг ИТ-среды и централизованное управление активами предприятия от программного обеспечения до аппаратных систем и сетевого оборудования позволяет снизить риски и проактивно управлять сложными составными объектами.

Директор департамента ИТ инфраструктуры OCS Distribution Сергей Бородин: Помимо основного стека для мониторинга, такого как Zabbix, Grafana и так далее, мы успешно внедрили RPA для моделирования действий пользователей с целью оценки качества работы не только систем, но и бизнес-процессов.

 

Директор департамента ИТ инфраструктуры OCS Distribution Сергей Бородин

Директор департамента ИТ инфраструктуры OCS Distribution Сергей Бородин

 

ICT-Online.ru: Грамотно организованный мониторинг - каким он должен быть? Велико ли в нем участие человека, или большее значение имеют правильно подобранные средства автоматизации? Какими компетенциями должен обладать специалист, ответственный за мониторинг?

Компания «Инфосистемы Джет» давно занимается мониторингом и вырастила серьезную практику в этой сфере. Сейчас помимо коммерческих систем, например, AppDynamics, в портфеле компании несколько решений на базе Open Source. Особенную гордость представляет проектный опыт. Об этом говорит руководитель направления мониторинга «Инфосистемы Джет» Алексей Акопян (см. интервью раздела «Инфосистемы Джет» от 26 мая 2021 г.).

Алексей Акопян («Инфосистемы Джет»): Результаты мониторинга должны быть понятными людям, которые будут с ними работать. Вот главный критерий успешности проекта внедрения подобных систем. А для этого все данные, предоставляемые системой, должны быть правильно интерпретированы, их не должно быть слишком много. На своей практике мы часто сталкивались со случаями, когда на мониторинг ставят максимум систем, а по факту оказывается, что потом с этими данными невозможно работать. Большой поток данных с ложными срабатываниями, события разного уровня важности - как из этого выделить причину той или иной проблемы? Частые срабатывания триггеров подрывают доверие к системе мониторинга.

Компании часто поддаются соблазну решить задачу мониторинга ИТ-инфраструктуры, внедрив определенный ИТ-инструмент. Но это не гарантирует предотвращения ЧС. Универсальных инструментов, которые выявят настоящие и потенциальные проблемы, - не существует. Гораздо действеннее сначала определить подход к мониторингу, проанализировать процессы компании и разработать карту мониторинга, а уже потом выбирать под него инструменты. Это задача команды внедрения. И у нее должен быть широкий технический кругозор, понимание не только технологий мониторинга, но и того оборудования и систем, с которыми система будет работать. Как собирать информацию, как предобрабатывать данные и какие скрипты для этого написать - это задачи для команды внедрения, их решения нет в самой системе мониторинга.

Олег Головко («ЛАНИТ-Интеграция»): В крупной компании мониторинг должен выполняться на всех уровнях: от инженерных систем, сети и инфраструктуры до бизнес-процессов, цифрового опыта и клиентского пути. Причем данные с каждого уровня должны передаваться наверх для агрегации и корреляции. Не охватив один из уровней, мы теряем контроль над ситуацией и драгоценное время в случае возникновения проблем. А клиент, как мы знаем, не любит ждать.

Платформа мониторинга, как и любая высоконагруженная информационная система, требует грамотного внедрения, поддержки и развития. Отдельной задачей является обучение пользователей платформы - разработчиков, администраторов, системных и бизнес-аналитиков, среди которых часто возникает сопротивление изменениям. Роль команды мониторинга в этих процессах очень важна.

Специалист мониторинга, в первую очередь, должен обладать широким техническим кругозором, ведь кроме знания самих инструментов нужно понимать принципы работы всех объектов мониторинга - сети, операционных систем, баз данных, прикладного ПО, а теперь еще и бизнес-процессов. И, безусловно, неотъемлемый навык - системный анализ и программирование хотя бы на базовом уровне для реализации многочисленных интеграций.

Олег Константинов («ФОРС – Центр разработки»): С каждым годом к современным системам мониторинга предъявляют все больше требований, и системы постоянно развиваются. Если раньше было достаточно собирать основные метрики с серверов, такие как загрузка ЦПУ, памяти, дисков, сетей, то сейчас эта информация покажет лишь «вершину айсберга» работы системы. Происходит постоянное усложнение архитектуры, появляются дополнительные абстракции, генерируемые программным обеспечением. Например, если мы говорим о мониторинге серверов СУБД, то нам важно видеть количество подключений к базе данных, как она аллоцирует выделенную память, сколько ресурсов потребляют ее внутренние компоненты.

«ФОРС – Центр разработки»  занимается установкой и настройкой систем ИТ-мониторинга более 5 лет. Эти работы являются неотъемлемой частью внедрения системы, особенно когда предъявляются высокие требования к доступности сервисов. Например, при новых внедрениях системы «Рекорд» для управления дорожным хозяйством сразу же настраивается мониторинг по ключевым метрикам, уже «обкатанным» на предыдущих внедрениях. Об этом говорит руководитель группы инженеров службы внедрения и сопровождения компании «ФОРС – Центр разработки» (ГК ФОРС) Олег Константинов (см. фигуру речи раздела «ФОРС» от 25 мая 2021 г.).

В свое время компания Google сформировала свое видение базовых правил мониторинга, основанное на опыте эксплуатации, и назвала их «4 золотых сигнала»:

  1. Задержка (Latency) или среднее время успешного выполнения запроса к системе;
  2. Трафик (Traffic) или количество запросов к системе в секунду;
  3. Ошибки (Errors), то есть количество регистрируемых ошибок;
  4. Насыщенность (Saturation) или утилизация (загруженность)системы.

Казалось бы, такой простой и очевидный на первый взгляд набор метрик, но он обеспечивает базовый охват ключевых инцидентов в системе.

Станислав Прищеп (STEP LOGIC): При организации мониторинга, как и любого рабочего процесса, в первую очередь требуется сработанная и компетентная команда специалистов и руководителей, во вторую - качественные технические средства автоматизации их деятельности. Также могут потребоваться организационные документы, обеспечивающие должный уровень качества процесса.

Технические средства автоматизации анализа данных наращивают свою функциональность и позволяют существенно повысить эффективность процесса мониторинга, в том числе за счёт применения технологий искусственного интеллекта. Но пока их возможности очень далеки от человеческих, поэтому ключевую роль в этом процессе играет специалист, который осуществляет мониторинг, является пользователем системы, донастраивает ее, определяет правила и анализирует результат их отработки.

Для специалиста-аналитика, использующего средства автоматизированного анализа данных, важно:

  • понимать предметную область и возможности программных средств автоматизации, которые он использует;
  • уметь анализировать область мониторинга, определять сценарии и правила выявления инцидентов;
  • знать, какие математические алгоритмы и данные можно использовать для выявления инцидентов и борьбы с ложными срабатываниями.

Александр Блинов (ТАЛМЕР): Грамотно построенный мониторинг должен предсказать возникновение проблем по «хлебным крошкам» - минимальным аномалиям в поведении инфраструктуры, незаметным при ручном наблюдении, и предотвращать потенциальные проблемы. Если система мониторинга и управления не может предотвратить возникновение инцидента в автоматическом режиме, то она должна донести информацию о возможных вариантах развития событий до ответственных лиц – дежурного специалиста по инфраструктуре, ответственного за конкретный сервис и так далее. Фактически, участие человека в самом процессе отслеживания состояния должно быть сведено если не к нулю, то к минимуму, равно как и участие в решении «типовых» проблем. Качественно проработанная автоматизация должна самостоятельно перезапускать зависшие сервисы, разворачивать дополнительные ноды в кластер ещё до исчерпания ресурсов и, при необходимости, производить ребалансировку нагрузки. Современная ИТ-инфраструктура позволяет отслеживать тысячи различных параметров и обрабатывать огромное количество событий одновременно, важно то, как использовать эти данные.

С точки зрения принятия решений в нештатных ситуациях, которые не были описаны при проектировании и внедрении мониторинга и автоматизации – важные решения должен принимать всё-таки человек. Такой специалист должен обладать достаточно широким кругозором, чтобы определить, с каким компонентом инфраструктуры возникли проблемы и как их можно устранить с минимальными потерями. Для этого нужно знать сетевой стек, особенности работы серверного оборудования, СХД, систем виртуализации и прочих компонентов. Без такой ИТ-эрудиции не получится с первого раза корректно распознать источник проблемы и эскалировать её в нужный департамент или решить самостоятельно.

 

 

Алексей Складчиков (ICL Services): С экспертной точки зрения, грамотный мониторинг представляет собой информационную систему, предотвращающую возможные убытки бизнеса вследствие неработающей инфраструктуры или ее компонентов и снижающую риски возникновения ситуаций недоступности бизнес-критичных систем и их последующего долгого/дорогого восстановления. Следовательно, грамотный мониторинг - это комплекс процессов, инструментов и обученного персонала, работающий как единое целое в рамках бизнес-потребностей заказчика.

Участие человека в мониторинге так же ценно, как и продуманный инструмент или средство автоматизации. Нельзя рассматривать одно в отрыве от другого. Синергия экспертности специалистов, обслуживающих систему мониторинга, и правильно подобранного и используемого средства автоматизации - необходимое условие и критерий успешности работы.

Необходимые компетенции специалиста, ответственного за мониторинг, можно разделить на hard skills (техническая экспертиза в системах мониторинга) и soft skills (развитые когнитивные способности: умение анализировать, системно мыслить, креативное мышление, развитые коммуникативные способности).

«Интерпроком» осуществляет комплексное внедрение проектов, которое включает в себя установку и настройку системы мониторинга сервиса, помогает с постановкой на учет в существующую систему мониторинга заказчика, оказывает консультации по выработке и определению метрик, алертов, шаблонов действий, регламентов. Компания - единственный в России провайдер облачных сервисов HCL Cloud Hosting MSP, что накладывает еще большую ответственность за предоставление сервисов самого высокого уровня. Об этом говорит ИТ-директор компании «Интерпроком» Олег Слядников (см. интервью раздела «Интерпроком» от 25 мая 2021 г.).

Олег Слядников («Интерпроком»): Грамотно организованный мониторинг – это разумный мониторинг, который помогает обеспечивать доступность ИТ-систем и сервисов 24х7. Например, вы прибыли в офис на машине, проехали на территорию парковки, зашли в здание по электронному пропуску, сели за свой рабочий стол, включили компьютер, открыли электронную почту, бизнес-приложения  и начали свой обычный рабочий день. При этом вы уже использовали несколько различных сервисов, о которых даже не задумывались. Что произойдет, если откажет хотя бы один из элементов ИТ-инфраструктуры: оборудование, программное обеспечение, сетевые и другие ресурсы? - Вы захотите войти в офис, а ваш пропуск не сработает, электронные письма не будут уходить, бизнес-приложения не запустятся.

Разумная система мониторинга сегодня – это больше, чем система информирования о сбоях. Она должна, во-первых, быть способна как минимум автоматически устранять ряд проблем. Например, если сервер Domino говорит, что повредился индекс одной из почтовых баз, то система мониторинга помимо отправки сообщения системному администратору, должна запустить команду перестройки индекса. Если ситуация со сбоем произошла ночью, то сисадмин начинает свое утро не с поиска повреждённой базы и запуска процедуры восстановления, а получает сообщение, что ночью был сбой, система восстановлена. Администратор может заниматься поиском причин сбоя и выработкой подходов и методик его предотвращения в дальнейшем, что снижает необходимость ручного труда, и повышает эффективности работы ИТ-специалистов.

Во-вторых, недостаточно просто обеспечить работоспособность ИТ-инфраструктура, важно определить, какие области можно улучшить. Зная это, можно соответствующим образом настроить свою инфраструктуру, чтобы система работала с максимальной производительностью. Вы можете заранее определить любую уязвимую область до того, как вообще возникнет какая-либо проблема, что позволяет предотвратить простои и недоступность системы.

Немаловажный момент – это сбор и визуализация метрик обслуживаемых сервисов. И здесь встает задача глубокого анализа причин сбоя, воссоздание картины, предшествовавшей сбою, анализ окружения и определение методов предотвращения. Поэтому очень важно, чтобы система мониторинга формировала рекомендации по возможным причинам сбоя и дальнейшим действиям.

Не стоит забывать, что требуется не просто установить сервис мониторинга, но и настроить его так, чтобы уведомления были понятны специалистам поддержки. При этом их не должно быть слишком много, дабы не возникало «симптома привыкания», когда сообщение о проблеме от системы мониторинга тонет среди других информационных сообщений системы мониторинга. Мониторинг должен информировать специалиста только о возникновении исключительных ситуациях.

Да, пока мы не можем отдать полностью исправления ситуации автоматизированным системам, но уверен, что в будущем, в том числе с помощью машинного обучения, число кейсов, где необходимо участие человека, будет неуклонно снижаться.

В компании OCS Distribution мониторинговая служба существует более 7 лет, недавно был произведен перезапуск ее процессов. Основной упор был сделан на доступность мониторинга как сотрудникам ИТ, так и пользователям. Метрики существенно были переосмыслены с технических на качественные, что позволило увидеть те проблемы, которые ранее не были заметны. Об этом рассказывает директор департамента ИТ инфраструктуры OCS Distribution Сергей Бородин (см. фигуру речи раздела «OCS» от 18 июня 2021 г.).

Сергей Бородин (OCS Distribution): Мониторинг -  это процесс, который на выходе должен реализовывать требования по доступности систем. Не придумали еще таких систем, которые не ломаются. Но есть системы, которые чинят быстрее, чем их поломку заметят, при этом пользователи не ощущают на себе никаких воздействий. Наблюдательность и умение предвидеть -  наверное, это ключевые компетенции для ответственного за мониторинг.

ICT-Online.ru: Какова роль интегратора в этом процессе? На каких участках помощь интегратора незаменима?

Алексей Акопян («Инфосистемы Джет»): Порой системы мониторинга создаются вне сервисного подхода. Тот или иной компонент ИТ-инфраструктуры или приложение рассматривается сам по себе, в отрыве от бизнес-функции, которую они поддерживают. Система мониторинга в этом случае лишь фиксирует факт «пожара» на ограниченном участке и не дает максимального эффекта: не показывает причины и не сообщает, к чему способен привести сбой. Более действенно, если она строится от бизнес-сервиса. Например, компания хочет понимать, как работает ее документооборот или финансовый процесс. Тогда, опираясь на структуру сервиса, система мониторинга «покрывает» компоненты ИТ-инфраструктуры и ПО, поддерживающее эти сервисы, отслеживает их доступность и качество.

Нередко мы встречаемся с ситуациями, когда система мониторинга не полностью интегрирована в процессы компании и результаты ее работы словно повисают в воздухе. В этом случае она становится бесполезной. Выявленные системой мониторинга слабые стороны ИТ-инфраструктуры должны регистрироваться как инциденты в Service Desk и прорабатываться. Мониторинг должен быть частью ИТ-процессов, интегрирован с системами учета оборудования, управления инцидентами и «обвязан» соответствующими регламентами.

Собственно, чтобы спроектировать, внедрить систему мониторинга, интегрировать ее с необходимыми ИТ-компонентами и нужен ИТ-интегратор.

«ЛАНИТ-Интеграция» за последние 5 лет реализовала более 15 проектов по мониторингу разной сложности и в различных отраслях. У компании одна из лучших в России команд по APM, отличная экспертиза по современным open source-инструментам инфраструктурного мониторинга, опыт построения зонтичных систем мониторинга и операционной аналитики. Об этом говорит первый заместитель управляющего директора компании «ЛАНИТ-Интеграция» (входит в группу ЛАНИТ) Олег Головко (см. интервью раздела «ЛАНИТ» от 25 мая 2021 г.).

Олег Головко («ЛАНИТ-Интеграция»): Интегратор исторически силен в трех вещах: экспертиза, понимание рынка технологий и опыт создания комплексных проектов с разными заказчиками. Поэтому роль интегратора как внешнего консультанта в процессе создания платформы мониторинга особо важна на ранних стадиях подбора инструментов, проектирования архитектуры, интеграции в ландшафт информационных систем, а также запуска, наполнения первичными данными и обучения. За это время у заказчика должна сформироваться команда, которая займется дальнейшей поддержкой, развитием платформы, а также распространением подходов и инструментов внутри компании в режиме самообслуживания. На этом этапе интегратор может оказывать вторую линию поддержки, выполнять отдельные сложные задачи и усиливать ресурсами для ускорения темпов развития.

Олег Константинов («ФОРС – Центр разработки»): Важно понимать, что уже на этапе разработки архитектуры приложения закладываются основные критерии мониторинга функциональности. Когда система вводится в эксплуатацию у заказчика, интегратор помогает правильно настроить основные метрики мониторинга, как системные, так и бизнес-приложений, что способствует бесперебойной работе уже на первых этапах.

Станислав Прищеп (STEP LOGIC): Системный интегратор - центр экспертизы, который реализует технические решения на базе систем мониторинга и анализа данных. Нередко компания-интегратор привлекается также для создания центра экспертизы по средствам мониторинга внутри заказчика, обеспечения технической поддержки и сопровождения созданных систем.

Кроме этого, интеграторы могут выступать провайдерами управляемых услуг на базе своей экспертизы и развёрнутых средств мониторинга. Например, помогают контролировать работоспособность информационных систем заказчика, выявляют хакерские атаки и другие инциденты информационной безопасности.

Александр Блинов (ТАЛМЕР): Интегратор, имея большой проектный опыт и высококвалифицированных специалистов в штате, помогает определить объекты и участки инфраструктуры, подлежащие мониторингу, выбрать единственное нужное решение из всего многообразия представленных на рынке систем, и, что крайне важно, разрабатывает алгоритмы отслеживания состояния объектов и автоматизирует реакции на изменение тех или иных метрик. Существенным преимуществом привлечения профессионального интегратора перед самостоятельным внедрением системы мониторинга и управления является гарантия того, что состояние инфраструктуры будет отслеживаться максимально полно, в связи с чем количество инцидентов с неожиданными отключениями служб и сервисов будут стремиться к нулю. Интегратор может разработать регулярную отчётность по доступности и качеству сервисов заказчика. Мониторинг это не только сбор и визуализация событий от оборудования, это в первую очередь процессы, процедуры, интеграция со смежными системами и, как итог, достижение поставленной бизнес-цели. Также стоит отметить возможность обучения интегратором сотрудников заказчика самостоятельной разработке алгоритмов автоматизации и мониторинга.

Компания ICL Services имеет большой опыт разработки, внедрения, интеграции и обслуживания систем мониторинга российских и международных заказчиков (как проприетарных, так и решений с СПО), а также экспертизу в области внедрения процессов end-to-end согласно лучшим отраслевым практикам. Данным направлением компания занимается более 11 лет. Об этом рассказывает старший руководитель группы консалтинга по инфраструктуре ЦОД компании ICL Services Алексей Складчиков (см. интервью раздела «ICL Services» от 25 мая 2021 г.).

Алексей Складчиков (ICL Services): Процесс внедрения или обслуживания системы мониторинга заказчиков со стороны интеграторов традиционно носит поэтапный характер и включает в себя: обследование инфраструктуры, анализ данных, формирование предложений (техническая часть и процессная), пилотирование и внедрение, эксплуатацию.

Интегратор, имеющий опыт в постройке систем мониторинга различной сложности и назначения, предлагает, как правило, несколько путей для решения проблем заказчика, начиная от модернизации информационной системы и заканчивая внедрением сквозных процессов с последующим обновлением ландшафта информационных систем.

Олег Слядников («Интерпроком»): Задача системного интегратора не просто установить и настроить программное обеспечение. Мы отдаем в эксплуатацию законченный сервис, настроенный на максимальную отдачу и бесперебойную работу.

Сергей Бородин (OCS Distribution): Если в компании недостаточно развита внутренняя экспертиза и ее необходимо оперативно нарастить, на помощь приходят интеграторы. В нашей компании хорошая внутренняя экспертиза и мы не только справляемся своими силами, но и готовы ей делиться с рынком.

ICT-Online.ru: Ваше экспертное мнение о перспективах развития направления мониторинга ИТ и роста его значимости для компаний в целом и разных категорий пользователей.

Алексей Акопян («Инфосистемы Джет»):  Сейчас мы переживаем очередную волну подъема интереса к мониторингу. Многие компании уже перешли в эпоху цифровизации. ИТ-ландшафт усложняется, ИТ становится все более критичной составляющей предоставляемых сервисов, к тому же выросли требования к их доступности - они должны не просто работать, а «летать». В некоторых отраслях простои обходятся безумно дорого. Например, мы опросили ТОП-10 ритейлеров. Средняя стоимость одного часа простоя составляет от 20 до 50 млн рублей. Потери компании от сбоев работы бизнес-приложений составляют от 300 до 800 млн рублей в год. Системы мониторинга способны предотвратить эти сбои и поэтому целесообразность их внедрения сомнений не вызывает.

Олег Головко («ЛАНИТ-Интеграция»): С увеличением темпов цифровой трансформации зависимость бизнеса от ИТ становится все сильнее. А значит, ИТ-мониторинг становится ключевым инструментом не только ИТ-службы, но и бизнес-пользователей. Первопроходцем здесь по традиции является сегмент E-commerce, но уже начали «подтягиваться» и другие сектора.

Олег Константинов («ФОРС – Центр разработки»): Как мы уже говорили, системы постоянно усложняются, предъявляя все новые и новые требования, поэтому мониторинг должен постоянно развиваться. Сейчас уже недостаточно собирать только метрики, теперь в обиход входит новый термин - observability (наблюдаемость) системы. Он отражает степень того, насколько хорошо и корректно внутреннее состояние системы отображается ее внешним представлением – например, журналами логов приложения. Таким образом, мониторинг, дополненный наблюдаемостью, не только сообщит нам об ошибке, но и даст ответ на вопрос, почему она произошла.

Станислав Прищеп (STEP LOGIC): Мониторинг ИТ имеет большие перспективы как ключевое средство автоматизации принятия решений в эпоху цифровизации. Чем активнее автоматизируются рабочие процессы, тем больше появляется цифровой информации, доступной для автоматического анализа. Поэтому технические решения, которые позволяют обработать большие массивы данных и принять правильные управленческие решения, очень важны и востребованы. По моему мнению, ключевой для развития этого направления является технология машинного обучения и искусственного интеллекта, обеспечивающая глубокий и качественный анализ данных. Системы на их основе могут учиться на ранее выявленных проблемах, передавать свои знания, самостоятельно адаптируются под инфраструктуру.

Применение средств мониторинга – это уже не вспомогательная, а обязательная задача при эксплуатации ИТ-инфраструктуры и автоматизации рабочих процессов, необходимое средство контроля в любой прикладной области, начиная от технологических и заканчивая бизнес-процессами и маркетинговыми акциями.

Компания ТАЛМЕР обладает наработками и практическим опытом внедрения комплексных систем управления и мониторинга для разных сегментов рынка - от малого бизнеса до крупных телеком операторов, делая основной акцент на максимизацию жизненного цикла предлагаемого продукта, интеграцию с OSS-системами заказчика и последующие циклы технической поддержки. Тему ИТ-мониторинга раскрывает системный архитектор компании ТАЛМЕР Александр Блинов (см. интервью раздела «ТАЛМЕР» от 16 июня 2021 г.).

Александр Блинов (ТАЛМЕР): Системы мониторинга продолжат наращивать возможности по отслеживанию изменений и управлению разнородными инфраструктурами. Будут разрабатываться новые методы проактивной/предиктивной аналитики. Соответственно, будут повышаться требования к квалификации специалистов, инсталляции станут больше, сложнее и дороже. Возможно, будут разработаны качественные мультитенантные платформы, которые смогут покрыть потребности в мониторинге и управлении для сотен компаний, размещённых в публичном облаке, но будут это делать при помощи всего лишь одной централизованной инсталляции. С развитием ИТ-продуктов в целом, заказчики смогут сначала получить достоверные ответы о причинах даже секундной недоступности сервисов, а затем достигнуть реального аптайма систем в 100 %.

Алексей Складчиков (ICL Services): Развитие мониторинга в ИТ может протекать в двух плоскостях. Это мониторинг для традиционных приложений и инфраструктуры. В этой области ничего кардинально нового не появляется уже долгое время, что связано с глобальным переходом к практике DevOps, Agile и так далее, а также с широким использованием публичного облака. И мониторинг облачных сервисов и решений, отслеживание успешности доставки приложения (ci/cd), где используется большое количество инструментов, доработок и интеграций. В зависимости от сложности и специфики бизнес-задач заказчика формируется подход к развитию и использованию систем мониторинга.

Олег Слядников («Интерпроком»): С моей точки зрения, для бизнес-пользователей системы мониторинга должны быть «невидимками», а все ИТ-системы и сервисы должны быть всегда доступны и бесперебойно работать.

Мой опыт работы показывает, что системы стремительно движутся от реактивного мониторинга к прогнозному проактивному.

Мечта любого сисадмина – это умная систем мониторинга с использованием роботизированных сервисов, ИИ и машинного обучения, которая может не только удаленно фиксировать сбои и устранять их, заниматься классификацией ошибок, но и обладает возможностями глубокой прогнозной аналитики, работая с большими данными, включая Интернет вещей, с целью накопления и обработки статистических данных и прогнозирования вероятных поломок оборудования и сбоев систем, расследования инцидентов, анализа причин, которые привели к сбою в прошлом. Системы мониторинга смогут предпринимать все необходимые действия от самостоятельного исправления ситуации, до отправки заявок в поддержку, разработку, отдел закупок. Роль системного администратора трансформируется в роль оператора системы без необходимости совершать рутинные механические действия.

Сергей Бородин (OCS Distribution): Мониторинг и современные средства автоматизации становятся умнее. Применение ИИ, внедрение сервисной архитектуры и использование гиперконвергентной инфраструктуры выведет работу систем на качественно новый уровень, где человек будет получать удовольствие от взаимодействия с машиной. В нашей компании разработана дорожная карта развития. Мы точно будем продолжать пробовать внедрять ИИ в процессы мониторинга и увеличивать количество качественных и предиктивных пользовательских метрик.

ICT-Online.ru: Большое спасибо за беседу!

Рубрики: Интеграция

Ключевые слова: системная интеграция, ФОРС, Инфосистемы Джет, ЛАНИТ, OCS, СТЭП ЛОДЖИК, ИТ инфраструктура, Интерпроком, ICL Services , ТАЛМЕР