В нашей практике было много разных проектов, включающих проведение ИТ-мониторинга. Один из недавних кейсов был связан с запуском высоконагруженного клиентского сервиса в ритейле. Сервис должен был обрабатывать большое количество одновременных сессий пользователей, сотни обращений в секунду с минимальным временем ожидания ответа. Казалось, все компоненты системы справлялись с возложенной нагрузкой, однако добиться целевых показателей производительности для конечного пользователя не удавалось.
Разобраться в ситуации помогла система мониторинга производительности приложений (Application Performance Monitoring, APM). Ресурсно-сервисная модель позволила наглядно увидеть, что производительность ограничивало взаимодействие некоторых микросервисов в Kubernetes с другими сервисами и базами данных. В сложных системах из десятков компонентов задача поиска таких узких мест без применения специализированных решений мониторинга производительности приложений часто является сложновыполнимой, не говоря уже о том, что при поиске причин низкой производительности придется потратить время на отработку далеко не одной неверной гипотезы.
Старший руководитель проектов компании «Иннодата» Андрей Рябов