Платформа разворачивается индивидуально для каждого клиента и может включать в себя популярные open-source инструменты ClearML или Kubeflow, которые позволяют организовать полный цикл обучения и тестирования ML-моделей. Инфраструктурно решение развернуто на базе сервиса Managed Kubernetes с GPU, датасеты и результаты экспериментов хранятся в объектном хранилище S3, а образы — в Container Registry. В новом решении Selectel используются передовые видеокарты NVIDIA с большим объемом памяти — T4, A2, A30, A100, A2000, A5000.
Платформа позволяет заказчикам значительно упростить процесс обучения и тестирования ML-моделей, а также ускорить time-to-market своих решений. Это возможно за счет делегирования провайдеру задач по организации инфраструктуры. Кроме того, использование платформы позволяет клиентам сократить затраты на обучение ML-моделей за счет разделения одной GPU между разными задачами и оплаты только за потребленные ресурсы. Решение поможет пользователям стандартизировать и унифицировать рабочие процессы благодаря единой инфраструктуре, точке входа в платформу, хранилищу артефактов, а также инструментам управления экспериментами.
«Российский рынок ИИ активно развивается: по данным МФТИ, в 2022 году он вырос на 17%. Это отражает и рост спроса на специально подготовленную инфраструктуру для обучения и тестирования ML-моделей — отмечает Антон Чунаев, менеджер ML-продуктов Selectel. — Новая платформа тестировалась в течение года — нашей целью было учесть обратную связь от пользователей и вывести на рынок решение, которое позволит клиентам меньше думать об инфраструктурных вопросах и сконцентрироваться на своих бизнес-задачах. Более того, Selectel второй год подряд занимает лидирующую позицию на рынке облачных решений с GPU, что является отличным подспорьем для дальнейшего развития платформенных ML-сервисов».