Ученые ИТМО автоматизировали разработку отраслевых систем ИИ с помощью больших языковых моделей

02.10.2024 |

В исследовательском центре «Сильный ИИ в промышленности» ИТМО создали новую гибридную систему искусственного интеллекта, которая объединила автоматическое машинное обучение и большие языковые модели. LLM-агент в этом решении служит гибким интерфейсом между пользователем и AutoML, отчасти заменяя ИИ-разработчика. Теперь достаточно вольно описать задачу по работе с данными, система в режиме диалога запросит дополнительную информацию, уточнит задание, переведет в понятные для разработки термины, сама напишет код и интерпретирует результаты.

«Чтобы внедрение новой модели искусственного интеллекта не занимало недели и даже месяцы у дорогостоящих специалистов по Data Science, в 2020 году мы создали FEDOT – инструмент автоматического машинного обучения с открытым исходным кодом. Хотя он быстро разлетелся по миру, инструмент могли полноценно использовать только эксперты довольно высокого уровня. Пользователями FEDOT стали в том числе сотрудники Яндекс, ВК, Сбера, Роснефти, Магнитогорского металлургического комбината. Но для массового отраслевого внедрения инструмент нужно было адаптировать. При решении задач предсказательного моделирования, AutoML порождает довольно много сущностей, которые необходимо понимать и уметь настраивать – от структуры модели до истории ее оптимизации. Эти трудности нам помогли преодолеть интегрированные в инструмент LLM-агенты. Теперь разработать отраслевое ПО с элементами ИИ можно будет в 7 раз быстрее», – рассказал доцент ИТМО, руководитель группы научно-технического развития исследовательского центра «Сильный ИИ в промышленности» Николай Никитин.

В этом проекте впервые языковые модели используются одновременно на нескольких этапах машинного обучения: первоначальный сбор информации от пользователя через диалоговый интерфейс, анализ полученных данных и интерпретация результата. AutoML конфигурируется с помощью генеративного ИИ на базе LLM, а оригинальность решений достигается за счет адаптивного эволюционного ПО. Прототип системы ученые представили 27 сентября на авторитетной конференции AiConf 2024 в Москве, в конце года решение будет оформлено и выложено в репозиторий открытого кода.

Проект разработки поддержал фонд НТИ, решение вошло в дорожную карту развития высокотехнологичного направления «Искусственный интеллект» на период до 2030 года и получило соответствующее финансирование. Руководитель рабочей группы «Практика и данные» Альянса в сфере искусственного интеллекта Алексей Шпильман отметил: «С сервисами AutoML и NoCode всегда была следующая проблема: они оставались достаточно технически сложными. И если уж специалист разобрался в том, как ими пользоваться, он мог сделать не трудный шаг и из CitizenDS стать полноценным DS, изучив Python и получив доступ к еще более сложным и тонко настраиваемым инструментам. Из-за этого количество пользователей этих сервисов всегда было ограниченным. Использование БЯМ может значительно снизить порог входа и расширить аудиторию так, что CitizenDS станут действительно Citizen».