В ЛЭТИ разработали нейросеть для ускорения и облегчения поиска новых лекарственных препаратов

Созданная в ЛЭТИ модель глубокого обучения RetroSynthNet позволяет прогнозировать реагенты для производства новых молекул, сохраняя высокую достоверность результатов реального синтеза. Об этом пишет сайт вуза.

Поиск новых типов лекарственных и фармацевтических препаратов — это трудоемкий и затратный аналитический процесс. Как правило, новые соединения являются либо модификациями, либо комбинациями веществ с известными свойствами. Поскольку таких компонентов относительно много, то подбор потенциально полезного нового препарата представляет собой математическую задачу перебора тысяч различных комбинаций в составе макромолекулы.

Применение такого подхода требует большого количества образцов для проведения испытаний, поскольку после окрашивания клетки, как правило, выводятся из эксперимента вследствие побочных эффектов красителей. При этом количество образцов, успешно прошедших испытания, обычно оказывается многократно ниже количества неудачных. Поэтому для разработчиков новых лекарственных препаратов задача автоматизации и удешевления процесса отбора перспективных макромолекул является крайне актуальной.

«Мы разработали инновационную модель глубокого обучения RetroSynthNet, которая значительно ускоряет и облегчает процесс проектирования синтеза новых фармацевтических препаратов. Используя подход “последовательность-последовательность” и анализ химических структур в формате SMILES, RetroSynthNet автономно прогнозирует возможные реагенты для производства целевых молекул, сохраняя при этом высокую химическую достоверность — почти 70%. Этот и другие показатели точности демонстрируют способность модели генерировать качественные и вычислительно эффективные решения».- рассказал аспирант кафедры вычислительной техники (ВТ) СПбГЭТУ «ЛЭТИ» Джозеф Инносент.

В рамках исследования использован набор данных для синтеза соединений USPTO-50K – это обширный датасет, который находится в свободном доступе для исследователей и включает огромное количество данных.

Датасет использовался для обучения нейросети типа Seq2Seq. Ее особенность заключается в том, что при генерации она может имитировать способность человека избирательно концентрироваться на различных фрагментах информации – в данном случае, на участках химических соединений. Производительность, химическая достоверность и точность прогноза оценивались при помощи различных независимых тестов (BLEU, RDKit).

«RetroSynthNet может помочь химикам и исследователям эффективно генерировать потенциальные пути для синтеза молекул лекарственных препаратов, минимизируя ручной анализ и ускоряя начальные этапы разработки лекарств при сравнительно низких вычислительных ресурсах. В перспективе наша нейросеть поможет ускорить темпы фармацевтических исследований, снизить затраты на разработку и облегчить поиск новых терапевтических соединений». - добавил Джозеф Инносент

Тематики: ПО, Здоровье

Ключевые слова: Информационные технологии в здравоохранении, Нейросети, Машинное обучение (ML)