Подведены итоги первого совместного мероприятия центра инфохимии ИТМО х Синтелли x Medtech.Moscow. С 28 по 30 апреля в онлайн формате прошел хакатон «Цифровая фармакология: предсказательное моделирование». Технологический партнер мероприятия – Selectel.
В борьбе за призовой фонд в размере 1 000 000 рублей участникам предстояло на основании открытых источников с использованием технологий искусственного интеллекта построить модель машинного обучения для прогнозирования параметров характеризующих токсичность химического соединения.
На хакатон зарегистрировались 390 участников, которые решали кейс, поставленный Синтелли – платформой искусственного интеллекта для органической и медицинской химии. В течение 48 часов участники работали над задачей и на финише представили 27 решений. Решение позволит существенно сократить время и средства на разработку и внедрение новых лекарственных препаратов. Важно, что при этом можно в разы уменьшить количество лабораторных животных используемых в экспериментах и снизить риски побочных эффектов лекарств на людей.
По итогам хакатона сильнейшие участники получили возможность учесть призовое место при поступлении на магистерскую онлайн-программу Chemistry Soft (Химический софт) от университета ИТМО, а также шанс стать частью команды Синтелли и других медицинских стартапов Medtech.Moscow.
В борьбе за призовой фонд в размере 1 000 000 рублей участникам предстояло на основании открытых источников с использованием технологий искусственного интеллекта построить модель машинного обучения для прогнозирования параметров характеризующих токсичность химического соединения.
На хакатон зарегистрировались 390 участников, которые решали кейс, поставленный Синтелли – платформой искусственного интеллекта для органической и медицинской химии. В течение 48 часов участники работали над задачей и на финише представили 27 решений. Решение позволит существенно сократить время и средства на разработку и внедрение новых лекарственных препаратов. Важно, что при этом можно в разы уменьшить количество лабораторных животных используемых в экспериментах и снизить риски побочных эффектов лекарств на людей.
По итогам хакатона сильнейшие участники получили возможность учесть призовое место при поступлении на магистерскую онлайн-программу Chemistry Soft (Химический софт) от университета ИТМО, а также шанс стать частью команды Синтелли и других медицинских стартапов Medtech.Moscow.
В ТОП-3 ВОШЛИ:
1 место – MML (500 000 рублей)
МФТИ/Москва
Участники: Кутузов Николай, Новиков Сергей
В основе решения команды лежит новый, авторский подход для решения задач анализа химических соединений - агрегирование признаков из различных источников, и применение к ним алгоритма градиентного бустинга деревьев. Это как химические признаки (наибольший прирост в качестве среди них дал подсчет функциональных групп в молекуле), так и данные из языковых моделей. Собранные данные из 20 источников позволили сформировать датасет из более, чем 1,1 млн молекул для прогнозирования 34 признаков. Получив очень полное признаковое пространство, алгоритм градиентного бустинга сегментирует его на блоки, в каждом из которых выводится среднее предсказание
Участники: Кутузов Николай, Новиков Сергей
В основе решения команды лежит новый, авторский подход для решения задач анализа химических соединений - агрегирование признаков из различных источников, и применение к ним алгоритма градиентного бустинга деревьев. Это как химические признаки (наибольший прирост в качестве среди них дал подсчет функциональных групп в молекуле), так и данные из языковых моделей. Собранные данные из 20 источников позволили сформировать датасет из более, чем 1,1 млн молекул для прогнозирования 34 признаков. Получив очень полное признаковое пространство, алгоритм градиентного бустинга сегментирует его на блоки, в каждом из которых выводится среднее предсказание
2 место – Billy QSAR (300 000 рублей)
Университет Иннополис/Иннополис, ТПУ/Томск
Участники: Лукин Руслан, Пякилля Борис
Проект, созданный в ходе хакатона называется «Мультимодели для предсказания параметров токсичности». Собрана база данных токсичности малых молекул из 41 датасета и пайплайн для обучения и валидации моделей на основе графовых нейросетей и дескрипторных подходов. Также команда собрала приложение для визуальной интерпретации моделей на основе структурных фрагментов. Данный подход позволяет выдавать как влияющие структурные фрагменты на выборке контрпримеров из наиболее близких по структуре соединений, так и визуализировать их в самой предсказанной молекуле.
Участники: Лукин Руслан, Пякилля Борис
Проект, созданный в ходе хакатона называется «Мультимодели для предсказания параметров токсичности». Собрана база данных токсичности малых молекул из 41 датасета и пайплайн для обучения и валидации моделей на основе графовых нейросетей и дескрипторных подходов. Также команда собрала приложение для визуальной интерпретации моделей на основе структурных фрагментов. Данный подход позволяет выдавать как влияющие структурные фрагменты на выборке контрпримеров из наиболее близких по структуре соединений, так и визуализировать их в самой предсказанной молекуле.
3 место – SCD Lab (200 000 рублей)
МГУ им М. В. Ломоносова/РГГУ, Москва
Участники: Иван Пикулин, Юдина Анастасия, Руденко Михаил, Ярышев Владислав.
В основе решения лежат как мультизадачные графовые нейронные сети, так и алгоритмы классического машинного обучения. Собранные данные из более чем 5 открытых источников позволили обучить модели, которые с высокой точностью прогнозируют широкий спектр показателей токсичности, основываясь исключительно на структурных формулах молекул. Более того, использованный подход можно в дальнейшем масштабировать на новые свойства, связанные с токсичностью.
Участники: Иван Пикулин, Юдина Анастасия, Руденко Михаил, Ярышев Владислав.
В основе решения лежат как мультизадачные графовые нейронные сети, так и алгоритмы классического машинного обучения. Собранные данные из более чем 5 открытых источников позволили обучить модели, которые с высокой точностью прогнозируют широкий спектр показателей токсичности, основываясь исключительно на структурных формулах молекул. Более того, использованный подход можно в дальнейшем масштабировать на новые свойства, связанные с токсичностью.
Церемония закрытия хакатона началась со вступительного слова генерального директора Московского центра инновационных технологий в здравоохранении (Медтеха) Вячеслава Шуленина:
“В Медтехе мы создаем уникальные технологии, часть из которых являются первыми в мире. Для этого мы всегда находимся в поиске талантливых специалистов, которые вносят весомый вклад в развитие здравоохранения Москвы и нашей страны. Хакатон – это удачный инструмент, который нам в этом всегда помогает. В этот раз вместе с партнерами отобрали лучшие модели в области предсказания токсичности потенциальных лекарственных препаратов. Это поможет ускорить разработку и вывод новых лекарственных препаратов на рынок, а также раскрыть потенциал молодых ученых, которые хотят профессионально расти в цифровой науке. Российскому рынку сейчас как никогда нужны такие кадры. Разработчики лучших решений будут приглашены к совместной работе в области машинного обучения и анализа больших данных в команде Синтелли и других стартапов нашего Технопарка”
«Участие в хакатоне на стыке химии, фармацевтики и IT – шанс для студентов и молодых ученых проявить себя, применить знания в реальных задачах бизнеса, поработать в интердисциплинарной команде. Для компаний – это возможность найти новые решения и подходы. Мы также учитываем результаты участников при поступлении в нашу магистратуру и трудоустройстве в компании-партнеры. Это дает ребятам больше мотивации и стимулирует их использовать подходы инфохимии на пользу науке и медицине. Применение IT в химии позволяет находить новые лекарства, снижать затраты на поиск и исследование новых лекарств», – отметила Екатерина Скорб, профессор ИТМО, директор Научно-образовательного центра инфохимии.
«Это событие может привести к качественным изменениям, улучшениям в популяционном здоровье всей нашей страны. Сейчас проблема предсказания токсичности тех веществ, которые мы употребляем в качестве лекарств, пищевых компонентов, стоит очень остро. На планете известно 200 млн веществ синтезируемых человеком. Только за время хакатона, думаю, было синтезировано около 10 000 новых веществ в различных лабораториях. А токсичность, хотя бы частично, исследована только для небольшого количества соединений, порядка 200 000 - 300 000. Разница в несколько порядков! Мы должны не догонять, а обгонять этот процесс. И наша платформа, Синтелли, стала частью этого процесса. Особенно в текущей санкционной ситуации, когда многие иностранные провайдеры аналогичного зарубежного ПО и баз данных в области химии покинули российский рынок.» – прокомментировал Максим Федоров, доктор химических наук, чл.-корр. РАН и со-основатель платформы Синтелли.
Синтелли – модульная платформа искусственного интеллекта для органической и медицинской химии, которая содержит более 96 млн молекул и включает набор прогностических моделей на основе глубоких нейронных сетей для расчета физико-химических, токсикологических, биологических и экологических свойств соединений. Для получения доступа к Синтелли – пишите на admin@syntelly.com.