24 мая команда Синтелли выступила на DataFest 2025 — крупнейшей российской конференции по данным и машинному обучению, которая прошла в московском офисе ВКонтакте.
В докладе «Извлечение химических реакций из текстовых документов» наши разработчики рассказали, как мы автоматизируем обработку научных публикаций с помощью нейросетей и создаём уникальную базу данных реакций, востребованную в химии, фармацевтике и R&D.
Что было в программе выступления:
— какие методы используются для извлечения химических реакций из текстов;
— как устроен пайплайн Синтелли: от научной статьи до структурированных данных;
— какие этапы проходят данные, чтобы в базу попали корректные реакции с максимально полными условиями и ссылкой на источник.
📺 Запись выступления: