Этот модуль Syntelly позволяет получить быстрое и наглядное представление об основных группах химических соединений, которые есть в датасете. Модель производит проецирование структур химических соединений в координаты X и Y на двумерную плоскость. Сами по себе координаты не несут физического смысла, однако модель настроена таким образом, что структурно близкие соединения оказываются рядом.
В итоге вы получаете карту распределения химических соединений, где можно увидеть знакомые кластеры: кластер простых линейных алифатических соединений, кластер стероидов, бисфенилов, психоактивных веществ и т.п. Также данный модуль взаимодействует с генератором химических структур. Для начала работы с разделом загрузите соединения из заранее подготовленных датасетов через кнопку «+» в блоке «Layers».
Затем вы увидите список всех ваших сетов из раздела «Molecules». Выберите необходимый датасет и нажмите на кнопку «Choose».
Загрузка больших датасетов занимает некоторое время. Если вы хотите убедиться в том, что она все-таки идет, обратите внимание на блок «Layers» в правом верхнем углу, там появится название датасета и индикатор загрузки. По окончании загрузки вы увидите на карте все молекулы.
Каждая точка на этой карте – это определенная структура, при наведении на точку – вы увидите карточку этой структуры. Прокруткой колеса мыши, либо с помощью кнопок увеличения масштаба, можно приблизить или отдалить определенные участки карты.
Для того, чтобы вернуться в первоначальное состояние карты (по умолчанию) – нажмите на кнопку autoscale.
По карте можно легко определить: какие основные классы соединений преобладают в этом датасете. Например, в нижней части по центру находится сгущение близких по свойствам молекул. Вы можете увидеть структуру каждой, наведя на нее курсор. В нашем случае в этой области расположены простые молекулы.
Вы можете выделить на карте отдельные группы молекул и также экспортировать их в отдельный датасет. Для этого выделите левой кнопкой мыши пространство, в котором они расположены. Под блоком «Layers» появляется дополнительное окно «Selected». Здесь можно увидеть общее количество молекул, попавших в выбранную область и их структурные формулы. На этом этапе можно двигать границы выбранной области, убеждаясь в том, что вы захватили необходимые молекулы. Максимально возможное количество молекул для выделения – 50 000. Для отмены выделения кликните дважды левой кнопкой мыши за границами выделенной области. Для сохранения нажмите на «дискету.
Выделенные молекулы можно добавить в уже существующий набор, либо создать новую корзину для них. Сохраненный сет можно найти в разделе «Datasets».
Для выделения молекул также можно использовать инструмент «Lasso».
При помощи молекулярной карты можно не только анализировать один датасет, но и сравнивать химические датасеты друг с другом, накладывая их на карту различными слоями. Для этого добавьте на карту второй сет с помощью того же знака «+» в блоке «Layers».