В России разработали ИИ для распознавания химических формул

Молекулярный "лист" собирает солнечную энергию без помощи солнечных панелей.

Молекулярный "лист" собирает солнечную энергию без помощи солнечных панелей.
Иллюстрация Indiana University.

Российские ученые разработали искусственный интеллект, который распознает химические формулы и переводит их в единый текстовый стандарт. Таким образом исследователи планируют ускорить процесс цифровизации всех накопленных материалов по химии.

В России разработали нейросеть, которая распознает химические формулы. Это позволит ускорить процесс цифровизации всей научной информации, опубликованной в печатных журналах и рукописях за последние столетия.

Искусственный интеллект, разработанный исследователями из Сколтеха, переводит произвольные химические формулы в понятный компьютеру язык. Раньше работы в этом направлении были сосредоточены в основном над тем, как распознавать молекулярные структуры. Сложность этой задачи состояла в отсутствии общепринятых стандартов в оформлении химических формул. Ученые из Сколтеха сосредоточились на создании генератора искусственных примеров для обучения ИИ с помощью нейросетей высокой производительности типа "Трансформер", рассказал научный сотрудник вуза Сергей Соснин, пишет ТАСС.

Нейросеть "Трансформер" была разработана компанией Google для онлайн-перевода с различных языков. Исследователи решили использовать этот навык для перевода различных химических формул, в единый текстовый формат, понятный для всех.

Для того, чтобы распознавать молекулярные структуры, нейросеть должна обучиться на большой выборке химических формул с подробным описанием. Эта задача требует большого количества времени и ресурсов. Ученые из Сколтеха предложили ускорить процесс с помощью генератора химических формул, который будет создавать случайные молекулярные шаблоны, комбинируя различные фрагменты молекул и стили отрисовки.

Разработанная нейросеть должна ускорить процесс цифровизации всех накопленных научных материалов по химии, что в свою очередь может ускорить поиск новых молекул или поможет открывать новые свойства у уже изученных.

В декабре специалисты из ИТМО разработали "Робота-химика". Система способна не только выполнять рутинные механические задачи, но и принимать активное участие в проведении научных исследований.