15 августа 2017 12:28 Дарья Загорская

Искусственный интеллект навёл порядок в крупнейшем гербарии

Гербарий Национального музея естествознания в Париже.
Фото Wikimedia Commons/François MEY.

Компьютерный инженер из Коста-Рики и ботаник из Франции разработали электронный алгоритм, который самостоятельно определяет виды растений, "рассматривая" тысячи изображений из крупнейшего цифрового гербария.

Ещё пару десятилетий назад обработка больших массивов данных являлась настоящей головной болью для ответственных за эту работу людей. Достаточно вспомнить библиотеки, в которых вся информация о книгах хранилась на заполненных вручную карточках. С развитием интернет-технологий появились проекты, в которых для рутинной исследовательской работы привлекали всех желающих (в том числе предлагали пользователям "просто поиграть"). Так, добровольцы помогали разбирать информацию, собранную телескопом Kepler. В итоге они даже смогли найти новые неизвестные науке планетные системы.

Но теперь на смену научному краудфаундингу постепенно приходит искусственный интеллект. На этот раз компьютерный мозг научили автоматически идентифицировать виды растений, рассматривая миллионы фотографий из крупнейшего цифрового гербария на планете.

Проект iDigBio Национального научного фонда США, объединяющий множество музеев естествознания по всему миру, содержит более 150 миллионов изображений растений и животных. Но, учитывая тот факт, что в трёх тысячах известных крупных гербариях хранится не менее 350 миллионов экземпляров высушенных растений, список оцифрованных экспонатов будет пополняться ещё долго.

Для того чтобы ускорить и оптимизировать процесс идентификации, компьютерный инженер Эрик Мата-Монтеро (Erick Mata-Montero) из Коста-Рики и французский ботаник Пьер Бонне (Pierre Bonnet) применили технологию глубинного обучения искусственного интеллекта. Метод заключается в использовании нейросетей, которые позволяют имитировать ход мысли живого человека. В этом случае, для того чтобы начать делать выводы, компьютерный мозг должен для начала изучить огромное количество отдельных изображений. Тогда он учится улавливать мельчайшие различия между ними.

На данный момент с помощью сканированных изображений более чем 260 тысяч экземпляров засушенных растений искусственный интеллект научился распознавать около 1000 видов с точностью в 80%. Причём в 90% случаев компьютер угадывал один из пяти наиболее вероятных вариантов. Авторы разработки считают, что уже сейчас машина практически не уступает квалифицированному ботанику в своих умениях.

Добавим, что для Мата-Монтеро и Бонне работа с машинной идентификацией растений уже стала привычным занятием. Ранее они разработали приложение Pl@ntNet, которое определяло виды живых растений так, как это делают ботаники в полевых условиях.

Отслеживая успехи искусственного интеллекта, некоторые специалисты высказывают опасения, что их многолетний труд вскоре может потерять своё значение. Но разработчики алгоритма успокаивают их, отмечая, что описанный подход реализуем только потому, что существует реальный ботанический опыт по определению растений. Кроме того, пока никто не отменял необходимости проверки результатов за машиной.

Результаты, которых удалось добиться искусственному интеллекту в деле распознавания листов гербария, подробно описаны в статье, опубликованной в журнале BMC Evolutionary Biology. Авторы проекта рассчитывают в конечном итоге разработать полностью или частично автоматизированную систему, которая упростит работу ботаников по ведению классификации растений, составлению их описаний, осуществлению ревизионных работ в музеях и многому другому.

Напомним, что с помощью глубинного обучения искусственному интеллекту удалось добиться успехов не только в ботанике, но и в кулинарии, литературе, музыке и живописи.