Искусственный интеллект учится делать идеальные фото людей

Новая платформа – первый шаг на пути к созданию системы роботизированной фотосъёмки, которая сможет создавать качественные снимки людей быстро и в отсутствие человека-фотографа.

Новая платформа – первый шаг на пути к созданию системы роботизированной фотосъёмки, которая сможет создавать качественные снимки людей быстро и в отсутствие человека-фотографа.
Фото с сайта pixabay.com.

Робот на базе платформы LeRop за работой: процесс съёмки (a) и конечный результат (b).

Робот на базе платформы LeRop за работой: процесс съёмки (a) и конечный результат (b).
Фото Kang et al.

Новая платформа – первый шаг на пути к созданию системы роботизированной фотосъёмки, которая сможет создавать качественные снимки людей быстро и в отсутствие человека-фотографа.
Робот на базе платформы LeRop за работой: процесс съёмки (a) и конечный результат (b).

Идеальный портретный снимок стоит фотографам немалых трудов: необходимо найти подходящий ракурс, правильно настроить камеру и освещение и так далее.

Но что, если доверить фотосъёмку роботу?

В последние годы многие инженеры изучают возможность автоматической съёмки с использованием "роботизированных" систем. И, похоже, в будущем робофотографы составят серьёзную конкуренцию профессионалам.

Команда исследователей из Университета Пердью (Purdue University) и компании Adobe Research разработала программную и аппаратную платформы под общим названием LeRop. Они позволяют роботу делать идеальные портретные фото людей.

Речь идёт о системе, в которой робот внимательно следит за объектом съёмки и в самый подходящий момент делает кадр, сообщает портал TechXplore.

Пока что LeRop работает исключительно в помещениях и специализируется на съёмке людей, но кто знает, какие "таланты" платформа разовьёт в будущем.

На сегодняшний день система работает следующим образом. По специальному каркасу робот направляется к месту съёмки. Затем система использует компьютерную модель для определения, с какой позиции может быть снят самый лучший кадр. В то же время используется модель глубокого обучения с подкреплением, чтобы отрегулировать положение и ориентацию робота, обеспечив тем самым лучшие условия по освещению объекта съёмки и сцены в целом.

Когда эти составляющие проведут необходимые вычисления, робот начинает регулировать своё положение, чтобы поймать "вид", который будет лучше всего соответствовать заданному шаблонному изображению, и, наконец, делает фотографию. Этот процесс исследователи подробно описывают в своей статье, препринт которой представлен на сайте arxiv.org.

Отметим, что шаблонное изображение, которое система фактически считает "золотым стандартом", может быть выбрано с использованием компьютерной модели для оценки фотографий или же самим пользователем. В последнем случае он должен указать программе на образец из определённого набора.

Кроме того, пользователь может настроить систему таким образом, чтобы она следовала за "целью" (пока только одной) строго до того места, где необходимо сделать фото. Как только пользователь достигает этого места, робот начинает поиск лучшего "вида". Модель глубокого обучения с подкреплением поможет системе впоследствии скорректировать точку съёмки в зависимости от степени совпадения с шаблонным изображением.

Помимо основной камеры для высококачественной съёмки исследователи снабдили робофотографа 360-градусной камерой. Таким образом, он всегда будет иметь полный обзор, и ему не нужно будет тратить время на повороты или вращение.

Добавим, что фреймворк LeRop (собственно, именно такой является данная программная платформа) имеет модульную структуру. Это означает, что все его модели могут быть заменены или изменены таким образом, чтобы соответствовать запросам пользователя.

Команда провела испытания LeRop на трёх съёмочных площадках, расположенных в помещении, интегрировав платформу с простым роботом под названием Turtlebot.

Робот на базе платформы LeRop за работой: процесс съёмки (a) и конечный результат (b).

В ходе тестов робот сделал по 20 фотографий человека на каждой площадке: 10 с предопределённым шаблоном и 10 с использованием шаблонов, которые система генерировала "по ходу действия". Среднее количество корректировок, сделанных роботом, составило 11,2 в первом случае и 12,76 во втором.

Робот делал снимки в среднем за 22,11 секунды, опираясь на заданные шаблоны, и за 22,4 секунды, опираясь на динамически генерируемые шаблоны.

Разработчики считают, что платформа LeRop – первый шаг на пути к созданию эффективной системы роботизированной фотосъёмки, которая сможет быстро создавать высококачественные снимки людей.

Однако пока платформа имеет ряд ограничений, которые могут помешать её широкому внедрению.

Например, LeRop имеет слабую вычислительную мощность "на борту", и для работы с платформой требуется более мощный отдельно стоящий компьютер.

Кроме того, в будущем исследователи хотят подобрать для своей платформы более продвинутого робота с большим количеством степеней свободы.

Наконец, потребуются доработки, чтобы робофотограф мог делать снимки разных жанров (не только портретные, но и, например, групповые), а также работать на открытом воздухе.

К слову, ранее "Вести.Наука" (nauka.vesti.ru) писали о технологии, которая позволит встраивать системы искусственного интеллекта прямо в фото- и видеокамеры.