Вести.net: Instagram обвинили в расизме из-за стикера

Происходящее в США, точнее — отражение протестных историй, получило новое преломление. В Instagram появился анимированный стикер Mute White People, что можно перевести примерно как "заглуши голоса белых людей". Стикер был общедоступным и вполне искался по контексту, что, очевидно, стало поводом для обвинений Instagram в расизме. Впрочем, довольно быстро выяснилось, что сам Instagram тут, в общем-то, ни при чем.

Стикер был создан одним из пользователей, известен и его никнейм. Создан стикер был не в самом Instagram, а в сервисе Giphy, который как раз рассчитан на хранение и обмен анимированными изображениями. Так вот, этот сервис всего пару месяцев назад приобрел Facebook, владелец Instagram, и приобрел как раз для интеграции именно с этой фотосоцсетью.

Сейчас расистский стикер уже удален, но, вероятно, это не последняя такая история: просто потому, что настроить нейросети на поиск провокационного и просто запрещенного содержания в обычном тексте получается не всегда хорошо. С поиском по содержимому картинок еще сложнее, по крайней мере, до сих пор систем без большого количества ложных срабатываний нет.

К российским новостям. Mail.ru представила бесплатный сервис для создания виртуальных ведущих. Он позволяет любому желающему с помощью технологий искусственного интеллекта создать небольшой ролик, похожий на телевизионные новости. Для этого достаточно выбрать ведущую (пока доступны только женские образы), затем — студию и добавить текст, не больше 1000 знаков. После алгоритм сгенерирует ролик, происходит это не очень быстро. Пока, например, выдается сообщение, что желающих создать видео много, так что к нейросетям выстроилась очередь. После в ролик можно добавить титры, видео или музыку.

«Создать на русском языке такие истории гораздо сложнее, потому что на английском языке гораздо больше моделей, то есть на самом деле мы достаточно просто воспроизвели модель Обамы. Потому что очень много видео: он там выступает с еженедельным посланием и, в общем, достаточно легко модель обучить, да и готовых очень много. Когда же речь идет о русском языке, то моделей недостаточно. Получается, голос «Маруси» с одной стороны, с другой стороны — реальные актеры, которых мы снимали, потому что нужно обучить сеть, показывая как говорят реальные люди. И в конце нужно получить некоторые миксы из голоса «Маруси» и реального актера — и вот, та самая модель. То есть проблема заключается в синхронности произношения звуков и выговаривания букв, они всегда разные. Даже разные люди по-разному говорят одну и ту же букву».

Егор Ганин, заместитель вице-президента, руководитель направления облачных и бизнес-сервисов Mail.ru Group.

Надо сказать, что сама по себе технология не есть что-то совершенно новое. Виртуального диктора уже показывало китайское агентство “Синьхуа”. Там такой кибер-ведущий уже полноценно выходит в эфир. А в прошлом году аналогичную девушку-диктора показал «Сбербанк», но вот дать доступ широкой аудитории к такому инструменту – это впервые. В Mail.ru рассчитывают, что им воспользуются в первую очередь интернет-издания, у которых есть текст, но нет видео. А ролики будут рекомендоваться пользователям на платформе «Смотри Mail.ru» – этакий шаг к персональному телевидению.

«Видеоновостей в природе не так много. Есть федеральные телеканалы, и мы их забираем. Они, как правило, рассказывают об общих темах федерального масштаба, и крайне сложно найти видеоновость на профессиональную тематику. Поэтому мы сделали шаг навстречу издателям и некотором СМИ, которые текстово имеют возможность создавать такой новостной фон. То есть они пишут на узкоспециальные темы, но при этом видеоформат они не делали, потому что это действительно дорого. Продакшн дорого, снимать дорого, монтировать дорого — и, самое главное, долго . И это все никак не встраивается в их производственную смету».

Егор Ганин, заместитель вице-президента, руководитель направления облачных и бизнес-сервисов Mail.ru Group.

В компании рассматривают возможность доработать сервис под бизнес-задачи. Например, можно оцифровать гендиректора, чтобы нейросеть скажем каждое утро готовила видеообращение ко всем сотрудникам.