"ВКонтакте" привлекла нейросеть для борьбы с угрозами и травлей

Администраторам сообществ "ВКонтакте" стал доступен инструмент на основе ИИ, позволяющий автоматически отсеивать комментарии с угрозами и травлей

"ВКонтакте" предоставила администраторам сообществ специальный инструмент на основе искусственного интеллекта, который позволяет автоматически блокировать комментарии с враждебными высказываниями. Об этом говорится в сообщении соцсети.

По умолчанию фильтр выключен, его можно активировать в любое время. Для этого нужно перейти в раздел "Комментарии" настроек сообщества, поставить галочку напротив пункта "Фильтр враждебных высказываний" и нажать на кнопку "Сохранить". Опция уже доступна 50% публичных страниц, и скоро будет открыта всем.

"Сейчас алгоритмы умеют определять прямые угрозы — пожелания смерти, обещания причинить вред здоровью и угрозы расправы", — сказали представители "ВКонтакте". ИИ корректно идентифицирует угрозы в 80% случаев. В будущем инструмент научится выявлять другие ненавистнические высказывания — например, травлю по национальной или религиозной принадлежности.

При желании, администраторы пабликов могут просмотреть отсеянные нейросетью публикации и восстановить их. Однако тестирование показало, что заблокированные комментарии возвращают очень редко — в 1% случаев.

Разработчики "ВКонтакте" испытывали новую функцию с ноября прошлого года. За это время фильтр опробовали администраторы более 13 миллионов публичных страниц, групп и мероприятий.