Искусственный интеллект научился распознавать фейковые новости лучше человека

Нейронная сеть вычленяет недостоверные новостные сюжеты, опираясь на их лингвистические характеристики.

Нейронная сеть вычленяет недостоверные новостные сюжеты, опираясь на их лингвистические характеристики.
Фото CC0 Public Domain.

Электронный эксперт может защитить пользователей от недостоверной информации. Если, конечно, профессиональные лгуны сами не возьмут на вооружение подобные алгоритмы.

Электронный эксперт может защитить пользователей от недостоверной информации. Если, конечно, профессиональные лгуны сами не возьмут на вооружение подобные алгоритмы.
Фото Global Look Press.

Нейронная сеть вычленяет недостоверные новостные сюжеты, опираясь на их лингвистические характеристики.
Электронный эксперт может защитить пользователей от недостоверной информации. Если, конечно, профессиональные лгуны сами не возьмут на вооружение подобные алгоритмы.
Как ожидается, электронный разум поможет защитить пользователей Интернета от недостоверной информации и откровенной дезинформации.

Учёные создали нейронную сеть, которая отличает фейковые новости от достоверных лучше, чем человек-эксперт. Создатели алгоритма надеются, что их детище поможет защитить пользователей Интернета от недостоверной информации, а порой и откровенной дезинформации. Достижение описано в научной статье, препринт которой опубликован на сайте arXiv.org группой во главе с Радой Михалча (Rada Mihalcea) из Мичиганского университета.

Не секрет, что по просторам интернета часто гуляют фальшивые новости. Некоторые из них создаются с целью сформировать определённое общественное мнение, например, на политические темы. Задача других в том, чтобы побудить пользователя перейти по ссылке и просмотреть рекламу. В том и другом случае потребители информации вместо достоверных сведений получают порцию лжи.

Задача отсеивать фейковые материалы может быть возложена на человека-редактора. Однако поток информации слишком велик, чтобы медленный человеческий мозг успевал его обрабатывать. Во-вторых, проверка на достоверность обычно происходит путём сравнения с другими источниками. Но если новость очень свежая, то "контрольные источники" могут и не успеть среагировать на неё. В итоге правдивость публикации проверяется в лучшем случае постфактум, когда её уже прочитали тысячи человек.

Михалча и её коллеги решили исправить ситуацию, создав автоматический фильтр фейковых новостей. Однако при сборе материала они столкнулись с рядом трудностей. Ложные сообщения быстро появляются и столь же быстро исчезают, так что в короткие сроки набрать обширный материал не так-то просто.

Кроме того, особенности фейковых материалов довольно сильно разнятся в зависимости от жанра. Скажем, сообщение, высмеивающее политического деятеля за некую выдуманную выходку, может быть совсем не похоже на статью, призванную напугать читателя столкновением с планетой Нибиру.

Электронный эксперт может защитить пользователей от недостоверной информации. Если, конечно, профессиональные лгуны сами не возьмут на вооружение подобные алгоритмы.

В конце концов исследователи усадили команду добровольцев писать поддельные новости специально для обучения искусственного интеллекта. Эти труженики клавиатуры брали за основу новостные статьи из достоверных источников, и, сохраняя общую структуру и стилистику текста, меняли содержание так, что получалась утка. Как утверждается в пресс-релизе, именно так и работают реальные "фабрики вранья". Так поступать проще и выгоднее, чем продуцировать ложные сюжеты, что называется, с нуля.

В итоге команда получила набор из 500 поддельных и подлинных коротких новостных материалов и приступила к обучению нейронной сети. Система анализировала такие факторы, как выбор слов, грамматическая структура предложения, сложность фраз и пунктуация.

Натаскав электронного эксперта, авторы проверили его навыки. Нейронная сеть анализировала поток новостей, не входивших в обучающую выборку, и выносила вердикт по поводу их достоверности. Тем же самым занимались соревнующиеся с ней эксперты. В итоге искусственный интеллект оказался прав в 76% случаев, а человек только в 70%.

В публикации авторов подробно описаны детали набора данных и алгоритма обучения нейронной сети. Учёные рассчитывают, что эта информация поможет другим командам в создании аналогичных систем. Остаётся надеяться, что эти же сведения не будут использованы "фабриками фейков" для того, чтобы научиться писать более правдоподобно.

В данный момент группа работает над совершенствованием своего детища. Исследователи собираются научить компьютерный разум учитывать также ссылки, использованные в материале, и комментарии, оставленные пользователями.

Напомним, что "Вести.Наука" (nauka.vesti.ru) ранее писали о системах искусственного интеллекта, которые сочиняют музыку и песни, а также другие произведения, предсказывают результаты дебатов, болтают по телефону, лучше людей строят отношения и читают по губам, а ещё прогнозируют будущее.