Учёные создали нейронную сеть, которая отличает фейковые новости от достоверных лучше, чем человек-эксперт. Создатели алгоритма надеются, что их детище поможет защитить пользователей Интернета от недостоверной информации, а порой и откровенной дезинформации. Достижение описано в научной статье, препринт которой опубликован на сайте arXiv.org группой во главе с Радой Михалча (Rada Mihalcea) из Мичиганского университета.
Не секрет, что по просторам интернета часто гуляют фальшивые новости. Некоторые из них создаются с целью сформировать определённое общественное мнение, например, на политические темы. Задача других в том, чтобы побудить пользователя перейти по ссылке и просмотреть рекламу. В том и другом случае потребители информации вместо достоверных сведений получают порцию лжи.
Задача отсеивать фейковые материалы может быть возложена на человека-редактора. Однако поток информации слишком велик, чтобы медленный человеческий мозг успевал его обрабатывать. Во-вторых, проверка на достоверность обычно происходит путём сравнения с другими источниками. Но если новость очень свежая, то "контрольные источники" могут и не успеть среагировать на неё. В итоге правдивость публикации проверяется в лучшем случае постфактум, когда её уже прочитали тысячи человек.
Михалча и её коллеги решили исправить ситуацию, создав автоматический фильтр фейковых новостей. Однако при сборе материала они столкнулись с рядом трудностей. Ложные сообщения быстро появляются и столь же быстро исчезают, так что в короткие сроки набрать обширный материал не так-то просто.
Кроме того, особенности фейковых материалов довольно сильно разнятся в зависимости от жанра. Скажем, сообщение, высмеивающее политического деятеля за некую выдуманную выходку, может быть совсем не похоже на статью, призванную напугать читателя столкновением с планетой Нибиру.
В конце концов исследователи усадили команду добровольцев писать поддельные новости специально для обучения искусственного интеллекта. Эти труженики клавиатуры брали за основу новостные статьи из достоверных источников, и, сохраняя общую структуру и стилистику текста, меняли содержание так, что получалась утка. Как утверждается в пресс-релизе, именно так и работают реальные "фабрики вранья". Так поступать проще и выгоднее, чем продуцировать ложные сюжеты, что называется, с нуля.
В итоге команда получила набор из 500 поддельных и подлинных коротких новостных материалов и приступила к обучению нейронной сети. Система анализировала такие факторы, как выбор слов, грамматическая структура предложения, сложность фраз и пунктуация.
Натаскав электронного эксперта, авторы проверили его навыки. Нейронная сеть анализировала поток новостей, не входивших в обучающую выборку, и выносила вердикт по поводу их достоверности. Тем же самым занимались соревнующиеся с ней эксперты. В итоге искусственный интеллект оказался прав в 76% случаев, а человек только в 70%.
В публикации авторов подробно описаны детали набора данных и алгоритма обучения нейронной сети. Учёные рассчитывают, что эта информация поможет другим командам в создании аналогичных систем. Остаётся надеяться, что эти же сведения не будут использованы "фабриками фейков" для того, чтобы научиться писать более правдоподобно.
В данный момент группа работает над совершенствованием своего детища. Исследователи собираются научить компьютерный разум учитывать также ссылки, использованные в материале, и комментарии, оставленные пользователями.
Напомним, что "Вести.Наука" (nauka.vesti.ru) ранее писали о системах искусственного интеллекта, которые сочиняют музыку и песни, а также другие произведения, предсказывают результаты дебатов, болтают по телефону, лучше людей строят отношения и читают по губам, а ещё прогнозируют будущее.
