Российский искусственный интеллект определяет успеваемость по постам в соцсетях

Посты в социальной сети могут выдать сведения, которыми пользователь вовсе не собирался делиться.

Посты в социальной сети могут выдать сведения, которыми пользователь вовсе не собирался делиться.
Иллюстрация Pixabay.

Иван Смирнов из Высшей школы экономики создал систему искусственного интеллекта, определяющую успеваемость учащегося по его постам в социальных сетях. Точность результата составляет 94%.

Достижение описано в научной статье, опубликованной в журнале EPJ Data Science.

Для обучения нейронной сети использовались посты с открытых страниц социальной сети "ВКонтакте". Были отобраны сообщения 2468 испытуемых, сдававших в 2012 году тест PISA. Этот тест определяет грамотность участника и его умение применять свои знания на практике. Всего в обучающую выборку попали более 130 тысяч текстов.

Обучив систему, Смирнов проверил её навыки на постах студентов из сотни крупнейших вузов страны. Прогнозы компьютера сопоставлялись со средним баллом ЕГЭ абитуриентов и выпускников учебного заведения и официальной общей информацией по успеваемости. Всего было проанализировано более миллиона постов почти 39 тысяч пользователей.

Оказалось, что нейронная сеть научилась отличать участников с хорошей успеваемостью от отстающих. Как выяснил электронный эксперт, творения отличников и двоечников различаются как формой, так и содержанием.

Так, хорошо успевающие школьники склонны писать длинные тексты с разнообразной лексикой. Они используют и более длинные слова, часто заимствованные из других языков. Ещё один маркер – любовь к глаголам "думаю", "считаю" и прочим обозначающим мыслительный процесс.

Те же, кто не может похвастаться успехами в учёбе, предпочитают короткие посты. Также "двоечников" можно распознать по обилию восклицательных знаков, смайлов, слов, написанных ПРОПИСНЫМИ БУКВАМИ, и (кто бы мог подумать!) грамматических ошибок.

Отличаются и темы сообщений. В постах отличников то и дело мелькают имена писателей и героев книг, а также научные термины. Малоуспевающие ученики предпочитают обсуждать гороскопы, дорожно-транспортные происшествия и военную службу.

"На основании этих правил наша модель с точностью до 94% выявляла учащихся с высокой и низкой успеваемостью по постам "ВКонтакте". Также мы попробовали применить её и к коротким текстам в "Твиттере" – успешно", – рассказывает Смирнов.

Теперь исследователь надеется научить искусственный интеллект выявлять по постам в социальных сетях состояние депрессии. Ранее некоторые учёные показали, что это возможно.

Вместе с тем Смирнов замечает, что развитие новых технологий сулит и тревожные перспективы.

"С одной стороны, такой подход может быть полезен, в том же выявлении депрессии, влияющей на учебные достижения, – отмечает эксперт. – С другой стороны, наши результаты лишний раз показали, насколько уязвима конфиденциальность пользователя в социальной сети. Люди переживают из-за вездесущих камер и систем распознавания лиц, однако даже такой, казалось бы, незначительный цифровой след, как короткий текст, может стать источником информации, которую человек даже не собирался раскрывать".

Работа Смирнова была поддержана грантом Российского научного фонда.

К слову, ранее Вести.Ru рассказывали о том, сколько времени нужно проводить в соцсетях, чтобы не чувствовать себя одиноким.

Писали мы и о том, что искусственным нейронным сетям доверили защиту психического здоровья детей и поручили выявлять обманщиков по текстовым сообщениям.