Новая энциклопедия преодолела языковой барьер "Википедии"

Пример поиска информации в "Википедии" при помощи "Омнипедии" по запросу "Россия 24" (иллюстрация Brent Hecht).

Читайте нас в Telegram

"Википедия" — шестой по популярности в мире сайт, который содержит информацию на более чем 270 языках мира. Десятки тысяч статей на различных языках могут содержать как идентичную информацию, так и отличаться между собой. Преодолеть языковой барьер и получить доступ к колоссальному объёму информации на разных языках поможет "Омнипедия" (Omnipedia).

В названии нового проекта префикс "omni" является латинским словом, которое означает "всё", "целиком". По мнению создателей программы, название подчёркивает главную цель "Омнипедии" – обеспечить полный доступ к накопленному "Википедией" материалу.

Программа автоматически следует по языковым ссылкам "Википедии" и анализирует хранящийся в статьях материал, а затем отображает его для пользователя. При обработке поискового запроса система определяет, какой из языков является наиболее общим для всех статьей, то есть содержит ссылки на наибольшее количество страниц на разных языках. В настоящее время "Омнипедия" может работать с информации на 25 языках, включая русский.

"Существует очень много информации, которая представлена в "Википедии" на не родном для человека языке. Причём некоторые статьи отражают особые культурные точки зрения, которые не встречаются в статьях на многих других языках", — рассказывает Патти Бао (Patti Bao), аспирантка Северо-Западного университета, один из авторов "Омнипедии".

Новая разработка обладает простым и удобным интерфейсом. Каждый поисковой запрос отображается в виде множества цветных окружностей или сегментов, являющихся ссылками на искомый материал. Цвет отображает язык статьи. Щелчок по сегменту отображает соответствующий фрагмент статьи, который автоматически переводится на нужный язык при помощи программы Bing Translator.

Опробовать систему на полезность пригласили 27 добровольцев, занимающихся изучением лингвистики. Большинство участников заявило, что они не предполагали ранее, как много может быть информации в "Википедии" по одной и той же статье. Некоторые были сильно удивлены широтой раскрытия темы, как, например, в случае статьи о регги на японском языке.

Специалисты называют разработку чрезвычайно полезной, так как, используя "Омнипедию", стало легче получить доступ к информации по одной интересующей теме, но на разных языках. Фактически благодаря данной системе появляется возможность взглянуть на одну и ту же проблему под разными углами, получая в результате не только больше информации, но и расширяя видение интересуемой темы.

О будущем проекта корреспонденту Вестей.Ru сообщил Брент Хечт (Brent Hecht), один из создателей "Омнипедии": "Конечно, прототип превосходно работает в "лабораторных условиях", однако программный код должен быть подготовлен к тысячам поисковых запросов пользователей. Мы пока не имеем достаточного финансирования, но в ближайшем будущем планируем сделать ограниченный выпуск "Омнипедии". Добавим, что проект был представлен широкой публике на прошлой неделе в рамках конференции CHI 2012.

Являясь крупнейшей энциклопедией современности, "Википедия" не первый раз привлекает исследователей и разработчиков. Так недавно было установлено, что шесть из десяти статей базы знаний содержат фактические ошибки

Сегодня