Новая энциклопедия преодолела языковой барьер "Википедии"

Пример поиска информации в "Википедии" при помощи "Омнипедии" по запросу "Россия 24" (иллюстрация Brent Hecht).
Пример поиска информации в "Википедии" при помощи "Омнипедии" по запросу "теория заговора" (иллюстрация Brent Hecht).
Обзор информации среди 25 языков позволяет получить доступ к уникальной информации. Так, видно, что статья об операционной системе Microsoft Windows на иврите содержит информацию о "теории заговора" (иллюстрация Brent Hecht).
Перевод куска текста, касающегося теории заговора, из статьи об операционной системе Microsoft Windows с иврита (иллюстрация Brent Hecht).
Увеличиваем масштаб (иллюстрация Brent Hecht).
При приближении становятся видны названия статей. Цвет окружности зависит от языка, на котором написана статья. Иврит - тёмно-зелёный, французский - голубой, японский - оранжевый, индонезийский √ розовый (иллюстрация Brent Hecht).
Более детальный вид позволяет анализировать каждую статью, проверяя, на каких языках она доступна (иллюстрация Brent Hecht).
Выпадающее меню позволяет использовать дополнительные настройки (иллюстрация Brent Hecht).
При нажатии на статью, можно сравнивать информацию на разных языках. Например, здесь показан ряд фрагментов статей, показывающих, как тема высадки на Луне обсуждается в различных языковых разделах в контексте "теории заговора" (иллюстрация Brent Hecht).
Пример поиска информации в "Википедии" при помощи "Омнипедии" по запросу "Россия 24" (иллюстрация Brent Hecht).
Пример поиска информации в "Википедии" при помощи "Омнипедии" по запросу "теория заговора" (иллюстрация Brent Hecht).
Обзор информации среди 25 языков позволяет получить доступ к уникальной информации. Так, видно, что статья об операционной системе Microsoft Windows на иврите содержит информацию о "теории заговора" (иллюстрация Brent Hecht).
Перевод куска текста, касающегося теории заговора, из статьи об операционной системе Microsoft Windows с иврита (иллюстрация Brent Hecht).
Увеличиваем масштаб (иллюстрация Brent Hecht).
При приближении становятся видны названия статей. Цвет окружности зависит от языка, на котором написана статья. Иврит - тёмно-зелёный, французский - голубой, японский - оранжевый, индонезийский √ розовый (иллюстрация Brent Hecht).
Более детальный вид позволяет анализировать каждую статью, проверяя, на каких языках она доступна (иллюстрация Brent Hecht).
Выпадающее меню позволяет использовать дополнительные настройки (иллюстрация Brent Hecht).
При нажатии на статью, можно сравнивать информацию на разных языках. Например, здесь показан ряд фрагментов статей, показывающих, как тема высадки на Луне обсуждается в различных языковых разделах в контексте "теории заговора" (иллюстрация Brent Hecht).
"Википедия" – крупнейшая онлайн-энциклопедия, располагающая тысячами статей почти на 300 языках мира. Несмотря на большой объём информации, часто бывает так, что пользователю нужна информация из статей на чужом языке. Преодолеть языковой барьер позволит новая разработка американских программистов.

"Википедия" — шестой по популярности в мире сайт, который содержит информацию на более чем 270 языках мира. Десятки тысяч статей на различных языках могут содержать как идентичную информацию, так и отличаться между собой. Преодолеть языковой барьер и получить доступ к колоссальному объёму информации на разных языках поможет "Омнипедия" (Omnipedia).

В названии нового проекта префикс "omni" является латинским словом, которое означает "всё", "целиком". По мнению создателей программы, название подчёркивает главную цель "Омнипедии" – обеспечить полный доступ к накопленному "Википедией" материалу.

Программа автоматически следует по языковым ссылкам "Википедии" и анализирует хранящийся в статьях материал, а затем отображает его для пользователя. При обработке поискового запроса система определяет, какой из языков является наиболее общим для всех статьей, то есть содержит ссылки на наибольшее количество страниц на разных языках. В настоящее время "Омнипедия" может работать с информации на 25 языках, включая русский.

"Существует очень много информации, которая представлена в "Википедии" на не родном для человека языке. Причём некоторые статьи отражают особые культурные точки зрения, которые не встречаются в статьях на многих других языках", — рассказывает Патти Бао (Patti Bao), аспирантка Северо-Западного университета, один из авторов "Омнипедии".

Новая разработка обладает простым и удобным интерфейсом. Каждый поисковой запрос отображается в виде множества цветных окружностей или сегментов, являющихся ссылками на искомый материал. Цвет отображает язык статьи. Щелчок по сегменту отображает соответствующий фрагмент статьи, который автоматически переводится на нужный язык при помощи программы Bing Translator.

Опробовать систему на полезность пригласили 27 добровольцев, занимающихся изучением лингвистики. Большинство участников заявило, что они не предполагали ранее, как много может быть информации в "Википедии" по одной и той же статье. Некоторые были сильно удивлены широтой раскрытия темы, как, например, в случае статьи о регги на японском языке.

Специалисты называют разработку чрезвычайно полезной, так как, используя "Омнипедию", стало легче получить доступ к информации по одной интересующей теме, но на разных языках. Фактически благодаря данной системе появляется возможность взглянуть на одну и ту же проблему под разными углами, получая в результате не только больше информации, но и расширяя видение интересуемой темы.

О будущем проекта корреспонденту Вестей.Ru сообщил Брент Хечт (Brent Hecht), один из создателей "Омнипедии": "Конечно, прототип превосходно работает в "лабораторных условиях", однако программный код должен быть подготовлен к тысячам поисковых запросов пользователей. Мы пока не имеем достаточного финансирования, но в ближайшем будущем планируем сделать ограниченный выпуск "Омнипедии". Добавим, что проект был представлен широкой публике на прошлой неделе в рамках конференции CHI 2012.

Являясь крупнейшей энциклопедией современности, "Википедия" не первый раз привлекает исследователей и разработчиков. Так недавно было установлено, что шесть из десяти статей базы знаний содержат фактические ошибки