Вести.net: Яндекс научился предсказывать ДТП

Яндекс и Intel официально объявили о сотрудничестве в рамках проекта по работе с "большими данными" Yandex Data Factory или Фабрика данных Яндекса. Cтоит оговориться, еще два года назад глава российского поисковика Аркадий Волож признался, что поисковому бизнесу Яндекса все труднее расти в Рунете.

Яндекс и Интел официально объявили о сотрудничестве в рамках проекта по работе с "большими данными" Yandex Data Factory или Фабрика данных Яндекса. Тут стоит оговориться, еще два года назад глава российского поисковика Аркадий Волож в интервью нашей программе признался, что поисковому бизнесу Яндекса все труднее расти в Рунете, и примерно обрисовал свое видение, как все уже разработанные технологии и продукты компании могут работать в каком-то другом секторе. И похоже, Фабрика данных Яндекса — это то самое применение уже существующих поисковых алгоритмов компании в совершенно новых направлениях.

"Сегодня мы официально рассказали о том, что заключили соглашение с компанией "Интел" о взаимном сотрудничестве. С компанией "Интел" Яндекс работает много лет, они наши основные поставщики серверов, мы для них самый крупный клиент в Европе. Собственно содержательные наши договоренности заключаются в том, что они нам помогают с развитием нашего бизнеса за пределами России, где наш бизнес идет не так легко, как хотелось бы, как это возможно в России. Просто потому, что мы неизвестный за пределами России бренд. Мы обещаем им, что наши решения будут построены на их серверах", — говорит вице-президент по развитию Фабрики данных Яндекса Ксения Елкина.
В свою очередь Intel, всегда заинтересованный в развитии высоких технологий, уже начал продвигать Яндекс среди своих партнеров. "Партнерство глобальное, рассчитано на то, что мы будем работать с Яндексом по всему миру. Мы начинаем обсуждения с некоторыми из наших партнеров, которые интересуются популярной темой Big Data, больших данных, но не знают, с какой стороны к этой теме подойти. Мы начинаем с региона ЕМИА то есть Европа, Ближний Восток и Африка. И я думаю, что отсюда у нас появятся первые хорошие новости", — говорит региональный директор Intel в России и странах СНГ.

Один из участников эксперимента, а теперь и полноценный партнер проекта — Росавтодор, Федеральное дорожное агентство. Для них компания "Яндекс" научилась предсказывать пробки и ДТП. Звучит невероятно, но это факт. Фабрика данных Яндекса разработала систему, которая предсказывает ситуацию на дорогах, показывает прогноз на интерактивной карте и обновляет его в реальном времени. Сейчас система работает в тестовом режиме.

"Мы взяли данные о трафике, о дорогах, о погоде, о ДТП, и посредством машинного обучения сделали модель, которая предсказывает, что будет. То есть на основе тех данных, которые были, мы ее построили. Теперь мы кормим ее свежими данными, и она предсказывает, что будет вперед. Была выбрана пилотная зона — северо-западная часть федеральной дороги, это не Москва, это федеральная трасса — потому что для Росавтодора. И для них было выбрано из множества дорог, и мы делали этот пилот и эту модель. И сейчас на них же будем практически тестировать, разворачивать по диспетчерским", — рассказывает руководитель проектного офиса Yandex Data Factory Александр Хайтин.

Сейчас система охватывает 2196 километров дорог. Все дороги она делит на километровые отрезки и для каждого из них предсказывает среднюю скорость движения на час вперёд, а вероятность ДТП — на четыре часа вперёд. "Росавтодор нуждается в том, чтобы предсказывать ДТП. Но поскольку на практике вероятностных моделей нет. Идеал предсказания выглядит так: угадайте нам с точностью 80%, где произойдет ДТП. С такой точностью угадать такую ситуацию невозможно, просто потому, что много случайностей. Но с другой стороны, для того, чтобы выбрать, где поставить экипаж ДПС на 5-ом км или на 25-ом — а в принципе им все равно, где стоять, — достаточно, чтобы мы с разумной вероятностью предсказали, где вероятнее будет проблема. И в этом случае эффект от попадания будет очень хорошим", — говорит Александр Хайтин.
Еще один пример работы фабрики данных — один из крупнейших создателей многопользовательских онлайн игр Wargaming использует разработанную YDF-модель для определения потенциальных пользователей, которые могут отказаться от использования сервиса. Новый подход позволяет компании значительно сократить затраты на поддержании лояльности клиентов, сосредоточив внимание на самых ценных пользователях. И тут самое важное — найти игрока нужно еще до того, как он принял решение покинуть игру.

"Первый шаг, — говорит Александр Хайтин, — это определить, кто собирается уйти. Вот это мы и сделали. Мы взяли их игровые данные, чем люди играли, использовали обращения в сервис, и прочие взаимодействия с Wargaming. Что важно, эти данные мы взяли деперсонализированно, то есть там нет никаких фамилий и имен, никаких e-mail, ничего такого, просто абстрактные идентификаторы. И построили модель, которая из всей массы пользователей выбирает тех, кто скорее всего уйдет. Для того чтобы Wargaming — они сейчас как раз этим занимаются, — смог сфокусировать на них свое внимание и поддержать их лояльность".

Подобная система прогнозирования, как в случае с Wargaming, применима практически в любой области, которая связана с обработкой больших данных — в сфере телеком-услуг, здравоохранения, банковских услуг, научных исследований, розничной торговли и т.д. К большим объемам данных Яндекс применяет свои алгоритмы на основе машинного обучения для того, чтобы сделать из этой информации практические бизнес-инструменты, которые в идеале будут помогать компаниями добиваться новых показателей экономической эффективности работы.