Нейросеть будет искать контент 18+ в онлайн-кинотеатре

Онлайн-кинотеатр Megogo запустит в дни России нейросеть для поиска контента 18+. Алгоритмам предстоит проанализировать более 700 тысяч фильмов и эпизодов сериалов в поисках матерных слов, сцен курения и насилия. Обнаруженные нарушения будут запикивать и ставить фильмам возрастной ценз.

Нейросеть, основана на технологии распознавания речи Vosk с открытым кодом и системе визуального распознавания. Инструмент по информации газеты "Ведомости" пока сырой, так как может распознать части слова как матерные, например, выражение "не психуй" маркирует как нецензурное. Поэтому специалисты некоторое время будут помогать алгоритмам фильтрации и по прогнозам компании через год система сможет работать полностью автономно.

Разработкой нейросети антиматерщинника сервис занялся после того, как Роспотребнадзор в начале ноября оштрафовал онлайн-кинотеатр за маркировку 16+ вместо 18+ в фильме "Никто не знает про секс". Сервис пытался оправдаться тем, что фильм вышел с таким возрастным цензом еще в 2006 году, на что в ведомстве объяснили, ссылаясь на закон о защите детей от информации, причиняющей вред их здоровью и развитию, что распространители должны маркировать контент сами.

Письма с требованиями Роскомнадзора получили в том числе ivi, Start и Kion. Вероятно, такая нейросеть скоро понадобится и кинотеатру Netflix. МВД планирует проверить американский сервис из-за того, что подборки фильмов и сериалов про ЛГБТ сообщество маркируются цензом 16+, а не 18+, как того требует российское законодательство.