Тема:

Google 1 неделя назад

Google позволила изучать популярность слов за последние 500 лет

Корпорация Google опубликовала в открытом доступе базу данных, состоящую из более чем 500 млрд слов, которые упоминаются в книгах на русском, английском и французском языках, опубликованных между 1500 и 2008 годами. Этот "склад" слов позволяет любому пользователю изучать частоту их использования.

Интернет-корпорация Google опубликовала в открытом доступе базу данных, состоящую из более чем 5 миллионов 200 тысяч оцифрованных книг. Это цифровое хранилище состоит из более чем 500 миллиардов слов, которые упоминаются в книгах на русском, английском, французском, испанском, немецком и китайском языках, опубликованных в период между 1500 и 2008 годами. "Склад" слов доступен для скачивания или через поисковик любому пользователю.

По мнению экспертов, этот корпус, включающий в себя частоту использования слов и коротких фраз, откроет новые возможности для исследований в области гуманитарных наук. Хотя эта база данных в основном предназначена для ученых, с ее помощью любой пользователь может "вбить" запрос, состоящий из нескольких словосочетаний, и посмотреть, как в течение последних 500 лет изменялась частота их использования.

В частности, благодаря цифровому хранилищу Google можно узнать, что слово "женщины" (women) по сравнению с "мужчинами" (men) редко упоминается в литературе на английском языке до начала 1970-х годов, когда начинает набирать силу феминистское движение. Линии на диаграмме, отражающие частоту использования этих слов в книгах, сравниваются примерно в 1986 году.

С помощью этого архива также можно узнать, что легендарной американской актрисе Мэрилин Монро и диснеевскому персонажу Микки Маусу не уделялось столько же внимания в печати по сравнению с экс-президентом США Джимми Картером, отмечает The New York Times. Кроме того, этот "склад" слов показывает, что в начале 1800-х годов общество принимало новые достижения в области технологий за 66 лет, а в период между 1880 и 1920 годами - всего лишь в течение 27 лет.

Ранее Google объявила о планах оцифровать Кумранские рукописи (также известные как "Свитки Мертвого моря") - древние манускрипты, содержащие почти все книги еврейской Библии (за исключением книги Эсфирь). По оценкам специалистов, возраст этих текстов и апокрифов составляет более 2 тысяч лет.

Также по теме:
Google оцифрует древние рукописи
Google инвестирует в ветряную энергетику
Google создала онлайн-учебник по Интернету для "чайников"
Google рассекретил автомобили с искусственным интеллектом
В аккаунтах Google нашли серьезную "дыру" в безопасности