Четверть всех веб-страниц, выпущенных 10 лет назад, становится недоступной.
В сети гуляет поговорка «Все, что попало в интернет, остается в нем навсегда». Журналисты газеты The Independent со ссылкой на исследование, опубликованное аналитической компанией Pew Research Center, развеяли миф о «бессмертии» глобальной сети.
Эксперты выяснили, что 38% веб-страниц, существовавших в 2013 году, в настоящее время потеряны. Исчезают и относительно новые страницы — 8% веб-страниц, существовавших в 2023 году, уже недоступны в первой половине 2024-го.
Что еще выяснили аналитики об исчезновении интернета?У 21% сайтов правительства существуют ссылки, которые никуда не ведут;В 54% статьях «Википедии» есть ссылки, которых больше не существует;В 23% новостных сайтах есть «мертвые» ссылки.
Подобная тенденция замечена и в социальных сетях. Например, каждый пятый пост в X(Twitter) исчезает в течение нескольких месяцев после публикации. Почти 60% новых приватных аккаунтов в соцсетях удаляются в течение года.
Для проведения исследования использовался открытый репозиторий данных веб-сканирования Common Crawl. Он архивирует миллиарды веб-страниц и предоставляет архивы и наборы данных для публичного использования. Аналитики случайным образом выбрали более 1 млн веб-страниц, прежде чем проверить ссылки, чтобы определить, какие из них все еще активны, а какие ушли в огромный архив потерянной информации.
Источник: hi-tech.mail.ru