Интернет теряет информацию

Американские ученые доказали, что значительная часть информации из всемирной паутины «умирает»

Об этом идет речь в свежем номере еженедельника «Комментарии».

Ученые-информатики из университета Старого Доминиона (Норфолк, США) Гани Салах-Ель-Дин и Майкл Нельсон доказали, что срок хранения информации в Интернете очень ограничен. Они проинспектировали более 11 тыс. ссылок на публикации (статьи, записи в блогах, видео, фото и т.д.), касающиеся шести самых резонансных событий, произошедших с 2009 по 2012 год. Этими ссылками обменивались пользователи «Твиттера». Оказалось, что 7% ссылок, опубликованных в «Твиттере» в марте нынешнего года, уже летом были нерабочими. А среди линков, зафиксированных в сообщениях «Твиттера» в 2009 году, мертвыми оказались почти четверть.

Ученые также установили, что в Архиве Интернета тоже хранятся далеко не все копии веб-страниц, то есть значительная часть информации ежегодно теряется безвозвратно. Общий итог исследования: через год после публикации 11% веб-страниц нельзя будет найти ни по своему адресу, ни в архиве интернета. Далее количество навсегда потерянных ресурсов будет ежедневно возрастать на 0,02%.

Сколько веб-страниц умерло (2009–2012)

Событие

Дата максимального количества твитов со ссылками

Доля заархивированных веб-страниц, %

Доля исчезнувших веб-страниц, %

Доля исчезнувших веб-страниц, которые не были заархивированы, %

Протесты в Иране

15.06.2009

38,51

25,86

17,76

Смерть Майкла Джексона

25.06.2009

34,2

33,45

25,85

Вспышка свиного гриппа

11.09.2009

42,12

23,95

17,99

Вручение Нобелевской премии мира Бараку Обаме

03.10.2009

47,87

24,86

15,95

Протесты в Египте

11.02.2011

20,18

10,48

7,67

Гражданская война в Сирии

25.03.2012

5,35

7,04

7,04

Исследование Гани Салах-Ель-Дин и Майкла Нельсона

Источник: Comments.UA