Цифровые архивариусы работают над спасением общественных данных от исчезновения

Image by Bernard Goldbach, from Flickr

Цифровые архивариусы работают над спасением общественных данных от исчезновения

Время для прочтения: 2 мин.

На протяжении более 30 лет Интернет-архив Wayback Machine сохраняет государственные веб-сайты и наборы данных, которые имеют критическое значение для исследований, как подробно описано в новом отчете от Spectrum.

Спешите? Вот краткие факты:

  • Машина Времени Wayback поддерживает важную государственную информацию, которая служит необходимым материалом для научных и инженерных исследований.
  • Во время второго срока президентства Трампа более 8 000 государственных веб-страниц и баз данных исчезли из общественного доступа.
  • Лаборатория Инноваций Библиотеки Гарвардского университета успешно сохранила 311 000 наборов данных, которые были частью коллекции Data.gov.

Эти записи, полученные от организаций вроде NASA и Национального научного фонда, предоставляют необходимые данные для ученых и инженеров. Если они исчезнут, встает под угрозу достоверность исследований и историческая точность, как отмечает Spectrum.

Удаление государственных данных не является новым явлением. После событий 11 сентября, администрация Буша удалила миллионы байт информации по причинам безопасности. Администрация Обамы выбрала другой подход, запустив в 2009 году Data.gov для расширения общественного доступа, как сообщает Spectrum.

Во время первого срока президентства Трампа, исследователи из Инициативы по управлению и сохранению экологических данных обнаружили, что некоторые государственные веб-сайты стали недоступными, а упоминания о «климатических изменениях» были стерты с нескольких страниц, говорит Spectrum.

Во время второго срока Трампа, проблемы с сохранением данных усилились. В феврале The New York Times сообщила, что более 8 000 государственных веб-страниц и баз данных были сняты с публикации.

Некоторые из них с тех пор появились снова, но Grist обнаружил изменения, включая удаление таких терминов, как «изменение климата» и «чистая энергия». 11 февраля последовали юридические иски, и федеральный судья приказал восстановить определенные наборы данных CDC и FDA, как сообщает Spectrum.

Чтобы бороться с этой потерей, цифровые архивариусы приняли меры. Лаборатория инноваций библиотеки Юридического факультета Гарварда скопировала весь 16-терабайтный архив Data.gov, содержащий более 311 000 наборов данных. Они используют автоматизированные запросы через API, чтобы обновлять его ежедневно.

Архивариусы играют жизненно важную роль в сохранении знаний, поддерживая исторические записи для будущих поколений. Потеря важной информации из-за их отсутствия привела бы к переписыванию общественных записей, что ограничило бы возможности для будущих исследований.

Понравилась статья? Поставьте оценку!
Ужасно Удовлетворительно Хорошо Очень хорошо! Превосходно!

Мы рады, что вам понравилась наша статья!

Дорогой читатель, не могли бы вы оставить отзыв о нас на сайте Trustpilot? Это не займет у вас много времени, но очень важно для нас. Спасибо, наш замечательный читатель!

Оценить нас на Trustpilot
0 Проголосовало 0 пользователей
Заголовок
Комментарий
Спасибо за ваш отзыв
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Оставьте комментарий

Loader
Loader Показать больше...