Что такое веб-архив и как им пользоваться
Содержание:
- Как увидеть историю из файла в Яндекс браузере
- Что такое Wayback Machine и Архивы Интернета
- Кто такой Тим Бернерс Ли
- Что такое веб-архив и зачем он нужен?
- Зачем нужны сателлиты?
- web.archive.org
- Как посмотреть историю посещения сайтов? Как очистить историю во всех браузерах?
- Как пользоваться веб архивом
- Коллекция карт Дэвида Рамси
- Исследователь истории
- Как использовать веб-архив?
- Как посмотреть сайт в прошлом
- Где расположена история в Яндекс браузере на Android
- Элементы сайта-истории
- Переделка сайта
- Качаем сайт с web.archive.org
- Заключение
Как увидеть историю из файла в Яндекс браузере
Сама история представляет собой обычную базу данных SQL3. Её может открыть любой обработчик баз данных. Есть и один недостаток, большинство подобных прог поставляются на английском языке и требуют установки локального сервера на Apache. Чтобы избежать перечисленных трудностей, можем воспользоваться хорошей утилитой DB Browser for SQLite.
Как ознакомиться с содержимым файла истории от Яндекс браузера:
- Скачиваем нужную прогу с сайта разработчика (в нижней части страницы есть кнопочки для загрузки 32-х и 64-х битных версий программы).
- Устанавливаем и открываем программу.
- Жмём на кнопку «Файл» в левом углу и выбираем «Открыть базу данных».
- В правом нижнем углу щёлкаем на «Файлы SQLite баз данных…» и меняем на «Все файлы (*)».
- Через «Проводник» находим файлик history (путь указан в прошлом разделе) и открываем его.
- Переходим во вкладку «Данные» в верхней области рабочего окна приложения.
- В строке «Table:» выбираем «urls».
Перед нами открывается таблица сайтов со всей данными из истории браузера. Тут указаны:
- url – ссылка на посещённую страницу;
- title – название просмотренной страницы;
- visit_count – количество входов на данную страницу;
- last_visit_time – время последнего входа на страницу. Есть одна проблемка – время представлено в UNIX-формате, его придётся переводить в понятную для человека дату. С этим поможет сайт cy-pr.com. Копируем время из столбца и вставляем на сайт, получаем время посещения с точностью до секунд.
Прочие столбцы таблицы не представляют особой ценности.
Что такое Wayback Machine и Архивы Интернета
В этой статье мы рассмотрим Веб Архивы сайтов или Интернет архивы: как искать удалённую с сайтов информацию, как скачать больше несуществующие сайты и другие примеры и случаи использования.
Принцип работы всех Интернет Архивов схожий: кто-то (любой пользователь) указывает страницу для сохранения. Интернет Архив скачивает её, в том числе текст, изображения и стили оформления, а затем сохраняет. По запросу сохранённые страницу могут быть просмотрены из Интернет Архива, при этом не имеет значения, если исходная страница изменилась или сайт в данный момент недоступен или вовсе перестал существовать.
Многие Интернет Архивы хранят несколько версий одной и той же страницы, делая её снимок в разное время. Благодаря этому можно проследить историю изменения сайта или веб-страницы в течение всех лет существования.
В этой статье будет показано, как находить удалённую или изменённую информацию, как использовать Интернет Архивы для восстановления сайтов, отдельных страниц или файлов, а также некоторые другие случае использования.
Wayback Machine — это название одного из популярного веб архива сайтов. Иногда Wayback Machine используется как синоним «Интернет Архив».
Кто такой Тим Бернерс Ли
У Бернерса Ли идеальный образ значимой фигуры в IT-индустрии.
Он знаком с технологиями с детства. Его родители были математиками и занимались разработкой одного из первых компьютеров в мире «Марк I».
Учась в Оксфордском королевском колледже, Тим устроил хакерскую атаку на учебное заведение. За это ему запретили пользоваться университетскими десктопами.
Ломал сетку, до того как это стало мэйнстримом.
С начала запуска Веба британец настаивал, что интернет должен быть общедоступным и децентрализованным.
Он даже не попытался заработать на правах на технологию и отказался патентовать ее.
«Если бы эта технология была проприетарной, и я полностью ее контролировал, она бы, скорее всего, не взлетела. Невозможно предложить то, что было бы общедоступным, и при этом вы сохранили контроль над ним», — говорил ученый.
Тим Бернерс Ли слева, Роберт Кайо справа
Помимо причастности к созданию первого сайта, Тим Бернерс Ли считается изобретателем URI, URL, HTTP и HTML. Именно эти технологии можно найти в info.cern.ch.
Если точнее, Бернерс Ли придумал:
язык разметки HTML для создания веб-страниц
протокол HTTP для передачи данных в Вебе
систему унифицированных адресов ресурсов URL для поиска документа или страницы
Эти технологии применяются в интернете и сейчас.
Что такое веб-архив и зачем он нужен?
Веб-архив — история миллионов сайтов
Веб-архив — это специализированный сайт, который предназначен для сбора информации о различных интернет-ресурсах. Робот осуществляет сохранение копии проектов в автоматическом и ручном режиме, все зависит лишь от площадки и системы сбора данных.
На текущий момент имеется несколько десятков сайтов со схожей механикой и задачами. Некоторые из них считаются частными, другие — открытыми для общественности некоммерческими проектами. Также ресурсы отличаются друг от друга частотой посещения, полнотой сохраняемой информации и возможностями использования полученной истории.
Как отмечают некоторые эксперты, страницы хранения информационных потоков считаются важной составляющей Web 2.0. То есть, частью идеологии развития сети интернет, которая находится в постоянной эволюции
Механика сбора весьма посредственная, но более продвинутых способов или аналогов не имеется. С использованием веб-архива можно решить несколько проблем: отслеживание информации во времени, восстановление утраченного сайта, поиск информации.
Зачем нужны сателлиты?
Ключевая задача понятна – продвигать основной ресурс. Чем же именно сателлит может помочь вашему проекту?
Передаёт ссылочный вес на основной сайт
Ссылочная масса – важный фактор ранжирования. Поэтому все чаще компании создают собственные сети сайтов-сателлитов – PBN (Private Blog Network), на которых можно бесплатно разместить ссылки с нужными анкорами, быстро убрать или отредактировать их при необходимости. Преимущество перед биржами в том, что цены на ссылки расти не будут, а за качество размещения полностью отвечаете вы.
Привлекает трафик по более узким запросам
Тематика сайта-спутника в данном случае более конкретная, чем у продвигаемого сайта. Например, для магазина бытовой техники создается сайт отдельно для холодильников, стиральных машин и т.д. Более узконаправленная тематика привлечет качественный трафик, который впоследствии можно передавать на основной сайт.
Заполняет выдачу поисковых систем
Использовать сателлиты можно для вывода в топ не одного своего сайта, а сразу нескольких. По определенным ключевым запросам с помощью сайтов-помощников вы можете полностью вытеснить конкурентов из выдачи.
web.archive.org
Этот сервис веб архива ещё известен как Wayback Machine. Имеет разные дополнительные функции, чаще всего используется инструментами по восстановлению сайтов и информации.
Для сохранения страницы в архив перейдите по адресу https://archive.org/web/ введите адрес интересующей вас страницы и нажмите кнопку «SAVE PAGE».
Для просмотра доступных сохранённых версий веб-страницы, перейдите по адресу https://archive.org/web/, введите адрес интересующей вас страницы или домен веб-сайта и нажмите «BROWSE HISTORY»:
В самом верху написано, сколько всего снимком страницы сделано, дата первого и последнего снимка.
Затем идёт шкала времени на которой можно выбрать интересующий год, при выборе года, будет обновляться календарь.
Обратите внимание, что календарь показывает не количество изменений на сайте, а количество раз, когда был сделан архив страницы.
Точки на календаре означают разные события, разные цвета несут разный смысл о веб захвате. Голубой означает, что при архивации страницы от веб-сервера был получен код ответа 2nn (всё хорошо); зелёный означает, что архиватор получил статус 3nn (перенаправление); оранжевый означает, что получен статус 4nn (ошибка на стороне клиента, например, страница не найдена), а красный означает, что при архивации получена ошибка 5nn (проблемы на сервере). Вероятно, чаще всего вас должны интересовать голубые и зелёные точки и ссылки.
При клике на выбранное время, будет открыта ссылка, например, http://web.archive.org/web/20160803222240/https://hackware.ru/ и вам будет показано, как выглядела страница в то время:
Используя эту миниатюру вы сможете переходить к следующему снимку страницы, либо перепрыгнуть к нужной дате:
Лучший способ увидеть все файлы, которые были архивированы для определённого сайта, это открыть ссылку вида http://web.archive.org/*/www.yoursite.com/*, например, http://web.archive.org/*/hackware.ru/
Кроме календаря доступна следующие страницы:
- Collections — коллекции. Доступны как дополнительные функции для зарегистрированных пользователей и по подписке
- Changes
- Summary
- Site Map
Changes
«Changes» — это инструмент, который вы можете использовать для идентификации и отображения изменений в содержимом заархивированных URL.
Начать вы можете с того, что выберите два различных дня какого-то URL. Для этого кликните на соответствующие точки:
И нажмите кнопку Compare. В результате будут показаны два варианта страницы. Жёлтый цвет показывает удалённый контент, а голубой цвет показывает добавленный контент.
В этой вкладке статистика о количестве изменений MIME-типов.
Site Map
Как следует из название, здесь показывается диаграмма карты сайта, используя которую вы можете перейти к архиву интересующей вас страницы.
Если вместо адреса страницы вы введёте что-то другое, то будет выполнен поиск по архивированным сайтам:
Показ страницы на определённую дату
Кроме использования календаря для перехода к нужной дате, вы можете просмотреть страницу на нужную дату используя ссылку следующего вида: http://web.archive.org/web/ГГГГММДДЧЧММСС/АДРЕС_СТРАНИЦЫ/
Обратите внимание, что в строке ГГГГММДДЧЧММСС можно пропустить любое количество конечных цифр.
Если на нужную дату не найдена архивная копия, то будет показана версия на ближайшую имеющуюся дату.
Как посмотреть историю посещения сайтов? Как очистить историю во всех браузерах?
Доброго времени суток.
Оказывается еще далеко не все пользователи знают, что по умолчанию любой браузер запоминает историю посещенных вами страничек. И даже если прошло несколько недель, а может и месяцев, открыв журнал учета посещений браузера — можно найти заветную страничку (если конечно, вы не очищали историю посещений…).
Вообще, опция эта довольно полезна: можно найти ранее посещенный сайт (если забыли добавить его в избранное), или посмотреть чем интересуются другие пользователи, сидящие за данным ПК. В этой небольшой статье я хочу показать как можно посмотреть историю в популярных браузерах, а так же как ее быстро и легко очистить. И так…
Как посмотреть историю посещения сайтов в браузере…
Google Chrome
В Chrome в правом верхнем углу окна есть «кнопка со списком», при нажатии на которую открывается контекстное меню: в нем нужно выбрать пункт «История«. Кстати, поддерживаются и так называемые быстрые клавиши: Ctrl+H (см. рис. 1).
Рис. 1 Google Chrome
Сама история представляет из себя обычный список адресов интернет страничек, которые отсортированы в зависимости от даты посещения. Довольно легко найти сайты, которые посещал, например, вчера (см. рис. 2).
Рис. 2 История в Chrome
Firefox
Второй по популярности (после Chrome) браузер на начало 2020г. Чтобы зайти в журнал можно нажать быстрые кнопки (Ctrl+Shift+H), а можно открыть меню «Журнал» и из контекстного меню выбрать пункт «Показать весь журнал«.
Кстати, если у вас нет верхнего меню (файл, правка, вид, журнал…) — просто нажмите левую кнопку «ALT» на клавиатуре (см. рис. 3).
Рис. 3 открытие журнала в Firefox
Кстати, на мой взгляд в Firefox самая удобная библиотека посещения: можно выбирать ссылки хоть вчерашние, хоть за последние 7 дней, хоть за последний месяц. Очень удобно при поиске!
Рис. 4 Библиотека посещения в Firefox
Opera
В браузере Opera просмотреть историю очень просто: щелкаете по одноименному значку в левом верхнем углу и из контекстного меню выбираете пункт «История» (кстати, поддерживаются и быстрые клавиши Ctrl+H).
Рис. 5 Просмотр истории в Opera
Яндекс-браузер
Яндекс-браузер очень сильно напоминает Chrome, поэтому здесь практически все так же: щелкаете в правом верхнем углу экрана по значку «списка» и выбираете пункт «История/Менеджер истории» (или нажмите просто кнопки Ctrl+H, см. рис. 6).
Рис. 6 просмотр истории посещения в Yandex-браузере
Internet Explorer
Ну и последний браузер, который не мог просто не включить в обзор. Чтобы посмотреть в нем историю — достаточно щелкнуть по значку «звездочка» на панели инструментов: далее должно появиться боковое меню в котором просто выбираете раздел «Журнал».
Кстати, на мой взгляд не совсем логично прятать историю посещения под «звездочку», которая у большинства пользователей ассоциируется с избранным…
Рис. 7 Internet Explorer…
Как очистить историю во всех браузерах сразу
Можно, конечно, вручную все удалять из журнала, если вы не хотите, чтобы кто-то мог просмотреть вашу историю. А можно просто использовать специальные утилиты, которые за считанные секунды (иногда минуты) очистят всю историю во всех браузерах!
Пользоваться утилитой очень просто: запустили утилиту, нажали кнопку анализа, затем поставили галочки где нужно и нажали кнопку очистки (кстати, история браузера — это Internet History).
Рис. 8 CCleaner — чистка истории.
В данном обзоре не мог не упомянуть и еще одну утилиту, которая порой показывает еще лучшие результаты по очистке диска — Wise Disk Cleaner.
Пользоваться утилитой так же просто (к тому же она поддерживает русский язык) — сначала нужно нажать кнопку анализа, затем согласиться с теми пунктами по очистке, которая назначила программа, а затем нажать кнопку очистки.
Рис. 9 Wise Disk Cleaner 8
На этом у меня все, всем удачи!
Как пользоваться веб архивом
Если вы хотите выполнить поиск в архиве веб-страниц, введите в адресную строку вашего браузера адрес web.archive.org.ru, после чего в поле поиска укажите адрес интересуемого сайта. Например, введите адрес домашней страницы Яндекса http://yandex.ru и нажмите клавишу «Enter».
Сохраненные копии главной страницы Яндекс на сайте web.archive.org
Зелеными кружочками обозначены даты когда была проиндексирована страница, нажав на него вы перейдете на архивную копию сайта. Для того чтобы выбрать архивную дату, достаточно кликнуть по временной диаграмме по разделу с годом и выбрать доступные в этом году месяц и число. Так же если вы нажмете на ссылку «Summary of yandex.ru» то увидите, какой контент был проиндексирован и сохранен в архиве для конкретного сайта с 1 января 1996 года ( это дата начала работы веб архива).
Какой контент сохраняет веб-архив интернета
Нажав на выбранную дату, вам откроется архивная копия страницы, такая как она выглядела на веб-сайте в прошлом. Давайте посмотрим на Яндекс в молодости, ниже приведен снимок главной страницы Яндекса на 8 февраля 1999 года.
Веб архив копия сайта Яндекс на 08.02.1999
Вполне возможно, что в архивном варианте страниц, хранящемся на веб-сайте Archive.org, будут отсутствовать некоторые иллюстрации, и возможны ошибки форматирования текста. Это результатом того, что механизм архивирования веб-сайтов, пытается, прежде всего, сохранить текстовый контент web-сайтов. Помните об еще одном ограничении онлайн-архива. При поиске конкретного контента, размещенного на определенной архивной странице, лучше всего вводить ее точный адрес, а не главный адрес данного веб-сайта.
Возвращаясь к нашему примеру: вы получили доступ к архивному контенту, размещенному на главной странице Яндекса, при нажатии на ссылки в архивной версии могут как загружаться так и не загружаться другие страницы сайта. Так в нашем варианте страница «последние 20 запросов» была найдена, а вот страница «Реклама на yandex.ru» не нашлась.
Подводя итоги можно сказать, что web.archive.org поистине уникальный и грандиозный проект. Он действительно является машиной времени для интернета, позволяя найти удаленные сайты и их архивные версии . Как использовать предоставляемые возможности решать только вам, но использовать их можно и нужно обязательно !
Коллекция карт Дэвида Рамси
Американский коллекционер карт является одним из самых известных в мире коллекционеров карт и картографов. Его коллекция исторических карт, насчитывающая 63 000 человек, является, пожалуй, самым большим ресурсом, доступным в Интернете для общественности. Здесь вы можете найти редкие карты с 16 по 21 век Америки, Северной Америки, Южной Америки, Европы, Азии, Африки, Тихого океана и мира. Многие новые добавляются каждый день, так как общая коллекция составляет 150 000 человек.
Карты — это удобные места для слияния древнего с современным. Используйте браузер LUNA для просмотра нескольких карт за разные периоды времени. Создайте свои собственные коллекции для изучения истории, искусства, генеалогии, исследований и собственной семейной истории.
Исследователь истории
Смитсоновский институт — крупнейший музейный комплекс в мире. Это может быть колыбелью американской истории, но многие экспонаты могут быть связаны с остальным миром. «Исторический исследователь» — это интерактивная выставка, созданная из 3 миллионов экспонатов из музейных коллекций. Он предназначен для использования учителями и учениками K-12, поставщиками программ послешкольного обучения, семьями и всеми, кто интересуется обучением в течение всей жизни. Используйте инструменты фильтрации в правой части экрана, чтобы сузить результаты по классу, типу ресурса или исторической эпохе.
, исследуя артефакты и истории, стоящие за ними. Вы можете виртуально взглянуть на канонерскую лодку Филадельфия, военный корабль, затонувший в озере Шамплейн в 1776 году. Или снять собственный интерактивный фильм с изображениями из онлайн-базы данных изображений.
Как использовать веб-архив?
Форма для поиска информации на Peeep.us
Как уже отмечалось выше, веб-архив — это сайт, который предоставляет определенного рода услуги по поиску в истории. Чтобы использовать проект, необходимо:
- Зайти на специализированный ресурс (к примеру, web.archive.org).
- В специальное поле внести информацию к поиску. Это может быть доменное имя или ключевое слово.
- Получить соответствующие результаты. Это будет один или несколько сайтов, к каждому из которых имеется фиксированная дата обхода.
- Нажатием по дате перейти на соответствующий ресурс и использовать информацию в личных целях.
О специализированных сайтах для поиска исторического фиксирования проектов поговорим далее, поэтому оставайтесь с нами.
Как посмотреть сайт в прошлом
Есть несколько сервисов, в которых можно посмотреть, как менялось визуальное оформление страниц сайта, его структуру страниц и контент, положение в поисковой выдаче и какие изменения вносились в регистрационные данные за время существования ресурса.
Сервис Веб-архив
При его использовании сначала заходим на сайт https://web.archive.org/ и после вводим адрес страницы.
График ниже показывает количество сохранений: первое было в 1998 году.
Дни, в которые были сохранения, отмечены кружком. При клике на время во всплывающем окне, открывается сохраненная версия. Показано ниже:
Как выгрузить сайт из ВебАрхива, расскажем дальше.
Сервис Whois History
Для его использования заходим на сайт http://whoishistory.ru/ и вводим данные в поиске по доменам и IP, либо по домену:
Сервис покажет информацию по данным Whois, где собраны сведения от всех регистраторов доменных имен. Посмотреть можно возраст домена, кто владелец, какие изменения вносились в регистрационные данные и т.д.
Где расположена история в Яндекс браузере на Android
История в мобильной версии Яндекс браузера также содержится на отдельной вкладке, где её можем изучить в любое время. Тут появляются все ссылки сайтов, просмотренных в браузере, а также ссылки с синхронизированных устройств. Мобильная версия Яндекс браузера не даёт возможность перейти к истории через файлик, так что просмотр вкладки – единственный путь.
Рассмотрим, где в Yandex browser на телефоне находится история:
- Открываем веб-обозреватель и переходим на абсолютно любую страницу.
- Нажимаем по значку с цифрой, обведённой в квадрате.
- Клацаем на значок с часами в нижнем меню навигации.
- Попадаем на страницу, где и располагается история в мобильном Яндекс браузере.
Даже перейдя на страницу «Закладки» или «Другие устройства» (располагаются по обе стороны от значка истории), мы сможем увидеть историю Яндекс веб-обозревателя на Андроид. Между этими тремя вкладками легко переходить, навигация на Андроид-устройствах располагается в верхней части окна.
Элементы сайта-истории
Любая история – это в первую очередь повествование. История на сайте – не исключение.
Повествование складывается из следующих элементов:
- Персонаж. Выступать в качестве персонажа может продукт компании, сам бренд или что-то еще. Может быть и вымышленный персонаж, который несет в себе собирательный образ, например, целевой аудитории компании.
- Конфликт (событие). В роли конфликта могут быть какие-либо волнующие целевую аудиторию проблемы. Ситуации, в которые попадает клиент и в решении которых может помочь компания.
- Действие. Это те действия, который должен совершить клиент, чтобы решить конфликт, проблему. И в истории рассказывается, какие это должны быть действия. Тут могут быть и действия, которые совершает компания, чтобы решить проблему клиента. Часто описывается конечный результат действий, положительные эмоции от использования продукта, счастье клиента после того, как проблема решена.
Переделка сайта
Сегодня закончена очередная, небольшая переделка сайта для улучшения его показателей. Что-то сразу было сделано не так, что-то нужно сделать в связи с произошедшими изменениями в Интернете. Опыт показывает, периодические переделки сайтов вполне нормальное явление, хотя есть и минусы.
Итак, мой блог был создан в начале 2013 года. Несмотря на наличие уроков, мной было допущено достаточно много различных ошибок, которые не позволяли блогу нормально развиваться. Приходилось учиться, вникать и понимать, какие вопросы должны быть обязательно сделаны. Кроме того в Интернете многое меняется и то, что работало еще год назад, сегодня может уже не работать. Теперь интересно сравнить новый и старый блог. Мы это обязательно сделаем, когда будем рассматривать вопрос, как посмотреть историю сайта.
В январе 2016 года, был полностью заменен шаблон моего блога, он был выполнен специалистами по дизайну и верстке. Старый шаблон поднадоел, да и был он серийным, не у меня одного был установлен такой шаблон. В процессе переделки блога, возникало много мелких вопросов, которые устранялись по ходу. В результате полученного опыта на блоге была опубликована статья «Как и где заказывать сайт». Думаю, статья многим помогла не наступать на грабли.
За прошедший год выявились небольшие недочеты, выявились резервы. По этой причине снова сделана его небольшая переделка. В футер перенесен виджет моей группы Вконтакте, дополнительно установлен виджет моей группы на Facebook, а также установлен виджет от Google+. Всё лишнее из футера удалено. Можете перейти в футер и посмотреть сами.
В последнее время были проблемы на хостинге из-за превышения нагрузки на CPU ядро. Естественно, нужно было решить часть вопросов. По рекомендации специалиста, который делал мне верстку блога и делал его переделку, установлен плагин WP Smush.
Плагин WP Smush ужимает все изображения, которые есть в статьях, это уменьшает время загрузки сайта. Оптимизирована и работа слайдера. Позже нужно будет с ним поработать еще. Убраны внешние ссылки, которые получались от привязки к JustClick. Любая переделка отрицательно влияет на позиции блога. В результате статьи, которые были в Топ 1-5, провалились и теперь они находятся на позициях 20-40. Сколько времени потребуется на их возврат в исходное состояние неизвестно. Вот такой получился краткий отчет о модернизации моего блога.
Если Вы тоже хотите сделать редизайн своего ресурса, блога, хотите сделать новый дизайн или оформить группу с оригинальным дизайном в соцсетях, могу рекомендовать Вам сайт Юлии — профессионала дизайнерского мастерства. Можно сделать, как обычный дизайн, строгий, графический, так и мультяшный.
Качаем сайт с web.archive.org
Процесс восстановления сайта из веб-архива я покажу на примере сайта 1mds.ru. Я не знаю что это за сайт, я всего лишь знаю что у него в архиве много страниц, а это значит что сайт не только существовал, но с ним работали.
Для того, что бы открыть архив нужного сайта, нам необходимо пройти по такой вот ссылке:
http://web.archive.org/web/*/1mds.ru
На 24 ноября 2018 года, при открытии этой ссылки я обнаружил вот такую картину:
Как видите на главной зафиксировались результаты экспериментов с программной частью. Если мы просто скачаем сайт как есть, то в качестве главной будет именно эта страница. нам необходимо избежать попадания в архив таких страниц. Как это сделать? Довольно просто, но для начала необходимо определить когда последний раз в архив добавлялась главная страница сайта. Для этого нам необходимо воспользоваться навигацией по архиву сайта, которая расположена вверху справа:
Кликаем левую стрелку ибо правая все равно не активна, и кликаем до тех пор, пока не увидим главную страницу сайта. Возможно кликать придется много, бывает домены попадаются с весьма богатым прошлым. Например сайт, на примере которого я демонстрирую работу с архивом, не является исключением.
Вот мы можем видеть что 2 мая 2018-го бот обнаружил сообщение о том, что домен направлен на другой сайт:
Классика жанра, регистрируешь домен и направляешь его на существующий дабы не тратить лимит тарифа на количество сайтов.
А до этого, 30 марта, там был вообще блог про шитье-вязание.
Долистал я до 23 октября 2017-го и вижу уже другое содержимое:
Тут мы видим уже материалы связанные с воспитанием ребенка. Листаем дальше, там вообще попадается период когда на домене была всего одна страница с рекламой:
А вот с 25 апреля 2011 по 10 сентября 2013-го там был сайт связанный с рекламой. В общем нам нужно определиться какой из этих периодов мы хотим восстановить. К примеру я хочу восстановить блог про шитье-вязание. Мне необходимо найти дату его появления и дату когда этот блог был замечен там последний раз.
Я нашел последнюю дату, когда блог был на домене и скопировал ссылку из адресной строки:
http://web.archive.org/web/20180330034350/http://1mds.ru:80/
Мне нужны цифры после web/, я их выделил красным цветом. Это временная метка, когда была сделана копия. Теперь мне нужно найти первую копию блога и также скопировать из URL временную метку. Теперь у нас есть две метки с которой и до которой нам нужна копия сайта. Осталось дело за малым, установить утилиту, которая поможет нам скачать сайт. Для этого потребуется выполнить пару команд.
- sudo apt install ruby
- sudo gem install wayback_machine_downloader
После чего останется запустить скачивание сайта. Делается это вот такой командой:
wayback_machine_downloader -f20171223224600 -t20180330034350 1mds.ru
Таким образом мы скачаем архив с 23/12/2017 по 30/03/2018. Файлы сайта будут сохранены в домашней директории в папке «websites/1mds.ru». Теперь остается закинуть файлы на хостинг и радоваться результату.
Заключение
Архивы страниц Глобальной сети могут хранить в себе неожиданные экземпляры, ушедшей в прошлое, эпохи развития HTML-дизайна. Разумеется, манипуляций с чистым кодом сегодня производится уже намного меньше. Для большинства необходимых действий были разработаны визуально понятные и удобные инструменты, которые избавляют вас от необходимости знать код и уметь его писать и редактировать. Тем не менее, плотно работая с различными сайтами, вы периодически будете сталкиваться с необходимостью ручной настройки, а значит ковыряться в исходном коде всё-таки придётся. Но для большинства пользователей и владельцев блогов по интересам, подобные умения могут оказаться абсолютно бесполезными.