Снимок экрана с archive.today | |
Тип сайта | Web-архивирование |
---|---|
Доступно в | Multilingual |
URL | |
Коммерческая | No |
Регистрация | No |
Запущена | лет назад (2012) (2012) (2012);
archive.today (ранее archive.is ) - это архивный сайт, на котором хранится s снимки веб-страниц. Он извлекает по одной странице за раз, аналогично WebCite, размером менее 50 МБ каждая, но с поддержкой JavaScript тяжелых сайтов, таких как Google Maps и прогрессивные веб-приложения, такие как Twitter.
Archive.today, используют просмотр без заголовка для записи того, какие встроенные ресурсы необходимо захватить, чтобы обеспечить высококачественный сувенир, и создает изображение PNG для обеспечения статической и неинтерактивной визуализации представления.
Archive.today can захватывать отдельные страницы в ответ на явные запросы пользователей. С самого начала Archive.Today поддерживает сканирование страниц с hash bang URL.
Archive.today записывает только текст и изображения, за исключением видео, xml, rtf, таблица (xls или ods ) и другое нестатическое содержимое. Он отслеживает историю сохраненных снимков, возвращая пользователю запрос на подтверждение перед добавлением нового снимка уже сохраненного Интернет-адреса.
Страницы захватываются с шириной браузера 1024 пикселей. CSS преобразуется в встроенный CSS, удаляя адаптивный веб-дизайн и такие селекторы, как : hover
и : active
.. Контент, созданный с использованием JavaScript в процессе сканирования, отображается в замороженном состоянии. Имена HTML-классов сохраняются внутри атрибута old-class
.
Когда выделен текст, апплет JavaScript генерирует фрагмент URL, видимый в строке URL браузера, который автоматически выделяет эту часть текста при повторном посещении.
Веб-страницы не могут быть продублированы из archive.is в web.archive.org как резервная копия второго уровня, как размещает archive.is исключение для Wayback Machine и не сохраняет свои снимки в формате WARC. Обратное - от web.archive.org к archive.is - возможно, но копирование обычно занимает больше времени, чем прямой захват. Некоторые веб-сайты удаляются из списков Internet Archive задним числом или блокируются для сохранения из-за их файла robots.txt, но Archive.today не использует это.
Панель инструментов исследования позволяет использовать расширенные операторы ключевых слов, используя *
в качестве подстановочного символа . Пара кавычек адресует поиск по точной последовательности ключевых слов, присутствующих в заголовке или в теле веб-страницы, тогда как оператор insite ограничивает поиск конкретным доменом в Интернете.
После того, как веб-страница заархивирована, она не может быть удалена напрямую любым пользователем Интернета.
При сохранении динамического списка, окно поиска archive.today показывает только результат, который связывает предыдущий и следующий раздел списка (например, 20 ссылок на страницу). Остальные сохраненные веб-страницы фильтруются, и иногда их можно найти по одному из их вхождений.
Функция поиска поддерживается Google CustomSearch. Если результатов нет, archive.is пытается использовать Яндекс.Поиск.
. Если страница уже была заархивирована, archive.is просит пользователя подтвердить архивирование новой ревизии вместо того, чтобы немедленно ее архивировать.
При загрузке страницы отображается список URL-адресов отдельных элементов страницы с указанием размеров их содержимого, статусов HTTP и типов MIME. Этот список можно просмотреть только в процессе сканирования.
Можно загрузить заархивированные страницы в виде ZIP-файла, за исключением страниц, заархивированных с 29 ноября 2019 года, когда Archive.Today изменил свой механизм браузера с PhantomJS <27 от>до Chromium.
С июля 2013 года archive.today поддерживает Memento Project интерфейс прикладного программирования (API).
Archive.today был основан в 2012 году. Первоначально сайт назывался archive.today, но в мае 2015 года основное зеркало было изменено на archive.is. В январе 2019 года он начал заменять домен archive.is на зеркало archive.today.
В марте 2019 года сайт был заблокирован на шесть месяцев несколькими австралийскими интернет-провайдерами после стрельбы в мечети Крайстчерч в попытке ограничить распространение видеозаписи нападения.
Согласно GreatFire.org, archive.today заблокирован в Китае с марта 2016 года, archive.li - с сентября 2017 года, а archive.fo - с июля 2018 года.
21 июля 2015 года операторы заблокировали доступ к услуге со всех финских IP-адресов, заявив в Twitter, что они это сделали. во избежание эскалации спора, который они предположительно вели с правительством Финляндии.
В России возможен только доступ по протоколу HTTP; HTTPS-соединения заблокированы.
Archive.today в настоящее время блокирует запросы от рекурсивного DNS-преобразователя Cloudflare, 1.1.1.1.
Кроме того, поскольку В конце 2018 года Archive.today ввел ограничение ограничения данных, предположительно для защиты от атак типа «отказ в обслуживании». Отдельные пользователи могут архивировать и / или извлекать только приблизительно от 10 до 20 мегабайт данных в день. После достижения этого ограничения их веб-сервер блокирует IP-адрес отдельного пользователя, больше не отвечая.