94年属狗的是什么命| 女人吃桑葚有什么好处| 秋葵吃多了有什么坏处| 口蘑是什么| 我是舅舅的什么人| 明心见性是什么意思| 左眼一直跳是什么原因| 什么是历史虚无主义| 吃善存片有什么好处| 心肌缺血吃什么好| 一什么不| 月加厷念什么| 孩子结膜炎用什么眼药水| 父亲节送什么| 宝宝经常发烧是什么原因引起的| 凌晨五点是什么时辰| 弱阳性和阳性有什么区别| 湿热带下是什么意思| 口痰多是什么原因| 梦见自己在洗澡是什么意思| 调理脾胃吃什么好| 咳嗽能吃什么水果| 乔木是什么| 大疱性皮肤病是什么病| hpv阳性是什么意思| 0元购是什么意思| h是什么元素| 舌头看什么科| ntr是什么意思| 绮字五行属什么| 葵水是什么| 喝大麦茶有什么好处| 干咳是什么原因| vsd是什么意思| 止吐吃什么药| 什么的李逵| 白芷炖肉起什么作用| 山楂泡水有什么好处| 开心果为什么叫开心果| 玄关挂什么装饰画好| 萨德是什么意思| 主管是什么级别| 气喘吁吁什么意思| 生蚝有什么营养价值| ntr是什么意思啊| 珵字五行属什么| 猫条是什么| 什么叫口腔溃疡| 炖鸡汤放什么材料好吃| 梦见自己和别人吵架是什么意思| 痔疮发痒是什么原因| 全身浮肿是什么原因| 二次元是什么| 起湿疹是什么原因造成的| 经常流眼泪是什么原因| 电视为什么打不开| 云加一笔是什么字| uva是什么意思| 天五行属什么| 拍肺部片子挂什么科| 间断是什么意思| 营养神经吃什么药效果好| 稻花鱼是什么鱼| 农字五行属什么| 甘油三酯是什么意思| 非即食是什么意思| 用什么泡脚能减肥| 护肝养肝吃什么好| 猫咪泪痕重是什么原因| 什么不同成语| 高血压吃什么药| 人体最长的骨头是什么| 一声什么| 引狼入室是什么意思| 有才是什么意思| 130是什么意思| 口痰多是什么原因| 乳腺结节吃什么| 2月14日是什么星座| 吞服是什么意思| 开口腔诊所需要什么条件| 小孩咳嗽不能吃什么食物| 打包是什么意思| 脚背疼是什么原因| 什么疾什么快| 苔藓是什么植物| 眼球内容物包括什么| 胆囊息肉是什么原因造成的| 尿蛋白高吃什么食物好| 太平猴魁是什么茶| 远视眼是什么意思| 什么是红斑狼疮| 背上长痘痘擦什么药膏| 手掌很红是什么原因| 什么是切片| 吃什么升白细胞| 唐筛是检查什么| 人是由什么组成的| 已知晓是什么意思| 能力是什么| 呼吁是什么意思| 来减一笔是什么字| 格列卫是什么药| 银杏叶提取物治什么病| touch什么意思| 任然什么意思| 什么药可以治早迣| 甲磺酸倍他司汀片治什么病| 元气是什么意思| 梦见很多狗是什么意思| e抗原阳性是什么意思| 血管瘤是什么| 梦见自己相亲是什么意思| 子宫内膜增厚是什么意思| 吃白萝卜有什么好处| 职业年金是什么| cd3cd4cd8都代表什么| 痢疾吃什么药| 提手旁加茶念什么| 苏打水喝了有什么好处| 剖腹产后可以吃什么食物| 地图舌吃什么好得快| 1961属什么生肖| 做眉毛有什么危害| 干什么呢| 牙龈疼是什么问题| 大红色配什么颜色好看| 孕妇鼻炎犯了可以用什么药治疗| 冠状沟是什么| 掉头发吃什么药最有效| 为什么会得乙肝| 女人梦见下雪是什么征兆| 蛇鼠一窝指什么生肖| 瑀字五行属什么| 什么样的阳光填形容词| 活泼开朗是什么意思| 阿尔山在内蒙古什么地方| 京东plus是什么意思| 梦到开车是什么意思| tfcc是什么| 女人脚发热是什么原因| 滚刀肉是什么意思| 高血糖主食吃什么好| 嫖娼是什么| 舌系带短有什么影响| 男人出虚汗是什么原因引起的| 什么是幻听| 医院红色手环代表什么| 鼻子旁边有痣代表什么| 大便潜血弱阳性是什么原因| 中暑为什么不能打点滴| 兵部尚书相当于现在的什么官| 铁是补什么的| 母乳是什么颜色| 青海有什么好玩的| 为什么天天做梦| 菲拉格慕属于什么档次| 黄瓜籽有什么功效| 佛跳墙是什么菜系| 甜瓜什么时候成熟| 肠痉挛有什么症状| 无后为大的前一句是什么| 无底洞是什么意思| 月月红是什么花| 小肠是干什么的| 高处不胜寒什么意思| 见地是什么意思| 吃什么药可以延长性功能| 睾丸长什么样| 积劳成疾的疾什么意思| 耄耋之年是什么意思| 湿气重可以吃什么| 幼儿腹泻吃什么食物| 尿液阳性是什么意思| 鸡的守护神是什么菩萨| 不速之客的速是什么意思| 老年人腿肿是什么原因引起的| 送男性朋友什么礼物合适| 猪展是什么| 扦脚是什么意思| experiment是什么意思| 女人右眼跳是什么意思| 鼻子发干是什么原因造成的| 什么雪糕最好吃| 卫生纸筒可以做什么| 天干地支是什么意思| 疝气挂什么科| 虎头虎脑是什么生肖| 肠道蠕动慢吃什么药| 一黑一白是什么蛇| 什么是刮痧| 窈窕是什么意思| 县长属于什么级别| 八字加一笔是什么字| 经期上火了吃什么降火| 云南雪燕有什么作用| 屡试不爽是什么意思| 女人吃人参有什么好处| 七八年属什么生肖| human什么意思| 十月初四是什么星座| 213是什么意思| 家里来狗是什么征兆| 亦或是什么意思| 体罚是什么意思| 针眼用什么药| 女人什么眉毛最有福气| 血氨高是什么原因| 2017年是属什么年| 京兆尹是什么官| 眼睛雾化的作用是什么| 压力过大会有什么症状| 甲状腺4a是什么意思| 黑布林是什么水果| 举人相当于现在的什么官| 脖子左侧疼是什么前兆| 长智齿意味着什么| 吐槽是什么意思| 无毒不丈夫是什么意思| 中国最长的河流是什么| 吃什么可以排出霉菌| 土字旁的有什么字| 舌根发黄是什么原因造成的| 微波炉什么牌子好| 林深时见鹿是什么意思| 梭织棉是什么面料| 伴手礼什么意思| hpv感染有什么表现| 欧巴是什么意思| 孙悟空头上戴的是什么| 过剩是什么意思| 脸红是什么大病的前兆| 梦见小麦粒是什么意思| 水险痣什么意思| 什么是风湿热| 智多星是什么意思| 为什么一直拉肚子| 肛门下坠感是什么症状| 象牙白适合什么肤色| 本科是什么意思| 米西米西是什么意思| 什么是低血压| 罗刹女是什么意思| 乱点鸳鸯谱什么意思| 电磁炉上可以放什么锅| 什么是干股| 腺肌症是什么原因引起的| 山竹为什么那么贵| 美国为什么那么强大| 佛山有什么特产| 什么能力| 蛰伏是什么意思| 白细胞低吃什么补| 彧读什么| 指甲很薄很软是为什么| 尿味大是什么原因| 浓鼻涕吃什么药| 玉林狗肉节是什么时候| 身体不适是什么意思| 转氨酶偏高有什么症状| 活血是什么意思| 什么叫自私的人| 头晕目眩吃什么药| 腰椎间盘突出是什么原因引起的| 百度

新疆日报评论:在新起点上奋力推进社会稳定...

百度 编辑注)的流行,也证明了传统印刷技术的创新与活力。

Wayback Machine (с англ.?—??Машина времени?) — бесплатный онлайн-архив некоммерческой библиотеки ?Архив Интернета?. С помощью поисковых роботов Wayback Machine архивирует и делает общедоступной бо?льшую часть ?открытого? интернета[1].

Wayback Machine
Изображение логотипа
Стартовая страница портала
Стартовая страница портала
URL web.archive.org
Тип сайта веб-архив[вд]
Язык (-и) английский
Язык программирования Java, Python
Владелец Архив Интернета
Начало работы 24 октября 2001
Текущий статус работает
Страна
Логотип Викисклада Медиафайлы на Викискладе

Сервис был запущен в 1996 году, однако стал доступен для общественности только в 2001 году.

За первые 20 лет существования Wayback Machine каталогизировал и сохранил коллекцию из более чем 286 млрд веб-страниц. Архивные снимки отображаются в формате HTML, JavaScript и CSS[2]. Благодаря сохранённым в Wayback Machine документам пользователи могут отслеживать происходящие на сайтах изменения и сравнивать разные версии правок[3]. По состоянию на февраль 2024 года Wayback Machine предоставляет доступ к более чем 866 миллиардам сохранённых веб-страниц[4].

На момент 10 октября 2024 года в связи с начавшейся 9 октября DDoS атакой сервис оказался недоступен[5]. По заявлению основателя Брюстера Кейла сервис был отключён дабы сохранить данные в ущерб доступности сервиса[6]. 11 октября он также заявил, что данные сервиса повреждены не были, а в настоящее время идут работы по модернизации их внутренних систем[7]. Кейл предполагает, что это займёт дни, а не недели[8]. 14 октября сервис восстановил работу, временно приостановив возможность сохранять страницы[9], а 28 декабря — вернулся к полноценной работе.

Создание

править
 
Серверы ?Архива Интернета?, 2008 год
 
Брюстер Кейл в 2009 году

В 1989 году английский учёный Тим Бернерс-Ли создал всемирную паутину — систему, позволяющую передавать данные через подключённые к интернету компьютеры. Однако с распространением всемирной паутины были выявлены две основные проблемы. Первая состояла в нехватке мест для хранения всех данных, из-за чего многие документы и веб-страницы удалялись. Другая проблема заключалась в том, что после редактирования веб-страницы (например, по юридическим причинам) пользователи не могли посмотреть её изначальную версию. Решить эти недостатки стремилась американская цифровая библиотека ?Архив Интернета? — некоммерческая организация, созданная программистами Брюстером Кейлом и Брюсом Галлиатом[англ.] в 1996 году[10]. При сотрудничестве с Alexa Internet (дочерней компанией Amazon, занимающейся веб-индексированием) ?Архив? инициировал создание и хранение копий существующих сайтов для развития ?универсального доступа к знанию?. Организация предоставляла бесплатный публичный доступ к оцифрованным материалам, таким как веб-страницы, книги, аудиозаписи, включая живые концерты, видео, изображения и программное обеспечение. На 2021 год штаб-квартира ?Архива Интернета? находится в Сан-Франциско, в здании бывшей христианской церкви, расположенной в районе Ричмонд. Журналист местной радиостанции Kawl[англ.] в 2019 году сравнивал офис ?Архива? с римским храмом[11][12][13]. Организация ставит перед собой цель спасти интернет от исчезновения[14].

Wayback Machine стал самым известным проектом ?Архива?. Онлайн-сервис был назван в честь машины времени из мультсериала 1960-х годов ?Шоу Рокки и Буллвинкля?. Он предоставляет доступ к цифровой коллекции из более чем 800 млрд различных веб-страниц[3][15]. Проект Wayback Machine был задуман как решение проблемы ошибки 404, означающей, что сервер не может найти данные по запрошенному адресу. Это связано с так называемым вымиранием ссылок — нарастающей недоступностью некогда опубликованных данных. Так, в 1997 году средняя продолжительность жизни веб-страницы составляла 44 дня. В 2003 году этот показатель составил 100 дней.

Проведённый в 2008 году анализ ссылок на 2700 цифровых ресурсов, большинство из которых не имеет печатных аналогов, показал, что около 8 процентов ссылок переставали работать через год. К 2011 году, по прошествии трёх лет, 30 процентов ссылок в коллекции были неработающими[16]. Благодаря интеграции с Alexa, столкнувшийся с сообщением об ошибке пользователь мог получить доступ к заархивированной версии страницы через внедрённую в браузер панель инструментов. Если копия недоступной страницы присутствовала в базе данных Wayback Machine, то загоралась специальная кнопка. При этом пользователи могли предоставить браузеру разрешение на просмотр и регистрацию активности — в таком случае все посещаемые сайты архивировались на портале[17].

Wayback Machine был запущен в мае 1996 года, однако стал доступным для общественности только в 2001 г. — до этого вся записанная на цифровых магнитных лентах информация была открыта только для ограниченного числа учёных и исследователей[18]. К моменту ?открытия? архив содержал более 10 млрд заархивированных страниц[3]. К декабрю 2014 года руководство Wayback Machine сообщило, что сохранило 435 млрд веб-страниц по всему миру[1]. С технической точки зрения программное обеспечение Wayback Machine не является архивом, а скорее общедоступным интерфейсом к ограниченному подмножеству всех хранилищ[19]. Так, Wayback Machine нельзя считать поисковой системой коллекции организации, так как она не осуществляет поиск по базе данных другой крупной виртуальной библиотеки — Open Library, позволяющей пользователям бесплатно получать доступ к цифровым копиям книг, которые загружаются и архивируются в рамках проекта[20][21].

Характеристика

править

С запуском Wayback Machine ?Архив Интернета? стал одним из самых популярных и узнаваемых онлайн-порталов и главным сервисом веб-архивирования[3][14].

В 1999 году ?Архив? начал расширять коллекцию за пределы архивного веб-контента, чтобы обеспечить статус как к оцифрованным, так и изначально цифровым ресурсам, в том числе книгам, аудио, фильмам, изображениям, документам, программному обеспечению и видеоиграм[12]. Некоторые сканирования выполняются поисковыми роботами самого архива, а другие — партнёрскими организациями. Отдельные базы данных могут приобретаться за счёт пожертвований пользователей и целевых приобретений[21]. Сами создатели организации сравнивали свою коллекцию с Александрийской библиотекой[12].

На 2021 год Wayback Machine содержал около 424 млрд веб-страниц[19] — больше, чем документов в Библиотеке Конгресса[22][12][21].

Принцип работы

править

Платформа Wayback Machine функционирует за счёт двух основных элементов — поисковых роботов (или веб-краулеров) и интерфейса. Веб-краулеры занимаются посещением, извлечением, загрузкой и архивацией веб-страниц. В свою очередь, через интерфейс пользователи получают доступ к онлайн-коллекциям[2].

Поисковые роботы

править
Рост коллекции Wayback Machine[23] по годам
Год Архивированные страницы (в миллиардах)
2005
40
2008
85
2012
150
2013
373
2014
400
2015
452
2016
505
2020
514
2021
581
2022
689
2023
828

Изначально коллекция архива пополнялась за счёт браузерного плагина от Alexa Internet, который автоматически фиксировал и сохранял каждую веб-страницу по мере её посещения, затем передавая всю собранную информацию в ?Архив Интернета?. Пользователи также могли установить бесплатную панель инструментов, позволявшую проверять статус архивирования выбранного веб-сайта[21].

В 2002 году ?Архив? запустил собственного поискового робота с открытым исходным кодом — Heritrix[англ.]. Коды краулеров записаны с помощью комбинации программных языков Си и Perl. Помимо этого, ?Архив Интернета? также принимает данные сканирования от других доноров[12]. Отсканированные копии веб-сайтов автоматически конвертируются в файлы размером около 100 МБ, которые затем сохраняются на серверах. В 2002 году общая скорость пополнения архива составляла около 10 терабайт в месяц[24].

Веб-краулеры запечатляют версию сайта такой, какой она была сохранена на момент доступа к ней через URL. Роботы регулярно сканируют большое количество веб-страниц, рекурсивно загружая, анализируя и отображая HTML-, JavaScript- и CSS-страницы[2]. Механизм работы краулеров похож на работу поисковых систем — роботы самостоятельно ищут порталы для архивирования через систему поиска путей, сканируя страницы и связанные с ними сайты, таким образом формируя сеть порталов. На момент создания ?Архива Интернета? всемирная сеть была настолько маленькой, что веб-краулеры могли совершить обход всех сайтов за один сеанс. Однако со временем постоянный рост онлайн-порталов и их изменчивость сделали полный обход всей сети практически невозможным. Таким образом, не все изменения на сайтах зафиксированы в Wayback Machine[14]. Руководство ?Архива Интернета? не уточняет то, как роботы находят и выбирают страницы для сканирования, однако заявляет, что чаще всего краулеры направляются на те сайты, которые имеют перекрёстные ссылки с других порталов и находятся в открытом доступе. Сканер начинает с веб-страницы, а затем следует по каждой гиперссылке на этой веб-странице, чтобы перейти на новые сайты. На каждой из новых веб-страниц поисковый робот повторяет процесс[19]. Он будет продолжаться до того момента, пока архивация не будет остановлена или не достигнет установленного скриптом лимита[25]. Помимо этого, каждый пользователь может использовать специальную форму на портале и вызвать краулер, который сохранит страницу в текущем состоянии[2]. Wayback Machine сканирует только общедоступные веб-страницы и не может получить доступ к контенту, защищённому паролем или расположенному на частном сервере[15][19][3].

Интерфейс

править

Интерфейс Wayback Machine позволяет пользователям осуществить два основных действия — получить доступ к истории изменений сайта и просмотреть все сделанные на порталах правки. Также доступна функция сравнения разных версий сайтов[17][26][22][27]. Для этого в специальное окно поиска вводится URL интересующего портала, после чего Wayback Machine выдаёт список дат архивации. Звёздочка после некоторых дат используется для обозначения обнаруженных на странице изменений. URL-адрес заархивированной страницы начинается с web.archive.org[28][19].

Любой пользователь может сохранить URL-адреса для архивирования, а с бесплатной учётной записью в архиве можно создать и заархивировать любые исходящие или внешние ссылки на исходной странице и получить обзорный отчёт[29][29].

Хранение

править

На 2018 год коллекция ?Архива Интернета? составляла более 40 петабайт, или 40 тыс. терабайт данных, Wayback Machine предоставлял доступ к примерно 63 % всех имеющихся материалов[30]. На февраль 2020 года в архиве Wayback Machine числилось более 900 млрд URL-адресов и более 400 млрд веб-страниц[31]. На июнь 2021 года Wayback Machine предоставлял доступ к более чем 581 млрд сохранённых веб-страниц[4].

Использование

править

Портал Wayback Machine зачастую применяют в правовой сфере — юристы используют сервис для поиска информации по гражданским искам, уголовным делам, в административном делопроизводстве и патентных процессах. Полученные через Wayback Machine архивные версии сайтов могут использоваться для решения вопросов о патентном праве или установлении наказания за публикацию материалов, которые впоследствии были удалены из сети[2][17]. Несмотря на широкое использование коллекции ?Архива Интернета? для предоставления доказательств, некоторые суды США отказывались принимать скриншоты веб-страниц, ссылаясь на юридическую сложность отождествления оригинала документа и его заархивированной версии[32]. В 2018 году Апелляционный суд США по второму федеральному апелляционному округу постановил, что скрины с архива веб-страниц Wayback Machine относятся к законным доказательствам, которые могут быть использованы в судебных разбирательствах; ранее аналогичное решение вынес Апелляционный суд США по третьему федеральному апелляционному округу[33]; позднее Апелляционный суд США по седьмому федеральному апелляционному округу также признал скриншоты веб-архивов допустимыми электронными доказательствами[34].

Благодаря архивированным в Wayback Machine статьям авторы могут устанавливать право на открытие или на публикацию[35]. Для социологов и историков Wayback Machine предлагает ценный крупномасштабный источник данных для анализа поведения компаний, стратегий продаж, социальных практик[1][36]. Также Wayback Machine позволяет получать доступ к журналам открытого доступа. Так, с начала 2000-х годов из интернета исчезло 84 журнала ОД по естественным наукам и ещё около 100 — по социальным и гуманитарным[37][38][39].

Активисты и исследователи используют портал для борьбы с дезинформацией, особенно усилившейся после избрания президента Дональда Трампа в США. В ответ на участившиеся противоречивые заявления со стороны администрации президента ?Архив? создал отдельную коллекцию под названием ?Архив Трампа?, содержащую выступления президента на телевидении и твиты. ?Архив? надеется, что его хранилище поможет другим выявлять ложную информацию и проверять подозрительный контент[40][41]. Однако в некоторых случаях отдельные активисты утверждали, что заархивированные Wayback Machine ресурсы наоборот способствовали распространению дезинформации. Так, с началом пандемии коронавируса сторонники конспиративных теорий использовали сохранённые порталом скриншоты для распространения ложной информации о коронавирусе[42]. В качестве контрмер в ноябре 2020 года ?Архив? внедрил в Wayback Machine инструменты проверки информации на достоверность. Для этого некоммерческая организация начала сотрудничать с различными компаниями, занимающимися проверкой фактов, чтобы предоставлять пользователям причины удаления той или иной страницы из коллекции. При открытии заархивированной версии сайта Wayback Machine предоставляет пользователям сведения о причине её удаления в виде жёлтого баннера вверху экрана. При подозрении на причастность веб-страницы к кампании по дезинформации Wayback Machine предоставляет данные об организации, проводившей проверку на достоверность, и ссылку на её отчёт[43].

В отдельных случаях полученная через Wayback Machine информация фигурировала в крупных скандалах. Так, Wayback Machine хранит копию удалённого сообщения со страницы, озаглавленной ?Сводки от Стрелкова Игоря Ивановича? в социальной сети ?ВКонтакте?, о сбитом самолёте АН-26, который в действительности оказался пассажирским Boeing 777[44][45]. В мае 2021 года издание Bellingcat выяснило, что находящиеся в Европе американские военные использовали для хранения засекреченных данных детские мобильные приложения для запоминания информации. Из-за неправильно установленных настроек приватности другие пользователи получили доступ к секретной информации. После обнаружения утечки информации военные удалили все карточки, но они остались в сервисе Wayback Machine[46].

Правовой статус

править

?Архив Интернета? не запрашивает разрешения на копирование веб-сайтов перед удалённым сбором данных, однако удаляет или ограничивает доступ к архивным материалам по запросу. Ранее владельцам веб-сайтов предоставлялась возможность ?отказаться? от архивирования через стандартный файл robots.txt, который исключает веб-сайты или их отдельные страницы, каталоги, из списка порталов для веб-краулеров[14][47]. По состоянию на 2022 год заявки на удаление сайтов или их страниц из архива принимаются только после прямого запроса от администрации удаляемого сайта. Однако из-за сохранения других данных ?Архив Интернета? находится в уязвимом юридическом положении[48]. Так, в 2005 году Wayback Machine оказался втянутым в спор о товарных знаках между компаниями Healthcare Advocates и Health Advocate. Последняя использовала Wayback Machine для доступа к веб-страницам Healthcare Advocates, датируемым 1999 годом, в попытке найти информацию, которая поддержала бы дело. В ответ Healthcare Advocates подала в суд как на Health Advocate, так и на ?Архив?, утверждая что архив нарушил Закон об авторском праве в цифровую эпоху. Впоследствии дело было урегулировано в досудебном порядке[49].

В 2002 году ?Архив? удалил из своей системы ссылки на архивные копии портала Xenu.net, принадлежащего критику церкви Андреасу Хельдал-Лунду. Удаление произошло по требованию юристов Церкви саентологии, заявивших, что владеют правом собственности на выдержки из документов Церкви, опубликованные на сайте[50][51].

Ограничения

править

Исследователи и активисты критикуют Wayback Machine и деятельность ?Архива Интернета? за попытку сохранить все онлайн-материалы, многие из которых не представляют должной ценности. По мнению отдельных исследователей, это связано с устаревшей политикой ?Архива?, который был основан в конце 1990-х годов — тогда, на заре создания интернет-архивов, считалось, что данные интернета должны сохраняться в полном объёме. Однако с созданием множества однодневных сайтов многие исследователи и активисты поменяли своё мнение[52]. Другие критические замечания относятся к техническим ограничениям сервиса — Wayback Machine не позволяет сохранять и обрабатывать определённые элементы JavaScript, а также может создавать заархивированные страницы, содержащие неработающие ссылки, отсутствующую графику или являющиеся неполными по иным причинам[53]. Сканеры захватывают только статический снимок сайта — функции порталов на основе Java или Flash работать не будут. Это означает, что бо?льшая часть функциональных возможностей исходной веб-страницы теряется[14].

Блокировки

править

В 2015 году Роскомнадзор принял решение заблокировать Wayback Machine за копию страницы текста ?Одиночный джихад в России?, содержащего информацию о ?теории и практике партизанского сопротивления?. Соответствующая страница в ?Архиве Интернета? была добавлена в официальный реестр запрещённых веб-сайтов в России 23 июня 2015 года, из-за чего некоторые российские интернет-провайдеры были вынуждены полностью заблокировать сайт ?Архива?[54][55][56]. Доступ к Wayback Machine был заново открыт в 2016 году, после того как запрещённые ролики удалили с портала[57].

В 2019 году представители ?Ассоциации по защите авторских прав в интернете? (АЗАПИ) подали серию исков против сервиса Wayback Machine за нарушение авторских прав. Представители АЗАПИ запросили Мосгорсуд вынести решение о вечной блокировке портала на территории России, однако на август 2020 года ?Архив Интернета? по-прежнему продолжал свою работу[58][59][60][61].

В 2017 году портал был заблокирован в Индии и Кыргызстане за содержание ?экстремистских материалов?[62][63][64]. По данным на 2021 год, сайт заблокирован в Китае[65].

В июне 2022 года Таганский райсуд Москвы оштрафовал ?Архив Интернета? на 800 тыс. рублей за неудаление из WayBack Machine видео о способах изготовления коктейля Молотова[66].

Примечания

править
  1. 1 2 3 Arora, 2015.
  2. 1 2 3 4 5 Lerner, 2017, pp. 1741—1755.
  3. 1 2 3 4 5 Michael Bryant. What is the Wayback Machine and Why is it Useful? (англ.). Groovy Post (22 апреля 2021). Дата обращения: 29 мая 2021. Архивировано 18 мая 2021 года.
  4. 1 2 Wayback Machine (англ.). Wayback Machine. Дата обращения: 7 июня 2021.
  5. Заявление основателя сервиса о DDoS атаке. Twitter (X). Дата обращения: 10 октября 2024. Архивировано 9 октября 2024 года.
  6. Сервис отключен дабы сохранить данные. Twitter (X). Дата обращения: 10 октября 2024. Архивировано 24 декабря 2024 года.
  7. Данные после атаки повреждены не были. Twitter (X). Дата обращения: 11 октября 2024. Архивировано 22 октября 2024 года.
  8. Информация о сроках восстановления. Twitter (X). Дата обращения: 12 октября 2024. Архивировано 5 ноября 2024 года.
  9. Сервис частично восстановил работу. Twitter (X). Дата обращения: 18 октября 2024. Архивировано 4 ноября 2024 года.
  10. Jack Schofield. The Time Machine (англ.). The Guardian (19 ноября 2007). Дата обращения: 1 июня 2021. Архивировано 19 апреля 2021 года.
  11. Dominic Cummings: how the internet knows when you’ve updated your blog (англ.). The Conversation (28 мая 2020). Дата обращения: 3 июня 2021. Архивировано 25 июля 2021 года.
  12. 1 2 3 4 5 Odgen, 2017.
  13. In An Old Church, The Internet Archive Stores Our Digital History (англ.). Kalw. San Francisco local public radio (11 сентября 2019). Дата обращения: 3 июня 2021. Архивировано 6 мая 2021 года.
  14. 1 2 3 4 5 Price, 2011.
  15. 1 2 Jenni McKinnon. Using the Wayback Machine to Archive (and Backup) WordPress (англ.). WPMudev (25 мая 2017). Дата обращения: 29 мая 2021. Архивировано 13 апреля 2021 года.
  16. Adrienne LaFrance. Raiders of the Lost Web (англ.). The Atlantic (14 октября 2015). Дата обращения: 7 июня 2021. Архивировано 7 мая 2017 года.
  17. 1 2 3 Rogers, 2017, pp. 160—172.
  18. Hartelius, 2020, p. 378.
  19. 1 2 3 4 5 Bowyer, 2021, pp. 43—57.
  20. Aja Romano. A lawsuit is threatening the Internet Archive — but it’s not as dire as you may have heard (англ.). Vox (23 января 2020). Дата обращения: 29 мая 2021. Архивировано 18 августа 2021 года.
  21. 1 2 3 4 Kalev Leetaru. The Internet Archive Turns 20: A Behind The Scenes Look At Archiving The Web (англ.). Forbes (18 января 2016). Дата обращения: 5 июня 2021. Архивировано 15 августа 2021 года.
  22. 1 2 O'Connor, 2008, p. 64.
  23. michelle. Wayback Machine Hits 400,000,000,000! (англ.). Internet Archive (9 мая 2014). Дата обращения: 25 марта 2015. Архивировано 26 августа 2014 года.
  24. Richard Koman. How the Wayback Machine Works (англ.). Xml.com (21 января 2002). Дата обращения: 5 июня 2021. Архивировано 28 мая 2021 года.
  25. A. Rossi. Worldwide Web Crawls (англ.). Internet Archive (5 октября 2010). Дата обращения: 5 июня 2021.
  26. Laura Bohannon. Wayback Machine archives websites for over 20 years (англ.). Spartan News Room (7 декабря 2017). Дата обращения: 5 июня 2021. Архивировано 24 июня 2021 года.
  27. Maemura, 2018.
  28. Notess, 2002.
  29. 1 2 Mark Graham. Tips for Using the Internet Archive’s Wayback Machine in Your Next Investigation (англ.). Global Investigative Journalism Network (5 мая 2021). Дата обращения: 29 мая 2021. Архивировано 29 мая 2021 года.
  30. Zachary Crockett. Inside Wayback Machine, the internet’s time capsule (англ.). The Hustle (28 сентября 2018). Дата обращения: 29 мая 2021. Архивировано 2 октября 2018 года.
  31. Евгений Делюкин. Браузер Brave от сооснователя Mozilla стал предлагать копии из ?архива интернета? вместо удалённых веб-страниц (англ.). vc.ru (26 февраля 2020). Дата обращения: 1 июня 2021. Архивировано 24 июня 2021 года.
  32. Eltgroth, 2009.
  33. Kieren McCarthy. Archive.org's Wayback Machine is legit legal evidence, US appeals court judges rule (англ.). The Register (4 сентября 2018). Дата обращения: 4 июня 2021. Архивировано 2 июня 2021 года.
  34. Маргарита Сазонова. Электронные доказательства в спорах в сфере интеллектуальной собственности. Гарант (26 октября 2020). Дата обращения: 5 июня 2021. Архивировано 24 июня 2021 года.
  35. Pearce, 2009, p. 875.
  36. Milligan, 2016.
  37. Jeffrey Brainard. Dozens of scientific journals have vanished from the internet, and no one preserved them (англ.). Science (8 сентября 2020). Дата обращения: 1 июня 2021. Архивировано 15 октября 2020 года.
  38. Diana Kwon. More than 100 scientific journals have disappeared from the Internet (англ.). Nature (10 сентября 2020). Дата обращения: 1 июня 2021. Архивировано 3 октября 2020 года.
  39. avouner. Десятки научных журналов исчезли из интернета за последние 20 лет и никто их не сохранил. Хабр (10 сентября 2020). Дата обращения: 5 июня 2021. Архивировано 24 июня 2021 года.
  40. Camilla Hodgson. How the Internet Archive is waging war on misinformation (англ.). Financial Times (17 сентября 2019). Дата обращения: 3 июня 2021. Архивировано 28 июня 2021 года.
  41. Mary Kay Magistad. Where to find what's disappeared online, and a whole lot more: the Internet Archive (англ.). PRI.org (23 февраля 2017). Дата обращения: 7 июня 2021. Архивировано 28 марта 2017 года.
  42. Acker, 2020.
  43. Wayback Machine теперь проверяет информацию на достоверность для архивных веб-страниц. Trash Box (2 ноября 2020). Дата обращения: 5 июня 2021. Архивировано 24 июня 2021 года.
  44. Did the Wayback Machine Catch Russian-Backed Rebels Claiming Responsibility for Malaysian Airlines Flight MH17? (англ.). Open Culture (19 июля 2014). Дата обращения: 3 июня 2021. Архивировано 24 июня 2021 года.
  45. Jil Lepore. The Cobweb (англ.). New Yorker (19 января 2015). Дата обращения: 7 июня 2021. Архивировано 25 января 2015 года.
  46. Дамир Камалетдинов. В сеть попали секретные данные об американском ядерном оружии — военные записывали их в школьных приложениях (англ.). TJournal (30 мая 2021). Дата обращения: 5 июня 2021. Архивировано 24 июня 2021 года.
  47. Carolyn Wimbly Martin. Internet Archive’s Open Library and Copyright Law (англ.). Lutzker (15 мая 2020). Дата обращения: 4 июня 2021. Архивировано 24 июня 2021 года.
  48. Nate Anderson. Copy some webpages, owe more than the national debt (англ.). Ars Technica (1 мая 2011). Дата обращения: 5 июня 2021. Архивировано 24 июня 2021 года.
  49. Eric Bangeman. Internet Archive settles suit over Wayback Machine. Ars Technica (31 августа 2006). Дата обращения: 7 июня 2021. Архивировано 5 ноября 2007 года.
  50. Lisa M. Bowman. Net archive silences Scientology critic (англ.). CNET (24 сентября 2002). Дата обращения: 10 июня 2021. Архивировано 15 мая 2012 года.
  51. Ernest Miller. Features: Sherman, Set the Wayback Machine for Scientology (англ.). LawMeme (24 сентября 2002). Дата обращения: 10 июня 2021. Архивировано из оригинала 16 ноября 2012 года.
  52. Nora Caplan-Bricker. Preservation Acts (англ.). Harper's Magazine (декабрь 2018). Дата обращения: 2 июня 2021. Архивировано 5 мая 2021 года.
  53. Crudo, 2014.
  54. Mike Masnick. Russia Blocks The Internet Archive's Wayback Machine Over A Single Page (англ.). Tech dirt (26 июня 2015). Дата обращения: 3 июня 2021. Архивировано 4 июня 2021 года.
  55. Роскомнадзор заблокировал архив интернета из-за "Одиночного джихада". Московский комсомолец (25 июня 2015). Дата обращения: 5 июня 2021. Архивировано 24 июня 2021 года.
  56. Роскомнадзор заблокировал страницу ?архива интернета? за экстремизм. Lenta (25 июня 2015). Дата обращения: 5 июня 2021. Архивировано 22 сентября 2021 года.
  57. Дмитрий Шестоперов, Анастасия Евтушенко. ?Архив интернета? снова в сети. Газета.ru (18 апреля 2016). Дата обращения: 9 декабря 2021. Архивировано 3 мая 2021 года.
  58. АЗАПИ хочет навечно заблокировать ?Архив Интернета?. Роскомсвобода (22 августа 2019). Дата обращения: 5 июня 2021. Архивировано 4 июня 2021 года.
  59. ?Архив интернета? могут навечно заблокировать в России. CNews (23 августа 2019). Дата обращения: 7 июня 2021. Архивировано 24 июня 2021 года.
  60. Россияне потребовали запретить в Европе Telegram, YouTube и Mail.ru. CNews (19 августа 2020). Дата обращения: 7 июня 2021. Архивировано 24 июня 2021 года.
  61. Американские издатели книг подали в суд на Internet Archive. Ведомости (2 июня 2020). Дата обращения: 5 июня 2021. Архивировано 24 июня 2021 года.
  62. Access to Internet Archive’s Wayback Machine Blocked in India (англ.). The Wire (8 августа 2017). Дата обращения: 3 июня 2021. Архивировано 24 июня 2021 года.
  63. Wayback Machine has been blocked in India (англ.). The Verge (9 августа 2017). Дата обращения: 5 июня 2021. Архивировано 24 июня 2021 года.
  64. Kyrgyzstan Blocks Archive.org on ‘Extremism’ Grounds (англ.). Global Voices. Дата обращения: 5 июня 2021. Архивировано 18 мая 2021 года.
  65. Anna Kramer. The internet is splitting apart. The Internet Archive wants to save it all forever (англ.). Protocol (10 марта 2021). Дата обращения: 9 июня 2021. Архивировано 1 июня 2021 года.
  66. Машину времени увезли на штрафстоянку. Коммерсантъ (28 июня 2022). Дата обращения: 1 июля 2022.

Литература

править
  • Acker, A., & Chaiet, M. The weaponization of web archives: Data craft and COVID-19 publics. (англ.) // Harvard Kennedy School (HKS) Misinformation Review. — 2020. — doi:10.37016/mr-2020-41.
  • Anat Ben-David, Adam Amram. The Internet Archive and the socio-technical construction of historical facts (англ.) // Internet Histories. — 2018. — doi:10.1080/24701475.2018.1455412.
  • Arora S., Li Y., Youtie J., Shapira P. Using the wayback machine to mine websites in the social sciences: A methodological resource (англ.). — 2015. — Vol. 67, iss. 8. — P. 1904—1915. — doi:10.1002/asi.23503.
  • Bowyer S. The Wayback Machine: notes on a re?enchantment (англ.) // Archival Science. — 2021. — Vol. 21. — P. 43—57.
  • Deborah R. Eltgroth. Best Evidence and the Wayback Machine: Toward a Workable Authentication Standard for Archived Internet Evidence (англ.) // Fordham L. Rev.. — 2009. — Vol. 78, iss. 181.
  • Greg R. Notess. The Wayback Machine: The Web's Archive (англ.) // Online. — 2002. — Vol. 26, iss. 2.
  • Hartelius J. The anxious flaneur: Digital archiving and the Wayback Machine (англ.) // Quarterly Journal of Speech. — 2020. — Vol. 106, iss. 4. — P. 377—398.
  • James L. Quarles III and Richard A. Crudo. [Way]Back to the Future: Using the Wayback Machine in Patent Litigation (англ.) // Landslide. — 2014. — Vol. 6, iss. 3.
  • Lerner A., Kohno T., Roesner F. Rewriting History: Changing the Archived Web from the Present (англ.) // Association for Computing Machinery. — 2017. — doi:10.1145/3133956.3134042.
  • Maemura E., Worby N., Milligan I., Becker C. If These Crawls Could Talk: Studying and Documenting Web Archives Provenance (англ.) // Journal of the association for information science and technology. — 2018. — Vol. 69, iss. 10. — P. 1223—1233.
  • Milligan I. Lost in the Infinite Archive: The Promise and Pitfalls of Web Archives (англ.) // International Journal of Humanities and Arts Computing. — 2016.
  • Murphy J., Hashim N., O’Connor P. Take Me Back: Validating the Wayback Machine (англ.) // Journal of Computer-Mediated Communication. — 2008. — Iss. 13. — P. 60—75.
  • Odgen J., Halford S., Carr L. Observing Web Archives (англ.) // WebSci. — 2017. — P. 299—308.
  • Pearce D., Charlton B. Plagiarism of online material may be proven using the Internet Archive Wayback Machine (archive.org) (англ.) // Medical Hypothesis. — 2009. — P. 875.
  • Price. Internet Archiving – The Wayback machine (англ.) // MLA Commons. — 2011.
  • Phyllis Holman Weisbard. Oldies but Goodies: Archiving WebBased Information (англ.) // Feminist Collections. — 2011. — Vol. 32, iss. 2.
  • Rogers R. Doing Web history with the Internet Archive: screencast documentaries (англ.) // Internet Histories. — 2017. — Vol. 1, iss. 1—2. — P. 160—172. — doi:10.1080/24701475.2017.1307542.
过期茶叶有什么用途 痛风是什么意思 面基什么意思 出汗特别多是什么原因 天秤座跟什么星座最配
一天吃一个苹果有什么好处 猫为什么流眼泪 腰椎退行性变是什么意思 鸡眼长什么样子 策字五行属什么
淡奶油能做什么 血管炎是什么病 女孩月经不规律是什么原因 马蜂窝能治什么病 龙日冲狗要忌讳什么
早晚体重一样说明什么 左顾右盼的顾是什么意思 肝风内动是什么意思 易孕期是什么意思 秋刀鱼在中国叫什么鱼
孕妇做唐筛是检查什么hcv9jop2ns5r.cn 87属什么生肖bjhyzcsm.com 白带异味是什么原因hcv7jop5ns0r.cn 梦见把蛇打死了是什么意思hcv8jop0ns7r.cn 男人阳气不足有什么症状hcv8jop6ns0r.cn
卵巢保养最好的方法是什么hcv8jop4ns8r.cn 缺铁性贫血的人吃什么补血最快hcv8jop9ns5r.cn camp是什么hcv8jop1ns3r.cn 猫抓病是什么病hcv8jop5ns1r.cn 腰扭伤挂什么科hcv8jop5ns1r.cn
肺气不足吃什么中成药naasee.com 怀孕尿液是什么颜色hcv8jop9ns4r.cn 哪些动物的尾巴有什么作用hcv9jop3ns3r.cn omega3是什么hcv9jop1ns5r.cn 肺部结节是什么意思啊hcv7jop7ns1r.cn
羊水透声欠佳什么意思hcv8jop6ns9r.cn 雏形是什么意思hcv8jop6ns9r.cn 嘴巴右下角有痣代表什么huizhijixie.com 叶公好龙是什么生肖hcv9jop4ns3r.cn 排卵期过后是什么期hcv8jop4ns6r.cn
百度