Почему не может быть российского archive.org

2013-12-05 (Last Modified: 2022-05-11)

Нужно ли сохранять цифровую информацию? Да! Можно ли это делать в России? Однозначного ответа на это нет.

Задача сохранения цифрового контента — для академических и исследовательских нужд, в качестве основы памяти о современности для потомков — предельна актуальна. Если ещё полвека назад культура наука и медиа существовали только в физической форме, то во втором десятилетии XXI века даже тот контент, который так или иначе привязан к физической форме, рано или поздно обретает цифровую форму и попадает в цифровую дистрибуцию в интернете.

Если Россия и осталась в лидерах хоть в чём-то, то в интернете. В Рунете 5 млн 865 тыс доменов верхнего уровня, включая зоны .ru, .su и .рф. Это 9-е место в мире по числу доменов. Месячная аудитория российского сегмента интернета, по данным ФОМ, летом 2013 года, составила более 67 млн человек, став самой большой среди европейских стран. 67 мл. — это примерно 2,4% мирового населения интернета. При этом на русский язык приходится 6% сайтов Всемирной паутины.

Если верить оценкам экспертов, то ориентировочно можно оценить общий объём информации за всю историю Рунета, которая могла бы быть интересна нашим потомкам, как минимум, в 1 зеттабайт (триллион гигабайтов). Есть что сохранять. Мы не знаем, что будет именно им интересно, и какую пользу из этого океана информации они смогут извлечь. Но, судя по тому, как развивается методология big data, смогут извлечь многое. И мы должны постараться это сохранить. Сможем ли? Это вопрос не только технический (как обустроить российский «Архив интернета») или экономический (сколько это будет стоить), но и юридический.

«Архив интернета» (The Internet Archive) вспоминается неслучайно. Этот институт и предоставляемые им сервисы является своего рода образцом того, как может — на совершенно общественных началах — вырасти крайне востребованный ресурс. По данным Alexa в мировом рейтинге самых посещаемых сайтов archive.org находится где-то между сайтом Forbes и Skype. Примечательно, что рейтинг «Архива интернет», бóльшая часть посетителей которого приходит, что логично, из США, примерно одинаковый и в США, и в России, что указывает на актуальность сервиса «истории интернета» и для современных российских пользователей.

«Архив интернета» занимается сохранением цифровой информации по двум направлениям — сохранением цифровых реплик (то есть цифровых копий книг, музыки, телетрансляций и даже компьютерных программ) и веб-харвестингом (то есть сбором и архивированием веб-страниц вместе с «историей» их изменения, делая доступными даже те из них, которые давно исчезли из сети).

В каких юридических рамках существует «Архив интернета»? В плане сохранения цифровых копий — в пределах public domain, которое, как ни странно, значительно шире в США, чем в России, поскольку разные виды контента, созданные в разное время, в Америке подлежат разным срокам охраны (мы как-то всё время забываем, что международные соглашения по авторскому праву подписаны США с рядом исключением, среди которых неполное расширение сроков охраны до требуемых, к примеру Бернской конвенцией и ВТО). И кроме того, обширная категория контента, создание которого финансируется государством, то есть налогоплательщиками, автоматически становится общественным достоянием. Именно поэтому, например, в «Архиве интернета» можно найти около полутора миллионов видеофайлов, более 5,5 млн текстов, почти 2 млн аудиозаписей, 48 тысяч программ. Что касается веб-харвестинга, то, поскольку он является всего лишь автоматическим копированием тех веб-страниц, которые доступны для широкой публики (при этом администраторы веб-ресурсов всегда могут запретить автоматическое копированием соответствующей настройкой веб-серверов), на него распространяется принцип добросовестного использования, а также положения, установленные DMCA, который предполагает, помимо всего прочего, досудебную процедуру урегулирования проблем, связанных с авторским правом (проще говоря — «не хотите, чтобы ваш материал был опубликован, сообщите об этом, и мы уберём»). Результат? 368 миллиардов сохраненных веб-страниц. В том числе на русском языке.

Что же в России? О суженной (причём задним числом) сферы общественного достояния см. выше. Переводить созданные за счёт государства, то есть, в конечном итоге, за наш с вами и наших предков счёт произведения в сферу общественного достояния государство не собирается. Поэтому до создания полноценного архива цифровых реплик культурных объектов, созданных в XX веке, наверное, доживут только наши внуки.

Ещё более сложна, однако, ситуация с публичным веб-харвестингом. Согласно ст. 1270 ГК РФ и воспроизведение, в том числе в электронном виде, за исключением кэширования, и доведение до всеобщего сведения относится к числу исключительных прав автора. Более того, ни один из допускаемых законом случаев свободного использования произведения (ст. 1273–1280) не может быть использован для легализации такого использования публичных веб-ресурсов, за исключением, пожалуй, материалов СМИ, использование которых прямо не запрещено их владельцами, а также речей политиков. Некоторым шатким основанием может быть положение п. 1 ст. 1274: «цитирование в оригинале и в переводе в научных, полемических, критических или информационных целях правомерно обнародованных произведений в объеме, оправданном целью цитирования». Согласитесь, довольно хлипкая база для серьезной работы. Укрепить ее могла бы п.1 ст. 1253 об информационных посредниках, который снимает с них ответственность за передачу информации третьими лицами при соблюдении некоторых условий. Однако доказывать, что архив интернета является информационным посредником, боюсь, придётся в суде.

Что в итоге? Архива российского интернета нет. Даже те поправки в 4-ю часть ГК, которые уже внесены в Госдуму и когда-нибудь наконец-то будут ею рассмотрены, ситуации не изменят. А значит такого архива в ближайшее время и не будет. В России. Но заглянуть в историю российского интернета можно, но нужно обращаться по адресу американской некоммерческой организации The Internet Archive.