Исключительно полезная база знаний по архивированию веба (по пре имущественно — личному): https://github.com/pirate/ArchiveBox/wiki/Web-Archiving-Community
Архив в Архиве: https://web.archive.org/web/20200111222928/https://github.com/pirate/ArchiveBox/wiki/Web-Archiving-Community
Признаюсь, нежно люблю Internet Archive и его Wayback Machine. Уже больше 20 лет они сохраняют «снимки» веб-сайтов, то есть если вам нужна история веба — вам сюда. Последние 10 лет они ещё собирают и книги, и новостное видео, и записи радио — всё, что может пригодится историкам и любопытствующим. Вебсайты ведь смертны. Каждый год «умирает» примерно 2% ссылок. Проект умер, хостинг закончился, всё. Или вебсайт кто-нибудь купил, всё переделал, старого контента не осталось.
http://booksinbrowsers.org/submit-your-proposal-vii/ Конференция Интернет-архива “Книги в браузерах” опять будет. 3-4 ноября 2016 в Сан-Франциско. Про короткие истории, не только книжные. Очень рекомендую.
Нужно ли сохранять цифровую информацию? Да! Можно ли это делать в России? Однозначного ответа на это нет.
Задача сохранения цифрового контента — для академических и исследовательских нужд, в качестве основы памяти о современности для потомков — предельна актуальна. Если ещё полвека назад культура наука и медиа существовали только в физической форме, то во втором десятилетии XXI века даже тот контент, который так или иначе привязан к физической форме, рано или поздно обретает цифровую форму и попадает в цифровую дистрибуцию в интернете.
Есть такой отличный писатель, Нил Стивенсон. И есть у него (как бы) исторический роман “Ртуть”. И был такой сайт, где читатели романа совокупно писали комментарии. И я даже этот сайт когда-то видел, и думал - вот крутизна какая - только индекс из нескольких сот вхождений.
Но в 2005 году, оказывается, если верить archive.org, сайт романа c красивым названием metaweb.com перешёл к компании, профилем которой стал Semantic Web. А потом компанию купил Google.
В нашей Отчизне сапожник оказался без сапог: стране, породившей лучшие в мире технологии распознавания языков, такие инструменты особо не нужны. «В России у нас был только один проект по оцифровке библиотечных фондов. Там требовалось распознавание русского языка XIX века, — замечает Григорий Липич. — Этот алфавит отличается от современного лишь несколькими символами, а вот поддержка более старых видов письма и алфавитов кириллицы пока даже не планируется». И это при том, что отечественные лингвисты продолжают защищать диссертации по старорусским текстам, которые явно пригодились бы в работе с архаичной кириллицей.
Некоммерческое Партнерство «ИнфоРост» занимается распространением и популяризацией инновационных Интернет технологий среди организаций культуры, науки и образования путем их обеспечения современными средствами по размещению цифровых коллекций и каталогов в свободный онлайн доступ для широкой аудитории Интернет пользователей.
via inforost.org
Internet Archive: A Future for Books – BookServer
The BookServer is a growing open architecture for vending and lending digital books over the Internet. Built on open catalog and open book formats, the BookServer model allows a wide network of publishers, booksellers, libraries, and even authors to make their catalogs of books available directly to readers through their laptops, phones, netbooks, or dedicated reading devices. BookServer facilitates pay transactions, borrowing books from libraries, and downloading free, publicly accessible books.
Ъ - Госдума цифруется на случай буквоедства
Сегодня Госдума в первом чтении должна рассмотреть поправки к закону “О библиотечном деле”, легализующие деятельность электронных библиотек. В целях “сохранности фондов” национальные библиотеки предлагается наделить правом оцифровывания книг, видеофильмов и других произведений, что позволит им создавать электронные копии документов без согласия авторов и без выплаты им вознаграждения <…>
“Издатели захотят зафиксировать защиту своего авторского права, и читатели будут оплачивать вот этот бесплатный доступ”,— прогнозирует гендиректор “Олма Медиа Групп” Дмитрий Иванов.