Project Gutenberg

редактировать
Электронная библиотека электронных книг

Project Gutenberg
Project Gutenberg logo.svg
Созданадекабрь 1971 г.; 48 лет назад (1971-12). (опубликован первый документ)
Коллекция
РазмерБолее 60000 документов
Веб-сайтДомашняя страница проекта Гутенберг

Проект Гутенберг (PG) - это добровольная попытка оцифровывать и архивировать культурные произведения, а также «поощрять создание и распространение электронных книг ». Она была основана в 1971 году американским писателем Майклом С. Хартом и является старейшей цифровой библиотекой. Большинство предметов в его коллекции - это полные тексты книг в общественном достоянии. Проект пытается сделать их как можно более бесплатными в долговременных, открытых форматах, которые можно использовать практически на любом компьютере. По состоянию на 20 мая 2020 года в коллекции бесплатных электронных книг Project Gutenberg было 62 108 элементов.

Релизы доступны в обычном тексте, но в других форматах, таких как HTML, PDF, EPUB, MOBI и Plucker включены везде, где это возможно. Большинство выпусков написаны на английском языке, но доступно и множество других работ. Есть несколько аффилированных проектов, которые предоставляют дополнительный контент, в том числе работы для конкретных регионов и языков. Project Gutenberg тесно связан с Distributed Proofreaders, интернет-сообществом для корректуры отсканированных текстов.

Содержание
  • 1 История
    • 1.1 Аффилированные организации
  • 2 Проект CD и DVD
  • 3 Объем коллекции
  • 4 Идеалы
  • 5 Авторские права
  • 6 Критика
  • 7 Аффилированные проекты
    • 7.1 Список аффилированных проектов
  • 8 См. также
  • 9 Ссылки
  • 10 Внешние ссылки
История
Майкл С. Харт (слева) и Грегори Ньюби (справа) из Project Gutenberg, 2006

Майкл С. Харт начал проект «Гутенберг» в 1971 году с оцифровки Декларации независимости США. Харт, студент Университета Иллинойса, получил доступ к Xerox Sigma V мэйнфрейм-компьютеру в лаборатории исследования материалов университета. Через дружелюбных операторов он получил аккаунт с практически неограниченным количеством компьютерного времени; его стоимость в то время по разным оценкам составляла 100 000 или 100 000 000 долларов. Харт объяснил, что хотел «вернуть» этот подарок, сделав что-то, что можно было бы считать очень ценным. Его первоначальная цель заключалась в том, чтобы к концу 20 века сделать 10 000 наиболее популярных книг доступными для широкой публики за небольшую плату или бесплатно.

Этот конкретный компьютер был одним из 15 узлов на ARPANET, компьютерная сеть, которая станет Интернетом. Харт полагал, что однажды широкая публика сможет получить доступ к компьютерам, и решил сделать литературные произведения доступными в электронной форме бесплатно. Он использовал копию Декларации независимости Соединенных Штатов в своем рюкзаке, и это стало первым электронным текстом проекта Гутенберг . Он назвал проект в честь Иоганна Гутенберга, немецкого печатника пятнадцатого века, который произвел революцию подвижного типа печатного станка.

К середине 1990-х Харт руководил проектом Гутенберг из бенедиктинского колледжа Иллинойса. К усилиям присоединились другие добровольцы. Он вручную вводил весь текст до 1989 года, когда сканеры изображений и программное обеспечение оптического распознавания символов улучшилось и стало более доступным, сделав сканирование книг более осуществимым. Позже Харт пришел к соглашению с Университетом Карнеги-Меллона, который согласился управлять финансами проекта Гутенберг. По мере того, как объем электронных текстов увеличивался, добровольцы начали брать на себя повседневные операции проекта, которыми руководил Харт.

Начиная с 2004 года, улучшенный онлайн-каталог упростил просмотр содержимого Project Gutenberg, доступ и гиперссылку. Сейчас проект Гутенберг обслуживается Ибиблио в Университете Северной Каролины в Чапел-Хилл.

Итальянский волонтер Пьетро Ди Мичели разработал и администрирует первый веб-сайт проекта Гутенберг и начал разработку онлайн-каталога проекта.. За десять лет работы в этой должности (1994–2004) веб-страницы проекта выиграли ряд наград, часто попадая в списки "лучших в Интернете" и способствуя популярности проекта.

Харт умер. 6 сентября 2011 года в своем доме в Урбане, штат Иллинойс, в возрасте 64 лет.

Аффилированные организации

В 2000 году некоммерческая корпорация, Project Gutenberg Literary Archive Foundation, Inc. была зарегистрирована в Миссисипи, США для удовлетворения юридических потребностей проекта. Пожертвования на него не облагаются налогом. Давний волонтер проекта Гутенберг Грегори Ньюби стал первым генеральным директором фонда.

. Также в 2000 году Чарльз Фрэнкс основал распределенные корректоры (DP), которые позволили распространять корректуру отсканированных текстов среди многих волонтеров через Интернет. Благодаря этим усилиям количество и разнообразие текстов, добавляемых в Project Gutenberg, увеличилось, а новым добровольцам стало проще начать вносить свой вклад. DP официально присоединилась к Project Gutenberg в 2002 году. По состоянию на 2018 год более 36 000 книг, предоставленных DP, составляли почти две трети из почти 60 000 книг в Project Gutenberg.

Проект CD и DVD

В августе 2003 года Project Gutenberg создал CD, содержащий примерно 600 «лучших» электронных книг из коллекции. Компакт-диск доступен для загрузки в виде ISO-образа. Когда пользователи не могут загрузить компакт-диск, они могут запросить бесплатную отправку копии.

В декабре 2003 г. был создан DVD, содержащий почти 10 000 элементов. В то время это представляла почти вся коллекция. В начале 2004 года DVD также стал доступен по почте.

В июле 2007 года было выпущено новое издание DVD, содержащее более 17 000 книг, а в апреле 2010 года был выпущен двухслойный DVD, содержащий почти 30 000 единиц.

Большинство DVD-дисков и все компакт-диски, отправленные по почте в рамках проекта, были записаны на записываемые носители добровольцами. Однако были изготовлены новые двухслойные DVD-диски, так как они оказались более экономичными, чем их записывать добровольцы. По состоянию на октябрь 2010 года проект разослал по почте около 40 000 дисков. По состоянию на 2017 год доставка бесплатных компакт-дисков была прекращена, хотя образ ISO все еще доступен для загрузки.

Объем коллекции
Рост публикаций Project Gutenberg с 1994 по 2015 год

По состоянию на август В 2015 году Project Gutenberg собрал более 60 000 предметов в свою коллекцию, и каждую неделю добавлялось в среднем более 50 новых электронных книг. Это, прежде всего, произведения литературы из западной культурной традиции. Помимо литературы, такой как романы, стихи, рассказы и драмы, в Project Gutenberg также есть поваренные книги, справочные материалы и выпуски периодических изданий. В коллекции Project Gutenberg также есть несколько нетекстовых элементов, таких как аудиофайлы и файлы с нотной записью.

Большинство выпусков на английском языке, но есть также значительное количество на многих других языках. По состоянию на апрель 2016 года наиболее широко представлены неанглийские языки: французский, немецкий, финский, голландский, итальянский и португальский.

По возможности, выпуски Gutenberg доступны в виде обычного текста, в основном используется кодировка символов US-ASCII , но часто расширяется до ISO-8859-1 (требуется для представления акцентированных символов на французском языке и Scharfes s на немецком например). Помимо отсутствия авторских прав, требование для текстовой версии релиза латиницей (набор символов ) было критерием Майкла Харта с момента основания Project Gutenberg, поскольку он считает это - это формат, который с наибольшей вероятностью станет читаемым в будущем. По необходимости этот критерий пришлось расширить для значительной коллекции текстов на восточноазиатских языках, таких как китайский и японский, которые теперь находятся в коллекции, где вместо этого используется UTF-8.

Другие форматы также могут быть выпущены, если они представлены добровольцами. Наиболее распространенным форматом, отличным от ASCII, является HTML, который позволяет включать разметку и иллюстрации. Некоторые участники и пользователи проекта запросили более продвинутые форматы, полагая, что их легче читать. Но некоторые форматы, которые нелегко редактировать, такие как PDF, обычно не считаются соответствующими целям Project Gutenberg. Также в Project Gutenberg есть два варианта основных форматов, которые могут быть отправлены (из которых создаются все остальные файлы): настроенные версии стандарта Text Encoding Initiative (с 2005 г.) и reStructuredText ( с 2011 года).

Начиная с 2009 года, каталог Project Gutenberg начал предлагать автоматически генерируемые альтернативные форматы файлов, включая HTML (если он еще не предоставлен), EPUB и plucker.

Идеалы

Майкл Харт сказал в 2004 году: «Миссия Project Gutenberg проста:« Поощрять создание и распространение электронных книг ». Его целью было «предоставить как можно больше электронных книг в как можно большем количестве форматов, чтобы весь мир мог читать на как можно большем количестве языков». Точно так же девиз проекта - «сломать прутья невежества и неграмотности», потому что его волонтеры стремятся продолжать распространять грамотность и ценить литературное наследие так же, как публичные библиотеки начали сделать в конце 19 века.

Проект Гутенберг намеренно децентрализован; не существует политики выбора, определяющей, какие тексты добавлять. Вместо этого отдельные волонтеры работают над тем, что им интересно или что им доступно. Коллекция Project Gutenberg предназначена для длительного хранения предметов, чтобы они не могли быть потеряны в результате какой-либо локальной аварии. Чтобы гарантировать это, вся коллекция регулярно копируется и зеркалируется на серверах в разных местах.

Авторские права

Project Gutenberg тщательно проверяет статус электронных книг согласно закону США об авторском праве. Материал добавляется в архив Project Gutenberg только после получения разрешения на авторские права, и записи этих разрешений сохраняются для использования в будущем. Project Gutenberg не претендует на новые авторские права на публикации, которые он публикует. Вместо этого он поощряет их бесплатное воспроизведение и распространение.

Большинство книг из коллекции Project Gutenberg распространяются как общественное достояние в соответствии с законом США об авторском праве. Есть также несколько текстов, защищенных авторским правом, таких как тексты научной фантастики автора Кори Доктороу, которые Project Gutenberg распространяет с разрешения. На них распространяются дополнительные ограничения, указанные правообладателем, хотя, как правило, они распространяются по лицензии Creative Commons.

«Project Gutenberg» является товарным знаком организации, и этот знак не может использоваться в коммерческих или модифицированных перераспределениях текстов общественного достояния из проекта. Если все ссылки на Project Gutenberg удалены, нет никаких юридических препятствий для перепродажи работ, находящихся в общественном достоянии, но участники Gutenberg подвергли сомнению целесообразность прямого и коммерческого повторного использования контента, отформатированного добровольцами. Были случаи, когда книги лишались ссылки на проект и продавались с целью получения прибыли в Kindle Store и других книжных магазинах, одним из которых была книга 1906 года «Ловушка лисы».

Веб-сайт недоступен. в пределах Германии на основании постановления суда С. Fischer Verlag относительно работ Генриха Манна, Томаса Манна и Альфреда Дёблина. Хотя они находились в открытом доступе в Соединенных Штатах, немецкий суд (региональный суд Франкфурта-на-Майне) признал нарушение авторских прав, все еще действующих в Германии, и заявил, что веб-сайт Project Gutenberg находится под юрисдикцией Германии, поскольку на нем размещается контент на немецком языке. язык и доступен в Германии. Это решение было подтверждено Апелляционным судом Франкфурта 30 апреля 2019 г. (11 U 27/18, доступно по адресу}). Апелляционный суд Франкфурта не дал разрешения на подачу апелляции в Федеральный суд (Bundesgerichtshof), однако, в Федеральный суд подано заявление о разрешении на подачу апелляции. По состоянию на 4 октября 2020 года это заявление все еще находилось на рассмотрении (Федеральный суд I ZR 97/19).

Критика

Текстовые файлы используют формат обычного текста, закодированного в UTF-8 и заключенного в 65–70 символов, с абзацами, разделенными двойным разрывом строки. В последние десятилетия в результате относительно мягкий внешний вид и отсутствие возможности разметки часто воспринимались как недостаток этого формата. Project Gutenberg пытается решить эту проблему, делая многие тексты доступными также в версиях HTML, ePub и PDF, но при этом сохраняя миссию предложения данные, которые легко обрабатывать с помощью компьютерного кода, простой текст ASCII remai ns самый важный формат; версии ePub по-прежнему содержат дополнительные разрывы строк между абзацами, а автоматически сгенерированные версии HTML представляют собой просто текст ASCII между тегами <pre >. Другой некоммерческий проект, Стандартные электронные книги, направлен на решение этих проблем с помощью своей коллекции отформатированных и стилизованных названий общественного достояния. Он исправляет проблемы, связанные с дизайном и типографикой.

В декабре 1994 года проект Гутенберг подвергся критике со стороны Text Encoding Initiative за то, что он не включил документацию или обсуждение решений, неизбежных при подготовке текста, или в некоторых случаях отсутствие документального подтверждения того, какая из нескольких (конфликтующих) версий текста была оцифрована.

Выбор доступных произведений (и редакций) определялся их популярностью, простотой сканирования, отсутствием авторских прав и других факторов; Этого было бы трудно избежать в любом краудсорсинговом проекте.

В марте 2004 года Майкл Харт и Джон С. Гуальярдо начали инициативу по предоставлению недорогой интеллектуальной собственности. Первоначальное название этого проекта было Project Gutenberg 2 (PG II), что вызвало споры среди добровольцев PG из-за повторного использования товарного знака проекта для коммерческого предприятия.

Аффилированные проекты

Все дочерние проекты являются независимыми организациями, которые разделяют одни и те же идеалы и получили разрешение на использование торговой марки Project Gutenberg. Они часто имеют определенную национальную или языковую направленность.

Список аффилированных проектов

  • Project Gutenberg Australia содержит множество текстов, которые являются общественным достоянием в соответствии с австралийским законом об авторском праве, но все же под авторским правом (или с неопределенным статусом) в Соединенных Штатах, с акцентом на австралийских писателей и книги об Австралии.
  • Project Gutenberg Canada.
  • Консорциумный центр Project Gutenberg специализируется на коллекциях коллекций. Они не имеют редакционного надзора или согласованного форматирования, как в основном Project Gutenberg. Показаны тематические коллекции, а также множество языков.
  • Projekt Gutenberg-DE заявляет об авторских правах на свой продукт и ограничивает доступ к просматриваемым веб-версиям своих текстов.
  • Project Gutenberg Europe запущен Автор Project Rastko в Сербии. Он нацелен на то, чтобы стать проектом Gutenberg для всей Европы, и начал публиковать проекты в 2005 году. Он использует программное обеспечение Distributed Proofreaders для быстрого создания текстов.
  • Project Gutenberg в Люксембурге в основном публикует, но не книги, написанные исключительно на люксембургском.
  • языке Projekti Lönnrot, начатом волонтерами финского проекта Gutenberg, получили свое название от финского филолога Элиаса Лённрота (1802–1884)
  • Проект «Гутенберг» из Филиппин направлен на «сделать как можно больше книг доступным как можно большему количеству людей, с особым акцентом на филиппинском и филиппинском языках».
  • Проект Gutenberg Russia (Рутенберг) направлен на сбор книг в общественном достоянии на славянских языках, в частности на русском. Обсуждение проекта и его юридической стороны началось в апреле 2012 года. Слово «Рутенберг» представляет собой сочетание слов «Россия» и «Гутенберг».
  • Самопубликационная пресса проекта Гутенберг, также известная как Консорциумный центр проекта Гутенберг. В отличие от самого проекта Gutenberg, Project Gutenberg Self-Publishing позволяет отправлять тексты, никогда ранее не публиковавшиеся, в том числе самостоятельно изданные электронные книги. Запущенный в 2012 году, он также владеет доменом "gutenberg.us".
  • Проект Gutenberg из Тайваня направлен на архивирование книг, свободных от авторских прав, с особым акцентом на Тайване на английском, китайском и тайваньских языках. Это специальный проект Forumosa.com
См. Также
Ссылки
Внешние ссылки
Слушайте эту статью Разговорный значок Википедии Этот аудиофайл был создан на основе редакции этой статьи от 23 июля 2007 г. и не отражает последующих правок. ()
Последняя правка сделана 2021-06-02 07:57:56
Содержание доступно по лицензии CC BY-SA 3.0 (если не указано иное).
Обратная связь: support@alphapedia.ru
Соглашение
О проекте