Репост из: Системный Блокъ
Проект Гутенберг: от тысячи книг до электронного собрания
#digitalheritage
Project Gutenberg — это собрание бесплатных электронных книг. Проект появился в июле 1971 года и постоянно пополняется, благодаря десяткам тысяч добровольцев, которые оцифровывают, вычитывают и выкладывают книги на портал, поэтому сейчас для скачивания доступно более 60 тыс. книг. Ядро проекта — изданные до 1924 года произведения с истекшими авторскими правами.
Библиотека проекта включает в себя три раздела. В разделе «Легкая литература» можно найти детские произведения и притчи для семейного чтения, в «Тяжелой литературе» — религиозные документы и сочинения классиков, а в «Ссылках» — альманахи, энциклопедии, словари и справочники. Издания представлены в разных форматах и на 50 языках.
История проекта
Автор проекта — Майкл Харт, студент университета Иллинойса, которому друзья из лаборатории исследования материалов предоставили счет с «компьютерным временем» на 100 млн долларов. В то время вычислительные мощности дата-центров были в десятки раз меньше, чем в смартфоне, и распределялись по часам. 4 июля Харт перевел «Декларацию независимости» в электронную форму, а друзья уговорили его разместить текст в свободном доступе. Файл скачало 6 человек, и Project Gutenberg «родился».
В течение первых двадцати лет Харт лично оцифровал сто текстов и набрал сотни волонтеров. Для них в октябре 2000 года Чарльз Фрэнкс, коллега Харта, основал веб-сайт Distributed Proofreaders. Здесь корректоры-волонтеры выбирают книги для вычитки и координируют работу между собой.
Философия проекта
Майкл Харт опирался на концепцию «технологии репликатора». Ее суть в том, что каждый человек может получить копию материалов, которые когда-либо появлялись в сети. Project Gutenberg создавался, чтобы «поощрять, создавать и распространять больше бесплатных электронных книг» и «разрушать преграды невежества и неграмотности».
Изначально проект задумывался как общественное достояние. Создатели также подчеркивают, что проект является чисто волонтерским, не стремится к перфекционизму и не зависит от какой-либо финансовой или политической власти.
Подход к оцифровке
Project Gutenberg не просто сканирует книги, а переводит их в цифровой формат. После сканирования издание распознают, затем дважды вычитывают два разных человека и вносят правки. Distributed Proofreaders позволяет нескольким корректорам работать над одной книгой одновременно, каждая правка читается на разных страницах. При плохом состоянии оригинала текст вносят в компьютер вручную.
Большинство книг оцифровано в формате Plain Text, поэтому их легко читать на любом устройстве или программном обеспечении, а также копировать, индексировать, искать, анализировать и сравнивать. Пользователи также могут менять шрифт, размер символов или фон текста, поля или количество строк на странице.
Смежные проекты
У Project Gutenberg есть много партнеров и филиалов.
— Project Gutenberg-DE сосредоточен на немецкой литературе.
— Project Runeberg занимается литературой скандинавских стран.
— Project Gutenberg of Australia — австралийский филиал проекта.
— Project Gutenberg of Canada специализируется на канадской литературе на английском и французском языках. Помимо него существует канадский список Эндрю Слая, где хранятся книги авторов, которые переехали в Канаду или жили в других местах. А проект Канадского института исторических микропродукций состоит из отсканированных страниц из ранней канадской литературы.
— ClassicalArchives.com — интернет-архив с записями классической музыки в разных форматах.
— На Librivox.org и LiteralSystems хранятся аудиокниги и другие материалы в аудиоформатах.
— В интернет-архиве Project Gutenberg хранятся резервные копии первых книг.
https://sysblok.ru/digital-heritage/proekt-gutenberg-ot-tysjachi-knig-do-jelektronnogo-sobranija/
Варвара Гузий
#digitalheritage
Project Gutenberg — это собрание бесплатных электронных книг. Проект появился в июле 1971 года и постоянно пополняется, благодаря десяткам тысяч добровольцев, которые оцифровывают, вычитывают и выкладывают книги на портал, поэтому сейчас для скачивания доступно более 60 тыс. книг. Ядро проекта — изданные до 1924 года произведения с истекшими авторскими правами.
Библиотека проекта включает в себя три раздела. В разделе «Легкая литература» можно найти детские произведения и притчи для семейного чтения, в «Тяжелой литературе» — религиозные документы и сочинения классиков, а в «Ссылках» — альманахи, энциклопедии, словари и справочники. Издания представлены в разных форматах и на 50 языках.
История проекта
Автор проекта — Майкл Харт, студент университета Иллинойса, которому друзья из лаборатории исследования материалов предоставили счет с «компьютерным временем» на 100 млн долларов. В то время вычислительные мощности дата-центров были в десятки раз меньше, чем в смартфоне, и распределялись по часам. 4 июля Харт перевел «Декларацию независимости» в электронную форму, а друзья уговорили его разместить текст в свободном доступе. Файл скачало 6 человек, и Project Gutenberg «родился».
В течение первых двадцати лет Харт лично оцифровал сто текстов и набрал сотни волонтеров. Для них в октябре 2000 года Чарльз Фрэнкс, коллега Харта, основал веб-сайт Distributed Proofreaders. Здесь корректоры-волонтеры выбирают книги для вычитки и координируют работу между собой.
Философия проекта
Майкл Харт опирался на концепцию «технологии репликатора». Ее суть в том, что каждый человек может получить копию материалов, которые когда-либо появлялись в сети. Project Gutenberg создавался, чтобы «поощрять, создавать и распространять больше бесплатных электронных книг» и «разрушать преграды невежества и неграмотности».
Изначально проект задумывался как общественное достояние. Создатели также подчеркивают, что проект является чисто волонтерским, не стремится к перфекционизму и не зависит от какой-либо финансовой или политической власти.
Подход к оцифровке
Project Gutenberg не просто сканирует книги, а переводит их в цифровой формат. После сканирования издание распознают, затем дважды вычитывают два разных человека и вносят правки. Distributed Proofreaders позволяет нескольким корректорам работать над одной книгой одновременно, каждая правка читается на разных страницах. При плохом состоянии оригинала текст вносят в компьютер вручную.
Большинство книг оцифровано в формате Plain Text, поэтому их легко читать на любом устройстве или программном обеспечении, а также копировать, индексировать, искать, анализировать и сравнивать. Пользователи также могут менять шрифт, размер символов или фон текста, поля или количество строк на странице.
Смежные проекты
У Project Gutenberg есть много партнеров и филиалов.
— Project Gutenberg-DE сосредоточен на немецкой литературе.
— Project Runeberg занимается литературой скандинавских стран.
— Project Gutenberg of Australia — австралийский филиал проекта.
— Project Gutenberg of Canada специализируется на канадской литературе на английском и французском языках. Помимо него существует канадский список Эндрю Слая, где хранятся книги авторов, которые переехали в Канаду или жили в других местах. А проект Канадского института исторических микропродукций состоит из отсканированных страниц из ранней канадской литературы.
— ClassicalArchives.com — интернет-архив с записями классической музыки в разных форматах.
— На Librivox.org и LiteralSystems хранятся аудиокниги и другие материалы в аудиоформатах.
— В интернет-архиве Project Gutenberg хранятся резервные копии первых книг.
https://sysblok.ru/digital-heritage/proekt-gutenberg-ot-tysjachi-knig-do-jelektronnogo-sobranija/
Варвара Гузий