The Million Book Project (или Universal Библиотека ) - это проект по оцифровке книг, который в 2007–2008 годах возглавлял Университет Карнеги-Меллона Школа компьютерных наук и университетские библиотеки. Работая с правительством и партнерами по исследованиям в Индии (Цифровая библиотека Индии ) и Китае, проект сканировал книги на многих языках, используя OCR для включения полнотекстового поиска и предоставления свободного доступа к книгам в Интернете. По состоянию на 2007 год они завершили сканирование 1 миллиона книг и сделали весь каталог доступным в Интернете.
Проект «Миллион книг» был благотворительной организацией 501 (c) 3 с различными центрами сканирования по всему миру.
К декабрю 2007 года было отсканировано более 1,5 миллиона книг на 20 языках: 970 000 на китайском; 360 000 на английском языке; 50 000 на телугу ; и 40 000 на арабском языке. Большинство книг находятся в общественном достоянии, но было получено разрешение на включение более 60 000 книг, защищенных авторским правом (примерно 53 000 на английском и 7 000 на индийских языках). Книги частично дублируются на сайтах в Индии, Китае, Карнеги-Меллон, Internet Archive, Bibliotheca Alexandrina. Не все книги, которые были отсканированы к настоящему времени, еще не доступны в Интернете, и ни на одном сайте нет копий всех книг, доступных в Интернете.
Проект миллиона книг был «доказательством концепции», который в значительной степени был заменен проектами HathiTrust, Поиском книг Google и сканированием книг Интернет-архивом.
В Интернет-архиве могут быть книги, которых нет у Google (например: Стихи Роберта Фроста, опубликованные после конца 1922 года).
Национальный научный фонд ( NSF) присудил Карнеги-Меллону 3,63 миллиона долларов в течение четырех лет на оборудование и административные поездки для проекта «Миллион книг». Индия ежегодно выделяла 25 миллионов долларов на поддержку исследовательских проектов по языковому переводу. Министерство образования Китая выделило 8,46 миллиона долларов на три года. Интернет-архив предоставил оборудование, персонал и деньги. Библиотека Мерсед Калифорнийского университета, профинансировала работу, чтобы получить разрешение на авторские права от издателей США.
Программа завершилась в 2008 году.
Учреждения в Китае, которые участвуют в этом проекте, включают:
Учреждения в Индии, которые являются участниками этого проекта, включают:
Учреждения в США, которые являются участниками, включают:
Учреждения в ЕС, которые являются участниками, включают: