Новый амбициозный проект перевода тысяч редких исторических документов Библиотеки конгресса США в цифровой вид с помощью GNU/Linux и Open Source призван сохранить всеобщее достояние, пока оно не обветшало окончательно.
Финансовую поддержку акции "Оцифровка американских документов в Библиотеке конгресса" оказала организация Sloan Foundation. По словам Брюстера Кале из Internet Archive (крупного архива, который в свое время полностью отказался от Windows, перейдя на платформу GNU/Linux), занимающегося разработкой технологии оцифровки, программное обеспечение с открытым кодом (Open Source) сыграет "абсолютно критическую" роль в реализации проекта.
В качестве главного программного инструмента будет использоваться Scribe: "Scribe - это система сканирования, которая снимает высококачественные изображения с книг и проводит над ними ряд операций, распознает текст и сжимает так, что на выходе вы получаете красивые печатные версии книг, для которых появляется функция поиска [подразумеваются файловые форматы документов PDF и DjVu]", - пояснил Кале. Для манипуляции картинками используются различные Open Source-утилиты, среди которых, например, netpbm и ImageMagick.
Доктор Джереми Адамсон, директор по коллекциям и сервисам Библиотеки конгресса США, объяснил выбор Scribe для данного проекта тем, что Internet Archive, использующий в своей работе подобное Open Source-решение, уже продемонстрировал "эффективное производство высококачественных изображений" с его помощью.