Новый амбициозный проект перевода тысяч редких исторических документов Библиотеки конгресса США в цифровой вид с помощью GNU/Linux и Open Source призван сохранить всеобщее достояние, пока оно не обветшало окончательно.

Финансовую поддержку акции "Оцифровка американских документов в Библиотеке конгресса" оказала организация Sloan Foundation. По словам Брюстера Кале из Internet Archive (крупного архива, который в свое время полностью отказался от Windows, перейдя на платформу GNU/Linux), занимающегося разработкой технологии оцифровки, программное обеспечение с открытым кодом (Open Source) сыграет "абсолютно критическую" роль в реализации проекта.

В качестве главного программного инструмента будет использоваться Scribe: "Scribe - это система сканирования, которая снимает высококачественные изображения с книг и проводит над ними ряд операций, распознает текст и сжимает так, что на выходе вы получаете красивые печатные версии книг, для которых появляется функция поиска [подразумеваются файловые форматы документов PDF и DjVu]", - пояснил Кале. Для манипуляции картинками используются различные Open Source-утилиты, среди которых, например, netpbm и ImageMagick.

Доктор Джереми Адамсон, директор по коллекциям и сервисам Библиотеки конгресса США, объяснил выбор Scribe для данного проекта тем, что Internet Archive, использующий в своей работе подобное Open Source-решение, уже продемонстрировал "эффективное производство высококачественных изображений" с его помощью.

  • Подпишись на наc в Telegram!

    Только важные новости и лучшие статьи

    Подписаться

  • Подписаться
    Уведомить о
    0 комментариев
    Межтекстовые Отзывы
    Посмотреть все комментарии