Конвертер pdf2htmlEX — отличный инструмент для преобразования документов PDF в нормальные HTML-страницы, с сохранением форматирования. Конвертер на удивление хорошо справляется с разными документами, включая научные статьи, журналы, формулы и прочее.
Несколько примеров в качестве демонстрации.
- Типографика (LaTeX): HTML / PDF
- Шпаргалка (математически формулы): HTML / PDF
- Научная статья (текст и графики): HTML / PDF
- Журнал Full Circle (для Linux-сообщества): HTML / PDF
- Руководство Git: HTML / PDF
- Можно попробовать конвертер на своих файлах
Конвертер старается бережно сохранить шрифты из PDF-документа и генерирует статичную страницу вполне приемлемого размера, примерно такого же, как оригинальный PDF-файл.
Код конвертера опубликован на github под GPLv3, его можно использовать в своих проектах. Например, можно сделать опцию предварительного просмотра PDF на сайте, пригодится для просмотра газет, журналов, книг, резюме и прочей информации, которую в интернете часто публикуют в формате PDF. Более того, теперь можно создавать полноценные веб-страницы прямо в математическом редакторе LaTeX!
Сравнение pdf2htmlEX с другими методами преобразования PDF в вебе см. здесь.