Poppler-utils
Poppler-utils est un paquet logiciel fournissant un ensemble d'utilitaires en ligne de commande. Il s'appuie sur Poppler qui est une bibliothèque de rendu PDF fondée sur l'afficheur PDF Xpdf. Ces utilitaires permettent notamment d'extraire du texte ou des images d'un fichier PDF pour obtenir en retour des fichiers au format texte (TXT) ou HTML.
Les utilitaires fournis sont :
Installation
Poppler-utils est installé par défaut.
Si toutefois ce n'était pas le cas sur votre système, cette application ne nécessitant pas de pré-requis, il suffira d'installer le paquet poppler-utils
Utilisation
L'option -h permet d'afficher une liste des paramètres disponibles pour chaque utilitaire.
Par exemple pour lister les options de l'outil pdftotext saisissez dans un terminal la commande suivante:
pdftotext -h
Extraction de texte
pdftotext fichier.pdf fichier.txt
Extraction d'images
pdfimages fichier.pdf /chemin/ouksé/bien
PDF vers HTML
pdftohtml fichier.pdf fichier.html
Une page dédiée à pdftohtml existe sur le wiki.
PDF vers Postscript
pdftops fichier.pdf
Obtenir les infos d'un fichier PDF
pdfinfo fichier.pdf
Obtenir des infos sur les fonts
pdffonts fichier.pdf
Désinstallation
Si Evince utilise Poppler pour le rendu des fichiers PDF1) sans dépendre pour autant de poppler-utils, d'autres logiciels comme le serveur d'impression CUPS dépendent de ce paquet ! Il n'est donc pas conseillé de le supprimer d'autant qu'il n'occupe que très peu d'espace disque.