YAGF
YAGF est une interface graphique (nécessite la bibliothèque Qt4) pour les outils de reconnaissance cuneiform et tesseract.
Pré-requis
- Disposer des droits d'administration,
- Disposer d'une connexion à Internet configurée et activée,
Installation
Pour installer ce logiciel, il suffit d'installer le paquet yagf.
Utilisation
Lancez l'application en faisant une recherche dans votre tableau de bord avec le mot clé "YAGF".
Configuration
Aller dans le menu Édition → Réglages → OCR et langues et choisir le moteur OCR (dans Engine OCR) : cuneiform ou tesseract.
Désinstallation
Pour supprimer cette application, il suffit de supprimer son paquet.
Problèmes connus
Yagf plante à l'ouverture d'un fichier
Pour éviter que Yagf plante à l'ouverture d'un ficher aller dans le menu Édition → Réglages → Traitement des images et décochez la caser Recadrer les images lors de l'ouverture des fichiers.
Si vous ne voyez pas cette option pensez à déplacer la barre inférieure de la fenêtre. La case Traitement des images est après celle sur OCR et langues.
Faire fonctionner YAGF avec tessseract
- Dans les paramètres de YAGF, pour le moteur OCR Tesseract, on choisit le dossier :
/usr/share/tesseract-ocr/4.00 qui contient d'ailleurs le sous dossier tessdata
pour « L’accès aux données de tesseract »
- Si le moteur de reconnaissance est paramétré à tesseract,
aucune reconnaissance ne démarre et j'ai un message d'erreur tesseract lié à la langue :
"Vous avez choisi reconnaissant Française langue à l'aide tesseract OCR. Actuellement, les données pour cette langue n'est pas installé sur votre système. S'il vous plaît installer les fichiers de données de tesseract pour \"fra\" de votre référentiel système."
- Pour contourner cette erreur :
Initialement, dans le dossier /usr/share/tesseract-ocr/4.00, on trouve un sous-dossier tessdata qui contient les cinq fichiers suivants :
deu.traineddata
eng.traineddata
fra.traineddata
osd.traineddata
pdf.ttf
Il faut les copier, en mode administrateur, dans le dossier /usr/share/tesseract-ocr/4.00
YAGF plante si le correcteur orthographique est sélectionné et si les langues du correcteur ne sont pas installés
- Si la case "Vérifier l'orthographe", c'est à dire le bouton "abc", est activé, les mots éventuellement mal orthographiés ou reconnus sont affichés
- Pour ce faire, le fichier de langue Aspell correspondant est nécessaire ; s'il n'existe pas, un message d'erreur sera affiché, ou même le programme plante sans qu'un message d'erreur n'apparaisse.
- Il faut donc vérifier, par Synaptic par exemple, qu’aspell, aspell-fr, aspell-de, aspell-en sont bien installés si l'on veut vérifier les langues française, allemande et anglaise.