YAGF

YAGF est une interface graphique (nécessite la bibliothèque Qt4) pour les outils de reconnaissance cuneiform et tesseract.

Pour installer ce logiciel, il suffit d'installer le paquet yagf.

Lancez l'application en faisant une recherche dans votre tableau de bord avec le mot clé "YAGF".

Aller dans le menu Édition → Réglages → OCR et langues et choisir le moteur OCR (dans Engine OCR) : cuneiform ou tesseract.

Pour supprimer cette application, il suffit de supprimer son paquet.

Yagf plante à l'ouverture d'un fichier

Pour éviter que Yagf plante à l'ouverture d'un ficher aller dans le menu Édition → Réglages → Traitement des images et décochez la caser Recadrer les images lors de l'ouverture des fichiers.
Si vous ne voyez pas cette option pensez à déplacer la barre inférieure de la fenêtre. La case Traitement des images est après celle sur OCR et langues.

Faire fonctionner YAGF avec tessseract

  • Dans les paramètres de YAGF, pour le moteur OCR Tesseract, on choisit le dossier :

/usr/share/tesseract-ocr/4.00 qui contient d'ailleurs le sous dossier tessdata
pour « L’accès aux données de tesseract »

  • Si le moteur de reconnaissance est paramétré à tesseract,

aucune reconnaissance ne démarre et j'ai un message d'erreur tesseract lié à la langue : "Vous avez choisi reconnaissant Française langue à l'aide tesseract OCR. Actuellement, les données pour cette langue n'est pas installé sur votre système. S'il vous plaît installer les fichiers de données de tesseract pour \"fra\" de votre référentiel système."

  • Pour contourner cette erreur :

Initialement, dans le dossier /usr/share/tesseract-ocr/4.00, on trouve un sous-dossier tessdata qui contient les cinq fichiers suivants :
deu.traineddata
eng.traineddata
fra.traineddata
osd.traineddata
pdf.ttf

Il faut les copier, en mode administrateur, dans le dossier /usr/share/tesseract-ocr/4.00

YAGF fonctionne alors avec tesseract

YAGF plante si le correcteur orthographique est sélectionné et si les langues du correcteur ne sont pas installés

  • Si la case "Vérifier l'orthographe", c'est à dire le bouton "abc", est activé, les mots éventuellement mal orthographiés ou reconnus sont affichés
  • Pour ce faire, le fichier de langue Aspell correspondant est nécessaire ; s'il n'existe pas, un message d'erreur sera affiché, ou même le programme plante sans qu'un message d'erreur n'apparaisse.
  • Il faut donc vérifier, par Synaptic par exemple, qu’aspell, aspell-fr, aspell-de, aspell-en sont bien installés si l'on veut vérifier les langues française, allemande et anglaise.

Contributeur principal : buvi85, L'Africain.

  • yagf.txt
  • Dernière modification: Le 03/07/2019, 19:00
  • (modification externe)