L'informatique

3 lecteurs PDF gratuits pour Windows avec fonctions de reconnaissance de caractères OCR

Il existe de nombreux programmes qui fonctionnent localement ou via Internet qui se concentrent sur le traitement des fichiers bureautiques populaires au format PDF, mais ceux qui incluent également d’autres fonctions supplémentaires qui augmentent leur polyvalence, comme c’est le cas, seront toujours appréciés.

C’est pourquoi dans ces lignes nous allons parler de trois programmes dont la fonction principale est de lire les PDF susmentionnés , tous gratuitement, mais qui incluent également une fonction de reconnaissance de caractères , OCR, dans Windows . Par conséquent et grâce à eux, nous aurons la possibilité de lire le contenu de ces fichiers, ainsi que d’extraire le texte des pages du fichier d’entrée grâce à la fonction OCR intégrée.

Supposons que la plupart de ces programmes soient compatibles avec les documents PDF de plusieurs pages et que nous pouvons en même temps utiliser d’autres fonctions telles que la conversion de PDF en TIFF , l’extraction de pièces jointes , l’extraction de texte d’images pour le sauvegarder sous forme de texte brut, etc.

Lecteurs de fichiers PDF avec fonction OCR intégrée

Outil multifonction ByteScout PDF

ByteScout PDF Multitool est un logiciel multifonctionnel gratuit à usage non commercial qui nous offre divers outils intéressants pour le travail de bureau . Par exemple, nous pouvons extraire automatiquement les tableaux des PDF chargés, extraire les fichiers joints, optimiser le document, convertir du PDF en TIFF, etc. En même temps, il dispose d’une fonction de reconnaissance de caractères (OCR) qui fonctionne très bien.

Grâce à cette fonctionnalité ajoutée, nous pourrons extraire le texte des fichiers avec un aperçu qui sera utile pour voir si le processus a été bien fait, ce qui ne se produit pas toujours.

FreeOCR

Dans ce cas, nous allons parler d’un autre outil similaire, FreeOCR , qui est également un logiciel très utile qui nous aidera à lire les fichiers PDF et à effectuer la reconnaissance de texte grâce à sa fonction OCR . Il nous offre une interface très simple à utiliser où vous pouvez ajouter le PDF et lire son contenu sur les différentes pages qui le composent. En même temps, il nous offre un bouton pour démarrer le processus de reconnaissance OCR qui nous permettra de ne traiter que la page en cours, ou toutes. Par la suite, le fichier de sortie est visible depuis l’ interface du logicielafin de vérifier le texte extrait puis de l’enregistrer sous forme de fichier TXT .

gImageReader

Et enfin nous allons parler de l’application gImageReader , un puissant lecteur PDF open source qui intègre également sa propre fonction OCR et qui peut nous aider à effectuer cette reconnaissance de caractères dans des images dans des formats tels que GIF , JPG , BMP , ICO , etc. . Disons qu’il a deux options pour utiliser la fonction de reconnaissance, puisque nous pouvons extraire du texte d’un PDF et l’enregistrer en tant que fichier texte, ou nous pouvons enregistrer un PDF de sortie avec le texte reconnaissable .

Bien sûr, dans ce cas, nous devons garder à l’esprit que si nous traitons les PDF susmentionnés, nous ne pouvons travailler qu’avec ceux qui contiennent une seule page, car ils ne sont pas compatibles avec les PDF multi-pages .

Articles Similaires

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Botón volver arriba