Retour

Optimiser sa gestion documentaire grâce à un logiciel OCR

En entreprise et dans sa vie privée, les documents circulent de plus en plus souvent sous format numérique. On y voit un moyen sûr d’avoir un suivi du document, mais aussi une méthode pour préserver la planète en évitant d’utiliser du papier. En revanche, ces documents dématérialisés ne sont généralement pas modifiables, sauf en utilisant un logiciel OCR (optical character recognition).

Qu’est-ce qu’un logiciel OCR ?

À quoi sert-il ?

Un logiciel OCR est un programme utilisé pour rendre un fichier numérique non modifiable en un fichier bureautique sur lequel il est ensuite possible d’apporter des modifications.

Le fichier PDF, format favori en entreprise, en est l’exemple par excellence. Ce type de fichier n’est pas modifiable en l’état. Il peut être paraphé ou signé, mais il reste impossible d’insérer du texte, ou simplement de corriger une faute d’orthographe. Un logiciel OCR vous permet de le convertir au format Word, Excel, ou autre, afin de pouvoir lui apporter toutes les modifications nécessaires.

Comment fonctionne-t-il ?

Un logiciel OCR est équipé d’un système de reconnaissance optique des caractères plus ou moins performant qui permet de détecter les caractères alphanumériques dans un document pour ensuite les transposer dans un autre format. Plus le système est perfectionné, plus il sera capable de détecter de polices et de langues. Vous obtiendrez un résultat satisfaisant, fidèle au contenu original. À l’inverse, un logiciel peu perfectionné sera limité et risque de vous faire perdre du temps en ne comprenant pas tout le texte et en le reproduisant qu’à moitié.

Ses avantages d’utilisation

Les fichiers au format figé sont particulièrement intéressants à exploiter, car ils se présentent de la même façon sur tous les ordinateurs. Le fait de pouvoir les modifier grâce à un logiciel OCR offre des avantages intéressants : + facilitation de la manipulation des informations + extraction et saisie de donnée plus rapide en cas de besoin de réutiliser des informations pour un autre document + décodage des textes scannés ou imprimés apportant une aide précieuse aux personnes malvoyantes

Top 3 des solutions OCR gratuites

FreeOCR

FreeOCR est un logiciel gratuit qui se télécharge sans avoir besoin de s’enregistrer. Très léger, ce logiciel dispose des fonctionnalités de base pour la reconnaissance optique. Il supporte les images JPG, GIF, BMP de TIFF, ou PDF avec du texte multi colonne et peut travailler dans plus de 30 langues.

Cependant, il ne garantit pas le formatage du texte et peut avoir du mal avec les polices écrites trop petites. Aussi, il traite uniquement les images inférieures à 2 Mo et de moins de 5 000 pixels. Disponible sur PC uniquement.

SimpleOCR

SimpleOCR est un logiciel à télécharger. Il permet de transformer un document scanné en un format TXT ou RTF. Il respecte la mise en page du fichier d’origine, ce qui s’avère pratique s’il s’agit simplement de lui apporter des petites corrections.

Grâce à son dictionnaire de plus de 120 000 mots, SimpleOCR est plutôt performant et offre un document de sortie plutôt fiable au contenu de base, ne nécessitant que peu de retouches. D’autre part, si la qualité du document scanné n’est pas suffisante, le logiciel se charge lui-même de l’améliorer pour en tirer le maximum. Disponible sur PC uniquement.

I2OCR

i2OCR est un logiciel en ligne qui fonctionne sans enregistrement préalable. Assez perfectionné, il est capable de reconnaître jusqu’à 60 langues. Il peut travailler sur des documents aux formats PNG, JPG, BMP, PBM, TIF, PBM, PGM ou depuis l’URL d’une image pour les convertir au format text, RTF ou Word.

Ce qui est appréciable avec I2OCR, c’est qu’après traitement, le fichier source et le fichier de sortie sont affichés côte à côte, ce qui permet de visualiser rapidement les différences. Ainsi, il est plus simple d’apporter les retouches nécessaires. Même s’il s’agit d’une solution en ligne, celle-ci est parfaitement sécurisée puisque le serveur supprime automatiquement les fichiers de sa base de données une heure après le traitement.

Top 3 des solutions OCR payantes

Abbyy finereader

Abbyy finereader est un logiciel sous licence qui combine des fonctionnalités de conversion de documents, de gestion de PDF, mais aussi de comparaison de documents. Ce logiciel reconnu est capable de travailler dans 189 langues avec un taux d’erreur autour de 1 %.

Tarif : 199 € pour la version qui permet de modifier, commenter et convertir. 299 € pour la version complète qui permet également de comparer des documents et d’automatiser la conversion de 5 000 pages/mois. Disponible sur PC et Mac.

Nitro Pro

Nitro Pro est un logiciel flexible qui offre de nombreuses possibilités. Il permet de convertir des fichiers de PDF à Word, Excel ou PowerPoint et vice-versa, et met à votre disposition une large gamme d’outils pour créer et modifier des fichiers papiers scannés.

Nitro Pro peut aussi convertir un email ainsi que ses fichiers attachés directement en un seul PDF. Il permet aussi de compiler plusieurs documents en un seul afin de simplifier le partage.

Tarif : à partir de 191 €/utilisateur selon les fonctionnalités souscrites. Il est possible d’essayer le logiciel pendant 2 semaines gratuitement avant de souscrire. Disponible uniquement sur PC.

PDFelement

PDFelement est un logiciel sur licence qui permet de convertir un PDF dans d’autres formats éditables comme Word, Excel, PPT, TXT. Très performant, ce logiciel est doté de nombreuses fonctionnalités. Parmi les plus importantes, on note la possibilité d’éditer les textes ou images d’un PDF, de remplir en formulaire, mais aussi d’annoter un PDF ou encore de le couper, le tourner ou d’en extraire des parties.

En bref, c’est un logiciel multi tâche, mais qui ne fonctionne que pour les PDF. Il analyse et retranscrit de manière très fiable les langues les plus couramment écrites dans le monde et permet de modifier la mise en forme du texte. Il permet également de convertir plusieurs fichiers en même temps, et d’en sécuriser l’accès avec un mot de passe.

Tarif : 89,95 € pour 1 ordinateur, 169,11 € pour 2 à 10 ordinateurs, 890,51 € pour 11 à 20 ordinateurs. Avant d’acheter le logiciel, il est possible de le tester pendant 14 jours gratuitement. Disponible sur PC et Mac.

Les solutions pour rendre des fichiers figés modifiables sont nombreuses. Il s’agit de déterminer quel logiciel OCR sera le plus approprié selon vos besoins et votre budget. Si vous ne travaillez que sur des PDF, inutile d’investir dans un logiciel coûteux qui peut travailler sur tous les formats d’images.

Ces articles peuvent vous intéresser