Nous recrutons: Tu es un IT qui souhaite travailler en Node, Python, Serverless et Cloud dans l'IA ?
logiciel-OCR

Les logiciels OCR : Acteurs de l’intelligence artificielle

Blog / Intelligence artificielle

Les logiciels OCR : Acteurs de l’intelligence artificielle

La technologie OCR* aussi appelée reconnaissance optique de caractères en français, permet à tout un chacun de convertir un document papier ou numérisé en un fichier texte éditable. On parle alors de dématérialisation de documents. Et ce, en vous réduisant la tâche pénible et chronophage qu’est la saisie manuelle. Dans notre article nous avons décidé d’une part, de vous en dire un peu plus sur le sujet. Et d’autre part, de vous lister les logiciels OCR les plus utilisés et ceux que vous ne connaissez peut être pas encore. 

*Optical Character Recognition en anglais

 

Le fonctionnement d’un OCR

Avant de vous délivrer un document type Word qui est exploitable et modifiable, un système OCR passe par différentes étapes. Là où un scanneur, ne fera que dématérialiser l’image ou le document, un OCR va collecter et traiter les informations de ces mêmes sources. 

Pour ce faire, il analyse tout d’abord la structure du document. Et ce, en séparant les différentes composantes de l’image (ou document) telles que les tableaux, les textes, les photographies etc. À la suite de cela, grâce à des procédés de machine learning, le système étudie les couleurs noires et blanches du document qui seront interprétées étant comme des lignes. Ces dernières seront à leur tour converties en caractères puis en mots (donc en texte). 

Une fois la conversion en texte terminée, l’OCR compare son texte avec des anciennes données déjà traitées ou prédéfinies. Cette étape permet au logiciel de proposer une signification des caractères convertis. Ce n’est qu’à la suite de ces hypothèses que le système OCR va proposer un contenu éditable et similaire au document d’origine.

Pourquoi utiliser un OCR et non un scanneur ?

Les sceptiques des nouvelles technologies, vous diront que leur bon vieux scanneur peut être tout aussi performant qu’un OCR. Cependant, ils n’ont pas tout à fait raison et nous allons vous le prouver au travers de ce cas.  

Prenons l’exemple d’une conversion de contrat envoyé par mail en format PDF. Un scanneur va se contenter de faire un “copier/coller” de votre document sur un autre format (souvent PNG ou JPEG). L’utilisation de cet outil ne permet pas d’extraire les informations pertinentes du contrat pour les reporter sur un format adéquat et modifiable.

Pour véritablement exploiter le document et afin d’en ressortir les informations importantes, il vous faut un logiciel OCR. Ce dernier reconnaîtra les lettres, les mots et les phrases.  Vous pourrez ainsi modifier des termes du contrat ou vous pourrez même le signer électroniquement. Chose, qu’un scanneur ne vous aurait pas permis.

.

 

Notre top 5 des logiciels OCR

Maintenant que vous avez une meilleure appréhension des OCR, nous avons décidé de vous lister 5 OCR qui pourraient vous être utiles.

1 – Google Vision OCR

Google vision est une API OCR développée par Google Cloud. Cet OCR utilise une technologie de machine learning très performante et pré-entraînée. Grâce à Google Vision il est possible d’attribuer des étiquettes à des images, de lire du texte aussi bien imprimé que manuscrit. Vous pouvez aussi détecter et extraire des objets, des visages tout en obtenant d’autres informations sur ces derniers telles que leur position dans l’image.

Google vision OCR

2 – AWS Textract

Amazon Textract est un logiciel OCR qui extrait automatiquement un texte et ses données depuis un document scanné, afin de le convertir en document exploitable. Cependant, AWS Textract va plus loin qu’un simple OCR. En effet, au-delà du travail de lecture et de retranscription, il va également identifier le contenu des formulaires ainsi que des informations stockées dans vos tableaux.

AWS Textract

3 – OCR Space

A la différence de certains logiciels de reconnaissance optique de caractères, OCR Space est entièrement en ligne. La simplicité et la rapidité de la plateforme ont déjà séduit beaucoup d’entre nous. De plus, il possède des explications très claires et précises sur la même page qui vous accompagne tout au long du processus. Ainsi, vous aurez l’opportunité de transformer votre dossier depuis un PDF ou un URL et ce, de manière simple, rapide et efficace. 

OCR Space

4 – Azure API Vision

Azure API vision est une API OCR développée par le groupe Microsoft. Cette API se focalise essentiellement sur les images. Il va convertir un document format PNG ou JPEG en différentes données. Vous pouvez ainsi retrouver une fiche caractéristique de votre image où figure des catégories telles que : objet; mots-clés; description; format; couleurs etc. Par ailleurs, cet OCR va vous permettre d’identifier et d’étiqueter le contenu. Vous pouvez par exemple utiliser l’outil “détection d’objet” afin de localiser un objet dans une image. 

Azure Vision OCR

5 – Pdefelement 6

Ce logiciel d’OCR permet comme ses concurrents la conversion d’images ou de documents PDF en document Word, Excel mais aussi HTML ou Texte. Le tout dans une dizaine de langues différentes. Vous pouvez surligner du texte, ajouter des commentaires, modifier une image de manière sécurisée. De plus, PdFelement 6 est capable de d’autoriser la modification des formulaires numérisés, mais aussi d’exporter des données numérisées au format CSV*.

*CSV : Format Texte

PDFelement 6 screenshot

Ces logiciels OCR que vous ne connaissez peut être pas

Maintenant que vous connaissez les principaux OCR, nous avons décidé de vous présenter 3 logiciels encore méconnus par certains. Spécialisés pour une action ou non, ils peuvent vous être bien plus utiles que ce que vous pensez.

  .Taggun

Cette jeune entreprise, fondée en 2017, a développé sa propre API OCR. Tout comme Azure API, Taggun a décidé de spécialiser son OCR. Ainsi, dès lors que vous avez un besoin de retranscription en matière de note de frais, vous pouvez compter sur eux. Leurs maîtres-mots : précision et rapidité. Avec 52 langues dans leur base de données, il retranscrivent votre reçu en moins de 30 secondes. 

Site web Taggun

 

  .Rossum

Spécialiste en OCR en ticket de caisse mais aussi reçu et facture, Rossum met l’intelligence artificielle au coeur de son activité depuis quelques années maintenant. Toute la stratégie de Rossum se base sur les connexions et réseaux. Leur objectif est de faire en sorte que l’ordinateur pense comme un humain. 

Là où un logiciel d’OCR traditionnel retranscrit une facture, sur un autre format, Rossum, étant un OCR de haut niveau, la restructure dans un premier temps. Et dans un second temps il va utiliser le machine learning. Ce procédé lui permet ainsi d’interroger votre document pour vous émettre des hypothèses sur son contenu.  

Par ailleurs, a contrario de certains de ses concurrents, qui séparent la structure d’un document de son contenu, l’OCR Rossum restructure votre document. Ils vont “reconstruire” votre document en gardant sa forme et son contenu, sans toucher au format du document.

Rossum

  .OCR Mobile

Cette entreprise fondée en 2012 a développé son propre OCR optimisée aussi bien sur smartphone que sur serveur. Ces derniers font de l’acquisition d’image avec smartphone leur principale force. OCR Mobile peut extraire des informations provenant de reçu (ou facture), de passeport, de CNI mais aussi d’une carte grise par exemple ou encore d’un RIB. Tous ces documents pouvant bien évidemment être pris en photo depuis un smartphone.

OCR Mobile