Numeriblog Google Workspace AppSheet AppSheet : Lecture OCR d’une image

AppSheet : Lecture OCR d’une image

Saviez-vous qu’AppSheet propose une fonctionnalité qui permet d’extraire le texte présent sur une image ? Cette fonctionnalité s’appelle la lecture OCR – Reconnaissance Optique de Caractères en français. Les usages potentiels de cette fonction sont […]

personnes ont consulté cet article

2 minutes

Rédigé par Mathieu D'Hondt - il y a 2 semaines

Ce que vous allez découvrir

  • Configurer un jeu de données d'entraînement
  • Accéder à la fonctionnalité OCR dans AppSheet
  • Utilité de l'OCR dans une application

AppSheet : Lecture OCR d’une image

Saviez-vous qu’AppSheet propose une fonctionnalité qui permet d’extraire le texte présent sur une image ? Cette fonctionnalité s’appelle la lecture OCR – Reconnaissance Optique de Caractères en français. Les usages potentiels de cette fonction sont nombreux en entreprise avec entre autres la lecture de factures, de bons de livraison, de tickets, etc.

L’idée de cet article est de voir comment entraîner un modèle OCR dans AppSheet pour lui permettre de préremplir des champs de données à partir d’une image.

Configurer un jeu de données d’entraînement

Avant de créer notre premier modèle OCR, il est nécessaire de pouvoir l’entraîner avec des exemples ! En effet AppSheet est capable de lire les éléments d’une image et surtout de les interpréter pour inscrire les données dans les bonnes colonnes de notre jeu de données.

Dans cet article, considérons une application simpliste avec une seule table « registre » et les colonnes présentées ci-dessous :

Base de données

Les données déjà existantes vont servir à alimenter notre modèle OCR. Il est à noter que cet échantillon de données est le strict minimum pour permettre au modèle de fonctionner. Plus l’échantillon fourni est conséquent et plus le modèle est entraîné et donc efficace.

Accéder à la fonctionnalité OCR dans AppSheet

La fonctionnalité de reconnaissance OCR est appelée dans AppSheet « OCR MODELS » et cet élément est disponible dans le menu « Intelligence » de l’éditeur. Pour créer un nouveau modèle OCR, il vous suffit de suivre les deux étapes présentées sur l’illustration ci-dessous :

Nouveau modèle OCR

l’interface de création apparaît et nous propose les éléments présentés ci-dessous :

AppSheet : interface de création

on retrouve dans l’ordre :

  • Name : Le nom de notre modèle (à noter que le changer ultérieurement peut générer des problèmes) ;
  • Table : La table de données qui contient les données d’entraînement ;
  • Image Column : La colonne de type « Image » et qui contient donc les images d’entraînement ;
  • Output Columns : Les différentes colonnes qui correspondent aux données à retrouver sur les images.

Une fois ces champs remplis comme ci-dessus, nous sauvegardons ce modèle. La sauvegarde de ce nouveau modèle va déclencher instantanément son apprentissage. En effet celui-ci va analyser les différentes images fournies dans notre jeu de données test pour identifier les éléments listés dans « Output Columns ».

Après l’apprentissage, un nouvel élément apparaît dans les paramètres de notre modèle, en dessous de « Output Columns », ce nouvel élément est « Patterns » :

AppSheet : patterns

Les patterns correspondent au résultat de l’apprentissage. Pour chaque entrée de données, un pattern indique les éléments détectés et à quel emplacement.

Ici les images fournies sont de mauvaise qualité et les textes sont manuscrits. Ce scénario est l’un des pires et malgré cela, le modèle a su identifier les bribes d’information visées. Jugez par vous-même sur un pattern ci-dessous.

AppSheet surligne automatiquement les éléments détectés avec le nom de la colonne associée
AppSheet surligne automatiquement les éléments détectés avec le nom de la colonne associée

Utilité de l’OCR dans une application

Passons à la finalité du modèle OCR. En effet une fois celui-ci entraîné, il permet de remplir automatiquement les champs qu’il détecte.

Dans ce petit exemple d’application, nous allons insérer de nouvelles données dans notre table « registre ». AppSheet propose par défaut une action permettant l’ajout d’un nouveau registre, cette action ouvre un formulaire sur lequel on retrouve toutes les colonnes d’un registre, aussi bien le nom et le prix que l’image.

L’animation ci-dessous montre que l’ajout de l’image permet – après quelques instants – de remplir les champs avec les valeurs récupérées.

AppSheet : ajout de l'image

Conclusion

En cas d’erreur de lecture de la part de l’OCR, il est bien évidemment possible de corriger manuellement la saisie. Cet outil peut être très performant sur des cas d’utilisation beaucoup plus structurés que celui de cet article. Par exemple sur la lecture de ticket standardisée type ticket de transport, où chaque information est à une place précise et écrite noir sur blanc sans ambiguïté possible.

Chez Numericoach nous réalisons des applications AppSheet sur-mesure pour répondre aux besoins de nos clients. Toutes ces applications n’utilisent pas forcément la lecture OCR et il nous reste encore beaucoup de super fonctionnalités AppSheet à vous présenter. À bientôt !

Besoin d'un peu plus d'aide sur App Sheet ?

Des formateurs sont disponibles toute l'année pour vous accompagner et optimiser votre utilisation de App Sheet, que ce soit pour votre entreprise ou pour vos besoins personnels !

Découvrir nos formations App Sheet

Rédacteur

Photo de profil de l'auteur
Mathieu D'Hondt

Consultant Google Workspace et Développeur chez Numericoach

S’abonner
Notification pour
guest
0 Commentaires
Commentaires en ligne
Afficher tous les commentaires