Pour traiter les données comptables à partir des factures, le processus d'extraction de données est une étape primordiale. La qualité du traitement décide de la qualité d'affectation finale. Ce processus est complexe et nécessite plein de technologies différentes, qui se rapproche d'un processus d'extraction d'or.

Pour résumer ce processus, on peut le voir sous l'angle de production de chacune de ces étapes : de données brutes (factures en papier) jusqu'au gain final prestigieux, les écritures comptables.

Vous allez constater, à travers chaque étape, que les données se transforment de la quantité vers la qualité, et peuvent même être  enrichies grâce aux données externes.

1. Entrée

C'est la porte d'entrée dans n'importe quel système de dématérialisation connu. Il s'agit de vos connecteurs d'entrées (email, SFTP, http, ...) ou de votre application smartphone permettant de scanner directement vos factures sous plusieurs formats différents. Cette étape convertit vos factures papier en fichiers images stockables et transformables par un système informatique.
Elle est en général extensible dynamiquement pour être capable de recevoir des centaines de milliers de fichiers en quelques minutes, 24h/24 et 7j/7.
Malgré l'attention et le  soin apporté lors de l'envoi, il est possible qu'il reste des problèmes : fichiers scannés avec des pages manquantes, fichiers ou pages parasites introduites dans le lot envoyé, images capturées avec trop de bruit, qualité de l'image, etc.

Cette première étape va donc permettre d'obtenir des fichiers de bonne qualité pour le traitement ultérieur

2. OCR

La technique d'OCR (Reconnaissance Optique de Caractères) n'est pas une nouveauté. Cette étape convertit vos fichiers scannés en un flux de caractères non structuré. En l'état, vos données sont des textes bruts, encore difficiles à exploiter.

L'OCR reconnait les caractères contenus dans vos documents

3. La détection du document

Dans notre objectif ultime, c'est la facture qu'il faut trouver parmi les données textuelles produites par l'OCR lors de la phase précédente. Il faut donc identifier l'unité de document parmi ces textes, découper automatiquement plusieurs factures envoyées regroupées dans un seul lot, voire mieux, reconnaitre son type : facture manuscrite, facturette, facture particulière, facture de vente ou d'achat, etc.

Un autre cas particulier est à gérer : le document n'est pas une facture. Dans ce cas inutile de le traiter, il suffit de le ranger dans la bonne banette.

Lors de cette étape, nous pouvons également détecter si le document a déjà été envoyé pour éviter un traitement en double.

La détection du document découpe le fichier reçu en documents indépendants auto porteurs.

4. Restitution

Cette étape est fascinante et complexe. Il s'agit de reconstruire les informations qui paraissent évidentes pour un humain : les fournisseurs, les montants, les numéros de factures et ainsi que les lignes des factures...

Cette étape se compose de plusieurs technologies de statistique, empiriques et humaines et s'auto-perfectionne en permanence. On peut même utiliser des sources de données externes pour enrichir les données, comme par exemple, consulter la base des sociétés SIREN pour mieux identifier les fournisseurs mentionnés dans vos factures.

À l'issue de cette étape, vos données sont structurées en champs, et exploitables, par exemple pour l'affectation comptable automatique.

5. Vérification

Malgré nos efforts et la capacité d'apprentissage de notre reconnaissance des factures, il reste encore des erreurs. L'exigence de qualité de la saisie comptable, ainsi que l'affectation comptable par les experts-comptables nous obligent à mettre en place plusieurs contrôles, à différents niveaux pour s'assurer que 100% des factures sont traitées correctement. Ces contrôles sont capables de renvoyer les factures à l'étape précédente dans le processus si nécessaire.

La vérification est une étape indispensable de tout process de digitalisation pour en assurer la qualité. C'est une des raisons majeures de la nécessité de lire les lignes d'une facture.

6. Final : l'export

Vos données sont maintenant analysées, traitées, enrichies, structurées, donc prêtes à être exportées dans votre système comptable (IsaCompta, Sage, Quadra, ...) sous forme de l'écriture demandée.

L'extraction de l'or de la masse de cailloux est terminée !