IA (Intelligence Artificielle) est un terme à la mode actuellement. Par définition, l'IA peut inclure plusieurs méthodes, mais séparable grosso-modo en méthodes statistiques (Machine Learning, Deep Learning, ...) et méthodes empirique (moteur de règles).

Une idée fausse très répandue consiste à considérer que l'Intelligence Artificielle = Machine Learning ou Deep Learning.

Suite aux progrès majeurs de ces techniques récemment, la conception et l'implémentation d'une vraie application comme le traitement automatique des factures en utilisant l'IA consiste bien à choisir, combiner, adapter pas une mais plusieurs techniques parmi les statistiques ainsi que les empiriques

Méthodes  statistiques

Un peu de théorie pour mieux comprendre pourquoi cette combinaison est nécessaire.
Les méthodes statistiques utilisent un algorithme permettant de prédire un phénomène ou un comportement en observant les données. Cette technique peut donner les résultats spectaculaires dans des domaines précis dont on a beaucoup entendu parler comme le dépassement l'humain par l'Intelligence Artificielle dans les jeux, l'assistance médicale, la voiture intelligente ...

@copyright Philippe Geluck
La statistique prédictive 

Méthodes empiriques

De l'autre côté, les méthodes empiriques travaillent sur des faits (par exemple des caractères particuliers dans une facture), puis manipulent l'information de manière utile (par exemple la reconnaissance des factures particulières, des fournisseurs particuliers, etc.)

@copyright Philippe Geluck
Règle inductive

Good Bad Ugly

Ce schéma résume approximativement les avantages et les inconvénients de chacune de ces deux méthodes.

Comparaison statistique vs empirique

Cependant, chacune de ces méthodes ont des conditions pour fonctionner. Le point d'entrée de statistiques est les données. L'absence de données adéquates ou pas assez de données sont est souvent le frein pour l'usage de ce méthode. Même avec un volume de données important, si l'algorithme ne permet pas la convergence, la prédiction ne sera possible.

Même avec les conditions de données remplies, le choix d'un bon algorithme avec bon tunning parmi la jungle des paramètres possibles (le modèle NLP GPT3 a 145 millards de paramètres) est vraiment un savoir-faire unique de nos data scientistes.

L'autre côté, l'approche par règle semble facile à appliquer, surtout au début d'un projet. Des simples "Si/Alors" peuvent être facilement implémentés en repérant des faits particuliers dans les échantillons. Parmi les pièges connus, on tombera dans une situation "Facile à démarrer, mais difficile à finir" une fois dans une vrai phrase de production.

Vers une combinaison en évolution permanente

Le processus de traitement des factures est complexe et comporte plusieurs étapes. Le choix de technique dans chacune des étapes se pose constamment et évolue selon la qualité des retours et les conditions imposées. Dans certains cas, nous utilisons une méthode statistique pour couvrir la majorité des cas et une empirique pour les cas particuliers afin d'obtenir une meilleure performance. Même la proportion de ces 2 méthodes peut évoluer, s'auto-perfectionner en fonction des mesures observées en permanence et retours des clients.

Conciliator Expert possède dans son éco système avec plusieurs méthodes. Le cocktail unique de ces méthodes que nous avons créé permet de reconnaitre automatiquement plusieurs informations dans la facture et affecter automatiquement des comptes comptables (charges, TVA, analytique) des lignes de facture.