Transformation digitale
La transformation digitale à l'ère de l'intelligence artificielle
La transformation digitale est un élément clé de la performance des entreprises. Avec l'IA, c'est même un formidable accélérateur. Quels enjeux...
docTeller + ITESOFT : une nouvelle offre de remédiation KYC.
ITESOFT a décroché la dernière version de la certification ISO 27001:2022
Logiciel de facturation obligatoire: Comment évaluer les PDP ?
Base M+, une IA pour lutter contre la fraude documentaire
Sommaire
Réseaux de neurones, Machine Learning, Deep Learning, … Les algorithmes d’Intelligence Artificielle (I.A.) sont aujourd’hui omniprésents dans notre quotidien ! Couplés au big data -alimenté par notre monde désormais hyper connecté - ils semblent pouvoir révolutionner tous les domaines : celui de la santé, du commerce, de l’art ou même de la politique internationale comme l'a récemment titré Le Monde (1). Mais quid de l’intelligence artificielle et de l’automatisation des processus documentaires ? Quelles applications ? Mythe ou réalité ? On fait le point !
On pourrait croire que l’I.A. est un concept du 21eme siècle. Il n’en est rien ! Lorsque l’on parle I.A., nous avons tous en tête des innovations récentes telles que la Google Car roulant sans pilote mais capable d’évoluer sans encombre en plein centre-ville. Ce que l’on sait moins c’est que l’histoire de l’I.A. remonte aux années 50 avec Alan Turing, considéré comme le précurseur de l’I.A. et connu pour son fameux « test de Turing » (2), l’une des premières expériences en matière d’Intelligence Artificielle de l’histoire.
Plus près de nous – mais il y a 20 ans tout de même (1997) - Deep Blue, le super-ordinateur d’IBM battait pour la première fois le champion du monde d’échecs, Garry Kasparov. Mais il faudra attendre 2016, pour qu’AlphaGo, l'algorithme d'I.A. de Google DeepMind batte le champion Coréen de Go - jeu plus complexe que les échecs dont le nombre de combinaisons possibles serait supérieur au nombre d’atomes dans l’univers. Dernier retentissement en date en octobre 2017 : une nouvelle version d’AlphaGo nommée AlphaGo Zero devient 100% autodidacte. Cette fois l’IA n’apprend qu’en jouant contre elle-même, plus aucune supervision humaine n’est nécessaire pour réussir à battre en 1 mois seulement le meilleur joueur de GO. En presque 70 ans, l’I.A. n’a cessé de progresser en efficacité !
Si l’I.A. n’est pas une nouveauté en soi, il est un point indiscutable : nous assistons depuis quelques années à un véritable « revival » de l’Intelligence Artificielle. Selon une enquête réalisée par Serena Capital (3), trois fois plus de start-up spécialisées dans l'Intelligence Artificielle ont été financées en 2016, par rapport à 2015. Et le sujet de l’I.A. ne suscite pas seulement l’intérêt des entrepreneurs et des géants du web : philosophes, juristes, scientifiques, déontologues, politiques… s’emparent du débat.
Cette renaissance s’explique par la conjonction de 3 facteurs cruciaux :
Ainsi, sur ces dernières années, le monde de l’I.A. a permis des progrès visibles dans les techniques de la détection de fraude, dans la reconnaissance vocale (son inventeur n’est autre que Ray Kurzweil, patron de la R&D de Google, également concepteur d’OCR) ou la reconnaissance d’image pour identifier des personnes et objets sur des photos (pièces d’identité, photos de foules…) ou sur des vidéos (permettant ainsi aux voitures sans conducteur de distinguer un piéton d’un panneau de signalisation, ou dans un autre domaine d’identifier les émotions des clients filmés devant un article dans un magasin).
A plus ou moins court terme, tous les secteurs d’activité sont concernés par l’I.A. :
Ce ne sont que quelques exemples. L’effervescence des startups est considérable et les applications innombrables.
Dans le monde de la capture de documents et de l’automatisation des processus, l’utilisation de l’IA fait aussi partie du quotidien comme le rappelle Vincent Poulain d’Andecy, Responsable du Laboratoire R&D au sein du groupe ITESOFT :
Chez ITESOFT, nous pratiquons aussi l’I.A. et cela depuis fort longtemps. Notre première utilisation des réseaux de neurones remonte au tout début des années 90. Aujourd’hui nous travaillons sur des technologies beaucoup plus poussées telles que l’Incremental Learning.
Voici quelques illustrations pratiques des applications d’ITESOFT dans le domaine de l’IA :
Dès le début des années 90, pour lire automatiquement des formulaires, ITESOFT s’est appuyé sur les réseaux de neurones pour effectuer de l’OCR sur des caractères manuscrits. Objectif : simuler la vision humaine pour faire de la reconnaissance automatique de formes. Les réseaux de neurones sont aujourd’hui encore utilisés par les solutions ITESOFT… mais dans une version toutefois beaucoup plus puissante désormais car capable d’effectuer un apprentissage sur un volume de données sans commune mesure : on parle là du Deep Learning.
Les solutions ITESOFT permettent aussi d’ identifier automatiquement la nature de tout type de documents entrants et de les trier selon leur classe : RIB, pièce d’identité, facture, courrier de réclamation… Comment ? En exploitant les techniques d’apprentissage du Machine Learning. Si les premières applications de l’éditeur, permettaient dès 1993 d’analyser des flux de formulaires avec des classes de documents assez limitées (ex : distinguer des feuilles de soins médecins, auxiliaires ou biologie), il est aujourd’hui possible pour le système d’apprendre des flux très hétérogènes de documents de plusieurs dizaines voire centaines de classes.
Les années 2 000 ont été marqués par un nouvel enjeu i.e. typer des documents « non-structurés » tels que des courriers libres. Chez ITESOFT, cette variabilité extrême du document (les informations peuvent être écrites n’importe où sur le document) et de son contenu (une même information peut avoir différentes formulations selon les individus) a pu être adressé au travers de l’I.A. et du Text Mining.
Le Text Mining utilise des techniques de traitement automatique du langage naturel tout comme l’humain le ferait. Il détecte et sélectionne des groupes de mots appris pour catégoriser un contenu. Exemple ? Trouver les mots « bulletin » et « salaire » séparément dans un courrier est insuffisant pour indiquer qu’il s’agit d’un bulletin de salaire. En revanche, trouver le groupe de mots « bulletin de salaire », expression du langage naturel - que le système aura appris et saura reconnaître quel que soit sa position dans le courrier - sera particulièrement utile pour le typage.
Les factures fournisseurs sont les documents « semi-structurés » par excellence : il existe autant de formats de factures que de fournisseurs. Dès lors, comment automatiser un flux aussi variable et hétérogène ? L’approche d’ITESOFT est celle des « Systèmes Experts ». Au départ, le système est alimenté d’un ensemble de connaissances et de règles sur les problématiques du traitement de la facture qui vont lui permettre par la suite de faire de lui-même des déductions. Nous pouvons même le spécialiser avec des boucles d’auto-apprentissage.
Parmi ses connaissances : des bibliothèques de mots clés ou des règles de format de données qui vont lui permettre de retrouver et d’extraire les données des factures. Ainsi, lorsqu’un format « date » est identifié à proximité d’un mot-clé « date », lui-même localisé à proximité du « numéro de la facture », alors le système saura déduire de lui-même que l’information lue correspond à la « date de facture ». Le système reproduit ainsi la logique - la déduction - qu’aurait eu le comptable !
La recherche ne s’arrête pas. Parmi les travaux les plus récents du laboratoire R&D d’ITESOFT, deux innovations majeures sont à souligner :
La Capture as a Service est une nouvelle approche disruptive de la capture de documents en mode cloud enrichie de fonctions cognitives et d’Intelligence Artificielle. Dans le domaine du traitement de la facture, les moteurs d’identification de fournisseurs et de lecture de documents d’ITESOFT s’appuient ainsi sur une base de connaissance mutualisée, plus complète et de meilleure qualité que celles de chaque clients pris indépendamment. Au final : un super système expert à la puissance décuplé ! Et des taux d’automatisation qui passent de 50% à 85%.
Le Deep Learning est particulièrement bien adaptée pour typer de nombreux documents. Une limite cependant : il ne peut reconnaître que des éléments présents dans son set d’apprentissage. Si le périmètre documentaire est connu, peu variable, aucun problème ! En revanche si votre flux documentaire évolue souvent, le Deep Learning devra régulièrement refaire un apprentissage complet pour rester performant dans le temps. L’Incrémental Learning permet de pallier à cela. Il n’est plus nécessaire de ré-entraîner le système, il le fait de lui-même en permanence. La machine progresse en auto-apprenant - au fur et à mesure- des nouveaux documents reçus.
Nous l’avons vu, les applications et les opportunités existent bel et bien. Mais ne nous y trompons pas l’I.A. n’est pas une finalité en soi. L’innovation - qu’elle soit portée par l’I.A. ou pas - se doit toujours de servir un résultat de performance. C’est la vision portée par ITESOFT.
Vouloir à tout prix utiliser des algorithmes d’I.A. sans se poser la question de leur intégration dans le processus global de gestion documentaire peut parfois paradoxalement s’avérer moins efficace. A quoi bon par exemple mettre en place du Deep Learning si votre flux comporte seulement quelques classes de documents ?
Vous l’aurez compris, l’I.A. au service de l’automatisation des processus est bel et bien une réalité pour ITESOFT et pour ses clients. Elle n’a en fait jamais cessé de l’être. Ses équipes y travaillent quotidiennement, avec le bon sens et le recul nécessaire, guidées par la quête de l’efficacité avant tout !
Revivez l'intervention de Stéphane Mallard, Digital Evangelist lors de la Rencontre Clients ITESOFT 2016
Responsable communication et éditorial
Laurent rejoint ITESOFT en 2000. Directeur de Projet Marketing et diplômé de l’IAE d’Aix en Provence, il dispose d’une expérience de plus de 15 ans dans la production d’évènements, d’études et de contenus autour de la dématérialisation et de l’automatisation des processus.
Transformation digitale
La transformation digitale à l'ère de l'intelligence artificielle
La transformation digitale est un élément clé de la performance des entreprises. Avec l'IA, c'est même un formidable accélérateur. Quels enjeux...
Transformation digitale
AI ACT : prêt pour la révolution IA responsable ?
AI ACT législation inédite pour réguler l'IA sur un modèle responsable, éthique et sécurisé. Alexandre Rispal analyse ce nouveau cadre juridique.
Dématérialisation des documents
L’Intelligence artificielle au service de la protection sociale
L’intelligence artificielle aide à réduire le temps passé à manipuler des documents et contribue à diminuer les risques d’erreurs de saisies