"On ne s'intéresse pas à une technologie parce qu'elle est à la mode, mais pour changer la vie des gens", assure Philippe Lebas. Le fondateur d'Airudit, ex-EA4T, veut faciliter le dialogue entre les humains et les machines. Son approche Speech-to-context, basée sur les ontologies, présente de réelles avancées.

Philippe Lebas a fait un rêve un jour - celui d'un monde où les hommes et les machines se parleraient et se comprendraient. Finis les écrans, oubliés les claviers. Juste des conversations fluides et naturelles, aussi bien pour régler le chauffage dans sa voiture que pour diriger un bras robotisé sur une chaine de montage ou renégocier son crédit au téléphone.

Pendant de longues années, ce type de dialogue humain-machine est resté l'apanage des films de science-fiction, tandis que dans le monde réel, ces interactions demeuraient limitées, imparfaites et artificielles. Au grand dam du CEO d'Airudit, Philippe Lebas donc. Ce technophile, passionné de radio - "un monde où les humains parlent aux humains" - souhaite faciliter la communication entre hommes et machines. Sa première entreprise s'attaquait à la gestion "intuitive" de documents. Dès 2008, il s'intéresse aux chatbots, puis aux vocalbots (ou Voicebots) et crée "un agent vocal pour les collectivités". L'intelligence artificielle est en plein essor, elle doit permettre de dialoguer avec les ordinateurs en langage naturel. La pratique s'avère plus compliquée. "Nous nous sommes rapidement aperçus que les technologies de scoring de mots-clés et d'arbres de décision, qu'on appelle aujourd'hui Machine Learning (ML), étaient beaucoup moins efficaces pour comprendre la parole que pour analyser du texte ". Le langage oral s'avère en effet plus riche que le langage écrit : le sens d’une phrase dépend autant de ce qui est énoncé que du contexte non-dit, voire implicite. Les constructions grammaticales sont aussi plus aléatoires, les phrases plus longues, moins structurées, et celles en suspens "traduites" inconsciemment par les interlocuteurs.

La jeune entreprise – elle s'appelle alors EA4T – décide de développer un moteur de reconnaissance de la parole qui travaille conjointement avec le moteur sémantique. "On nous traitait de fous", se souvient Philippe Lebas.  "Tout le monde croyait que c'était impossible de parler naturellement à une machine !" Pas de quoi décourager la start-up, qui s'investit dans la R&D. Quatre années de tests, de recherches et d'essais… Puis le déclic, avec un premier projet lancé pour Cofidis. Le spécialiste du crédit aux particuliers cherche un robot capable de répondre aux 200 questions de sa FAQ. Le problème s'annonce complexe, les données parcellaires (les informations du site internet, quelques pages d'échanges retranscrits), mais Philippe et ses deux collègues parviennent en seulement six semaines à construire un premier prototype capable de comprendre… 6.500 questions.

Après cette première réussite, l'entreprise développe pour Cofidis un robot pouvant préqualifier automatiquement les demandes de crédit. "Plutôt qu'un bot spécifique et limité, nous avons créé un bot capable de répondre à tout type de demande, même peu claire. Si un client appelle en disant "mon fils aimerait faire du piano, mais le modèle qui nous intéresse coûte 8.000 euros", il faut comprendre que, dans ce contexte, la demande implicite est : "je suis intéressé par un crédit loisir" ; et, à partir de là, proposer différentes offres et poursuivre la conversation de la manière la plus naturelle possible." Le secret repose sur un triptyque : un moteur de reconnaissance automatique de la parole (RAP) ; une API de compréhension sémantique basée sur les ontologies - sorte de "grammaire des données" recouvrant les mots et leurs relations, les ontologies donnent le contexte et les références d'une discussion ; et un moteur chargé d'élaborer différents scénarios et de formuler les réponses. "Pour parler à un assistant vocal classique, il faut réfléchir, utiliser des mots-clés… C'est peu fluide, souvent décevant et pas naturel", assure Philippe Lebas. "Notre démarche est différente : plutôt qu'apprendre aux humains à parler comme des machines, nous apprenons aux machines à comprendre les personnes réelles".

Cette approche présente plusieurs avantages. Les ontologies reconnaissant le langage naturel et les spécificités métiers, il n'est plus indispensable, à la différence du Machine Learning, de s'appuyer sur de grandes quantités de données pour développer des robots conversationnels. "Concrètement, nous travaillons avec les métiers pour la phase d'apprentissage. Il "suffit" de cartographier les process, les objets, les ressources, puis la machine pourra inférer, en fonction du contexte ; comme si elle raisonnait". Airudit avance aujourd'hui un taux de reconnaissance de mots de 97%, soit des performances proches de celles d'un humain. "C'est mieux que le Speech-to-text : le Speech-to-context. Avec la capacité de prendre en charge une discussion complète, ce que très, très peu d'entreprises savent faire aujourd'hui, en France et dans le monde."

Les agents conversationnels peuvent être déployés en ligne ou on-premise, intégrés dans des systèmes d'information, des applications, des sites web ou même des objets connectés. "Le client garde le contrôle complet de ses données, qui ne passent jamais par les GAFAM ou des data centers étranger", insiste Philippe Lebas. Autant d'avancées qui séduisent de nombreuses entreprises qui manipulent des données sensibles. Dernière en date, Dassault Aviation. Airudit a remporté l'appel d'offres Man-Machine Teaming (MMT) pour intégrer la voix dans l'avion de chasse du futur. "Le pilote pourra parler naturellement à son cockpit et se libérer d'une charge cognitive, cruciale en vol et lors des combats aériens".

Outre la défense et le secteur Banque-Assurance, l'industrie se montre très intéressée par Airudit. "L'industrie est confrontée à la même problématique que d'autres secteurs : une tendance à toujours rajouter des devices - tablettes, téléphones, etc. Ce sont autant d'objets supplémentaires à gérer, qui éloignent de l'action et du contexte, alors même que les opérateurs doivent travailler avec leurs mains ! Nous, nous leur proposons d'interagir de la manière la plus naturelle qui soit : en parlant." Airudit s'apprête aujourd'hui à relever de nouveaux défis, avec une levée de fonds pour se donner les moyens d'accélérer sa conquête des marchés. Le nombre de collaborateurs devrait aussi tripler en deux ans. Et s'enrichir "de caractères, pas de caractériels", s'amuse Philippe Lebas. "Les qualités humaines comptent bien plus que les diplômes ! J'aime les gens qui savent prendre des initiatives, apprécient de travailler en équipe et souhaitent faire profiter de leur expérience et de leur valeur ajoutée." Car l'objectif d'Airudit, lui, ne changera pas : "aider les gens. Nous sommes les seuls à pouvoir maîtriser toute la chaine, de la demande d'un locuteur jusqu'à la réponse de la machine. Notre terrain de jeu est infini !"