Natural Language Processing (NLP)

Qu’est-ce que c’est et pourquoi c’est important

Le traitement automatique du langage naturel (NLP) est une branche de l’intelligence artificielle qui aide les ordinateurs à comprendre, interpréter et manipuler le langage humain. Le NLP s’inspire de nombreuses disciplines, incluant l’informatique et la linguistique informatique, et a pour objectif de combler le fossé entre la communication humaine et la compréhension informatique.

 

Évolution du NLP

Si le traitement automatique du langage naturel ne date pas d’hier, sa technologie avance à grands pas grâce à un engouement croissant pour les communications homme-machine, et à une plus grande capacité en termes de big data, de puissance de calcul et d’amélioration d’algorithmes.

En tant qu’humains, vous parlez et écrivez peut-être en anglais, en espagnol ou en chinois. Mais la langue maternelle d’un ordinateur, qu’on appelle le code ou langage machine, est parfaitement incompréhensible pour la plupart des gens. Au niveau le plus primaire de votre appareil, la communication se fait non pas à l’aide de mots mais de millions de zéros et de uns qui produisent des actions logiques.

En effet, il y a 70 ans de cela, les programmeurs utilisaient des cartes perforées pour communiquer avec les premiers ordinateurs. Ce procédé manuel et laborieux n’était connu que de très peu de gens. Aujourd’hui, il suffit de dire « Alexa, j’aime cette chanson » pour qu’un appareil jouant de la musique dans votre maison baisse le son et vous réponde d’une voix humaine « Très bien. Notation enregistrée ». Puis cet appareil adapte son algorithme pour jouer cette chanson, ainsi que d’autres chansons similaires, lors de votre prochaine écoute de cette station de radio.

Étudions cette interaction de plus près. Votre appareil s’est activé en entendant votre voix, a compris l’intention tacite dans votre remarque, a exécuté une action et a fourni un retour dans une phrase bien formulée en anglais, le tout en l’espace de cinq secondes environ. Cette interaction dans son intégralité a été rendue possible grâce au NLP, ainsi qu’à d’autres éléments d’IA tels que le machine learning (apprentissage automatique) et le deep learning (apprentissage profond).

Réduire les réclamations client grâce au NLP

La Royal Bank of Scotland s’appuie sur l’analytique textuelle, une des techniques du NLP, pour extraire les principales tendances des retours client de divers formats. La banque analyse les données contenues dans les emails, les enquêtes de satisfaction et les conversations de centres d’appel pour identifier les causes principales d’insatisfaction client et apporter des améliorations. En regardant cette vidéo, vous en apprendrez plus sur la façon dont l’analytique transforme la relation client.

 

Pourquoi le NLP est-il important ?

À cause du volume important de données textuelles

Le traitement automatique du langage naturel aide les ordinateurs à communiquer avec les humains dans leur propre langue et à passer à l’échelle. Par exemple, le NLP permet aux ordinateurs de lire un texte, de capter un discours, de l’interpréter, d’y mesurer les sentiments et d’en dégager les parties essentielles.

Aujourd’hui, les ordinateurs peuvent analyser davantage de données linguistiques que les humains, sans fatigue et de manière constante et objective. Compte tenu de l’impressionnante quantité de données non structurées générées chaque jour, allant du dossier médical aux publications sur les réseaux sociaux, l’automatisation s’avère de plus en plus indispensable pour mener à bien une analyse exhaustive et efficace des données textuelles et orales.

Structurer une source de données non structurées

Le langage humain est extrêmement complexe et diversifié. Nos possibilités d’expression sont infinies, tant à l’écrit qu’à l’oral. Non seulement il existe des centaines de langues et dialectes, mais en plus dans chaque langage se trouve un ensemble unique de règles grammaticales et syntaxiques, de termes et d’argot. Lorsque nous écrivons, il nous arrive souvent de faire des fautes ou d’utiliser des abréviations, ou encore d’oublier la ponctuation. Lorsque nous parlons, nous avons des accents régionaux, nous marmonnons, bégayons et empruntons des termes à d’autres langues.

Si l’apprentissage supervisé et non supervisé, et notamment le deep learning, sont désormais largement utilisés pour modéliser le langage humain, il existe également un besoin en termes de compréhension syntaxique et sémantique, et d’expertise du domaine, qui ne sont pas nécessairement présents dans ces approches d’apprentissage automatique. Le NLP est important car il aide à résoudre les ambiguïtés de langage et apporte une structure numérique aux données textuelles qui s’avèrent utiles pour de multiples applications, telles que la reconnaissance vocale ou l’analytique textuelle.

Le NLP aujourd’hui

Découvrez comment le NLP est utilisé dans de nombreux secteurs d’activité

L’avenir du NLP

Comment les entreprises du monde entier utilisent-elles l’intelligence artificielle et le NLP ? Quels sont les taux d’adoption de ces technologies et que leur réserve l’avenir ? Quels en sont les plans budgétaires et de déploiement ? Et quelles problématiques d’entreprises sont solutionnées par les algorithmes du type NLP ? Découvrez la réponse à ces questions dans ce rapport de TDWI.

Le potentiel inexploité des textes bruts

Les pensées, recherches, opinions, anecdotes et retours des utilisateurs, consommateurs, internautes sont transférés dans le monde virtuel à travers les fils d’actualité sur les réseaux sociaux, les dossiers juridiques, les rapports médicaux électroniques, les journaux de centre d’appels, les réclamations SAV et bien d’autres encore. Le NLP permet de découvrir les informations cachées dans les flux de mots.

Que permet l’analyse textuelle pour votre organisation?

L’analytique textuelle est un type de NLP qui transforme les textes en données à analyser. Découvrez comment les organisations bancaires, médicales et des sciences de la vie, manufacturières et les administrations gouvernementales utilisent l’analyse textuelle pour optimiser l’expérience consommateur, réduire les fraudes et améliorer la société.

Comment fonctionne le NLP?

Analyse des composantes principales du langage

Le NLP comprend de multiples techniques diverses qui permettent d’interpréter le langage humain, allant des méthodes statistiques et d’apprentissage automatique aux approches fondées sur des règles et algorithmes. Un vaste choix d’approches est utile tant les données textuelles et vocales varient considérablement, tout comme les applications pratiques. 

Les tâches de base du NLP comprennent entre autres : la tokenisation, le parsing, la lemmatisation (recherche du radical), la détection des parties du discours, la détection de la langue et l’identification des relations sémantiques. S’il vous est arrivé de schématiser des phrases lors de votre cursus scolaire, alors vous avez déjà effectué ces tâches, mais manuellement. 

En général, les tâches du NLP décomposent le langage en éléments essentiels courts, tentent de comprendre les relations entre ces éléments et comment ils s’imbriquent pour créer du sens.

Ces tâches sous-jacentes servent souvent de base aux tâches plus complexes du NLP, telles que:

  • La catégorisation de contenu. Un résumé linguistique du document, comprenant la recherche et l’indexation, des alertes de contenu et la détection de duplication.
  • Modélisation et découverte automatique de thèmes. Capture précise du sens et des thèmes cachés dans une collection de textes, et analytique avancée sur les textes, comme l’optimisation et la prévision.
  • Extraction contextuelle. Extraction automatique d’informations structurées prenant en compte le contexte de la phrase à partir de sources textuelles brutes.
  • Analyse de sentiment. Identification de l’humeur ou des opinions subjectives dans de larges volumes de textes, et identification automatique des sentiments. 
  • Conversion parole-texte et texte-parole. Transformation des commandes vocales en texte écrit, et inversement. 
  • Synthèse de documents. Génération automatique de résumés de sources textuelles.
  • Traduction automatique. Traduction automatique de textes ou discours d’une langue source vers une langue cible.


L’objectif principal, dans toutes ces tâches, est de prendre en entrée des données en langage brut et d’utiliser la linguistique et les algorithmes pour transformer ou enrichir le texte de manière à lui donner une plus grande valeur. 

Méthodes de NLP et applications

Comment les ordinateurs donnent du sens aux données textuelles

Le NLP et l’analyse de textes

Le traitement automatique du langage naturel va de pair avec l’analytique textuelle, qui compte, regroupe et catégorise les mots pour extraire la structure et le sens d’un grand volume de contenu. L’analytique textuelle sert à explorer le contenu du texte et dériver de nouvelles variables à partir du texte brut, qui peuvent être visualisées, filtrées ou utilisées comme entrées pour des modèles prédictifs ou autres méthodes statistiques.

Le NLP et l’analyse textuelle sont utilisés ensemble dans plusieurs cas d’usage, parmi lesquels:

  • La recherche d’investigation. Elle consiste à identifier les modèles et les indices dans les emails ou les rapports écrits pour aider à la détection et à la résolution de crimes.
  • L’expertise de domaine. Elle consiste à classer le contenu en thèmes significatifs pour vous aider à prendre des décisions et à découvrir les tendances.
  • L’analyse des médias sociaux. Elle consiste à suivre le niveau de sensibilité et les sentiments à propos de sujets spécifiques, et à identifier les principaux influenceurs. 

Le NLP au quotidien 

Il existe de multiples applications pratiques et courantes du NLP dans notre vie quotidienne. Au-delà de la conversation avec un assistant virtuel comme Alexa ou Siri, voici quelques exemples supplémentaires: 

  • Avez-vous remarqué dans votre boîte mail que les lignes d’objet des spams présentent des similitudes entre elles ? C’est le filtrage bayésien des spams, une technique statistique de NLP qui compare les mots dans les spams aux emails valides pour trier le courrier indésirable.
  • Avez-vous déjà manqué un appel téléphonique et lu la transcription automatique du message vocal dans votre boîte mail ou sur une application smartphone ? Il s’agit de la conversion parole-texte, une composante du NLP.
  • Avez-vous déjà navigué sur un site internet en vous servant de sa barre de recherche intégrée, ou en sélectionnant une balise suggérée pour un sujet, une entité ou une catégorie ? Alors vous avez utilisé des méthodes de NLP pour la recherche, la détection automatique des thèmes, l’extraction d'entités et la catégorisation de contenu.

Un sous-domaine du NLP appelé la compréhension du langage naturel ou Natural Language Understanding (NLU) gagne du terrain grâce à son potentiel en matière d’applications cognitives et d’IA. Le NLU va au-delà de la compréhension structurelle du langage et interprète l’intention, résout les ambiguïtés contextuelles et de mots, et génère même du langage humain par lui-même. Les algorithmes NLU doivent traiter le problème extrêmement complexe que représente l’interprétation sémantique, c’est-à-dire, comprendre l’intention tacite d’un langage écrit ou oral, avec toutes ses subtilités, son contexte et ses inférences que nous, humains, sommes capables de comprendre.

L’évolution du NLP - traitement automatique du langage naturel- vers le NLU a une grande importance, tant pour les entreprises que pour les consommateurs. Imaginez ce que permet un algorithme capable de comprendre le sens et la nuance du langage humain dans de nombreux contextes, allant de la médecine aux classes d’école, en passant par les cours juridiques. À mesure que les volumes d’informations brutes continuent de croître de manière exponentielle, nous pourrons tirer profit des ressources informatiques inépuisables pour nous aider à donner du sens à absolument tout. 

Autres articles