La théorie sens-texte : pour la construction de modèles de langues

Le Moteur de Recherche Sémantique d’Inbenta s’appuie sur la Théorie Sens-Texte (TST). Cette théorie linguistique modélise le langage humain afin de le rendre compréhensible par les machines. C’est cette approche qui garantit l’efficacité de la technologie Inbenta dans la réponse automatique aux questions des utilisateurs.

Introduite par Mel’čuk en 1995, la Théorie Sens-Texte se prête particulièrement bien aux applications liées à l’Intelligence Artificielle. Elle vise à comprendre le véritable sens d’une phrase, en prenant en compte des paramètres comme la syntaxe, les synonymes, les figures de style ou même les ambiguïtés.

Que se cache-t-il derrière cette technologie de recherche sémantique ?

La Théorie Sens-Texte décompose le langage grâce à plusieurs zones linguistiques, telles que la phonologie ou la syntaxe. Inbenta va plus particulièrement s’intéresser à la sémantique grâce à la zone de combinatoire lexicale.

Concrètement, les mots sont liés entre eux grâce à des relations sémantiques (appelées également Fonctions Lexicales). La Théorie Sens-Texte compte près de 60 Fonctions Lexicales décrivant des relations telles que la synonymie, l’hyperonymie/hyponymie (un chien est un type d’animal) ou d’autres relations entre unités lexicales au niveau de la phrase (expressions figées du langage comme « rendre l’âme » qui signifie « mourir »).

Voici un exemple :

Modélisation du langage via des relations sémantiques

 

Nous notons deux grands types de Fonctions Lexicales : les Fonctions Lexicales Syntagmatiques et les Fonctions Lexicales Paradigmatiques. Les premières permettent d’analyser l’enchaînement des termes, leur combinaison, leur coordination dans l’espace tandis que les secondes s’intéressent au choix des termes.

Quels sont les résultats de cette technologie sémantique ?

Prenons le cas d’un service client équipé d’une FAQ Dynamique Inbenta, capable de traiter en self-care de gros flux de contacts entrants. Les internautes et les conseillers peuvent y poser librement leur questions et obtenir une réponse précise et instantanée. Grâce à la théorie sens-texte, le moteur est capable de déterminer que les requêtes suivantes :

  • « quelles sont vos coordonnées ? »
  • « quel est votre numéro de téléphone ? »
  • « je souhaite joindre un conseiller »
  • « à quelle adresse mail puis-je vous écrire ? »

signifient la même chose et doivent renvoyer vers le contenu « Comment vous contacter ? ». Nul besoin de créer ou de décliner les contenus pour répondre aux centaines de formulations différentes employées par vos visiteurs.

Depuis 2005, les experts linguistes d’Inbenta décrivent plus d’une dizaine de langues grâce à ce formalisme linguistique. Et c’est cette technologie du langage qui fait le succès de notre Moteur de Recherche Sémantique !