La solution logicielle d’inbenta se base sur la Théorie Sens-Texte et son traitement du langage naturel concentré sur le lexique et la sémantique. En effet, l’équipe linguistique spécialisée d’inbenta décrit de manière détaillée et précise chaque unité lexicale (mot), et ce, dans différentes langues.
La théorie Sens-Texte (TST) est une théorie linguistique, initiée par Aleksandr Žolkovskij et Igor Mel’čuk dont l’objectif est de créer un modèle de langage naturel. La théorie fournit une base importante et complexe pour la description linguistique et, en raison de son caractère formel, se prête particulièrement bien à des applications informatiques.
L’un des principes importants de la théorie Sens-Texte est la mise en relation des éléments du lexique (unité lexicale) du langage les uns aux autres dans un réseau sémantique. Ces relations sont représentées dans la théorie Sens-Texte par des fonctions lexicales (FL). Ainsi, la description du lexique est un aspect très important chez inbenta..
Les Fonctions Lexicales sont spécialement désignées pour représenter formellement les relations entre les unités lexicales, et par conséquent, elles nous permettent de formaliser et de décrire de manière simple le complexe réseau des relations lexicales que présente le langage et assigne un poids sémantique à chaque élément de la phrase. Ainsi, elles nous permettent de relier des significations analogues, quelles que soient leurs représentations graphiques.
Le langage naturel est plus restrictif qu’on ne le pense. C’est ainsi que, souvent, nous rencontrons des expressions figées dans la langue. Bien qu’elles aient différents degrés de figement, elles sont néanmoins fixes et doivent être décrites comme telles. Par exemple:
- Obtenir un résultat
- Faire une faveur
- Poser une question
- Commettre un crime
Tous ces exemples nous montrent que c’est par le lexique que s’imposent les restrictions des collocations. Ainsi, nous trouverions difficilement les expressions "faire une question" ou "poser une faveur" dans un texte. Ce que l’on peut constater en analysant ces phrases, c’est que, du point de vue du sens, les éléments n’ont pas la même valeur sémantique: le premier élément ne donne pas beaucoup d’information, tout le sens (ou poids sémantique) se trouvant dans le second élément.
Au vue des quatre exemples ci-dessus, le locuteur veut exprimer "FAIRE + quelque chose" (une faveur, question, un crime). Ce type de relation peut être représenté par la fonction lexicale "Oper".
La TST comprend environ 60 fonctions lexicales différentes, qui permettent, entre autres choses, de décrire des relations comme la synonymie (acheter et payer sont des actions identiques), l’hyperonymie / l’hyponymie (un chien fait partie de la classe des animaux) et d’autres relations entre les unités lexicales au niveau de la phrase comme l’Oper déjà mentionnée plus haut. Un autre exemple est la manière d’exprimer l’intensité: si tu fumes trop, tu es un fumeur invétéré, mais si tu dors trop, tu n’es pas un dormeur invétéré mais un gros dormeur...
L’équipe linguistique d’inbenta adapte les principes de la Théorie Sens-Texte à la description de plusieurs langues. L’objectif est que les questions des utilisateurs complétement différentes en forme mais avec un sens identique puissent être reconnues par le système et, ainsi, donne entière satisfaction aux attentes des utilisateurs en leur offrant les réponses les plus pertinentes.
Posons les exemples suivants:
- Acheter un billet pour quelqu’un en surpoids
- Acquérir un billet pour une personne obèse
Même si les mots employés sont différents, le sens est identique et ces deux questions devraient logiquement avoir la même réponse dans l’Assistent Virtuel. Le moteur de recherche sémantique d’inbenta est construit sur un réseau complexe de relations lexicales afin de comprendre ce que veulent dire les utilisateurs, indépendamment des mots utilisés par ceux-ci.



