A Inbenta implementou em seu software a Teoria Texto-Sentido e sua maneira de conceber o léxico e semântica da linguagem natural, além de possuir uma equipe especializada em linguística para criar descrições detalhadas e específicas das unidades lexicais, em várias línguas diferentes.

 

A Teoria Texto-Sentido (MTT) é uma estrutura linguística teórica, apresentada pela primeira vez em Moscou por Aleksandr Žolkovskij e Igor Melčhuk, para a construção de modelos de linguagem natural. A teoria fornece uma grande e elaborada base para a descrição linguística e, devido ao seu caráter formal, presta-se particularmente bem a aplicações informáticas.

 

Uma descoberta importante do texto-sentido foi o reconhecimento de que os elementos do léxico (unidades lexicais) em uma língua podem estar relacionados com outros em um sentido semântico abstrato. Estas relações são representadas em MTT como funções lexicais (LF). Assim, a descrição do léxico possui um aspecto crucial na Inbenta.

 

As funções lexicais são uma ferramenta especialmente concebida para representar formalmente as relações entre unidades lexicais e, portanto, permitem formalizar e descrever de forma relativamente simples, a rede de relação lexical complexa das línguas presentes e atribuir um peso semântico correspondente a cada elemento em uma frase. O mais importante, no entanto, é que elas nos permitem relacionar significados análogos, não importa que forma eles são apresentados dentro da frase.

 
As línguas naturais são mais restritivas do que pode parecer à primeira vista. Consequentemente, na maior parte dos casos, nos deparamos com expressões congelados, mais cedo ou mais tarde. Embora tenham diferentes graus de rigidez, em última instância, eles são fixos, e deve ser descrita de acordo com esta característica, por exemplo:
  • Obter um resultado
  • Fazer um favor
  • Perguntar / postar uma questão
  • Levantar um edifício

Todos esses exemplos mostram-nos que é o léxico que impõe restrições de seleção, uma vez que dificilmente encontramos “fazer uma pergunta” ou “fazer um favor” em um texto. Na verdade, o fator mais importante quando se analisa essas frases é que, do ponto de vista do sentido, os elementos não têm o mesmo valor semântico. Como mostrado nesses exemplos, o primeiro elemento dificilmente fornece qualquer informação, mas todo o significado ou peso semântico é fornecido pelo segundo elemento.

 

A questão crucial aqui é que a relação semântica entre o primeiro e o segundo elemento é exatamente o mesmo em todos os exemplos. A grosso modo, o que estamos dizendo é que “fazer X” (resultado, uma piada, um favor, uma pergunta, um edifício). Este tipo de relação pode ser representada pela função lexical “Oper”.

 

A MTT recolhe cerca de 60 diferentes tipos de funções lexicais, que permitem, entre outras coisas, a descrição das relações como sinonímia (compra e compras são ações idênticas), hiperonímia/ hiponímia (um cão é um tipo de animal) ou outras relações entre unidades lexicais ao nível de sentença, como a Oper que mencionamos antes, ou estes expressando “um monte”: se você dorme muito você tem um sono pesado, mas se você fuma muito, você não é um “fumante pesado” ….

 

Os linguistas na Inbenta adaptam os princípios da Teoria Texto-Sentido ao descrever os idiomas suportados. O objetivo é que as perguntas de usuários que são completamente diferentes na superfície, mas cujo significado subjacente é o mesmo, está corretamente entendida pelos nossos sistemas de busca baseados em semântica, para que os usuários sempre obtenham os melhores resultados para suas consultas.

 

Vamos dar essas possíveis perguntas do usuário :

  • compra de uma passagem para uma pessoa com sobrepeso
  • Eu quero comprar uma passagem para alguém que é obeso

Mesmo que as palavras sejam diferentes, em ambos os casos, o significado transmitido é o mesmo, por isso ambos devem chegar a mesma resposta do assistente virtual. O motor de busca semântico da Inbenta é construído em cima de uma rede rica e complexo de relações lexicais, a fim de ser capaz de entender o que significa usuários com suas dúvidas, não importando as palavras exatas que eles usam para fazer as suas questões.

A Inbenta patrocinou a 5ª Conferência Internacional sobre a Teoria Texto-Sentido em 2011, que ocorreu em Barcelona.