A Inbenta possui em seu software a Teoria Texto-Sentido, um dos pilares que nos possibilita gerar um léxico poderoso, sempre atrelado à semântica da linguagem natural. A inclusão dessa estrutura linguística é um dos fatores geradores de ferramentas de autoatendimento tão capazes.

A teoria em questão está diretamente vinculada com a Inteligência Artificial. É graças a ela que nossos produtos, do chatbot às FAQ inteligentes, acumulam resultados muito positivos na compreensão de perguntas de usuário.

Falar da Teoria Texto-Sentido demanda conhecimento razoável sobre alguns termos da linguística. Portanto, antes de avançarmos, é preciso recorrer aos seus conceitos básicos.

O que é semântica?

De acordo com o dicionário de Cambridge, semântica nada mais é do que o estudo dos significados de uma língua. Desse conceito, destacamos a palavra “significado”, pois ela é fundamental para compreender como uma ferramenta de autoatendimento funciona.

Em outras palavras, a semântica é o meio para compreender palavras e frases, indo além do que elas apresentam. Isto é, superando o sentido literal para desvendar a real intenção daquela palavra ou frase.

O que é léxico?

Por outro lado, o léxico é o vocabulário de determinada pessoa, idioma e, no nosso caso, de ferramentas de autoatendimento. Ele contém absolutamente todas as palavras e relações, independente do idioma em questão.

Então, pensar em “unidades lexicais” significa simplesmente palavras ou conjunto de palavras dentro de um vocabulário.

O que é a Teoria Texto-Sentido?

A Teoria Texto-Sentido (MTT) é uma estrutura linguística teórica, apresentada pela primeira vez em Moscou por Aleksandr Žolkovskij e Igor Melčhuk. Ela basicamente surge para viabilizar a construção de modelos de linguagem natural. A teoria fornece uma grande e elaborada base para a descrição linguística, que resulta em um uso muito pertinente para aplicações em tecnologia.

Uma descoberta importante do texto-sentido foi o reconhecimento de que os elementos do léxico (unidades lexicais) em uma língua podem estar relacionados com outros em um sentido semântico abstrato. Estas relações são representadas em MTT como funções lexicais (LF, do inglês Lexicon Functions). Assim, a descrição do léxico possui um aspecto crucial na Inbenta.

O que são funções lexicais?

As funções lexicais são uma ferramenta especialmente concebida para representar formalmente as relações entre unidades lexicais.

Por exemplo: imagine uma frase longa com algumas palavras e expressões. A rede de relação lexical complexa das línguas presentes viabiliza a atribuição de um peso semântico correspondente a cada elemento dessa frase. O mais importante, no entanto, é que elas nos permitem relacionar significados análogos, não importando que forma eles são apresentados dentro da frase.

Pense por um instante nos exemplos abaixo:

  • Obter um resultado
  • Fazer um favor
  • Perguntar / postar uma questão
  • Levantar um edifício


Todos eles mostram-nos que é o léxico que impõe restrições de seleção. Dificilmente encontramos “fazer uma pergunta” ou “fazer um favor” em um texto, seja em livros ou internet.

O fator mais importante quando analisamos essas frases é que, do ponto de vista do sentido, os elementos não têm o mesmo valor semântico. Como mostrado nesses exemplos, o primeiro elemento dificilmente fornece qualquer informação, mas todo o significado ou peso semântico é fornecido pelo segundo, que aparece na sequência. Repare nos termos em itálico abaixo:

  • Obter um resultado
  • Fazer um favor
  • Perguntar / postar uma questão
  • Levantar um edifício


A questão crucial aqui é que a relação semântica entre o primeiro e o segundo elementos é exatamente o mesmo em todos os exemplos. A grosso modo, o que estamos dizendo é: “FAZER X”, seja um resultado, uma piada, um favor ou uma pergunta. Este tipo de relação pode ser representada pela função lexical “Oper”.

Como funciona a Teoria Texto-Sentido?

A MTT recolhe cerca de 60 diferentes tipos de funções lexicais, que permitem, entre outras coisas, a descrição das relações como:


  • sinonímia (compra e compras são ações idênticas);
  • hiperonímia/ hiponímia (um cão é um tipo de animal).


Há ainda outras relações entre unidades lexicais ao nível de sentença, como a Oper, mencionada antes. Para enxergar outro exemplo basta pensar na expressão “um monte”. Se você dorme muito, você tem um sono pesado, mas se você fuma muito, você não é um “fumante pesado”.

Os linguistas na Inbenta adaptam os princípios da Teoria Texto-Sentido ao descrever os idiomas suportados. O objetivo é que as perguntas de usuários, que são completamente diferentes à primeira vista, mas cujo significado subjacente é o mesmo, estejam corretamente entendidas pelos nossos sistemas de busca baseados em semântica. Tudo para que os usuários sempre obtenham os melhores resultados para suas consultas.


Mais exemplos:


Compra de uma passagem para uma pessoa com sobrepeso

Eu quero comprar uma passagem para alguém que é obeso


Mesmo que as palavras sejam diferentes, em ambos os casos, o significado transmitido é o mesmo. Por isso ambos devem chegar à mesma resposta do chatbot. O motor de busca semântico da Inbenta é construído em cima de uma rede rica e complexo de relações lexicais, a fim de ser capaz de entender e encontrar respostas para dúvidas dos usuários. Não importando as palavras exatas que eles usam para fazer as suas questões.

A Inbenta patrocinou a 5ª Conferência Internacional sobre a Teoria Texto-Sentido em 2011, que ocorreu em Barcelona.