Quiénes somos Meaning-Text Theory
Teoría Sentido-Texto

Inbenta ha implementado su software basado en la teoría del Sentido-Texto y su forma de entender las lenguas naturales a partir del léxico y su semántica. Como consecuencia de ello, el equipo de lingüistas de inbenta ha creado descripciones detalladas  y específicas de las unidades léxicas en diversos idiomas.

La Teoría Sentido-Texto (TST) (en inglés Meaning-Text Theory, MTT) fue formulada por primera vez en Moscú por Aleksandr Žolkovskij e Igor Mel’čuk para la construcción de modelos de lenguas naturales. Esta teoría proporciona una base extensa y elaborada para la descripción lingüística y, debido a su carácter formal, combina a la perfección con las aplicaciones informáticas.

Un descubrimiento importante para la lingüística del sentido-texto es que los elementos en el léxico (unidades léxicas) en un idioma pueden relacionarse entre ellos en un sentido semántico abstracto. En TST, estas relaciones aparecen representadas como funciones léxicas (FL). Por ello, la descripción del léxico es un aspecto crucial en inbenta.

Las Funciones Léxicas son una herramienta especialmente diseñada para representar formalmente las relaciones entre las unidades léxicas y, de este modo, permitirnos formalizar y describir de manera relativamente sencilla la compleja red de relaciones léxicas que presentan las lenguas y asignar un peso semántico correspondiente a cada elemento en una frase. No obstante, lo más importante es que nos permiten relacionar significados análogos independientemente de la forma en la que se presenten.

El lenguaje natural es más restrictivo de lo que puede parecer a simple vista. Por ello, en la mayoría de casos, tarde o temprano nos encontramos con expresiones fijas. A pesar de que éstas varían en grado de rigidez, en última instancia se trata de expresiones fijas que deben ser descritas según sus características. Por ejemplo:

  • Prestar atención
  • Hacer un favor
  • Poner un ejemplo
  • Dar un grito

Todos estos ejemplos ilustran que el léxico impone las restricciones de colocación, puesto que difícilmente encontraremos en un texto "hacer un grito" o "poner un favor". De hecho, el factor más importante al analizar estas frases es que, desde el punto de vista del significado, los elementos no tienen el mismo valor semántico. Como muestran los ejemplos, el primer elemento apenas proporciona información; todo el significado o peso semántico se encuentra recogido en el segundo elemento.

Lo realmente importante es que la relación semántica entre el primer y el segundo elemento es exactamente la misma en todos los ejemplos. En resumen, lo que estamos diciendo es "hacer X" (un favor, un ejemplo, un grito, la atención). Este tipo de relación se puede representar con la función léxica "Oper".

TST recoge unas 60 funciones léxicas distintas, que permiten entre otras cosas la descripción de relaciones como la sinonimia (cigarrillo y pitillo son lo mismo), hiperonimia/ hiponimia (un perro es una clase de animal) u otras relaciones entre las unidades léxicas a nivel de frase, como el Oper que hemos mencionado anteriormente. Otro ejemplo sería la manera de expresar intensidad: si fumas mucho eres un fumador empedernido, pero si duermes mucho, no eres un "soñador empedernido"... A menos que lo consideremos una licencia poética.

El equipo lingüístico en inbenta adapta los principios de la Teoría Sentido-Texto a la descripción de las diversas lenguas de trabajo. El objetivo es que preguntas de usuario completamente diferentes en la forma pero cuyo significado sea el mismo puedan ser entendidas a la perfección por nuestros sistemas de búsqueda semántica, de manera que los usuarios siempre obtengan los mejores resultados.

Pongamos como ejemplo las siguientes preguntas de usuario:

  • quiero comprar un billete para una persona obesa
  • adquirir ticket para un pasajero gordo
  • hacer la compra de billetes para personas con sobrepeso

Aunque no compartan ninguna palabra en común, en los tres casos en realidad se está preguntando por lo mismo, por lo que deberían recibir la misma respuesta por parte de un Asistente Virtual. El buscador semático de inbenta se nutre de una compleja y rica red de relaciones léxicas para ser capaz de entender el significado de aquello que preguntan los usuarios, más allá de las palabras que empleen para formular sus cuestiones.