La única teoría lingüística que utiliza las funciones léxicas para tratar la semántica

Inbenta ha implementado su software basado en la Teoría Sentido-Texto y su forma de concebir el lenguaje natural a partir de un léxico y de su semántica. De este modo, el equipo lingüístico de Inbenta ha creado toda una serie de descripciones específicas y detalladas de las unidades léxicas en diferentes lenguas.
 
La Teoría Sentido-Texto es un marco teórico lingüístico creado por Aleksandr Žolkovskij e Igor Mel’čuk, para la construcción de modelos de lenguaje natural. La teoría proporciona una base extensa y elaborada para la descripción lingüística y, debido a su carácter formal, se adapta a la perfección a las aplicaciones informáticas.
 
Un descubrimiento importante de la Teoría Sentido-Texto fue reconocer que los elementos del léxico (unidades léxicas) en una lengua pueden relacionarse entre sí en un sentido semántico abstracto. Estas relaciones se representan mediante funciones léxicas (FL). Así pues, la descripción del léxico es fundamental en Inbenta.
 
Las funciones léxicas son una herramienta especialmente diseñada para representar formalmente las relaciones entre unidades léxicas, de manera que podemos codificar y describir de un modo relativamente sencillo la compleja red de relaciones léxicas que presentan las lenguas, así como asignar un peso semántico a cada elemento en una frase. Aunque lo más importante es que nos permiten relacionar significados análogos independientemente de la forma en la que se presenten.
 
Las lenguas son más restrictivas de lo que pueden aparentar en un primer momento. Así pues, en la mayoría de los casos, en algún momento topamos con expresiones fijadas. Aunque hay varios grados de rigidez, al fin y al cabo se trata de expresiones fijadas, y se deben describir según sus características; por ejemplo:
  • Obtener un resultado
  • Hacer un favor
  • Formular una pregunta
  • Levantar un edificio
Todos estos ejemplos demuestran que la colocación es importante en el léxico, ya que no encontraremos en un texto “formular un favor” o “levantar una pregunta”. De hecho, el factor más importante para analizar estas frases es que, desde el punto de vista del significado, los elementos no poseen el mismo valor semántico. Como demuestran estos ejemplos, el primer elemento apenas proporciona información, y todo el peso semántico se concentra en el segundo elemento.
 
El punto crucial es que la relación semántica entre el primero y el segundo elemento es exactamente la misma en todos los ejemplos. Grosso modo, estamos diciendo “hacer X” (una broma, un favor, una pregunta, un edificio). Este tipo de relación se representa mediante la función léxica “Oper”.
 
La Teoría Sentido-Texto recoge unos 60 tipos de funciones léxicas que permiten entre otras cosas la descripción de  relaciones, como por ejemplo la sinonimia (comprar y adquirir son acciones idénticas), hiperonimia/hiponimia (un perro es un tipo de animal); u otras relaciones entre las unidades léxicas a un nivel oracional, como el Oper mencionado con anterioridad. Otro ejemplo sería el siguiente: a una persona que fuma mucho se le puede llamar “fumador empedernido”, pero si una persona compra mucho no se le llamará “comprador empedernido” sino “comprador compulsivo”.
 
Los lingüistas en Inbenta se encargan de adaptar los principios de la Teoría Sentido-Texto a la vez que describen las distintas lenguas que reconoce el sistema. El objetivo es que nuestro sistema de búsqueda semántico entienda correctamente preguntas de usuario completamente distintas en apariencia pero con el mismo significado, de manera que los usuarios siempre obtienen los mejores resultados a sus consultas.
 
Pongamos otro ejemplo con posibles preguntas de usuario:
  • Comprar un billete para una persona con exceso de peso
  • Quiero comprar un billete para una persona obesa
A pesar de que las palabras son distintas, en ambos casos el significado es el mismo, así que ambas preguntas deberían obtener el mismo resultado. El motor de búsqueda semántico de Inbenta está construido a partir de una red vasta y compleja de relaciones léxicas con el fin de entender lo que quieren decir los usuarios en sus consultas, sin importar las palabras exactas utilizadas para formular dichas consultas.
Inbenta patrocinó la 5a Conferencia Internacional de la Teoría Sentido-Texto en 2011, que tuvo lugar en Barcelona.