Inbenta ha implementat el seu software basant-se en la Teoria Sentit-Text i la seva manera d'entendre el llenguatge natural a partir del lèxic i la seva semàntica. Com a conseqüència d'això, l'equip de lingüistes d'inbenta ha creat descripcions detallades i específiques de les unitats lèxiques en diversos idiomes.
La Teoria Sentit-Text (TST) (en anglès Meaning-Text Theory, MTT) va ser formulada per primer cop a Moscou per Aleksandr Žolkovskij i Igor Mel’čuk per a la construcció de models de llengües naturals. Aquesta teoria proporciona una base extensa i elaborada per a la descripció lingüística i, degut al seu caràcter formal, combina a la perfecció amb les aplicacions informàtiques.
Un descobriment important per a la lingüística del sentit-text és que els elements del lèxic (unitat lèxiques) d'una llengua es poden relacionar entre ells en un sentit semàntic abstracte. A la TST, aquestes relacions apareixen representades com a funcions lèxiques (FL). Per aquesta raó, la descripció del lèxic és un aspecte crucial a inbenta.
Les Funcions Lèxiques són una eina especialment dissenyada per representar formalment les relacions entre les unitats lèxiques i, d'aquesta manera, permetre'ns formalitzar les relacions i descriure de manera relativament senzilla la complexa xarxa de relacions lèxiques que presenten les llengües i assignar un pes semàntic corresponent a cada element a una frase. No obstant, el més important és que ens permetin relacionar significats anàlegs independentment de la forma com es presentin.
Les llengües naturals són més restrictives del que pugui semblar a primera vista. Per aquest motiu, a la majoria de casos, tard o d'hora ens trobem amb expressions fixes. Malgrat que aquestes varien segons el grau de rigidesa, en última instància es tracta d'expressions fixades que han de ser descrites segons les seves característiques, per exemple:
- Gastar una broma
- Fer un favor
- Donar un cop
- Cometre un delicte
Tots aquests exemples il·lustren que el lèxic imposa les restriccions de col·locació, ja que difícilment trobarem a un text "gastar un favor" o "cometre un cop" en un text. De fet, el factor més important en analitzar aquestes frases és que, des del punt de vista del significat, els elements no tenen el mateix valor semàntic. Com mostren els exemples, el primer element no proporciona gaire informació; tot el significat o pes semàntic es recau en el segon element.
Allò realment important és que la relació semàntica entre el primer i el segon element és exactament la mateixa en tots els exemples. En resum, el que estem dient és "fer X" (un favor, una broma, un cop, un delicte). Aquest tipus de relació es pot representar amb la funció lèxica "Oper".
La TST recull unes 60 funcions lèxiques diferents, que permeten entre d'altres coses la descripció de relacions com la sinonímia (comprar i adquirir són accions idèntiques), hiperonímia/ hiponímia (un gos és una classe d'animal) i altres relacions entre les unitats lèxiques a nivell de frase, com l'Oper que hem mencionat. Un altre exemple és la manera d'expressar intensitat: si fumes molt ets un fumador empedreït, però si dorms molt, no ets un "somiador empedreït".... Tot i que ho podríem considerar una llicència poètica.
L'equip lingüístic d'inbenta adapta els principis de la Teoria Sentit-Text a la descripció de les diverses llengües de treball. L'objectiu és que preguntes d'usuari completament diferents a la forma però amb significat idèntic puguin ser compreses pel nostre sistema de cerca semàntica, de manera que els usuaris sempre obtinguin els millos resultats.
Posem per exemple les següents preguntes d'usuari:
- comprar un bitllet per algú amb sobrepès
- adquirir un bitllet per una persona obesa
Malgrat que les paraules emprades són diferents, el significat en els dos casos és el mateix, així que les dues preguntes haurien d'obtenir el mateix resultat a l'Assistent Virtual. El motor de cerca semàntic d'inbenta està construït sobre una complexa xarxa de relacions lèxiques per tal d'entendre allò que volen dir els usuaris amb llurs consultes, independentment de les paraules exactes que facin servir per formular llurs preguntes.




