Inbenta à l’atelier RISE de la conférence CORIA 2016 !

Créée en 2004, la Conférence en Recherche d’Information et Applications est une manifestation francophone regroupant chercheurs, doctorants et entreprises dans l’optique d’échanger autour des théories et des applications du domaine de la recherche d’information. Elle est l’occasion de faire état de l’avancée de leurs recherches, de les partager au sein de la communauté et d’élargir leur réseau académique et professionnel

Cette année la conférence CORIA s’est déroulée à l’IRIT (Institut de Recherche d’Informatique de Toulouse), du 8 au 11 mars. La journée du 8 mars s’est déroulée sous forme d’atelier avec d’une part, le Hackday, 24h durant lesquelles les invités devaient concevoir un prototype d’une application de recherche d’information et, d’autre part, l’atelier RISE. Inbenta a participé à ce dernier. Les jours restants étant consacrés aux conférences.

Comment s’est déroulé l’atelier RISE ?

Cet atelier fut divisé en trois parties : une session conférencier, doctorant et entreprise.

Session conférencier :

D’abord, Jean-Pierre Chevallet a mis en lumière les liens qui existent entre la logique formelle et la recherche d’information. Pour cela, il a d’abord réintroduit les concepts de base de la logique puis a détaillé la logique dite des propositions. Cette approche consiste à représenter le contenu d’un document et d’une requête sous une formule logique. Ainsi, les déductions réalisables (ex : vrai, faux) permettront de déterminer la pertinence d’un résultat à une requête.

Ensuite, Brigitte Grau a présenté un état de l’art des systèmes de question-réponse. Le but d’un système de question-réponse est de retourner la bonne réponse à une question précise. Il existe deux types de systèmes de questions-réponses (recherche dans des documents textuels vs. recherche dans des bases de connaissances) ayant chacun leurs problématiques, leurs méthodes, leurs atouts et leurs écueils. Par exemple, un document textuel présente l’information de façon non structurée, comporte des variations lexicales et des ambiguïtés mais a l’avantage de comporter un nombre illimité d’informations, à l’inverse d’une base de connaissances. À la fin de son état des lieux, elle conclut que, pour augmenter la performance des systèmes actuels, l’idéal serait de créer un système qui combine les deux systèmes.

CORIA 2016

Enfin, Lynda Tamine, a exposé une façon différente de déterminer la pertinence entre une requête et un document. En effet, elle cherche à prendre en compte d’autres facteurs (autres que la requête et le document) tels le contexte spatio-temporel, le domaine, les centres d’intérêts afin de déterminer un « profil utilisateur ». Ceci ayant pour but de retourner des résultats plus précis à l’utilisateur.

Session doctorants

Chaque doctorant a présenté les prémisses de leurs travaux exploitant des méthodes différentes :

La propagation d’activation : Cette méthode consiste à représenter les termes d’un document sous forme de graphe ; les termes de la requête activant les termes du document. Cette activation se propage en utilisant les expansions, présentent dans l’ontologie (« ensemble structuré de termes et concepts représentant le sens d’un champ d’informations » – selon Wikipédia). Finalement, le document est alors interrogé via plusieurs termes similaires.

L’expansion de requête via le deep learning : Cette méthode consiste, dans un premier temps, à calculer la similarité des termes d’une base de documents puis d’élargir la requête en rapprochant les termes de celle-ci avec les termes similaires appris lors de la première étape.

Dans la présentation de sa thèse CIFRE en partenariat avec l’entreprise Cogniteev, Armel Fotsoh a proposé un prototype ayant pour but d’améliorer la pertinence des résultats retournés par les moteurs de recherche vis-à-vis du secteur d’activité et de la géolocalisation d’entreprises. Son approche contient deux axes : d’abord, faire le tri des sites d’entreprises par secteur d’activité, puis définir leurs lexiques via clustérisation. Ensuite, extraire leurs adresses en utilisant trois méthodes complémentaires : ontologies, apprentissage automatique et patrons.

Session entreprise

Deux entreprises ont été conviées pour présenter un cas client particulier.

La société Actia a présenté un moteur de recherche développé pour des garagistes afin de leur faciliter l’accès à l’information aux documentations techniques. Pour cela, Actia a créé un moteur dans lequel le garagiste tape un type de symptôme de dysfonctionnement d’un véhicule. En retour, il obtient automatiquement la solution adéquate pour résoudre le problème.

Quant à la société Mondeca, elle a exposé son système de détection de risque et d’alerte. Elle propose d’identifier des moments de crise en collectant et analysant une très grande quantité de donnée. Ces données sont triées et classifiées selon leurs thématiques. Si une thématique inquiétante est abordée (ex : thème de l’hospitalisation dans un contexte de crise sanitaire), alors une alerte est automatiquement envoyée au client.

Inbenta Team
by Inbenta Team