Qu’est-ce que la Recherche d’Information ?

La Recherche d'Information (RI) est le domaine consistant à trouver un objet dans tout média pertinent pour répondre à la requête d'un utilisateur. Découvrez en détails ce que cela implique et les différents moteurs de recherche qui existent !

Jusqu’à récemment, la recherche de techniques efficaces pour la Recherche d’Information ne concernait que des domaines très spécifiques comme la loi, la médecine, le commerce. Avec l’avènement du Web tel nous le connaissons, nous sommes tous devenus des utilisateurs de la Recherche d’Information. Ce changement a poussé la communauté de la Recherche d’Information à développer de nouvelles techniques.

Le saviez-vous ? On dénombre chaque minute environ 4 millions de requêtes sur Google…

 

Quelles sont les applications de la Recherche d’Information ?

La Recherche d’Information concerne la représentation, le stockage, l’organisation et l’accès aux sources d’information.

Une de ses applications est le système de recommandations. Basé sur le comportement passé de l’utilisateur ainsi que sur les décisions similaires prises par d’autres utilisateurs, le système de recommandation suggère des contenus à l’issue d’une recherche. Amazon, par exemple, utilise un système de recommandation. Il s’agit de sa rubrique « Les clients ayant consulté cet article ont également regardé : ».

L’application la plus répandue en Recherche d’Information reste le Moteur de Recherche.

 

Qu’est-ce qu’un moteur de recherche ?

Un moteur de recherche est un outil permettant de localiser une information (ou une ressource : pages web, articles de forums, images, vidéo, fichiers, etc.) dans une base de données via une requête formulée dans un langage naturel ou formel.

Le Moteur de Recherche crée une représentation simplifiée des documents et des requêtes. Après un pré-traitement des documents (suppression des mots vides comme les déterminants, racinisation des mots), un index est créé pour chaque document, listant l’ensemble de ses éléments. Ensuite, la similarité entre l’index et la requête est mesurée. Plus elle est importante, plus le document est supposé pertinent, c’est-à-dire en adéquation avec le besoin exprimé par l’utilisateur via sa requête.

Recherche d'information fonctionnement

 

 

Quelle est la différence entre Moteur de Recherche par mots-clés et Moteur de Recherche Sémantique ?


Il existe deux grands types de moteurs de recherche : les Moteur de Recherche par mots-clés et les Moteur de Recherche sémantiques.
Le Moteur de Recherche par mot-clé est le premier à avoir été développé. Il calcule la similarité en vérifiant si l’Index et la requête ont des mots-clés en commun. C’est-à-dire s’ils comportent des mots exactement identiques.
Cependant, l’une des propriétés du langage naturel est la variabilité. Il existe en effets plusieurs mots pour désigner un même concept .
C’est au niveau de la variation lexicale que s’arrêtent les capacités d’un Moteur de Recherche par mot-clé et que se distinguent les Moteur de Recherche sémantiques. Prenons le cas d’une page web (document) dont l’index contient les mots « livre », « seconde-main » et « achat » et d’une requête « bouquin d’occasion ». Du point de vue des mots-clés, il n’y a pas de points communs entre la requête et l’index. Un Moteur de Recherche par mot-clé ne ramènera donc pas cette page. En revanche, un Moteur de Recherche sémantique est capable d’établir la similarité entre ce document et cette requête, car il existe une relation de synonymie entre « bouquin » et « livre » d’une part, et « occasion » et « seconde main » d’autre part.
On parle de Moteur de Recherche sémantique car il exploite des relations lexicales entre les mots. Il nécessite donc le recours à des ressources lexicales décrivant le langage concerné. Il s’avère bien plus performant que son homologue par mots clés puisqu’il est capable de comparer le sens des représentations (concepts) plutôt que leurs formes de surface (mots).
Le Moteur de Recherche d’Inbenta est un exemple de Moteur de Recherche sémantique. Retrouvez prochainement un article sur son fonctionnement !

 

Inbenta est un leader dans les technologies innovantes de recherche pour les entreprises. Nous mettons en oeuvre les dernières avancées en termes de traitement automatique du langage afin d’améliorer la qualité de service pour les entreprises et leurs clients.

Intéressés ? Notre team d’experts est à votre service pour vous créer une offre personnalisée.

PLANIFIER UNE DÉMO

Utilisation des cookies : Nous utilisons des cookies propres et de tiers pour fournir nos services et recueillir des informations statistiques. En poursuivant la navigation, vous en acceptez l’installation et l’utilisation. Vous pouvez modifier les paramètres ou obtenir plus d’informations dans notre cookies policy.