Les bases de la recherche dans Synclab

Quand on manipule de large volume de document, retrouver le document que l'on souhaite peut rapidement devenir un casse tête. C'est pourquoi Synclab a été conçu pour aider à trouver rapidement et facilement les documents recherchés. Qu'il s'agisse de la recherche d'un document spécifique, d'un historique de chat ou d'une collection, Synclab offre des outils puissants pour affiner la recherche documentaire et obtenir des résultats rapides et pertinents.

Il existe deux méthodes de recherche dans Synclab. D'une part, la recherche par similarité. Et d'autre part, la recherche par occurrence. Ce guide explique comment ça marche et dans quels cas utiliser l'une ou l'autre de ces méthodes.

La recherche par similarité

La recherche par similarité est au cœur de la technologie du RAG. C'est pourquoi nous avons souhaité l'intégrer comme base dans la recherche d'un document précis.

Cette méthode utilise des algorithmes de mesure de distance vectoriel afin de comparer le contenu d'une requête utilisateur avec le contenu de l'ensemble d'une base de connaissance. La recherche par similarité est particulièrement utile lorsque le titre exact du document est inconnu mais que l'idée générale de son contenu est connue.

Qu'est ce que ça signifie concrètement ? Cela signifie que lorsqu'une recherche documentaire est déclenché avec l'option similarity search dans Synclab, le système va analyser le contenu sémantique de la requête utilisateur et le comparer à la sémantique des descriptions, des tags, des titres et contenu de l'ensemble des documents inclus dans la base de connaissance. Pour se faire le contenu de la recherche va suivre un processus de vectorisation (d'embedding). Puis le système va comparer les vecteurs de la recherche avec les vecteurs de tous les documents de la base de connaissance. Cette technique permet de trouver des documents qui sont similaires en termes de contenu, même s'ils n'ont pas les mêmes mots-clés.

Dans ce cas, on recherche de la même manière que lorsque l'on s'adresse à un LLM. On ne recherche pas par mot clé mais bien en créant un prompt qui s'appliquera à produire un champ lexical varié autour de la recherche. Par exemple, si la recherche porte sur le fait de retrouver un document ou plusieurs documents sur les "meilleures pratiques de marketing", le système va rechercher des documents qui contiennent des termes similaires tels que "stratégies de marketing", "conseils de marketing" ou "tendances du marketing".

La recherche par occurrence

La recherche par occurrence permet quant à elle de rechercher un mot clé ou une suite de mot clé dans différentes composantes du document (titre, tag ou description). Cela peut être utile si le titre exact du document ou un thème clé est connu. C'est la recherche classique et rapide par excellence. La plupart des pages dans Synclab ont une recherche par occurrence afin de faciliter la navigation. Par exemple, rechercher un document intitulé "Encyclopédie" remontera tous les documents qui contiennent strictement la présence du mot "Encyclopédie" soit dans le titre, les tags, ou la description.

Comment rechercher ?


La recherche globale

Accessible via la mini-barre de navigation latéralegrâce à l'icon : ou par la combinaison de touches ctrl + K sous Mac, Linux ou Windows, la recherche globale permet de rechercher dans l'ensemble de l'espace de travail. C'est la seule recherche qui permet de rechercher à la fois des documents, des historiques de chat et des collections. C'est aussi la seule recherche qui permet de rechercher par similarité.

Lorsqu'on lance une recherche via la recherche globale, par défaut le système utilise la recherche par similarité ; celle ci est matérialisée par l'activation de l'icône : . Pour passer à la recherche par occurrence, il suffit de cliquer sur l'icône .

La recherche dans les barres de navigation latérales Librarie, Historique, Corpus, Partage ou Archivage

cette recherche ne recherche que par occurrence et uniquement dans les documents liés à la barre de navigation latérale dans laquelle vous vous situez.

Illustration

La recherche d'une collection

La recherche dans la page "Mes documents" fonctionne uniquement sur l'occurrence et uniquement le titre des collections. Elle n'a vocation qu'à remonter la collection cible.

La recherche dans une collection

La recherche dans une collection fonctionne uniquement sur l'occurrence de la recherche dans le titre des fichiers. Rapide, elle permet de trouver un document dans une collection sans avoir à faire défiler l'ensemble de la collection.

Cette page vous a t-elle été utile ?