L'arborescence documentaire de Synclab

Pour organiser les documents, SyncLab propose une arborescence à trois niveaux.

  1. Le fichier est la plus petite unité de stockage. Il représente le contenu d'un document ; texte, table ou image.
  2. La collection est un ensemble de fichiers. Elle permet d'organiser les fichiers par thématique.
  3. Le corpus est un ensemble de collections et de fichiers. Il permet d'organiser les collections par grands ensembles thématiques.

Les fichiers

  • Définition:

    Le fichier est la plus petite unité de stockage. Il représente le contenu et peut être de différent type : document, table ou image.

  • Capacité :

    • Requêter
    • Importer.
    • Renommer.
    • Déplacer.
    • Supprimer.

Les collections

  • Définition:

    Une collection est composée par un ensemble de documents qui peuvent être de différents types (texte, tableau, image). Le nombre de fichiers composant une collection n'est pas limité. Nous avons expressément fait le choix de ne pas permettre de créer des collections à l'intérieur d'autres collections. Nous pensons que la création de collections imbriquées peut rendre la gestion des documents plus complexe dans le contexte du RAG.

  • Intérêt de la collection :
    1. Organiser les documents par thématique.
    2. Permettre de requêter rapidement un ensemble de documents partageant une même thématique.
    3. Permettre de partager un ensemble de document à un autre utilisateur.
  • Capacité :
    • Créer.
    • Renommer.
    • Supprimer.
    • Partager.

Les corpus

  • Définition :

    Un corpus est un ensemble de fichiers ou de collections. Le nombre de fichiers ou de collections composant un corpus n'est pas limité.

  • Intérêt du corpus :

    • Organiser documents et collections par grands ensembles.
    • Permettre de requêter rapidement un ensemble de document et de collection partageant une même thématique.
  • Capacité :

    • Créer.
    • Renommer.
    • Supprimer.

Cette page vous a t-elle été utile ?