Bases de connaissances

Les bases de connaissances tirent parti de la fonctionnalité de recherche vectorielle d'Oracle Database 26ai pour stocker les incorporations vectorielles à partir de documents stockés dans AI Data Platform Workbench.

Grâce aux fonctionnalités de recherche vectorielle d'Oracle Database 26ai, les bases de connaissances permettent aux agents d'IA d'effectuer des recherches sémantiques et d'extraire des documents sémantiques pertinents. Dans AI Data Platform Workbench, les bases de connaissances sont créées dans un schéma d'un catalogue sous le type Bases de connaissances.


Page Catalogue principal du pupitre AI Data Platform ouverte avec un catalogue sélectionné et des bases de connaissances mises en évidence

Dans AI Data Platform Workbench, les bases de connaissances sont créées dans des schémas de catalogues standard à l'aide du type Base de connaissances. L'ingestion de fichiers PDF, DOCX et TXT stockés dans des volumes gérés ou externes est prise en charge dans les bases de connaissances. Par défaut, les vecteurs sont stockés dans l'instance Oracle Database 26ai Vector Search qui est provisionnée dans votre location lors de la création de votre instance AI Data Platform.

AI Data Platform Workbench prend en charge deux modèles d'intégration :
  • ALL_MINILM_L12_V2 : modèle de transformateur de phrases qui met en correspondance des phrases et des paragraphes avec un espace vectoriel dense de 384 dimensions. Utilisé pour les tâches telles que le clustering ou la recherche sémantique.
  • MULTILINGUAL_E5_SMALL : Génère des incorporations vectorielles pour du texte en plusieurs langues. Sa conception compacte permet des performances efficaces dans différents langages, adaptées à divers ensembles de données et scénarios multilingues.

Remarques :

En soi, un objet de base de connaissances dans AI Data Platform Workbench ne peut pas être directement interrogé. Vous interrogez une base de connaissances en créant un outil RAG attaché à un agent dans un flux d'agent et en sélectionnant la base de connaissances appropriée. Pour plus d'informations sur les outils RAG, reportez-vous à la section RAG Tool. Pour plus d'informations sur les agents d'IA, reportez-vous à Agents d'IA.

Assimilation des sources de données

Après avoir créé une base de connaissances dans AI Data Platform Workbench, vous devez accéder à cette base de connaissances et indiquer une source de données à partir de laquelle ingérer les données. Vous pouvez sélectionner un volume entier ou un dossier dans un volume comme source d'inclusion, mais vous ne pouvez pas sélectionner de fichiers individuels.

Vous pouvez voir vos sources de données dans l'onglet Source de données de votre base de connaissances et voir les informations sur cette source de données en cliquant sur son nom. L'onglet Paramètres fournit des informations sur le volume, le chemin de fichier, le cluster attaché et les types de fichier sélectionnés.

Remarques :

AI Data Platform Workbench ne prend pas en charge les travaux d'inclusion programmés. Vous pouvez inclure des données immédiatement en cliquant sur Inclure maintenant dans l'onglet Paramètres de la source de données.

Vous pouvez consulter des informations plus détaillées sur la source de données dans l'onglet Détails et consulter l'historique des travaux d'inclusion de données dans l'onglet Exécutions de travail.

Créer une base de connaissances

La création d'une base de connaissances dans AI Data Platform Workbench est une configuration unique qui vous permet d'enregistrer une source de document, de découper automatiquement, d'intégrer et d'indexer des fichiers, et d'activer la recherche sémantique et l'extraction de RAG via des flux d'agent.

Vous ne pouvez pas interroger directement les bases de connaissances dans AI Data Platform Workbench. Vous pouvez interroger les bases de connaissances en créant un outil RAG attaché à un agent AI. Pour plus d'informations, reportez-vous à Agents AI.
  1. Cliquez sur Catalogue maître.
  2. Accédez au catalogue et au schéma standard dans lesquels vous souhaitez créer votre base de connaissances.
  3. Cliquez sur Bases de connaissances.
  4. Cliquez sur Icône de création de la base de connaissances Créer une base de connaissance.

    Boîte de dialogue Créer une base de connaissance

  5. Indiquez un nom et un descriptif pour votre base de connaissances.
  6. Sélectionnez un espace de travail et un cluster Spark pour l'inclusion de fichiers. Si aucun cluster n'est sélectionné, le calcul du catalogue maître par défaut est utilisé.
  7. Sélectionnez le modèle d'intégration utilisé, si nécessaire.
  8. Indiquez la taille du bloc et le chevauchement du bloc, si nécessaire.
  9. Cliquez sur Créer.

Modifier une base de connaissances

Vous pouvez modifier le nom, la description, le cluster, le modèle ou les détails de découpage d'une base de connaissances existante si vous disposez des droits d'accès appropriés.

  1. Accédez au dossier de votre base de connaissances.
  2. En regard de la base de connaissances à modifier, cliquez sur Icône Actions à trois points Actions, puis sur Modifier.
  3. Modifiez les attributs de la base de connaissances.
  4. Cliquez sur Enregistrer.

Supprimer une base de connaissances

Vous pouvez supprimer des bases de connaissances dont vous n'avez plus besoin ou que vous n'utilisez plus dans votre catalogue.

  1. Accédez au dossier de votre base de connaissances.
  2. En regard de la base de connaissances à supprimer, cliquez sur Icône Actions à trois points Actions, puis sur Supprimer.
  3. Cliquez sur Supprimer.

Ajouter une source de données à une base de connaissances

Une fois que vous avez créé une base de connaissances, vous devez lui affecter une source de données à assimiler.

  1. Accédez à votre base de connaissances.
  2. Cliquez sur l'onglet Source de données.
  3. Cliquez sur Ajouter une source de données à la base de connaissances Ajouter une source de données à la base de connaissances.

    Boîte de dialogue Ajouter une source de données à la base de connaissances

  4. Dans le catalogue maître, sélectionnez le volume ou le dossier d'un volume à inclure dans votre base de connaissances. Vous ne pouvez pas sélectionner de fichiers individuels.
  5. Si nécessaire, sélectionnez le cluster de calcul à utiliser pour l'assimilation des données.
  6. Sélectionnez les types de fichier à inclure. Les types de fichier pris en charge sont PDF, TXT et DOCX.
  7. Sélectionnez Démarrer le travail d'inclusion lors de l'ajout pour démarrer l'inclusion immédiatement après l'ajout de la source de données.
  8. Cliquez sur Ajouter.

Assimilation de données à une base de connaissances

Une fois qu'une source de données est ajoutée à une base de connaissances, vous pouvez démarrer manuellement un travail d'inclusion de données à partir de l'onglet Paramètres.

  1. Accédez à votre base de connaissances.
  2. Dans l'onglet Source de données, cliquez sur le nom de la source de données pour laquelle exécuter un travail de données d'inclusion.
  3. Dans l'onglet Paramètres, cliquez sur Inclure maintenant.

Afficher le statut d'exécution du travail d'inclusion

Vous pouvez visualiser la liste de tous les travaux d'inclusion pour la source de données à partir de l'onglet Exécutions de travail de la source de données.

  1. Accédez à votre base de connaissances.
  2. Dans l'onglet Source de données, cliquez sur le nom de la source de données pour laquelle visualiser le statut.
  3. Cliquez sur l'onglet Exécutions de travail.
  4. Utilisez les filtres pour restreindre la liste des traitements de travail affichés.

Suppression d'une source de données

Vous pouvez supprimer des sources de données dont vous n'avez plus besoin ou que vous n'utilisez plus dans votre base de connaissances.

La suppression d'une source de données supprime également les incorporations vectorielles correspondantes de votre plate-forme de données AI.
  1. Accédez à votre base de connaissances. Cliquez sur l'onglet Sources de données.
  2. En regard de la source de données à supprimer, cliquez sur Icône Actions à trois points Actions, puis sur Supprimer.
  3. Cliquez sur Supprimer.