Création d'un pipeline RAG pour la recherche avec OpenSearch

Générez automatiquement du code pour configurer et utiliser un connecteur du service d'intelligence artificielle générative pour OCI avec la fonction de recherche OpenSearch pour un pipeline de génération augmentée par extraction de bout en bout.

Avant de commencer, vérifiez et mettez en oeuvre les préalables pour l'utilisation d'un connecteur du service d'intelligence artificielle générative pour OCI avec la fonction de recherche OpenSearch.

Vous devrez peut-être configurer davantage de réseau pour que l'application appelle la fonction qui parle à la grappe OpenSearch. Le réseau requiert l'une des options suivantes :

  • Pour un sous-réseau public, une passerelle Internet et deux règles de la liste de sécurité : une règle de trafic sortant avec état et une règle de trafic entrant permettant au trafic TCP d'utiliser le port 9200.
  • Pour un sous-réseau privé, une passerelle de service et une règle de trafic sortant avec état dans la liste de sécurité.

Pour plus d'informations sur la configuration de ces options, voir Création du VCN et des sous-réseaux à utiliser avec le service des fonctions pour OCI, s'ils n'existent pas déjà.

L'application doit être exécutée à partir d'une instance de machine virtuelle dans le même sous-réseau que la grappe, ou vous pouvez configurer le réacheminement de port pour exécuter le code localement. Voir Tâche 5 : Interroger le service de recherche OCI pour obtenir des exemples de ces options.

Dans la console

  1. Ouvrez le menu de navigation et cliquez sur Bases de données. Sous OpenSearch, cliquez sur Grappes.
  2. Sous Portée de la liste, sélectionnez le compartiment qui contient la grappe.
  3. Dans la liste Grappes, cliquez sur le nom de la grappe pour laquelle vous voulez créer le pipeline RAG.
  4. Dans la page des détails de la grappe, cliquez sur Créer un pipeline de RAG.
  5. Dans la page Configurer le pipeline RAG, dans Informations générales, entrez un nom, une description et un marqueur pour le pipeline, puis spécifiez un ou plusieurs champs de contexte.
    Les champs de contexte spécifient le texte qui est traduit en plongements pour l'index. Les valeurs indiquées ici doivent correspondre aux champs qui existent dans l'index.

    Pour utiliser la fonctionnalité permettant de générer automatiquement le code du connecteur du service d'intelligence artificielle générative à partir de la console, le mot de passe de la grappe doit être stocké à l'aide d'une clé secrète avec le service de chambre forte OCI. Si le mot de passe est déjà stocké en tant que clé secrète de chambre forte, spécifiez le nom d'utilisateur dans Données d'identification du service de chambre forte de grappe, puis sélectionnez la chambre forte, la clé secrète de chambre forte et la version de clé secrète pour la grappe.

    Si le mot de passe n'est pas stocké en tant que clé secrète de chambre forte, sélectionnez Créer une chambre forte et une clé secrète et effectuez les tâches suivantes :

    1. Créer une chambre forte.
    2. Une fois la chambre forte active, créez une clé pour la chambre forte.
    3. Pour la chambre forte, créez une clé secrète avec les détails suivants :
      • Sélectionnez la clé que vous avez créée à l'étape précédente.
      • Entrez manuellement le mot de passe de la grappe OpenSearch dans le format suivant :
        • Modèle de type de clé secrète : Plain-Text
        • Contenu de la clé secrète : <OpenSearch-password>
  6. Dans Groupe de modèles, entrez un nom et une description pour le groupe de modèles. Si vous entrez le nom d'un groupe de modèles existant, le code généré utilise l'ID groupe de modèles pour le groupe de modèles existant, sinon un nouveau groupe de modèles est créé.
  7. Sélectionnez Suivant.
  8. Dans la page Configurer le connecteur du service d'intelligence artificielle générative, dans Connecteur du service d'intelligence artificielle générative, entrez un nom et une description pour le connecteur.
  9. Sélectionnez l'action, puis le modèle à utiliser pour le connecteur.
    Les champs de la section Paramètres du modèle d'IA générative sont alimentés avec des valeurs par défaut, en fonction du modèle que vous avez sélectionné à l'étape précédente. Vous pouvez modifier les valeurs des paramètres. Vous ne pouvez entrer que des paramètres valides et les valeurs de paramètre autorisées sont basées sur le modèle que vous sélectionnez. Une valeur de paramètre qui fonctionne pour un modèle peut ne pas fonctionner si vous sélectionnez un autre modèle.
  10. Dans Modèle de registre d'IA générative, entrez un nom et une description pour le modèle d'IA générative.
  11. Sélectionnez Suivant.
La page Générer du code contient le code que vous utilisez pour créer le pipeline RAG, en fonction des options que vous avez spécifiées dans les pages précédentes du flux de travail Créer un pipeline RAG. Pour le code autonome que vous pouvez copier ou télécharger, sélectionnez Java ou Python dans la liste déroulante Langue. Vous pouvez ensuite copier ou télécharger le code de la première zone de texte dans une application.

Si vous sélectionnez Kibana, le code généré ne peut pas être exécuté en tant qu'application autonome. Le code généré est fractionné en étapes séquentielles que vous copiez pour exécuter à partir du tableau de bord OpenSearch de la grappe.

La deuxième zone de texte contient le code de modèle indiquant comment effectuer des interrogations après la création du pipeline.