Création d'un pipeline RAG pour la recherche avec OpenSearch

Générez automatiquement du code pour configurer et utiliser un connecteur OCI Generative AI avec Search avec OpenSearch pour un pipeline de génération augmentée de récupération (RAG) de bout en bout.

Avant de commencer, vérifiez et implémentez les prérequis pour l'utilisation d'un connecteur OCI Generative AI avec Search avec OpenSearch.

Vous devrez peut-être configurer davantage de réseau pour que l'application appelle la fonction qui parle au cluster OpenSearch. Le réseau requiert l'une des options suivantes :

  • Pour un sous-réseau public, une passerelle Internet et deux règles de la liste de sécurité : une règle sortante avec conservation de statut et une règle entrante permettant au trafic TCP d'utiliser le port 9200.
  • Pour un sous-réseau privé, une passerelle de service et une règle sortante avec conservation de statut dans la liste de sécurité.

Pour plus d'informations sur la configuration de ces options, reportez-vous à Création du VCN et des sous-réseaux à utiliser avec OCI Functions, s'ils n'existent pas déjà.

L'application doit être exécutée à partir d'une instance de machine virtuelle dans le même sous-réseau que le cluster, ou vous pouvez configurer le transfert de port pour exécuter le code localement. Pour obtenir des exemples de ces options, reportez-vous à Tâche 5 : interroger le service OCI Search.

A partir de la console 

  1. Ouvrez le menu du navigateur et cliquez sur Bases de données. Sous OpenSearch, cliquez sur Clusters.
  2. Sous Portée de liste, sélectionnez le compartiment contenant le cluster.
  3. Dans la liste Clusters, cliquez sur le nom du cluster pour lequel créer le pipeline RAG.
  4. Sur la page de détails du cluster, cliquez sur Créer un pipeline RAG.
  5. Sur la page Configurer le pipeline RAG, dans Informations générales, entrez le nom, la description et la balise du pipeline, puis indiquez des champs de contexte.
    Les champs contextuels indiquent le texte qui est traduit en incorporations pour l'index. Les valeurs indiquées ici doivent correspondre aux champs qui existent dans l'index.

    Pour utiliser la fonctionnalité permettant de générer automatiquement le code du connecteur d'IA générative à partir de la console, le mot de passe du cluster doit être stocké à l'aide d'une clé secrète avec le service OCI Vault. Si le mot de passe est déjà stocké en tant que clé secrète de coffre, indiquez le nom utilisateur dans Informations d'identification de coffre de cluster, puis sélectionnez le coffre, la clé secrète de coffre et la version de clé secrète pour le cluster.

    Si le mot de passe n'est pas stocké en tant que clé secrète de coffre, sélectionnez Créer un coffre et une clé secrète, puis effectuez les tâches suivantes :

    1. Créer un coffre.
    2. Une fois le coffre actif, créez une clé pour le coffre.
    3. Pour le coffre, créez une clé secrète avec les spécificités suivantes :
      • Sélectionnez la clé que vous avez créée à l'étape précédente.
      • Entrez manuellement le mot de passe du cluster OpenSearch au format suivant :
        • Modèle de type de clé secrète : Plain-Text
        • Contenu de clé secrète : <OpenSearch-password>
  6. Dans Groupe de modèles, entrez le nom et la description du groupe de modèles. Si vous entrez le nom d'un groupe de modèles existant, le code généré utilise l'ID du groupe de modèles pour le groupe de modèles existant, sinon un nouveau groupe de modèles est créé.
  7. Sélectionnez Suivant.
  8. Sur la page Configurer le connecteur d'IA générative, dans Connecteur d'IA générative, entrez le nom et la description du connecteur.
  9. Sélectionnez l'action, puis le modèle à utiliser pour le connecteur.
    Les champs de la section Paramètres du modèle d'IA générative sont renseignés avec les valeurs par défaut, en fonction du modèle que vous avez sélectionné à l'étape précédente. Vous pouvez modifier les valeurs des paramètres. Vous ne pouvez entrer que des paramètres valides et les valeurs de paramètre autorisées sont basées sur le modèle que vous sélectionnez. Une valeur de paramètre qui fonctionne pour un modèle peut ne pas fonctionner si vous sélectionnez un autre modèle.
  10. Dans Modèle de registre d'IA générative, entrez un nom et une description pour le modèle d'IA générative.
  11. Sélectionnez Suivant.
La page Générer du code contient le code que vous utilisez pour créer le pipeline RAG, en fonction des options indiquées sur les pages précédentes dans le workflow Créer un pipeline RAG. Pour le code autonome que vous pouvez copier ou télécharger, sélectionnez Java ou Python dans la liste déroulante Langage. Vous pouvez ensuite copier ou télécharger le code dans la première zone de texte dans une application.

Si vous sélectionnez Kibana, le code généré ne peut pas être exécuté en tant qu'application autonome. A la place, le code généré est divisé en étapes séquentielles que vous copiez pour l'exécuter à partir du tableau de bord OpenSearch du cluster.

La deuxième zone de texte contient un code de modèle indiquant comment effectuer des requêtes après la création du pipeline.