Créer un profil d'IA

Autonomous AI Database utilise des profils d'IA pour faciliter et configurer l'accès à un LLM et pour configurer la génération, l'exécution et l'explication du code SQL en fonction des invites de langage naturel à l'aide de Data Studio.

Avant de créer un profil AI à l'aide de Data Studio, vous devez connaître les concepts suivants :
  • Paramètres RAG : les paramètres RAG configurent les pipelines de génération augmentée de récupération dans Oracle Autonomous Database Serverless, ce qui permet aux profils d'IA de charger et d'interroger des données non structurées à partir de bases de connaissances avec des tables structurées. Ces paramètres définissent la façon dont les documents sont traités en vecteurs pour la recherche sémantique, améliorant ainsi la précision de SELECT AI pour les requêtes en langage naturel.
    Remarque

    Vous ne pouvez pas accéder aux fonctionnalités RAG, telles que la création et l'utilisation d'index vectoriels dans Oracle AI Database 19c. Ces fonctionnalités sont prises en charge dans Oracle AI Database 26ai.
  • Index de vecteur : les index de vecteur doivent être spécifiés pour stocker les incorporations générées à partir de pipelines RAG ou de données de table, ce qui permet des recherches de similarité efficaces lors de l'inférence AI. Lors de la création de profils d'IA via DBMS_CLOUD_AI.CREATE_PROFILE, les index vectoriels lient le profil aux fonctionnalités de recherche vectorielle d'Oracle, ce qui garantit que le modèle d'IA extrait le contexte pertinent des données vectorisées. Vous pouvez créer des index vectoriels à partir des paramètres Data Studio.
  • Métadonnées de table:

    Les métadonnées de table, fournies en tant que object_list dans les attributs du profil (par exemple, [{"owner" : "SH", "name" : "customers"}]), étend l'accès du programme d'installation automatisée à des tables de base de données spécifiques et applique les stratégies de sécurité. Cela empêche l'IA d'interroger des données involontaires, s'aligne sur les contrôles IAM et optimise le langage naturel pour la génération SQL pour les schémas définis.

Pour plus de détails, reportez-vous à Sélectionner une IA avec la génération augmentée d'extraction (RAG).

Les profils AI prennent en charge deux modes :
  • Mode RAG : Il utilise l'index vectoriel pour la recherche sémantique sur les données non structurées.
  • Mode du langage naturel au langage SQL (NL2SQL) : il n'est pas nécessaire d'utiliser l'index vectoriel pour activer des options axées sur une table, telles que le mode de liste d'objets.
Si vous sélectionnez +, l'assistant Créer un profil AI s'ouvre :
  1. Dans l'onglet Service de l'assistant Créer un profil AI, indiquez les valeurs de champ suivantes :



    • Nom de profil : entrez le nom du profil AI. Par exemple, OCI AI.
    • Fournisseur AI : sélectionnez l'un des fournisseurs suivants dans le champ déroulant :
      • OCI
      • Ouvrir l'IA
      • Service Azure OpenAI
      • Cohere
      • Google
      • Anthropique
      • Hugging Face
    • Modèle d'IA : sélectionnez les modèles d'IA disponibles dans la liste déroulante vers laquelle votre profil d'IA pointera pour que la base de données réponde aux questions en langage naturel sur vos données et génère ou explique le code SQL, y compris les résultats augmentés par extraction à l'aide d'intégrations et d'index vectoriels.

    • Informations d'identification : il s'agit des informations d'identification stockées que la base de données utilise pour se connecter en toute sécurité au fournisseur d'IA externe que votre profil est configuré pour utiliser.

    Sous Paramètres avancés, vous pouvez afficher les paramètres de génération et les paramètres de service :
    • Paramètres de génération : les paramètres de génération vous aident à configurer le comportement et les limites du modèle d'IA accessible via le profil des services d'IA d'Oracle Cloud Infrastructure, ce qui permet de personnaliser différents cas d'utilisation tels que les discussions, la génération SQL ou les requêtes en langage naturel à partir d'Autonomous Database.
    • Paramètres de service : les paramètres de service font référence aux champs de configuration qui apparaissent dynamiquement en fonction du fournisseur d'IA sélectionné, ce qui permet aux utilisateurs d'entrer des informations d'identification et des paramètres propres au fournisseur, tels que des adresses, des régions ou des noms de déploiement.
      Note

      For AI Providers such as OpenAI, Cohere, Google, Anthropic, or Hugging Face, the Service Settings section is not displayed.

    Les valeurs du champ Paramètres de service varient en fonction du fournisseur d'IA que vous sélectionnez.

    Lorsque vous sélectionnez OCI dans Fournisseur d'IA, vous affichez les champs suivants :
    • Format d'API OCI : indique le schéma de demande et de réponse attendu par l'adresse d'IA générative, par exemple COHERE, Generic ou un format natif OCI pour les modèles Oracle.
    • Région OCI : identificateur de région OCI sur lequel l'adresse est exécutée. Elle garantit que les appels de votre base de données sont acheminés vers les modèles d'IA régionaux appropriés. Chaque région OCI de base de données d'IA autonome prend en charge différents LLM. Certaines régions telles que us-chicago-1, uk-london-1 et ap-osaka-1 en offrent beaucoup, tandis que d'autres en proposent moins. Nous affichons uniquement les modèles disponibles dans la région sélectionnée. Si le modèle d'IA OCI n'apparaît pas, vous pouvez changer de région pour actualiser la liste des modèles. Pour plus d'informations, reportez-vous à Régions avec l'IA générative et à Modèles de base préentraînés dans l'IA générative.
    • ID de compartiment OCI : il s'agit de l'OCID du compartiment OCI propriétaire des adresses à utiliser. Il étend l'accès et la facturation au conteneur logique approprié dans votre location, en s'alignant sur vos stratégies IAM.
    • ID d'adresse OCI : il s'agit de l'OCID d'une adresse AI spécifique sur un cluster d'IA dédié, par exemple ocid1.generativeaiendpoint.oc1.us-chicago-1. La spécification de ce champ indique à Select AI d'utiliser cette adresse dédiée au lieu d'un modèle partagé à la demande.
    Lorsque vous sélectionnez Service OpenAI Azure dans le champ Fournisseur d'IA, vous affichez les champs suivants :
    • Nom de ressource Azure : indiquez le nom unique de l'instance de ressource de service OpenAI Azure, qui fait partie de l'URL d'adresse (par exemple, https://your-resource-name.openai.azure.com/) pour accéder au service.

    • Nom de déploiement Azure : indiquez le nom personnalisé que vous affectez lors du déploiement d'un modèle de langue spécifique au sein de cette ressource OpenAI Azure.

    • Nom de déploiement d'intégration Azure : indiquez le nom personnalisé d'un déploiement distinct pour un modèle d'intégration (tel que text-embedding-ada-002 ou text-embedding-3-large) au sein de la même ressource, utilisée exclusivement pour créer des représentations vectorielles de texte.

    Pour plus d'informations sur les champs ci-dessus, reportez-vous à Brique d'intégration Azure OpenAI - Recherche Azure AI | Microsoft Learn.

    Sous Paramètres de génération, vous pouvez afficher les champs suivants :
    • Jetons d'arrêt : il s'agit de séquences de jeton qui indiquent au modèle AI où arrêter de générer une sortie de texte supplémentaire. Lorsque le modèle génère l'un de ces jetons, il s'arrête. Cela permet de contrôler la longueur de la réponse et d'éviter le texte de fin indésirable.

    • Nombre maximal de jetons : définit le nombre maximal de jetons que le modèle AI peut générer en réponse à une invite. Il limite la longueur de la sortie générée pour éviter des réponses trop longues ou coûteuses.

    • Valeurs sensibles à la casse : ce paramètre indique si les valeurs ou paramètres d'entrée doivent être traités comme sensibles à la casse par le traitement AI. Si la valeur est True, la casse exacte doit être mise en correspondance pour les valeurs d'entrée ou de paramètre.

    • Conversation : indique généralement si le profil d'IA prend en charge le contexte conversationnel, ce qui permet au modèle de conserver le contexte sur plusieurs interactions ou échanges d'invite, ce qui est utile pour les applications d'IA de type chat.

    • Température : paramètre de curseur contrôlant le caractère aléatoire des réponses de l'IA. Une température plus basse (par exemple, 0,2) rend la production plus ciblée et déterministe, tandis qu'une température plus élevée (par exemple, 0,8) donne une génération de texte plus créative et diversifiée.

    Cliquez sur Suivant pour accéder à l'onglet Paramètres RAG de la page Créer un profil AI.

  2. Paramètres RAG :

    Vous pouvez afficher les champs facultatif suivants dans les paramètres RAG :



    • Index de vecteur : sélectionnez l'index de vecteur que vous créez dans la liste des index de vecteur disponibles. Il indique l'index vectoriel Oracle Database à utiliser pour stocker et rechercher les incorporations de vos documents, de sorte que le profil d'IA puisse rapidement trouver le contenu le plus pertinent lors de la génération augmentée par extraction.

      Pour plus d'informations, reportez-vous à Créer un index de vecteur.

      Votre profil AI nécessite un index vectoriel pour fonctionner.

    • Modèle d'intégration : indique le modèle d'intégration utilisé pour convertir votre texte en représentations vectorielles stockées dans cet index, ce qui garantit que le comportement de recherche sémantique correspond au modèle que vous configurez pour la RAG.

      Les champs ci-dessus sont facultatif. Vous pouvez les ignorer et cliquer sur Créer un profil AI pour créer un profil AI. Vous pouvez également accéder à l'onglet Métadonnées de table.

  3. Sous l'onglet Métadonnées de table, vous pouvez afficher les champs facultatif suivants :



    Remarque

    Si vous avez ignoré la sélection d'un index de vecteur à l'étape précédente, vous afficherez un paramètre appelé Mode de liste d'objets.

    • Mode Liste d'objets : vous pouvez sélectionner l'une des options de champ disponibles :
      • Tout : cette option envoie les métadonnées de toutes les tables des schémas indiqués au LLM, afin qu'il puisse générer des instructions SQL sur chacune d'elles.

      • Automatisé : cette option permet à Select AI de choisir automatiquement un sous-ensemble de tables pertinentes en exécutant une recherche vectorielle sur les métadonnées de schéma. Seules les tables les plus probables pour une invite donnée sont donc utilisées.

      • Tables sélectionnées : cette option limite les métadonnées aux seules tables spécifiques répertoriées dans le profil AI, de sorte que la génération SQL est limitée à ces tables.

        Vous pouvez également visualiser la liste d'objets dans laquelle vous pouvez sélectionner la liste des objets que le LLM peut utiliser.

        Si vous sélectionnez Liste d'objets, un autre paramètre supplémentaire Imposer la liste d'objets est également affiché.

      • Aucun : cette option n'envoie pas de métadonnées de table à partir d'une liste d'objets, de sorte que le programme d'installation automatisée ne peut pas générer de SQL sur des tables ou s'appuyer sur une autre configuration qui n'utilise pas de liste d'objets explicite.
      Remarque

      Vous ne pouvez pas afficher le champ Mode Liste d'objets avec Oracle AI Database 19c.
    • Annotations : utilisez cette bascule pour activer les annotations qui indiquent si le programme d'installation automatisée peut utiliser des métadonnées descriptives supplémentaires attachées à des objets (comme des descriptions de colonne ou des balises) en tant que contexte supplémentaire lors de la génération des résultats.

    • Commentaires : utilisez cette bascule pour contrôler si les commentaires de table et de colonne du dictionnaire de données sont exposés à l'IA en tant que contexte, ce qui peut l'aider à mieux comprendre la signification de vos données.
    • Contraintes : utilisez cette bascule pour contrôler si les informations sur les clés primaires, les clés étrangères et d'autres contraintes sont fournies à l'IA, ce qui l'aide à raisonner sur les relations entre les tables et à améliorer la précision des requêtes.

    Cliquez sur Créer un profil d'IA.

Vous avez créé et configuré votre profil AI dans l'assistant Paramètres de Data Studio.