Sélection de modèle dans les agents d'IA générative
Le service Agents OCI Generative AI prend en charge la sélection de modèle, dans laquelle vous pouvez sélectionner un grand modèle de langage (LLM) comme LLM de routage pour votre agent lors de sa création ou de sa modification. Vous pouvez sélectionner des modèles à la demande hébergés dans le service OCI Generative AI ou créer et utiliser des adresses de cluster d'IA dédiées pour les modèles pris en charge.
La sélection de modèle permet d'optimiser les performances de votre agent en fonction de votre charge globale (par exemple, pour les outils RAG et SQL).
Sélection d'un modèle
Lors de la création ou de la modification d'un agent dans la console OCI, accédez à la section Sélection de modèle sous la configuration de l'agent.
-
Sélectionnez le type de LLM de routage :
- Sélectionnez l'une des options suivantes :
- Valeur par défaut : utilise le modèle standard fourni par le service Agents d'IA générative (Llama 3.3 70B). Il convient aux agents à usage général sans besoin de modèle personnalisé.
- Modèle d'IA générative : sélectionnez l'un des modèles à la demande hébergés directement dans le service OCI Generative AI.
- Adresse d'IA générative : sélectionnez parmi les modèles hébergés sur des adresses de cluster d'IA dédiées dans le service OCI Generative AI.
- Sélectionnez l'une des options suivantes :
-
Sélectionnez un modèle ou une adresse spécifique :
- Si vous avez sélectionné Modèle d'IA générative ou Adresse d'IA générative dans la liste, la console affiche la liste des options disponibles. Parcourez et sélectionnez le modèle ou l'adresse de préférence.
- La liste est renseignée en fonction des modèles/adresses disponibles de la location et des droits d'accès IAM
-
Mettre à jour les hyperparamètres par défaut :
- Vérifiez les valeurs par défaut des hyperparamètres de modèle.
- Mettez éventuellement à jour l'un de ces hyperparamètres.
- Vous pouvez utiliser ces modèles lorsque vous ajoutez des outils RAG, SQL et Agent.
- Pour plus d'informations sur ces modèles, activez la trace lorsque vous créez une adresse pour cet agent.
- Si la liste n'est pas renseignée, voyez quelle stratégie vous devez ajouter à partir des exemples de la page Accès utilisateur à la sélection de modèle dans les agents.
Modèles pris en charge
| Modèles que vous pouvez sélectionner | Hyperparamètres que vous pouvez mettre à jour |
|---|---|
|
|
|
|
|
Régions prises en charge
Les régions suivantes sont prises en charge :
- Est du Brésil (São Paulo)
- Allemagne centrale (Francfort)
- Centre du Japon (Osaka)
- Sud du Royaume-Uni (Londres)
- Est des Etats-Unis (Ashburn)
- Midwest des Etats-Unis (Chicago)
- Ouest des Etats-Unis (Phoenix)
Pour confirmer les régions utilisables d'un modèle pour la fonction de sélection du modèle d'agents, effectuez les tâches suivantes.
Rubriques connexes
Si un modèle n'est pas disponible dans votre région ou votre mode, envisagez des alternatives à partir de la liste prise en charge.
Rubriques connexes