Sélection de modèle dans les agents d'intelligence artificielle générative
Le service d'agents du service d'intelligence artificielle générative pour OCI prend en charge la sélection de modèle, où vous pouvez sélectionner un grand modèle de langage (LLM) comme modèle d'acheminement pour votre agent lors de la création ou de la modification. Vous pouvez sélectionner des modèles sur demande hébergés dans le service d'intelligence artificielle générative pour OCI ou créer et utiliser des points d'extrémité de grappe dédiée à l'IA pour les modèles pris en charge.
La sélection de modèle offre la flexibilité nécessaire pour optimiser les performances de votre agent en fonction de votre charge de travail (par exemple, pour les outils RAG et SQL).
Comment sélectionner un modèle
Lors de la création ou de la modification d'un agent dans la console OCI, naviguez jusqu'à la section Sélection de modèle sous la configuration de l'agent.
-
Sélectionnez le type de GML d'acheminement :
- Vous disposez des options suivantes :
- Valeur par défaut : Utilise le modèle standard fourni par le service d'agents d'IA générative (Llama 3.3 70B). Ceci convient aux agents à usage général sans besoins de modèle personnalisé.
- Modèle d'IA générative : Sélectionnez un des modèles sur demande hébergés directement dans le service d'IA générative pour OCI.
- Point d'extrémité du service d'intelligence artificielle générative : Sélectionnez un des modèles hébergés sur des points d'extrémité de grappe dédiée au service d'intelligence artificielle générative pour OCI.
- Vous disposez des options suivantes :
-
Sélectionner un modèle ou un point d'extrémité spécifique :
- Si vous avez sélectionné Modèle d'IA générative ou Point d'extrémité d'IA générative dans la liste, la console affiche une liste des options disponibles. Parcourez et sélectionnez le modèle ou le point d'extrémité préféré.
- La liste est alimentée en fonction des modèles/points d'extrémité disponibles de la location et des autorisations IAM
-
Mettre à jour les hyperparamètres par défaut :
- Vérifiez les valeurs par défaut des hyperparamètres de modèle.
- Vous pouvez éventuellement mettre à jour l'un de ces hyperparamètres.
- Vous pouvez utiliser ces modèles lorsque vous ajoutez des outils RAG, SQL et Agent.
- Pour voir plus d'informations sur ces modèles, activez la trace lorsque vous créez un point d'extrémité pour cet agent.
- Si la liste n'est pas alimentée, consultez la politique à ajouter à partir des exemples de la page Accès de l'utilisateur à la sélection de modèle dans les agents.
Modèles pris en charge
| Modèles que vous pouvez sélectionner | Hyperparamètres que vous pouvez mettre à jour |
|---|---|
|
|
|
|
|
Régions prises en charge
Les régions suivantes sont prises en charge :
- Brésil - Est (Sao Paulo)
- Allemagne - Centre (Francfort)
- Japon - Centre (Osaka)
- Royaume-Uni - Sud (Londres)
- États-Unis - Est (Ashburn)
- États-Unis - Midwest (Chicago)
- États-Unis - Ouest (Phoenix)
Pour confirmer les régions utilisables d'un modèle pour la fonction de sélection de modèle d'agent, effectuez les tâches suivantes.
Rubriques connexes
Si un modèle n'est pas disponible dans votre région ou mode, envisagez des alternatives dans la liste prise en charge.
Rubriques connexes