Modellauswahl in Generative AI Agents
Der OCI Generative AI Agents-Service unterstützt die Modellauswahl, bei der Sie während der Erstellung oder Bearbeitung ein Large Language Model (LLM) als Routing-LLM für Ihren Agent auswählen können. Sie können aus On-Demand-Modellen auswählen, die im OCI Generative AI-Service gehostet werden, oder dedizierte KI-Clusterendpunkte für unterstützte Modelle erstellen und verwenden.
Die Modellauswahl bietet Flexibilität, um die Performance Ihres Agents basierend auf Ihrer Workload zu optimieren (z.B. für RAG- und SQL-Tools).
So wählen Sie ein Modell aus
Navigieren Sie beim Erstellen oder Bearbeiten eines Agent in der OCI-Konsole unter der Agent-Konfiguration zum Abschnitt Modellauswahl.
-
Wählen Sie die LLM-Art des Arbeitsplans:
- Wählen Sie unter folgenden Optionen:
- Standard: Verwendet das Standardmodell, das vom Generative AI Agents-Service (Llama 3.3 70B) bereitgestellt wird. Dies eignet sich für Allzweckmittel ohne kundenspezifische Modellanforderungen.
- Generatives KI-Modell: Wählen Sie aus On-Demand-Modellen aus, die direkt im OCI Generative AI-Service gehostet werden.
- Endpunkt für generative KI: Wählen Sie aus Modellen aus, die auf dedizierten KI-Clusterendpunkten im OCI Generative AI-Service gehostet werden.
- Wählen Sie unter folgenden Optionen:
-
Bestimmtes Modell oder Endpunkt auswählen:
- Wenn Sie in der Liste Modell für generative KI oder Endpunkt für generative KI ausgewählt haben, zeigt die Konsole eine Liste der verfügbaren Optionen an. Durchsuchen und wählen Sie das bevorzugte Modell oder den bevorzugten Endpunkt aus.
- Die Liste wird basierend auf den verfügbaren Modellen/Endpunkten und IAM-Berechtigungen des Mandanten aufgefüllt
-
Standard-Hyperparameter aktualisieren:
- Prüfen Sie die Standardwerte für die Modell-Hyperparameter.
- Aktualisieren Sie optional einen dieser Hyperparameter.
- Sie können diese Modelle verwenden, wenn Sie RAG-, SQL- und Agent-Tools hinzufügen.
- Um weitere Informationen zu diesen Modellen anzuzeigen, aktivieren Sie das Trace, wenn Sie einen Endpunkt erstellen für diesen Agent.
- Wenn die Liste nicht aufgefüllt wird, sehen Sie anhand der Beispiele auf der Seite Benutzerzugriff auf Modellauswahl in Agents, welche Policy Sie hinzufügen müssen.
Unterstützte Models
| Modelle, die Sie auswählen können | Zu aktualisierende Hyperparameter |
|---|---|
|
|
|
|
|
Unterstützte Regionen
Die folgenden Regionen werden unterstützt:
- Brazil East (Sao Paulo)
- Germany Central (Frankfurt)
- Japan Central (Osaka)
- UK South (London)
- US East (Ashburn)
- US Midwest (Chicago)
- US West (Phoenix)
Führen Sie die folgenden Aufgaben aus, um die verwendbaren Regionen eines Modells für die Agent-Modellauswahlfunktion zu bestätigen.
Verwandte Themen
Wenn ein Modell in Ihrer Region oder Ihrem Modus nicht verfügbar ist, sollten Sie Alternativen aus der unterstützten Liste in Betracht ziehen.
Verwandte Themen