Erstellen eines Endpunkts

Erstellen Sie einen Endpunkt für ein benutzerdefiniertes, vortrainiertes oder importiertes Modell in einem dedizierten KI-Hostcluster in OCI Generative AI.

Wichtig

Um einem privaten Endpunkt ein Modell hinzuzufügen, erstellen Sie zunächst einen privaten Endpunkt, und kehren Sie dann zu dieser Seite zurück, um die Schritte zum Anhängen des Modells anzuzeigen.

Private Endpunkte unterstützen nur vortrainierte und benutzerdefinierte Modelle. Importierte Modelle werden nicht unterstützt.

Wählen Sie auf der Listenseite Endpunkte die Option Endpunkt erstellen aus. Wenn Sie Hilfe beim Suchen der Listenseite benötigen, lesen Sie Endpunkte auflisten.
Endpunktinformationen
Wählen Sie ein Compartment für die Erstellung des Endpunkts aus. Das Standard-Compartment ist mit der Listenseite identisch. Sie können jedoch jedes Compartment auswählen, für das Sie die Berechtigung zur Arbeit haben.

Tipp

Es wird empfohlen, den Endpunkt in demselben Compartment wie das Modell zu erstellen.

(Optional) Geben Sie einen Namen für den Endpunkt ein. Beginnen Sie den Namen mit einem Buchstaben oder Unterstrich, gefolgt von Buchstaben, Zahlen, Bindestrichen und Unterstrichen. Sie können zwischen 1 und 255 Zeichen lang sein. Wenn Sie keinen Namen eingeben, generiert das System einen Namen, den Sie später ändern können.
Der generierte Name hat das Format generativeaiendpoint<timestamp>. Beispiel: generativeaiendpoint20250531235319

(Optional) Geben Sie eine Beschreibung für das Modell an.
Hostingkonfiguration
Wählen Sie das Compartment aus, das das Modell hostet, dem Sie einen Endpunkt hinzufügen möchten.
Wählen Sie das Modell aus, dem Sie einen Endpunkt hinzufügen möchten. Bei diesem Modell kann es sich um ein benutzerdefiniertes Modell, ein importiertes Modell oder ein einsatzbereites, vortrainiertes Basismodell handeln, das in der Region verfügbar ist, in der Sie arbeiten.
Wenn das ausgewählte Modell mehrere Versionen aufweist, wählen Sie eine Modellversion aus.
Für die einsatzbereiten, vortrainierten Basismodelle wird dieses Feld bei der Auswahl des Modells ausgefüllt.

Wählen Sie ein dediziertes Hosting-KI-Cluster aus, indem Sie eine der folgenden Aktionen ausführen:

Wählen Sie ein dediziertes KI-Cluster aus der Liste aus. Wenn Sie vor einigen Minuten ein Cluster erstellt haben, warten Sie, bis dieses Cluster aktiv wird.

Wählen Sie Neues dediziertes KI-Cluster erstellen aus, und führen Sie die folgenden Schritte durch:

(Optional) Geben Sie einen Namen und eine Beschreibung ein.

Wählen Sie unter Basismodell eine der folgenden Optionen aus:

Das vortrainierte Basismodell, das Sie hosten.

Wenn Sie ein benutzerdefiniertes Modell verwenden, das anhand eines Basismodells verfeinert wurde, wählen Sie das ursprüngliche Basismodell aus, auf dem es trainiert wurde.

Wenn Sie ein importiertes Modell verwenden, wählen Sie dieses importierte Modell aus.

Wenn Sie ein importiertes Modell ausgewählt haben, wählen Sie eine empfohlene Einheitsgröße basierend auf diesem Leitfaden aus.

Für das Modellreplikat benötigen Sie mindestens eine Einheit für einen Endpunkt.

Lesen Sie die Stunden der Verpflichtungseinheit für das dedizierte KI-Cluster für das Hosting, und aktivieren Sie das Kontrollkästchen, um der Verpflichtung zuzustimmen.

(Optional) Wählen Sie Tag hinzufügen aus, und weisen Sie diesem dedizierten KI-Cluster Tags zu. Siehe Ressourcentags.

Wählen Sie Erstellen aus, und warten Sie, bis das Cluster aktiv wird.

Markieren Sie in der Liste Dediziertes KI-Cluster das von Ihnen erstellte dedizierte KI-Cluster.
Netzwerkressourcen (für vortrainierte und benutzerdefinierte Modelle)
Wählen Sie eine der folgenden Optionen aus:

Öffentlicher Endpunkt

Privater Endpunkt: Wenn Sie diese Option auswählen, wählen Sie das Compartment für den privaten Endpunkt und dann den privaten Endpunkt aus, den Sie verwenden möchten. (Nicht für importierte forl-Modelle verfügbar.)

Standardmäßig haben importierte Modelle öffentliche Endpunkte.
Leitschienen (für vortrainierte und kundenspezifische Modelle)
Hinweis

Guardrails sind für importierte Modelle nicht verfügbar.
Wählen Sie, ob die folgenden Leitplanken aktiviert werden sollen.

Inhaltsmoderation

Aus: Wenden Sie keine Inhaltsmoderation an, und geben Sie keine expliziten Inhalte aus.

Blockieren: Helfen Sie dabei, die Moderation von Inhalten zu identifizieren und anzuwenden.

Informieren: Wenden Sie keine Inhaltsmoderation an, sondern informieren Sie den Benutzer, wenn das Modell Inhalte erkennt, die moderiert werden müssen.

Schutz vor Prompt-Injection (PI)

Aus: Wenden Sie keinen PI-Schutz an, und lassen Sie uneingeschränkte Eingaben zu.

Blockieren: Helfen Sie bei der Identifizierung und dem Schutz vor Prompt Injection.

Informieren: Wenden Sie keinen PI-Schutz an, sondern informieren Sie den Benutzer, wenn das Modell Inhalte erkennt, die PI-Schutz erfordern.

Schutz personenbezogener Daten

Aus: Wenden Sie keinen Schutz für personenbezogene Daten an, sondern geben Sie Inhalte ohne Einschränkungen für die Offenlegung von Daten aus.

Blockieren: Helfen Sie dabei, personenbezogene Daten zu identifizieren und zu schützen, wie z.B. Hilfe beim Entfernen personenbezogener Daten aus Antworten.

Informieren: Wenden Sie keinen PII-Schutz an, sondern informieren Sie den Benutzer, wenn das Modell Inhalte erkennt, die personenbezogene Daten schützen müssen.

(Optional) Wählen Sie Tag hinzufügen aus, und weisen Sie diesem Endpunkt Tags zu. Siehe Ressourcentags.
Wählen Sie Erstellen aus.
Sie werden zur Seite mit den Endpunktdetails weitergeleitet, auf der Sie den Status des Endpunkts verfolgen können.

Nachdem der Endpunkt aktiv ist, wählen Sie Im Playground anzeigen aus, und verwenden Sie das Modell von diesem Endpunkt aus.
Verwenden Sie den Befehl endpoint create und die erforderlichen Parameter, um einen Endpunkt zu erstellen:
```
oci generative-ai endpoint create 
--model-id <model-OCID>
--compartment-id <compartment-OCID> 
--dedicated-ai-cluster-id <hosting-dedicated-AI-cluster-OCID> 
[OPTIONS]
```
Eine vollständige Liste der Parameter und Werte für CLI-Befehle finden Sie in der CLI-Befehlsreferenz.

Hinweis

Bei vortrainierten Modellen können Sie anstelle einer OCID den Modellnamen genau wie auf dem Playground der Konsole verwenden. Sie finden diesen OCI-Modellnamen auch auf der Detailseite des Modells unter Vorgeschulte Grundlagenmodelle in generativer KI.
Führen Sie den Vorgang CreateEndpoint aus, um einen Endpunkt zu erstellen.

Hinweis

Bei vortrainierten Modellen können Sie anstelle einer OCID den Modellnamen genau wie auf dem Playground der Konsole verwenden. Sie finden diesen OCI-Modellnamen auch auf der Detailseite des Modells unter Vorgeschulte Grundlagenmodelle in generativer KI.

Oracle Cloud Infrastructure-Dokumentation

Erstellen eines Endpunkts

Endpunktinformationen

Hostingkonfiguration

Netzwerkressourcen (für vortrainierte und benutzerdefinierte Modelle)

Leitschienen (für vortrainierte und kundenspezifische Modelle)