Privaten Endpunkt erstellen
Erstellen Sie einen privaten Endpunkt für ein benutzerdefiniertes oder vortrainiertes Modell in einem dedizierten KI-Hostcluster in OCI Generative AI.
Bevor Sie einen privaten Endpunkt erstellen, führen Sie die Voraussetzungen für private Endpunkte aus, und weisen Sie folgende Details auf:
- Der Name des virtuellen Cloud-Netzwerks (VCN)
- Der Name des privaten Subnetzes im VCN
- (Optional, für Zero Trust Packet Routing (ZPR): Der Sicherheitsattribut-Namespace/Schlüssel/Wert, den Sie dem Endpunkt zuweisen möchten, und eine ZPR-Policy, die Traffic zum Endpunkt zulässt.
Achtung
Wenn Sie dem privaten Endpunkt ein ZPR-Sicherheitsattribut zuweisen, ist für den Zugriff auf den Endpunkt eine explizite ZPR-Policy-Zulassungsregel erforderlich. Andernfalls kann Traffic blockiert werden, auch wenn es Ihre Routingregeln, NSGs und Sicherheitslisten zulassen.
Standardmäßig hat ein Mandant ein maximales Limit von 5 privaten Endpunkten. Für mehr private Endpunkte mit generativer KI fordern Sie eine Erhöhung des Limits an, private-endpoint-count für den Service für generative KI.
Wählen Sie auf der Listenseite Private Endpunkte die Option Privaten Endpunkt erstellen aus. Wenn Sie Hilfe beim Suchen der Listenseite benötigen, lesen Sie Private Endpunkte auflisten.
Allgemeine Informationen
VCN und Subnetz
Wählen Sie die folgenden Informationen aus:
- VCN-Compartment
- VCN
- Compartment des privaten Subnetzes
- Privates Subnetz
DNS- und Netzwerksicherheitsgruppen
Diesen Endpunkt für On-Demand-Modelle verwenden
Standardmäßig ist dieser private Endpunkt für Modelle verfügbar, die auf dedizierten KI-Clustern gehostet werden. Wenn dieser Endpunkt auch für On-Demand-Modelle verfügbar sein soll, die im Service für generative KI angeboten werden, führen Sie den folgenden Schritt aus: - Wählen Sie Nutzung im On-Demand-Modus zulassen.
- Informationen zum Erreichen des On-Demand-Modells finden Sie im Tipp am Ende dieses Abschnitts.
Wichtig
Informationen zum Zugriff auf ein generatives KI-Modell über diesen privaten Endpunkt finden Sie unter Modell zu einem privaten Endpunkt hinzufügen.Endpunkt erstellen
- (Optional) Wählen Sie Tag hinzufügen aus, und weisen Sie diesem privaten Endpunkt Tags zu. Siehe Ressourcentags.
- Wählen Sie Erstellen aus.
Tipp
Um mit diesem privaten Endpunkt ein On-Demand-Modell zu erreichen, erstellen Sie eine Compute-Instanz im privaten Subnetz, das für den privaten Endpunkt zugewiesen ist, fügen Sie den Code zur Compute-Instanz hinzu, verwenden den FQDN für den privaten Endpunkt, und greifen Sie von dieser Compute-Instanz aus auf das Modell zu.Verwenden Sie den Befehl generative-ai-private-endpoint create und die erforderlichen Parameter, um einen privaten Endpunkt zu erstellen:
oci generative-ai generative-ai-private-endpoint create [OPTIONS] [OPTIONS]Eine vollständige Liste der Parameter und Werte für CLI-Befehle finden Sie in der CLI-Befehlsreferenz.
Hinweis
Bei vortrainierten Modellen können Sie anstelle einer OCID den Modellnamen genau wie auf dem Playground der Konsole verwenden. Sie finden diesen OCI-Modellnamen auch auf der Detailseite des Modells unter Offerte vortrainierte Grundlagenmodelle in generativer KI.Führen Sie den Vorgang CreateGenerativeAiPrivateEndpoint aus, um einen privaten Endpunkt zu erstellen.