Creazione di un endpoint Privato
Crea un endpoint privato per un modello personalizzato o pre-addestrato su un cluster AI dedicato all'hosting in OCI Generative AI.
Prima di creare un endpoint privato, eseguire i Prerequisiti per gli endpoint privati e disporre dei dettagli riportati di seguito.
- Nome della rete cloud virtuale (VCN)
- Nome della subnet privata nella VCN
- (Facoltativo, per Zero Trust Packet Routing (ZPR): lo spazio di nomi/chiave/valore degli attributi di sicurezza che si prevede di assegnare all'endpoint e un criterio ZPR che consente il traffico all'endpoint.
Attenzione
Se si assegna un attributo di sicurezza ZPR all'endpoint privato, l'accesso all'endpoint richiede una regola di consenso esplicita del criterio ZPR. In caso contrario, il traffico può essere bloccato anche se le regole di instradamento, i gruppi NSG e le liste di sicurezza lo consentono.
Per impostazione predefinita, una tenancy ha un limite massimo di 5 endpoint privati. Per altri endpoint privati dell'AI generativa, richiedi un aumento del limite, private-endpoint-count per il servizio di AI generativa.
Nella pagina della lista Endpoint privati selezionare Crea endpoint privato. Se è necessaria assistenza per trovare la pagina della lista, vedere Elenca endpoint privati.
Informazioni generali
VCN e subnet
Selezionare le informazioni riportate di seguito.
- Compartimento VCN
- VCN
- Compartimento subnet privata
- Subnet privata
DNS e gruppi di sicurezza di rete
Usa questo endpoint per i modelli su richiesta
Per impostazione predefinita, questo endpoint privato è disponibile per i modelli ospitati su cluster AI dedicati. Se si desidera che questo endpoint sia disponibile anche per i modelli su richiesta offerti nel servizio AI generativa, effettuare le operazioni riportate di seguito. - Selezionare Consenti utilizzo in modalità su richiesta.
- Vedere il suggerimento alla fine di questa sezione su come raggiungere il modello on-demand.
Importante
Per accedere a un modello di intelligenza artificiale generativa tramite questo endpoint privato, vedere Aggiunta di un modello a un endpoint privato.Crea l'endpoint
- (Facoltativo) Selezionare Aggiungi tag e assegnare tag a questo endpoint privato. Vedere Tag risorsa.
- Selezionare Crea.
Suggerimento
Per utilizzare questo endpoint privato per raggiungere un modello su richiesta, creare un'istanza di computazione nella subnet privata allocata per l'endpoint privato, aggiungere il codice all'istanza di computazione, utilizzare il nome FQDN per l'endpoint privato e accedere al modello da tale istanza di computazione.Utilizzare il comando generative-ai-private-endpoint create e i parametri necessari per creare un endpoint privato:
oci generative-ai generative-ai-private-endpoint create [OPTIONS] [OPTIONS]Per un elenco completo dei parametri e dei valori per i comandi CLI, consultare il manuale CLI Command Reference.
Nota
Per i modelli pre-addestrati, anziché un OCID, è possibile utilizzare il nome del modello esattamente come elencato nell'area di gioco della console. Puoi anche trovare questo nome di modello OCI nella pagina dei dettagli del modello in Modelli di base pre-addestrati offerti nell'intelligenza artificiale generativa.Eseguire l'operazione CreateGenerativeAiPrivateEndpoint per creare un endpoint privato.