Creazione di un endpoint Privato

Crea un endpoint privato per un modello personalizzato o pre-addestrato su un cluster AI dedicato all'hosting in OCI Generative AI.

Nota

Prima di creare un endpoint privato, eseguire i Prerequisiti per gli endpoint privati e disporre dei dettagli riportati di seguito.

  • Nome della rete cloud virtuale (VCN)
  • Nome della subnet privata nella VCN
  • (Facoltativo, per Zero Trust Packet Routing (ZPR): lo spazio di nomi/chiave/valore degli attributi di sicurezza che si prevede di assegnare all'endpoint e un criterio ZPR che consente il traffico all'endpoint.

Attenzione

Se si assegna un attributo di sicurezza ZPR all'endpoint privato, l'accesso all'endpoint richiede una regola di consenso esplicita del criterio ZPR. In caso contrario, il traffico può essere bloccato anche se le regole di instradamento, i gruppi NSG e le liste di sicurezza lo consentono.

Per impostazione predefinita, una tenancy ha un limite massimo di 5 endpoint privati. Per altri endpoint privati dell'AI generativa, richiedi un aumento del limite, private-endpoint-count per il servizio di AI generativa.

  • Nella pagina della lista Endpoint privati selezionare Crea endpoint privato. Se è necessaria assistenza per trovare la pagina della lista, vedere Elenca endpoint privati.

    Informazioni generali

    1. Selezionare un compartimento in cui creare l'endpoint privato. Il compartimento predefinito è uguale alla pagina di elenco, ma è possibile selezionare qualsiasi compartimento nel quale si è autorizzati a lavorare.
      Si consiglia di creare l'endpoint privato nello stesso compartimento del modello che utilizzerà questo endpoint.
    2. (Facoltativo) Immettere un nome per l'endpoint. Iniziare il nome con una lettera o un carattere di sottolineatura seguito da lettere, numeri, trattini o caratteri di sottolineatura. La lunghezza può essere compresa tra 1 e 255 caratteri. Se non si immette un nome, il sistema genera un nome che è possibile modificare in seguito.
      Il nome generato ha il formato generativeaiprivateendpoint<timestamp>. Esempio: generativeaiprivateendpoint20250929212918
    3. (Facoltativo) Immettere una descrizione per l'endpoint privato.

    VCN e subnet

    Selezionare le informazioni riportate di seguito.

    • Compartimento VCN
    • VCN
    • Compartimento subnet privata
    • Subnet privata

    DNS e gruppi di sicurezza di rete

    1. Immettere un prefisso DNS (Domain Namepace) per il nome FQDN.
      Un'anteprima visualizza il nome FQDN con questo prefisso DNS. Un nome di dominio completamente qualificato è un nome univoco completo per una risorsa di rete, che viene risolto in un indirizzo IP specifico. Ad esempio:
      <DNS-prefix>.pe.inference.generativeai.us-chicago-1.oci.oraclecloud.com
    2. (Facoltativo) Selezionare se aggiungere uno o più gruppi di sicurezza di rete selezionando Aggiungi gruppo di sicurezza di rete per ogni gruppo che si desidera aggiungere.
      Informazioni sulle regole di sicurezza.
    3. (Facoltativo) Selezionare un gruppo di sicurezza di rete dall'elenco.
    4. (Opzionale) Aggiungere altri gruppi di sicurezza di rete.
    5. Nel flusso di creazione espandere Mostra attributi di sicurezza, quindi espandere l'opzione Tag che consente di visualizzare gli attributi di sicurezza.
    6. Selezionare Aggiungi attributo di sicurezza.
    7. Immettere le informazioni riportate di seguito.
      • Spazio di nomi degli attributi di sicurezza
      • Chiave degli attributi di sicurezza
      • Valore attributo di sicurezza
    8. Selezionare Aggiungi attributo di sicurezza per aggiungere altri attributi (fino a 3 totali).

      Se si dispone delle autorizzazioni per creare una risorsa, è possibile che si disponga anche delle autorizzazioni per aggiungere attributi di sicurezza a tale risorsa. Per aggiungere un attributo di sicurezza, è necessario disporre delle autorizzazioni per utilizzare lo spazio di nomi degli attributi di sicurezza. Per ulteriori informazioni sugli attributi di sicurezza e sugli spazi di nomi degli attributi di sicurezza, vedere Instradamento di Zero Trust Packet. Se non si è certi di aggiungere attributi di sicurezza, saltare questa opzione o chiedere a un amministratore. È possibile aggiungere attributi di sicurezza in un secondo momento.

      Nota

      Per evitare il blocco involontario dell'accesso, assicurarsi che i criteri ZPR siano definiti in modo da consentire il flusso di traffico previsto all'endpoint prima di utilizzare l'endpoint in produzione. Consulta la sezione Prerequisiti.

    9. (Facoltativo) Selezionare Aggiungi tag e assegnare tag a questo endpoint privato. Vedere Tag risorsa.
    10. Selezionare Crea.

    Usa questo endpoint per i modelli su richiesta

    Per impostazione predefinita, questo endpoint privato è disponibile per i modelli ospitati su cluster AI dedicati. Se si desidera che questo endpoint sia disponibile anche per i modelli su richiesta offerti nel servizio AI generativa, effettuare le operazioni riportate di seguito.
    1. Selezionare Consenti utilizzo in modalità su richiesta.
    2. Vedere il suggerimento alla fine di questa sezione su come raggiungere il modello on-demand.
    Importante

    Per accedere a un modello di intelligenza artificiale generativa tramite questo endpoint privato, vedere Aggiunta di un modello a un endpoint privato.

    Crea l'endpoint

    1. (Facoltativo) Selezionare Aggiungi tag e assegnare tag a questo endpoint privato. Vedere Tag risorsa.
    2. Selezionare Crea.
    Suggerimento

    Per utilizzare questo endpoint privato per raggiungere un modello su richiesta, creare un'istanza di computazione nella subnet privata allocata per l'endpoint privato, aggiungere il codice all'istanza di computazione, utilizzare il nome FQDN per l'endpoint privato e accedere al modello da tale istanza di computazione.
  • Utilizzare il comando generative-ai-private-endpoint create e i parametri necessari per creare un endpoint privato:

    oci generative-ai generative-ai-private-endpoint create [OPTIONS] 
    [OPTIONS]

    Per un elenco completo dei parametri e dei valori per i comandi CLI, consultare il manuale CLI Command Reference.

    Nota

    Per i modelli pre-addestrati, anziché un OCID, è possibile utilizzare il nome del modello esattamente come elencato nell'area di gioco della console. Puoi anche trovare questo nome di modello OCI nella pagina dei dettagli del modello in Modelli di base pre-addestrati offerti nell'intelligenza artificiale generativa.
  • Eseguire l'operazione CreateGenerativeAiPrivateEndpoint per creare un endpoint privato.