Creazione di un endpoint Privato

Crea un endpoint privato per un modello personalizzato o pre-addestrato su un cluster AI dedicato all'hosting in OCI Generative AI.

Nota

Prima di creare un endpoint privato, eseguire i Prerequisiti per gli endpoint privati e disporre dei dettagli riportati di seguito.

  • Nome della rete cloud virtuale (VCN)
  • Nome della subnet privata nella VCN

Per impostazione predefinita, una tenancy ha un limite massimo di 5 endpoint privati. Per altri endpoint privati dell'AI generativa, richiedi un aumento del limite, private-endpoint-count per il servizio di AI generativa.

  • Nella pagina della lista Endpoint privati selezionare Crea endpoint privato. Se è necessaria assistenza per trovare la pagina della lista, vedere Elenca endpoint privati.

    Informazioni generali

    1. Selezionare un compartimento in cui creare l'endpoint privato. Il compartimento predefinito è uguale alla pagina di elenco, ma è possibile selezionare qualsiasi compartimento nel quale si è autorizzati a lavorare.
      Si consiglia di creare l'endpoint privato nello stesso compartimento del modello che utilizzerà questo endpoint.
    2. (Facoltativo) Immettere un nome per l'endpoint. Iniziare il nome con una lettera o un carattere di sottolineatura seguito da lettere, numeri, trattini o caratteri di sottolineatura. La lunghezza può essere compresa tra 1 e 255 caratteri. Se non si immette un nome, il sistema genera un nome che è possibile modificare in seguito.
      Il nome generato ha il formato generativeaiprivateendpoint2<timestamp>. Esempio: generativeaiprivateendpoint20250929212918
    3. (Facoltativo) Immettere una descrizione per il modello.

    VCN e subnet

    Selezionare le informazioni riportate di seguito.

    • Compartimento VCN
    • VCN
    • Compartimento subnet privata
    • Subnet privata

    DNS e gruppi di sicurezza di rete

    1. Immettere un prefisso DNS (Domain Namepace) per il nome FQDN.
      Un'anteprima visualizza il nome FQDN con questo prefisso DNS. Un nome di dominio completamente qualificato è un nome univoco completo per una risorsa di rete, che viene risolto in un indirizzo IP specifico. Ad esempio:
      <DNS-prefix>.pe.inference.generativeai.us-chicago-1.oci.oraclecloud.com
    2. (Facoltativo) Selezionare se aggiungere uno o più gruppi di sicurezza di rete selezionando Aggiungi gruppo di sicurezza di rete per ogni gruppo che si desidera aggiungere.
      Informazioni sulle regole di sicurezza.
    3. (Facoltativo) Selezionare un gruppo di sicurezza di rete dall'elenco.
    4. (Opzionale) Aggiungere altri gruppi di sicurezza di rete.
    5. (Facoltativo) Selezionare Aggiungi tag e assegnare tag a questo endpoint privato. Vedere Tag risorsa.
    6. Selezionare Crea.
    Importante

    Per accedere a un modello di intelligenza artificiale generativa tramite questo endpoint privato, vedere Aggiunta di un modello a un endpoint privato.
  • Per un elenco completo dei parametri e dei valori per i comandi CLI, consultare il manuale CLI Command Reference.

  • Eseguire l'operazione CreateGenerativeAiPrivateEndpoint per creare un endpoint privato.