Creazione di un endpoint

Crea un endpoint per un modello personalizzato, pre-addestrato o importato su un cluster AI dedicato all'hosting in OCI Generative AI.

Importante

Per aggiungere un modello a un endpoint privato, prima creare un endpoint privato, quindi tornare a questa pagina per i passi da eseguire per allegare il modello.

Gli endpoint privati supportano solo modelli pre-addestrati e personalizzati. I modelli importati non sono supportati.

  • Nella pagina della lista Endpoint selezionare Crea endpoint. Se è necessaria assistenza per trovare la pagina della lista, vedere Elenca endpoint.

    Informazioni sull'endpoint

    1. Selezionare un compartimento in cui creare l'endpoint. Il compartimento predefinito è uguale alla pagina di elenco, ma è possibile selezionare qualsiasi compartimento nel quale si è autorizzati a lavorare.
      Suggerimento

      Si consiglia di creare l'endpoint nello stesso compartimento del modello.
    2. (Facoltativo) Immettere un nome per l'endpoint. Iniziare il nome con una lettera o un carattere di sottolineatura, seguito da lettere, numeri, trattini o caratteri di sottolineatura. La lunghezza può essere compresa tra 1 e 255 caratteri. Se non si immette un nome, il sistema genera un nome che potrà essere modificato in un secondo momento.
      Il nome generato ha il formato generativeaiendpoint<timestamp>. Esempio: generativeaiendpoint20250531235319
    3. (Facoltativo) Immettere una descrizione per il modello.

    Configurazione di hosting

    1. Selezionare il compartimento che ospita il modello a cui si desidera aggiungere un endpoint.
    2. Selezionare il modello a cui si desidera aggiungere un endpoint. Questo modello può essere un modello personalizzato, un modello importato o un modello di base pre-addestrato pronto all'uso disponibile nell'area in cui si sta lavorando.
    3. Se il modello selezionato dispone di più versioni, selezionare una versione del modello.
      Per i modelli di base pre-addestrati pronti all'uso, questo campo viene popolato quando si seleziona il modello.
    4. Selezionare un cluster AI dedicato hosting eseguendo una delle azioni riportate di seguito.
      • Selezionare un cluster AI dedicato dalla lista. Se è stato creato un cluster qualche minuto fa, attendere che diventi attivo.
      • Selezionare Crea nuovo cluster AI dedicato ed eseguire i passi riportati di seguito.
        1. (Facoltativo) Immettere un nome e una descrizione.
        2. Per Modello base, selezionare una delle opzioni riportate di seguito.
          • Il modello di base pre-addestrato che stai ospitando.
          • Se si utilizza un modello personalizzato, ottimizzato da un modello di base, selezionare il modello di base originale su cui è stato addestrato.
          • Se si utilizza un modello importato, selezionare il modello importato.
        3. Se è stato selezionato un modello importato, selezionare una dimensione dell'unità consigliata in base a questa guida.
        4. Per la replica del modello è necessaria almeno un'unità per un endpoint.
        5. Leggere le ore unità di impegno per il cluster AI dedicato di hosting e selezionare la casella di controllo per accettare l'impegno.
        6. (Facoltativo) Selezionare Aggiungi tag e assegnare tag a questo cluster AI dedicato. Vedere Tag risorsa.
        7. Selezionare Crea e attendere che il cluster diventi attivo.
        8. Nell'elenco Cluster AI dedicato selezionare il cluster AI dedicato creato.

    Risorse di networking (per modelli pre-addestrati e personalizzati)

    Selezionare una delle opzioni seguenti.
    • Endpoint pubblico
    • Endpoint privato: se si seleziona questa opzione, selezionare il compartimento per l'endpoint privato, quindi l'endpoint privato che si desidera utilizzare. (Modelli importati non disponibili).
    Per impostazione predefinita, i modelli importati dispongono di endpoint pubblici.

    Guardrail (per modelli pre-addestrati e personalizzati)

    Nota

    I guardrail non sono disponibili per i modelli importati.
    1. Selezionare se abilitare i guardrail seguenti.
      • Moderazione dei contenuti
        • Non attivo: non applicare la moderazione del contenuto e non emettere contenuto esplicito.
        • Blocca: consente di identificare e applicare la moderazione del contenuto.
        • Informa: non applicare la moderazione del contenuto, ma cercare di informare l'utente se il modello rileva il contenuto che richiede moderazione.
      • Protezione da prompt injection (PI)
        • Non attivo: non applicare la protezione PI e consentire input illimitati.
        • Blocco: consente di identificare e proteggere dall'inserimento rapido.
        • Informa: non applicare la protezione PI, ma si propone di informare l'utente se il modello rileva il contenuto che richiede la protezione PI.
      • Protezione delle informazioni di identificazione personale (PII)
        • Non attivo: non applicare la protezione PII, ma eseguire l'output del contenuto senza limitazioni di esposizione dei dati.
        • Blocco: consente di identificare e proteggere le informazioni personali, ad esempio per rimuovere i dati personali dalle risposte.
        • Informa: non applica la protezione PII, ma mira a informare l'utente se il modello rileva il contenuto che richiede la protezione PII.
    2. (Facoltativo) Selezionare Aggiungi tag e assegnare tag a questo endpoint. Vedere Tag risorsa.
    3. Selezionare Crea.
      Si viene indirizzati alla pagina dei dettagli dell'endpoint in cui è possibile tenere traccia dello stato dell'endpoint.
    4. Dopo aver attivato l'endpoint, selezionare Visualizza nell'area di gioco e iniziare a utilizzare il modello da questo endpoint.
  • Utilizzare il comando endpoint create e i parametri richiesti per creare un endpoint:

    oci generative-ai endpoint create 
    --model-id <model-OCID>
    --compartment-id <compartment-OCID> 
    --dedicated-ai-cluster-id <hosting-dedicated-AI-cluster-OCID> 
    [OPTIONS]

    Per un elenco completo dei parametri e dei valori per i comandi CLI, consultare il manuale CLI Command Reference.

    Nota

    Per i modelli pre-addestrati, anziché un OCID, è possibile utilizzare il nome del modello esattamente come elencato nell'area di gioco della console. È inoltre possibile trovare questo nome di modello OCI nella pagina dei dettagli del modello in Modelli di base pre-addestrati nell'intelligenza artificiale generativa.
  • Eseguire l'operazione CreateEndpoint per creare un endpoint.

    Nota

    Per i modelli pre-addestrati, anziché un OCID, è possibile utilizzare il nome del modello esattamente come elencato nell'area di gioco della console. È inoltre possibile trovare questo nome di modello OCI nella pagina dei dettagli del modello in Modelli di base pre-addestrati nell'intelligenza artificiale generativa.