Aggiunta di un modello a un endpoint privato

Scopri come collegare un endpoint con un modello personalizzato o pre-addestrato a un endpoint privato in OCI Generative AI.

È possibile collegare uno o più endpoint a un endpoint privato.

Crea l'endpoint
Nella pagina della lista Endpoint privati selezionare l'endpoint privato da utilizzare. Se è necessaria assistenza per trovare la pagina della lista per gli endpoint privati, vedere Elenca endpoint privati.
Selezionare Endpoint, quindi selezionare Crea endpoint.
Informazioni sull'endpoint
Selezionare un compartimento in cui creare l'endpoint. Il compartimento predefinito è uguale alla pagina di elenco, ma è possibile selezionare qualsiasi compartimento nel quale si è autorizzati a lavorare.

Suggerimento

Si consiglia di creare l'endpoint nello stesso compartimento del modello.

(Facoltativo) Immettere un nome per l'endpoint. Iniziare il nome con una lettera o un carattere di sottolineatura seguito da lettere, numeri, trattini o caratteri di sottolineatura. La lunghezza può essere compresa tra 1 e 255 caratteri. Se non si immette un nome, il sistema genera un nome che è possibile modificare in seguito.
Il nome generato ha il formato generativeaiendpoint<timestamp>. Esempio: generativeaiendpoint20250531235319

(Facoltativo) Immettere una descrizione per il modello.
Configurazione di hosting
Selezionare il compartimento che ospita il modello a cui si desidera aggiungere un endpoint.
Selezionare il modello a cui si desidera aggiungere un endpoint. Questo modello può essere un modello personalizzato o un modello di base pre-addestrato pronto all'uso disponibile nell'area in cui si sta lavorando.
Se il modello selezionato dispone di più versioni, selezionare una versione del modello.
Per i modelli di base pre-addestrati pronti all'uso, questo campo viene popolato quando si seleziona il modello.

Selezionare un cluster AI dedicato hosting eseguendo una delle azioni riportate di seguito.

Selezionare un cluster AI dedicato dalla lista. Se è stato creato un cluster qualche minuto fa, attendere che diventi attivo. Assicurarsi che il modello di base associato a questo cluster corrisponda al modello di base per il modello a cui si desidera aggiungere un endpoint.

Selezionare Crea nuovo cluster AI dedicato ed eseguire i passi riportati di seguito.

(Facoltativo) Immettere un nome e un'indicazione.

Selezionare un modello di base che corrisponda al modello di base del modello che si desidera ospitare.

Aggiungere 1 replica del modello all'endpoint. Quando si crea un cluster, è necessaria almeno un'unità per un endpoint. Per un cluster esistente, è possibile utilizzare la stessa unità per ospitare nuovi endpoint. Ogni istanza ospita tutti gli endpoint attivi. Aumentando il conteggio delle istanze in un cluster, aumenta il numero di RPM supportati per tutti gli endpoint attivi ospitati in un cluster.

Leggere le ore dell'unità di impegno per il cluster AI dedicato hosting e selezionare la casella di controllo per accettare l'impegno.

(Facoltativo) Selezionare Aggiungi tag e assegnare tag a questo cluster AI dedicato. Vedere Tag risorsa.

Selezionare Crea e attendere che il cluster diventi attivo.

Nell'elenco Cluster AI dedicato selezionare il cluster AI dedicato creato.
Risorse di networking

Endpoint privato preselezionato.
Limiti
Selezionare se abilitare il guardrail seguente.

Moderazione dei contenuti

Non attivo: non applica la moderazione del contenuto e non genera contenuto esplicito.

Blocca: consente di identificare e applicare la moderazione del contenuto.

Informativa: non applica la moderazione dei contenuti, ma cerca di informare l'utente se il modello rileva i contenuti che richiedono moderazione.

(Facoltativo) Selezionare Aggiungi tag e assegnare tag a questo endpoint. Vedere Tag risorsa.
Selezionare Crea.
Si è indirizzati alla pagina dei dettagli dell'endpoint in cui è possibile tenere traccia dello stato dell'endpoint.
Utilizzare il comando endpoint create e i parametri richiesti per creare un endpoint:
```
oci generative-ai endpoint create 
--model-id <model-OCID>
--compartment-id <compartment-OCID> 
--dedicated-ai-cluster-id <hosting-dedicated-AI-cluster-OCID> 
[OPTIONS]
```
Per un elenco completo dei parametri e dei valori per i comandi CLI, consultare il manuale CLI Command Reference.

Nota

Per i modelli pre-addestrati, anziché un OCID, è possibile utilizzare il nome del modello esattamente come elencato nell'area di gioco della console. Puoi anche trovare questo nome di modello OCI nella pagina dei dettagli del modello in Modelli di base pre-addestrati offerti nell'intelligenza artificiale generativa.
Eseguire l'operazione CreateEndpoint per creare un endpoint.

Nota

Per i modelli pre-addestrati, anziché un OCID, è possibile utilizzare il nome del modello esattamente come elencato nell'area di gioco della console. Puoi anche trovare questo nome di modello OCI nella pagina dei dettagli del modello in Modelli di base pre-addestrati offerti nell'intelligenza artificiale generativa.

Documentazione dell'infrastruttura Oracle Cloud

Aggiunta di un modello a un endpoint privato

Crea l'endpoint

Informazioni sull'endpoint

Configurazione di hosting

Risorse di networking

Limiti