Gestione degli endpoint Privati
Gli endpoint privati forniscono un accesso privato sicuro AI modelli di AI generativa OCI all'interno di una rete cloud virtuale (VCN). Puoi creare endpoint privati per modelli on-demand e per modelli pre-addestrati e personalizzati ospitati su cluster AI dedicati.
Informazioni
Un endpoint privato è un indirizzo IP privato in una VCN che fornisce l'accesso privato a un servizio OCI. Per l'intelligenza artificiale generativa, gli endpoint privati ti consentono di accedere a modelli linguistici di grandi dimensioni dall'interno di una VCN. Il servizio crea l'endpoint privato in una subnet privata selezionata e ne gestisce la disponibilità. È possibile controllare l'accesso mediante routing, liste di sicurezza e gruppi di sicurezza di rete (NSG).
Informazioni su Informazioni sugli endpoint privati e sulle regole di sicurezza.
Quando crei un endpoint privato in OCI Generative AI, ricevi un nome di dominio completamente qualificato (FQDN) per esso, indipendentemente dal fatto che selezioni Consenti utilizzo in modalità su richiesta. Utilizzare l'endpoint privato per effettuare le operazioni riportate di seguito.
- Collegalo a un endpoint su un cluster AI dedicato per accedere al cluster (e AI relativi modelli in hosting) tramite l'endpoint privato.
- Accedere ai modelli su richiesta se si abilita Consenti utilizzo in modalità su richiesta.
Aree
Gli endpoint privati sono supportati per tutti i modelli elencati nella pagina Modelli di intelligenza artificiale generativa per area nelle aree commerciali (OC1), governative (OC4) e sovrane (OC19) in cui sono disponibili i modelli.
Accesso
Per accedere a un modello tramite un endpoint privato, eseguire un client da una rete con connettività privata alla subnet dell'endpoint e chiamare il modello utilizzando il nome FQDN dell'endpoint privato.
I percorsi di accesso comuni includono:
- Stessa VCN: da qualsiasi subnet nella VCN (soggetto all'instradamento, al gruppo di sicurezza di rete (NSG) e alle liste di sicurezza).
- VCN con peering: tramite il Local Peering Gateway (LPG) o la connettività del dynamic routing gateway (basata su DRG) (hub-and-spoke).
- Reti on-premise/altre reti private: tramite VPN (IPSec) Internet Protocol Security o FastConnect a un DRG.
- Amministrazione: utilizzare OCI Bastion per raggiungere un host privato nella VCN, quindi chiamare l'endpoint da lì.
Assicurarsi che il nome FQDN dell'endpoint privato venga risolto nell'IP privato.
Requisiti indispensabili
Prima di creare un endpoint privato, completare i prerequisiti per gli endpoint privati e assicurarsi di disporre di una VCN con una subnet privata.
Limiti
Per impostazione predefinita, una tenancy può avere fino a 5 endpoint privati. Per ulteriori informazioni, richiedere un aumento del limite del servizio per private-endpoint-count nel servizio AI generativa.
Gestisci
Per creare e gestire gli endpoint privati e i relativi attributi di sicurezza, è possibile eseguire i task riportati di seguito.