Cluster di computazione

Un cluster di computazione è un gruppo di istanze HPC (High Performance Computing), GPU o ottimizzate connesse a una rete a larghezza di banda elevata e a bassissima latenza.

Ogni nodo del cluster è un computer Bare Metal situato in prossimità fisica degli altri nodi. Una rete RDMA (Remote Direct Memory Access) tra i nodi fornisce una latenza pari a microsecondi a singola cifra, paragonabile ai cluster HPC on-premise.

Quando crei un cluster di computazione, crei un gruppo di rete RDMA vuoto. Dopo la creazione del gruppo, è possibile aggiungere istanze al gruppo oppure eliminare istanze dal gruppo. I cluster di computazione consentono di gestire le istanze nel cluster singolarmente e possono avere tipi diversi di istanze nel cluster.

Suggerimento

Se si desidera una capacità prevedibile per un numero specifico di istanze identiche gestite come gruppo, utilizzare invece reti cluster con pool di istanze.

Per i passi per la gestione dei cluster di computazione, vedere gli argomenti riportati di seguito.

Per ulteriori informazioni su come accedere e memorizzare i dati che si desidera elaborare nei cluster di calcolo, vedere FastConnect Panoramica, Panoramica dello storage di file, Panoramica dello storage degli oggetti e Panoramica del volume a blocchi.

Criterio IAM necessario

Per utilizzare Oracle Cloud Infrastructure, un amministratore deve essere membro di un gruppo a cui è stato concesso l'accesso di sicurezza in un criterio da un amministratore della tenancy. Questo accesso è necessario, indipendentemente dal fatto che si stia utilizzando la console o l'API REST con un SDK, un'interfaccia CLI o unaltro strumento. Se viene visualizzato un messaggio che informa che non si dispone dell'autorizzazione o che non si è autorizzati, verificare con l'amministratore della tenancy il tipo di accesso di cui si dispone e il compartimento in cui funziona l'accesso.

Per gli amministratori: per consentire agli utenti di eseguire tutte le operazioni con i cluster di computazione in tutti i compartimenti, scrivere il criterio seguente:

Allow group ComputeClusterUsers to manage compute-clusters in tenancy

È inoltre necessario consentire agli utenti di creare istanze nelle reti cluster. Per un criterio standard, vedere Consenti agli utenti di avviare le istanze di computazione.

Forme supportate

Le forme seguenti supportano i cluster di computazione:

  • BM.GPU.A100-v2.8
  • BM.GPU.H100.8
  • BM.GPU4.8
  • BMPC2.36
  • BM.Ottimizzato3.36
  • BM.GPU.GB200.4

In genere, per poter creare più istanze HPC, GPU o ottimizzate in un cluster di computazione, è necessario richiedere un aumento del limite del servizio.

Aree e domini di disponibile supportati

I cluster di computazione sono supportati in aree selezionate all'interno dei realm commerciali e dei realm cloud governativi di Oracle Cloud Infrastructure.

Regioni supportate nel realm commerciale
  • Australia (Est) - Sydney
  • Australia (Sud-est) - Melbourne
  • Brasile (Est) - San Paolo
  • Brasile (Sud-est) - Vinhedo
  • Canada (Sud-est) - Montreal
  • Francia (centrale) - Parigi
  • Francia meridionale - Marsiglia
  • Germania (Centro) - Francoforte
  • India (Sud) - Hyderabad
  • India (Ovest) - Mumbai
  • Israele centrale (Gerusalemme)
  • Italia (Nord-ovest) - Milano
  • Giappone centrale (Osaka)
  • Giappone (Est) - Tokyo
  • Paesi Bassi (Nord-ovest) - Amsterdam
  • Arabia Saudita (Ovest) - Gedda
  • Singapore (Singapore)
  • Sudafrica centrale - Johannesburg
  • Corea del Sud (Centro) - Seul
  • Corea del Sud (Nord) - Chuncheon
  • Svezia (Centro) - Stoccolma
  • Svizzera (Nord) - Zurigo
  • Emirati Arabi Uniti (Est) - Dubai
  • Regno Unito (Sud) - Londra
  • Stati Uniti (Est) - Ashburn
  • Stati Uniti (Midwest) - Chicago
  • Stati Uniti (Ovest) - Phoenix
  • Stati Uniti (Ovest) - San Jose
Region supportate nei realm cloud per il governo
  • Governo del Regno Unito (Sud) - Londra
  • Governo del Regno Unito (Ovest) - Newport
  • Governo degli Stati Uniti (Est) - Ashburn

Il dominio di disponibilità in cui si crea il cluster di computazione deve disporre di hardware che supporti i cluster di computazione.