Dimensionamento dell'applicazione Data Flow
Ogni volta che si esegue un'applicazione di flusso dati, si specifica una dimensione e un numero di esecutori che, a loro volta, decidono il numero di OCPU utilizzate per eseguire l'applicazione Spark.
Una OCPU è uguale a una memoria centrale della CPU, che a sua volta è uguale a due memorie centrali vCPUs. Per ulteriori informazioni sul numero di OCPU contenute in ciascuna forma, vedere Forme di computazione.
<Number_of_OCPUs> = <Processed_Data_in_GB> / (10 * <Desired_runtime_in_hours>)
<Number_of_OCPUs> = 1024 / (10 * 0.5) = 204.8
È possibile allocare 200 OCPU in vari modi. Ad esempio, è possibile selezionare una forma esecutore di VM.Standard2.8 e 25 esecutori totali per 8 * 25 = 200 OCPU totali.
Il numero di OCPU è limitato dalla forma VM scelta e dal valore impostato nella tenancy per
VM.Total
. Non è possibile utilizzare più VM in tutte le forme VM del valore in VM.Total. Ad esempio, se ogni forma VM è impostata su 20 e VM.Total
è impostata su 20, non è possibile utilizzare più di 20 VM in tutte le forme VM. Con forme flessibili, in cui il limite viene misurato come memorie centrali o OCPU, 80 memorie centrali in una forma flessibile sono uguali a 10 forme VM.Standard2.8. Per ulteriori informazioni, consulta Limiti del servizio.Forme di computazione flessibili
Data Flow supporta forme di computazione flessibili per i job Spark.
- VM.Standard3. Flex (Intel)
- VM.StandardE3. Flexfield (AMD)
- VM.StandardE4. Flexfield (AMD)
- VM.Standard.A1. Flex (processore Arm da Ampere)
Il driver e l'esecutore devono avere la stessa forma.
Migrazione delle applicazioni dalle forme di computazione VM.Standard2
Attenersi alla procedura riportata di seguito durante la migrazione delle applicazioni Data Flow esistenti da VM.Standard2 a forme di computazione flessibili.