Dimensionnement de l'application Data Flow
Chaque fois que vous exécutez une application Data Flow, vous indiquez une taille et un nombre d'exécuteurs qui, à leur tour, déterminent le nombre d'OCPU utilisées pour exécuter l'application Spark.
Une OCPU est égale à un coeur de processeur, qui est lui-même égal à deux vCPUs. Pour plus d'informations sur le nombre d'OCPU contenues dans chaque forme, reportez-vous à Formes de calcul.
<Number_of_OCPUs> = <Processed_Data_in_GB> / (10 * <Desired_runtime_in_hours>)
<Number_of_OCPUs> = 1024 / (10 * 0.5) = 204.8
Vous pouvez allouer 200 OCPU de différentes manières. Par exemple, vous pouvez sélectionner la forme d'exécuteur VM.Standard2.8 et 25 exécuteurs au total, pour 8 * 25 = 200 OCPU au total.
Le nombre d'OCPU est limité par la forme de machine virtuelle choisie et par la valeur définie dans la location pour
VM.Total
. Vous ne pouvez pas utiliser un nombre de machines virtuelles sur l'ensemble des formes de machine virtuelle supérieur à la valeur de VM.Total. Par exemple, si chaque forme de machine virtuelle est définie sur 20 et que VM.Total
est défini sur 20, vous ne pouvez pas utiliser plus de 20 machines virtuelles sur l'ensemble des formes de machine virtuelle. Avec les formes flexibles, dont la limite est mesurée en cœurs ou OCPU, 80 cœurs d'une forme flexible est égale à 10 formes VM.Standard2.8. Pour plus d'informations, reportez-vous à Limites de service.Formes de calcul flexibles
Data Flow prend en charge des formes de calcul flexibles pour les travaux Spark.
- VM.Standard3.Flex (Intel)
- VM.StandardE3.Flex (AMD)
- VM.StandardE4.Flex (AMD)
- VM.Standard.A1.Flex (processeur Arm d'Ampere)
Le pilote et l'exécuteur doivent avoir la même forme.
Migration d'applications à partir des formes de calcul VM.Standard2
Suivez ces étapes lors de la migration de vos applications Data Flow existantes de VM.Standard2 vers des formes de calcul flexibles.