Dimensionando o Aplicativo do Serviço Data Flow
Toda vez que você executa um Aplicativo do serviço Data Flow, você especifica um tamanho e um número de executores que, por sua vez, decidem o número de OCPUs usadas para executar o aplicativo Spark.
Uma OCPU é igual a um núcleo de CPU, que por si só é igual a dois vCPUs. Consulte Shapes de Computação para obter mais informações sobre quantas OCPUs cada forma contém.
<Number_of_OCPUs> = <Processed_Data_in_GB> / (10 * <Desired_runtime_in_hours>)
<Number_of_OCPUs> = 1024 / (10 * 0.5) = 204.8
Você pode alocar 200 OCPUs de várias maneiras. Por exemplo, você pode selecionar uma forma de executor de VM.Standard2.8 e 25 no total de executores para 8 * 25 = 200 total de OCPUs.
O número de OCPUs é limitado pela forma de VM escolhida e pelo valor definido na tenancy para
VM.Total
. Não é possível usar mais VMs em todas as formas de VM do que o valor em VM.Total. Por exemplo, se cada forma de VM estiver definida como 20 e a opção VM.Total
estiver definida como 20, não será possível usar mais de 20 VMs em todas as formas de VM. Com formas flexíveis, nas quais o limite é medido como núcleos ou OCPUs, 80 núcleos em uma forma flexível são iguais às formas 10 VM.Standard2.8. Consulte Limites de Serviço para obter mais informações.Formas de Computação Flexíveis
O serviço Data Flow suporta formas de computação flexíveis para jobs do Spark.
- VM.Standard3.Flex (Intel)
- VM.StandardE3.Flex (AMD)
- VM.StandardE4.Flex (AMD)
- VM.Standard.A1.Flex (processador Arm do Ampere)
O driver e o executor devem ter a mesma forma.
Migrando Aplicativos das Formas de Computação VM.Standard2
Siga estas etapas ao migrar seus aplicativos existentes do serviço Data Flow de VM.Standard2 para formas de computação flexíveis.