Migrar para Versões Posteriores do Spark
Siga estas instruções para atualizar o Spark da versão 3.0.2 para a 3.2.1 ou da versão 2.4 para a 3.0.2.
Migrar o Serviço Data Flow para o Spark 3.2.1
Siga estas etapas para migrar o serviço Data Flow para usar o Spark 3.2.1.
Para poder usar o serviço Data Flow com o Delta Lakes 1.2.1 e integrar com o Conda Pack, use pelo menos a versão 3.2.1. do Spark com o serviço Data Flow.
Siga as instruções no Spark 3.2.1 Migration Guide para fazer upgrade para o Spark 3.2.1.
Crie aplicativos usando as versões listadas para o Spark 3.0.2 antes de migrar para o Spark 3.2.1.
Biblioteca | Spark 3.2.1 | Spark 3.0.2 |
---|---|---|
Python | 3.8.13 | 3.6.8 |
Java | 11 | 1.8.0_321 |
Hadoop | 3.3.3 | 3.2.0 |
oci-hdfs | 3.3.1.0.3.2 | 3.2.1.3 |
Scala | 2.12.15 | 2.12.10 |
oci-java-sdk | 2.45.0 | 1.25.2 |
Migrando Aplicativos do Serviço Data Flow do Uso do Spark 2.4 para o Uso do Spark 3.0.2
Saiba mais sobre a migração do serviço Data Flow para usar o Spark 3.0.2 em vez do Spark 2.4.4.
Migrando o Serviço Data Flow para o Spark 3.0.2
As etapas para migrar o serviço Data Flow do Spark 2.4.4 para o Spark 3.0.2 e problemas a serem considerados.
Erros ao Fazer Parsing de Timestamp ou Strings de Data
Saiba como resolver erros de parsing ou formatação no serviço Data Flow relacionados a strings de data ou timestamp que migraram do Spark 2.4.4 para o Spark 3.0.2.
org.apache.spark.SparkUpgradeException: You may get a different result due to the upgrading of Spark 3.0: Fail to recognize ‘MMMMM’ pattern in the DateTimeFormatter.
Há uma correção simples. Defina spark.sql.legacy.timeParserPolicy
como LEGACY
. Execute novamente seu aplicativo.