Migrer vers les versions ultérieures de Spark
Suivez ces instructions pour mettre à jour Spark de la version 3.0.2 vers la version 3.2.1 ou de 2.4 vers la version 3.0.2.
Migration de Data Flow vers Spark 3.2.1
Suivez les étapes ci-après pour migrer Data Flow vers Spark 3.2.1.
Pour pouvoir utiliser Data Flow avec Delta Lake 1.2.1 et procéder à l'intégration à conda-pack, vous devez utiliser au moins la version 3.2.1. de Spark avec Data Flow.
Suivez les instructions du Guide de migration Spark 3.2.1 pour effectuer une mise à niveau vers Spark 3.2.1.
Créez des applications à l'aide des versions répertoriées pour Spark 3.0.2 avant de migrer vers Spark 3.2.1.
Bibliothèque | Spark 3.2.1 | Spark 3.0.2 |
---|---|---|
Python | 3.8.13 | 3.6.8 |
Java | 11 | 1.8.0_321 |
Hadoop | 3.3.3 | 3.2.0 |
oci-hdfs | 3.3.1.0.3.2 | 3.2.1.3 |
Scala | 2.12.15 | 2.12.10 |
oci-java-sdk | 2,45,0 | 1.25.2 |
Migration des applications Data Flow de Spark 2.4 vers Spark 3.0.2
Découvrez comment migrer Data Flow pour utiliser Spark 3.0.2 plutôt que Spark 2.4.4.
Migration de Data Flow vers Spark 3.0.2
Voici les étapes à suivre pour migrer Data Flow de Spark 2.4.4 vers Spark 3.0.2 et les problèmes auxquels faire attention.
Erreurs lors de l'analyse des chaînes d'horodatage ou de date
Découvrez comment résoudre les erreurs d'analyse ou de formatage liées aux chaînes d'horodatage ou de date dans Data Flow après avoir effectué une migration de Spark 2.4.4 vers Spark 3.0.2.
org.apache.spark.SparkUpgradeException: You may get a different result due to the upgrading of Spark 3.0: Fail to recognize ‘MMMMM’ pattern in the DateTimeFormatter.
Il existe une solution simple. Définissez spark.sql.legacy.timeParserPolicy
sur LEGACY
. Réexécutez l'application.