Migrer vers les versions ultérieures de Spark
Suivez ces instructions pour mettre à jour Spark de la version 3.0.2 à 3.2.1 ou de 2.4 à 3.0.2.
Migrer le service de flux de données vers Spark 3.2.1
Suivez les étapes ci-après pour migrer le service de flux de données vers Spark 3.2.1.
Pour pouvoir utiliser le service de flux de données avec Delta Lake 1.2.1 et pour l'intégration avec Conda Pack, vous devez utiliser au moins la version 3.2.1. de Spark avec le service de flux de données.
Suivez les instructions du guide de migration Spark 3.2.1 pour effectuer une mise à niveau vers Spark 3.2.1.
Créez des applications à l'aide des versions indiquées pour Spark 3.0.2 avant la migration vers Spark 3.2.1.
Bibliothèque | Spark 3.2.1 | Spark 3.0.2 |
---|---|---|
Python | 3.8.13 | 3.6.8 |
Java | 11 | 1.8.0_321 |
Hadoop | 3.3.3 | 3.2.0 |
oci-hdfs | 3.3.1.0.3.2 | 3.2.1.3 |
Scala | 2.12.15 | 2.12.10 |
oci-java-sdk | 2.45.0 | 1.25.2 |
Migration d'applications de flux de données à partir de Spark 2.4 vers Spark 3.0.2
Voyez comment migrer le service de flux de données pour qu'il utilise Spark 3.0.2 plutôt que Spark 2.4.4.
Migration du service de flux de données vers Spark 3.0.2
Description des étapes de migration du service de flux de données de Spark 2.4.4 vers Spark 3.0.2 et des problèmes éventuels.
Erreurs lors de l'analyse des chaînes d'horodatage ou de date
Voyez comment résoudre les erreurs d'analyse ou de format dans le service de flux de données concernant des chaînes de date ou d'horodatage après la migration de Spark 2.4.4 vers Spark 3.0.2.
org.apache.spark.SparkUpgradeException: You may get a different result due to the upgrading of Spark 3.0: Fail to recognize ‘MMMMM’ pattern in the DateTimeFormatter.
Il existe une solution simple. Réglez spark.sql.legacy.timeParserPolicy
à LEGACY
. Réexécutez votre application.