Avant de commencer à utiliser Data Flow

Avant de commencer à utiliser Data Flow, vous devez avoir :

  • Un compte Oracle Cloud Infrastructure. Les comptes d'essai peuvent être utilisés pour la démonstration de Data Flow.
  • Un rôle Administrateur de service pour vos services Oracle Cloud. Lorsque le service est activé, Oracle envoie les informations d'identification et l'URL à l'administrateur de compte choisi. L'administrateur de compte crée un compte pour chaque utilisateur ayant besoin d'accéder au service.
  • Un navigateur pris en charge, tel que :
    • Microsoft Internet Explorer 11.x+

    • Mozilla Firefox ESR 38+

    • Google Chrome 42+

  • Application Spark téléchargée vers Object Storage. Ne la fournissez pas de package dans un format compressé tel que .zip ou .gzip.
  • Données pour le traitement chargées dans Oracle Cloud Infrastructure Object Storage. Les données peuvent être lues à partir de clouds ou sources de données externes. Data Flow optimise les performances et la sécurité des données stockées dans une banque d'objets Oracle Cloud Infrastructure.
  • Les types d'application pris en charge sont les suivants :
    • Java
    • Scala
    • SparkSQL
    • PySpark (Python 3 uniquement)
  • Ce tableau présente les versions de Spark prises en charge par Data Flow.
    Versions de Spark prises en charge
    Version de Spark Hadoop Java Python Scala oci-hdfs oci-java-sdk Documentation Spark
    Spark 3.5.0 3,3 17 3,11 2,12 3.3.4.1.4.2 3,34 Guide de Spark version 3.5.0
    Spark 3.2.1 3.3.1 11 3.8.13 2.12.15 3.3.1.0.3.2 2,45 Guide de Spark version 3.2.1
    Spark 3.0.2 3.2.0 1.8.0_321 3.6.8 2.12.10 3.2.1.3 1.25.2 Guide de Spark version 3.0.2
    2.4.4 Spark 2,9 1,8_162 3.6.8 2.11.12 2.9.2.6 1,25 Guide de Spark version 2.4.4
    Ce tableau est fourni à titre de référence uniquement et n'est pas destiné à être complet.
Remarque

Evitez de saisir des informations confidentielles lors de l'affectation de descriptions, de balises ou de noms conviviaux aux ressources cloud dans la console, l'API ou l'interface de ligne de commande Oracle Cloud Infrastructure. Cela vaut également pour la création ou la modification d'une application dans Data Flow.