Introduction à spark-submit et à la trousse SDK
Ce tutoriel vous aide à commencer à utiliser le code de la trousse SDK Java pour exécuter une application Spark dans le service de flux de données à l'aide de spark-submit avec la chaîne execute.
Commencez à utiliser spark-submit dans le service de flux de données avec la trousse SDK. Suivez le tutoriel existant Introduction au service de flux de données pour Oracle Cloud Infrastructure, mais utilisez la trousse SDK Java pour exécuter les commandes spark-submit.
Avant de commencer
Vous devez effectuer certaines opérations préalables avant de pouvoir utiliser les commandes spark-submit dans le flux de données avec la trousse SDK Java.
1. Extraction, transformation et chargement avec Java
Utilisez Spark-submit et la trousse SDK Java pour effectuer l'extraction, la transformation et le chargement avec Java.
2 : Apprentissage automatique avec PySpark
À l'aide de Spark-submit et de la trousse SDK Java, effectuez l'apprentissage automatique avec PySpark.
Étape suivante
Utilisez Spark-submit et l'interface de ligne de commande dans d'autres situations.
Vous pouvez utiliser spark-submit et la trousse SDK Java pour créer et exécuter des applications Java, Python ou SQL avec le flux de données et explorer les résultats. Le service de flux de données prend en charge tous les détails du déploiement, de la panne, de la gestion des journaux, de la sécurité et de l'accès à l'interface utilisateur. Avec le service de flux de données, vous pouvez vous concentrer sur le développement d'applications Spark sans vous soucier de l'infrastructure.