Création et gestion des flux de travail

Utilisez l'interface utilisateur d'Apache Hue pour créer des flux de travail. Utilisez la liste du programmateur pour créer des ensembles, des coordonnateurs ou des flux de travail. Pour les tâches Spark, utilisez l'action Spark. La tâche suivante présente le widget d'action Spark avec des détails sur la tâche et l'emplacement Spark dans HDFS. La liste d'options affichée permet de fournir des paramètres Spark supplémentaires à la tâche Spark. Pour les grappes HA, vous devez fournir des informations XML liées à Ranger. Plus d'informations suivent.
  1. Connectez-vous à Hue.
  2. Créez un fichier de script et chargez-le dans Hue.
  3. Dans le menu de navigation le plus à gauche, sélectionnez Programmateur.
  4. Sélectionnez Flux de travail, puis cliquez sur Mon flux de travail pour créer un flux de travail.
  5. Sélectionnez l'icône du programme Spark pour faire glisser l'action Spark vers la zone Déposer votre action ici.
  6. Sélectionnez le fichier Jar ou le fichier Python dans la liste déroulante Nom Jar/py.
  7. Sélectionnez le flux de travail dans la liste déroulante FILES.
  8. Pour connecter Hive dans un environnement haute disponibilité, sélectionnez l'icône d'engrenage, puis sélectionnez Données d'identification.
  9. Sélectionnez hcat.
  10. Sélectionnez l'icône d'enregistrement.
  11. Sélectionnez le flux de travail dans la structure de dossiers, puis sélectionnez l'icône Soumettre.