Strukturiertes Spark-Streaming mit Workflows konfigurieren

Sie können eine Streamingaufgabe in einem Workflow für die kontinuierliche Verarbeitung von Streamdaten konfigurieren.

Sie müssen zunächst einen Job erstellen und dann diesem Job eine Notizbuch- oder Python-Aufgabe hinzufügen, um Workflows mit Streaming in Oracle AI Data Platform Workbench zu verwenden.
  1. Navigieren Sie zu Ihrem Workspace, und klicken Sie auf Workflow.
  2. Klicken Sie auf Cluster erstellen (Symbol)Job erstellen.
  3. Geben Sie einen Namen und die Beschreibung für Ihren Job an.
  4. Klicken Sie auf Durchsuchen, und wählen Sie den Speicherort aus, in dem der Job in der AI Data Platform Workbench gespeichert werden soll. Klicken Sie auf Auswählen.
  5. Geben Sie 1 für Max. gleichzeitige Ausführungen ein.
  6. Klicken Sie auf Create.
  7. Klicken Sie auf den gerade erstellten Job.
  8. Klicken Sie auf Aufgabe hinzufügen.
  9. Geben Sie einen Namen für Ihre Aufgabe an.
  10. Wählen Sie Notizbuch oder Python als Aufgabentyp aus.
  11. Klicken Sie auf Durchsuchen, und navigieren Sie zu dem Notizbuch- oder Python-Skript, das Sie als Streamingaufgabe hinzufügen möchten. Klicken Sie auf Auswählen.
  12. Wählen Sie ein Compute-Cluster für die Notizbuch- oder Python-Aufgabe aus, wenn noch kein Compute-Cluster angehängt ist.
  13. Aktivieren Sie das Kontrollkästchen Streaming. Wenn Sie Streaming auswählen, werden Ausführungstimeout und Aufgabenabhängigkeiten als Optionen deaktiviert.

    Seite "Aufgabendetails erstellen" mit aktiviertem Kontrollkästchen "Streaming" geöffnet

  14. Wählen Sie die Anzahl der Wiederholungsversuche, die eine Aufgabe bei einem Fehler versuchen soll. Wenn Sie mehr als 0 auswählen, müssen Sie auch angeben, wie lange der Joblauf zwischen Wiederholungen warten soll und ob Wiederholungen bei Timeout versucht werden sollen.

    Optionen für Aufgabenwiederholung, wenn die Anzahl der Wiederholungen 1 oder höher ist

  15. Klicken Sie auf Jetzt ausführen.
Nachdem eine Streamingaufgabe gestartet wurde, wird sie weiter ausgeführt, bis Sie sie manuell stoppen. Während der regelmäßigen monatlichen Wartung wird die Streamingaufgabe vom Service gestoppt und neu gestartet, ohne dass eine Aktion von Ihrem Ende aus erforderlich ist.