Aufgaben konfigurieren

In diesem Abschnitt wird die Erstellung und Konfiguration von Aufgaben beschrieben.

Aufgaben

Aufgaben sind kurze, funktionale Codeblöcke, die Sie als Teil einer Tätigkeit in einen Flow einfügen oder selbst zu Jobs hochstufen können.

Aufgaben sind die Hauptbausteine aller Workflows in Oracle AI Data Platform Workbench. Der Aufgabentyp bestimmt den verwendeten Codetyp. Im Rahmen eines Jobs verbinden Sie Aufgaben, um deren Reihenfolge und Priorität bei der Ausführung des Jobs zu bestimmen.

Aufgabentyp Beschreibung
Notizbuchaufgabe Eine Aufgabe, die in einem Notizbuch gespeichert wurde, auf das Sie zugreifen können
Python-Aufgabe Eine Aufgabe mit einem Snippet der Python-Programmiersprache
If/else-Bedingung Eine Aufgabe, die if/else-Bedingungen verwendet
Verschachtelte Jobaufgabe Eine Aufgabe, die einen vorhandenen Job und seine Aufgaben als verschachtelte Aufgabe verwendet
JAR-Aufgabe Eine Aufgabe, die Scala- oder Java-Code ausführen kann, der in Java Archive-(JAR-)Dateien kompiliert wird.

Wenn mehrere Aufgaben vorhanden sind, können Sie Gruppen von Aufgabenabhängigkeiten erstellen, bei denen der Erfolg oder Misserfolg einer Aufgabe nachfolgende Aufgaben nacheinander auslösen kann. Sie können nur Abhängigkeiten in Jobs erstellen, die mehrere Aufgaben haben. Siehe Notizbuchaufgabe erstellen.

Aufgaben können parallel zueinander ausgeführt werden. Dazu können Sie zwei oder mehr Aufgaben vom Erfolg oder Misserfolg einer anderen Aufgabe im selben Workflow abhängig machen, sodass sie gleichzeitig ausgeführt werden.

Aufgaben können aufgrund vorübergehender Probleme wie Netzwerkunterbrechungen, Nichtverfügbarkeit von Ressourcen oder vorübergehende Serviceausfälle nicht erfolgreich ausgeführt werden. In diesen Fällen wiederholt AI Data Platform Workbench die Aufgabe automatisch basierend auf Wiederholungs-Policys, die Sie beim Erstellen der Aufgabe konfigurieren. Im Rahmen dieser Policys definieren Sie:

  • Anzahl Wiederholungen: Die maximale Anzahl von Wiederholungsversuchen.
  • Wiederholungsintervall: Die Wartezeit zwischen Wiederholungen.

Neben standardmäßigen Aufgabenwiederholungen unterstützt AI Data Platform Workbench auch Bei Timeout wiederholen. Wenn eine Aufgabe aufgrund von Ressourcen-Constraints oder langsamer Verarbeitung ihre Ausführungszeit überschreitet und Sie nur für diese Szenarios versuchen möchten, können Sie eine automatische Wiederholung auslösen. Diese Wiederholungsrichtlinien verbessern die Resilienz des Workflows und stellen sicher, dass Aufgaben eine höhere Chance auf eine erfolgreiche Ausführung ohne manuelle Eingriffe haben.

Wann und wie Compute-Logs verwendet werden

Prüfen Sie Ihre Compute-Logs, wenn Ihre Aufgabe mit Ressourcen- oder Systemfehlern fehlschlägt, z.B. bei Fehlern außerhalb des Speichers oder bei einer CPU-Auslastung, die Grenzwerte überschreiten.

Prüfen Sie die Spark-Logs, wenn lange Wartezeiten, unerwartete Wiederholungen oder Engpässe bei der Jobperformance angezeigt werden. Diese Logs bieten Einblick in die Treiber- und Worker-Knoten des Compute-Clusters, das Ihre Aufgabe unterstützt, und können dazu beitragen, die Quelle möglicher Probleme zu identifizieren.

Weitere Informationen zum Prüfen Ihrer Logs finden Sie unter Bestimmten Joblauf überwachen.

Sie benötigen die entsprechende RBAC-Berechtigung auf Compute-Ebene, um Metadaten und Logs für die Compute-Instanz anzuzeigen, die mit dem Job verknüpft ist. Wenden Sie sich an den Administrator, um diese Berechtigungen zu erhalten, wenn Sie keine Compute-Logs anzeigen können. Weitere Informationen finden Sie unter Info über Berechtigungen.

Python-Aufgabe erstellen

Sie können eine Aufgabe als Teil eines Workflowjobs erstellen, der Python-Scripting verwendet.

  1. Klicken Sie auf der Homepage auf Workflow.
  2. Klicken Sie auf den Job, für den Sie eine Aufgabe erstellen möchten.
  3. Klicken Sie auf Aufgabe hinzufügen.
  4. Geben Sie einen Aufgabennamen ein.
  5. Wählen Sie unter Aufgabentyp die Option Python aus.
  6. Klicken Sie auf Durchsuchen, und navigieren Sie zu dem Python-Skript, das Sie als Aufgabe hinzufügen möchten. Klicken Sie auf Auswählen.
  7. Wählen Sie ein Compute-Cluster für die Python-Aufgabe aus, wenn noch kein Cluster angehängt ist.
  8. Wählen Sie die Anzahl der Wiederholungsversuche, die eine Aufgabe bei einem Fehler versuchen soll. Wenn Sie mehr als 0 auswählen, müssen Sie auch angeben, wie lange der Joblauf zwischen Wiederholungen warten soll und ob Wiederholungen bei Timeout versucht werden sollen.

    Optionen für Aufgabenwiederholung, wenn die Anzahl der Wiederholungen 1 oder höher ist

  9. Wählen Sie unter Abhängig alle Aufgaben aus, von denen Sie diese Aufgabe abhängig machen möchten. Wählen Sie in der Dropdown-Liste Ausführen, wenn die bedingte Antwort auf diese Abhängigkeit aus.
  10. Fügen Sie zusätzliche Parameter hinzu, indem Sie ihren Schlüssel und Wert angeben. Klicken Sie auf Parameter hinzufügen, um mehrere Parameter anzugeben.

Notizbuchaufgabe erstellen

Sie erstellen Aufgaben mit Notizbüchern, die Sie in AI Data Platform Workbench erstellt haben.

  1. Klicken Sie auf der Homepage auf Workflow.
  2. Klicken Sie auf den Job, für den Sie eine Aufgabe erstellen möchten.
  3. Klicken Sie auf Aufgabe hinzufügen.
  4. Geben Sie einen Aufgabennamen ein.
  5. Wählen Sie unter Aufgabentyp die Option Notizbuch aus.
  6. Klicken Sie auf Durchsuchen, und navigieren Sie zu dem Notizbuch, das Sie als Aufgabe hinzufügen möchten. Klicken Sie auf Auswählen.
  7. Wählen Sie ein Compute-Cluster für die Notizbuchaufgabe aus, wenn noch kein Cluster angehängt ist.
  8. Wählen Sie die Anzahl der Wiederholungsversuche, die eine Aufgabe bei einem Fehler versuchen soll. Wenn Sie mehr als 0 auswählen, müssen Sie auch angeben, wie lange der Joblauf zwischen Wiederholungen warten soll und ob Wiederholungen bei Timeout versucht werden sollen.

    Optionen für Aufgabenwiederholung, wenn die Anzahl der Wiederholungen 1 oder höher ist

  9. Wählen Sie unter Abhängig alle Aufgaben aus, von denen Sie diese Aufgabe abhängig machen möchten. Wählen Sie in der Dropdown-Liste Ausführen, wenn die bedingte Antwort auf diese Abhängigkeit aus.
  10. Fügen Sie zusätzliche Parameter hinzu, indem Sie ihren Schlüssel und Wert angeben. Klicken Sie auf Parameter hinzufügen, um mehrere Parameter anzugeben.

Verschachtelte Jobaufgabe erstellen

Sie können einen anderen Workflowjob und die darin enthaltenen Aufgaben als verschachtelte Aufgabe in einem anderen Workflow verwenden.

  1. Klicken Sie auf der Homepage auf Workflow.
  2. Klicken Sie auf den Job, für den Sie eine Aufgabe erstellen möchten.
  3. Klicken Sie auf Aufgabe hinzufügen.
  4. Geben Sie einen Aufgabennamen ein.
  5. Wählen Sie unter Aufgabentyp die Option Geschachtelte Jobaufgabe aus.
  6. Wählen Sie in der Dropdown-Liste Jobs einen vorhandenen Job aus, aus dem Sie eine Aufgabe erstellen möchten.
  7. Wählen Sie die Anzahl der Wiederholungsversuche, die eine Aufgabe bei einem Fehler versuchen soll. Wenn Sie mehr als 0 auswählen, müssen Sie auch angeben, wie lange der Joblauf zwischen Wiederholungen warten soll und ob Wiederholungen bei Timeout versucht werden sollen.

    Optionen für Aufgabenwiederholung, wenn die Anzahl der Wiederholungen 1 oder höher ist

  8. Wählen Sie unter Abhängig alle Aufgaben aus, von denen Sie diese Aufgabe abhängig machen möchten. Wählen Sie in der Dropdown-Liste Ausführen, wenn die bedingte Antwort auf diese Abhängigkeit aus.
  9. Fügen Sie zusätzliche Parameter hinzu, indem Sie ihren Schlüssel und Wert angeben. Klicken Sie auf Parameter hinzufügen, um mehrere Parameter anzugeben.

If/Sonst-Aufgabe erstellen

Sie können eine Aufgabe erstellen, die auf der Grundlage von Katalogdaten if/else-Bedingungen verwendet, um zu bestimmen, ob die Aufgabe ausgelöst wird.

  1. Klicken Sie auf der Homepage auf Workflow.
  2. Klicken Sie auf den Job, für den Sie eine Aufgabe erstellen möchten.
  3. Klicken Sie auf Aufgabe hinzufügen.
  4. Geben Sie einen Aufgabennamen ein.
  5. Wählen Sie unter Aufgabentyp die Option Falls/Sonst aus.
  6. Geben Sie die Bedingungen ein, die bestimmen, ob die Aufgabe ausgelöst wird. Klicken Sie auf Symbol "Hinzufügen" Hinzufügen, um mehrere Bedingungen festzulegen.
  7. Geben Sie den Bedingungsausdruck ein.
  8. Wählen Sie die Anzahl der Wiederholungsversuche, die eine Aufgabe bei einem Fehler versuchen soll. Wenn Sie mehr als 0 auswählen, müssen Sie auch angeben, wie lange der Joblauf zwischen Wiederholungen warten soll und ob Wiederholungen bei Timeout versucht werden sollen.

    Optionen für Aufgabenwiederholung, wenn die Anzahl der Wiederholungen 1 oder höher ist

  9. Wählen Sie unter Abhängig alle Aufgaben aus, von denen Sie diese Aufgabe abhängig machen möchten. Wählen Sie in der Dropdown-Liste Ausführen, wenn die bedingte Antwort auf diese Abhängigkeit aus.
  10. Fügen Sie zusätzliche Parameter hinzu, indem Sie ihren Schlüssel und Wert angeben. Klicken Sie auf Parameter hinzufügen, um mehrere Parameter anzugeben.

JAR-Aufgabe erstellen

Sie können Aufgaben erstellen, die Scala- oder Java-Code ausführen, der in Java Archive-(JAR-)Dateien kompiliert wird.

Hinweis:

Abhängige Library-Dateien müssen zum Zeitpunkt der Erstellung JDK-, Scala- oder Spark-Versionen verwenden, die mit der Laufzeit des Oracle AI Data Platform Workbench-Clusters kompatibel sind, um unerwartetes Verhalten zu vermeiden.
  1. Klicken Sie auf der Homepage auf Workflow.
  2. Klicken Sie auf den Job, für den Sie eine Aufgabe erstellen möchten.
  3. Klicken Sie auf Aufgabe hinzufügen.
  4. Geben Sie einen Aufgabennamen ein.
  5. Wählen Sie unter Aufgabentyp JAR-Aufgabe aus.
  6. Geben Sie unter Hauptklassenname den vollständigen Namen der Klasse an, die die Hauptmethode enthält, die Sie ausführen möchten. Beispiel: ProcessTransaction. Diese Klasse muss in einer der Dateien enthalten sein, die als abhängige Bibliothek hinzugefügt wurden.
  7. Klicken Sie unter Abhängige Librarys auf Hinzufügen.
  8. Wählen Sie eine Quelle für die abhängigen Bibliotheksdateien aus. Mindestens eine Bibliothek, die das oben angegebene Hauptklassenverfahren enthält, muss eingeschlossen werden.
    • Suchen Sie unter Workspace oder Volume den Workspace oder das Volume von AI Data Platform Workbench, wählen Sie die Datei(en) aus, die Sie als Library hinzufügen möchten, und klicken Sie auf Hinzufügen.
    • Suchen Sie unter Datei in Workspace hochladen auf dem lokalen Rechner nach der oder den Dateien, die als Library hochgeladen werden sollen, und klicken Sie auf Hinzufügen.
  9. Geben Sie unter Befehlszeilenargumente durch Leerzeichen getrennte Argumente an, die an die Hauptklasse übergeben werden sollen.
  10. Wählen Sie die Anzahl der Wiederholungsversuche, die eine Aufgabe bei einem Fehler versuchen soll. Wenn Sie mehr als 0 auswählen, müssen Sie auch angeben, wie lange die Jobausführung zwischen Wiederholungen warten soll und ob Wiederholungen bei Timeout versucht werden sollen.

    Optionen für Aufgabenwiederholung, wenn die Anzahl der Wiederholungen 1 oder höher ist

  11. Wählen Sie unter Abhängig alle Aufgaben aus, von denen Sie diese Aufgabe abhängig machen möchten. Wählen Sie in der Dropdown-Liste Ausführen, wenn die bedingte Antwort auf diese Abhängigkeit aus.
  12. Fügen Sie zusätzliche Parameter hinzu, indem Sie ihren Schlüssel und Wert angeben. Klicken Sie auf Parameter hinzufügen, um mehrere Parameter anzugeben.

Aufgabe bearbeiten

Sie können vorhandene Attribute einer Aufgabe, wie Name, Typ und Parameter, ändern, um die Funktionsweise in Ihrem Job zu ändern.

  1. Klicken Sie auf der Homepage auf Workflow.
  2. Klicken Sie auf den Job, für den Sie Aufgaben konfigurieren möchten.
  3. Klicken Sie auf der Registerkarte Aufgaben auf die Aufgabe, die Sie bearbeiten möchten.
  4. Ändern Sie im Bereich Aufgabendetails rechts die Aufgabenattribute nach Bedarf. Änderungen werden automatisch gespeichert.

Aufgabenlogs anzeigen

Sie können die Ausführungslogs einzelner Aufgaben in einem Job anzeigen.

  1. Klicken Sie auf der Homepage auf Workflows.
  2. Klicken Sie auf Jobläufe.
  3. Klicken Sie auf den Job, für den Sie die Aufgabenlogs anzeigen möchten.
  4. Klicken Sie auf die Aufgabenknoten, um die Logs für diese Aufgabe anzuzeigen.

Aufgaben löschen

Sie können eine Aufgabe löschen, indem Sie den Aufgabenknoten aus einem Job entfernen.

  1. Klicken Sie auf der Homepage auf Workflow.
  2. Klicken Sie auf den Job, aus dem Sie Aufgaben löschen möchten.
  3. Klicken Sie im Aufgabenknoten auf Aktionen und dann auf Knoten entfernen.
  4. Klicken Sie auf Löschen.