Job erstellen

Erstellen und führen Sie einen Job in Data Science aus.

Bevor Sie beginnen

    1. Wählen Sie auf der Listenseite Projekte das Projekt aus, das die Jobs enthält, mit denen Sie arbeiten möchten. Wenn Sie Hilfe beim Suchen der Listenseite oder des Projekts benötigen, finden Sie weitere Informationen unter Projekte auflisten.
    2. Wählen Sie auf der Seite mit den Projektdetails Jobs aus.
    3. Wählen Sie Job erstellen aus.
      Die Seite Job erstellen wird geöffnet.

    Grundlegende Informationen

    Wählen Sie einen oder mehrere Knoten aus, und geben Sie identifizierende Informationen an.

    • Jobtyp: Wählen Sie die entsprechende Option aus.
      • Einzelner Knoten: Ein Rechner für den Job.
      • Mehrknoten: Mehrere Knoten für einen anspruchsvollen Job.
    • Compartment (optional): Wählen Sie ein anderes Compartment für den Job.
    • Name (optional): Geben Sie einen Namen für den Job ein (max. 255 Zeichen). Wenn Sie keinen Namen angeben, wird automatisch ein Name generiert. Beispiel: job20210808222435

    Konfiguration

    Geben Sie folgende Informationen ein.

    • Knotengruppe hinzufügen (nur Jobs mit mehreren Knoten): Wählen Sie diese Option aus, um eine Knotengruppenkonfiguration hinzuzufügen. Fügen Sie bis zu 5 Knotengruppen hinzu.
      • Name: Geben Sie einen eindeutigen Namen für die Knotengruppe ein.
      • Replikate: Geben Sie die Anzahl der Replikate ein.
      • Replikate mit minimalem Erfolg: Geben Sie die Mindestanzahl an Replikaten ein, die erfolgreich sein müssen.
      • Sternchen (*)
      • (Optional) Wenn mehrere Knotengruppen vorhanden sind, geben Sie die Startreihenfolge der Knotengruppe entweder parallel oder nacheinander an.
    • Benutzerdefinierter Umgebungsvariablenschlüssel* (optional): Umgebungsvariablen, die den Job steuern.
      Hinweis

      Wenn Sie eine ZIP-Datei oder komprimierte TAR-Datei hochgeladen haben, fügen Sie die Datei JOB_RUN_ENTRYPOINT als benutzerdefinierte Umgebungsvariable hinzu, um auf die Datei zu verweisen.
    • Wert* (optional): Wert des benutzerdefinierten Umgebungsvariablenschlüssels.
    • Befehlszeilenargumente* (Optional): Die Befehlszeilenargumenten, die Sie zum Ausführen des Jobs verwenden möchten.
    • Maximale Laufzeit (in Minuten) (optional): Die maximale Anzahl von Minuten, die der Job ausgeführt werden kann. Der Service bricht den Joblauf ab, wenn die Laufzeit den angegebenen Wert überschreitet. Die maximale Laufzeit beträgt 30 Tage (43.200 Minuten). Es wird empfohlen, eine maximale Laufzeit für alle Jobläufe zu konfigurieren, um langfristige Arbeitsspeicherbelegung durch Jobläufe zu verhindern.
    • Ausprägung ändern* (Optional): Ändern Sie die Compute-Ausprägung, indem Sie Ausprägung ändern auswählen. Führen Sie anschließend die folgenden Schritte im Bereich Compute-Ausprägung auswählen aus.
      • Wählen Sie einen Instanztyp aus.
      • Wählen Sie eine Ausprägungsreihe aus.
      • Wählen Sie eine der unterstützten Compute-Ausprägungen in der Reihe aus. Wählen Sie die Ausprägung, die am besten zur gewünschten Verwendung der Ressource passt.
      • Blenden Sie die ausgewählte Ausprägung ein, um OCPUs und Arbeitsspeicher zu konfigurieren.
        • Anzahl OCPUs
        • Arbeitsspeicher (GB): Wählen Sie für jede OCPU bis zu 64 GB Arbeitsspeicher und maximal 512 GB Arbeitsspeicher aus. Der zulässige Mindestarbeitsspeicher ist entweder 1 GB oder ein Wert, der mit der Anzahl der OCPUs übereinstimmt, je nachdem, welcher Wert größer ist.
        • Burstfähige Ausprägung aktivieren: Wählen Sie diese Option aus, wenn Sie burstfähige VMs verwenden, und wählen Sie unter Baselineauslastung pro OCPU den Prozentsatz der OCPUs aus, den Sie normalerweise verwenden möchten. Die unterstützten Werte lauten 12,5% und 50%. (Bei Modell-Deployments wird nur der Wert von 50% unterstützt.)
      • Wählen Sie Ausprägung auswählen aus.
    • Speicher: Geben Sie die Blockspeichermenge ein, die zwischen 50 GB und 10, 240 GB (10 TB) verwendet werden soll. Sie können den Wert in 1-GB-Inkrementen ändern.
    • Netzwerkressourcen: Wählen Sie die entsprechende Option aus.
      • Standardnetzwerk: Schränkt den Traffic nur auf Oracle-Services ein. Das System verwendet das vorhandene serviceverwaltete Netzwerk. Die Workload wird mit einer sekundären VNIC an ein vorkonfiguriertes, vom Service verwaltetes VCN und Subnetz angehängt. Mit diesem bereitgestellten Subnetz kann Egress-Traffic zum öffentlichen Internet über ein NAT-Gateway und Zugriff auf andere Oracle Cloud-Services über ein Servicegateway erfolgen.

        Wenn Sie nur Zugriff auf das öffentliche Internet und die OCI-Services benötigen, wird empfohlen, diese Option zu verwenden. Damit müssen Sie keine Netzwerkressourcen erstellen oder Policys für Netzwerkberechtigungen schreiben.

      • Standardnetzwerk mit Internet: Ermöglicht ausgehenden Internetzugriff über das Data Science-NAT-Gateway.
        Hinweis

        Sie können Standardnetzwerk mit Internet nicht in getrennten Realms und Oracle-Entwicklungsmandanten verwenden. Wenn Ihr Mandant oder Compartment über eine Data Science-Sicherheitszonen-Policy verfügt, die den öffentlichen Netzwerkzugriff verweigert (z.B. deny model_deploy_public_network (siehe Data Science-Sicherheitszonen-Policy), ist die Option für den serviceverwalteten öffentlichen Internetzugriff deaktiviert. Wenn Sie versuchen, diese Option zu verwenden, erhalten Sie einen 404 NotAuthorizedOrNotFound-Fehler.
      • Benutzerdefiniertes Netzwerk:Wählen Sie das VCN und Subnetz (nach Compartment) aus, das Sie verwenden möchten.

        Verwenden Sie für den Egress-Zugriff auf das öffentliche Internet ein privates Subnetz mit einer Route zu einem NAT-Gateway.

        Hinweis

        • Benutzerdefiniertes Networking muss verwendet werden, um einen Dateispeicher-Mount zu verwenden.
        • Das Wechseln von benutzerdefiniertem Networking zu verwaltetem Networking wird nach dem Erstellen nicht unterstützt.
        • Wenn das Banner The specified subnet is not accessible. Select a different subnet. angezeigt wird, erstellen Sie eine Policy, mit der Data Science benutzerdefiniertes Networking verwenden kann. Siehe Policys.
    • Jobartefakt hochladen (Optional, wenn BYOC konfiguriert ist): Laden Sie das Jobartefakt hoch, indem Sie die erforderliche Jobartefaktdatei in das Feld ziehen.
    Hinweis

    Ein Sternchen (*) für ein Feld gibt eine andere Platzierung für Jobs mit mehreren Knoten an. Wenn Sie einen Job mit mehreren Knoten erstellen, suchen Sie das Feld, indem Sie eine Knotengruppe hinzufügen: Wählen Sie unter Konfiguration die Option Knotengruppe hinzufügen aus. Das Feld wird im Bereich Knotengruppe hinzufügen angezeigt.

    Zusätzliche Konfiguration

    Geben Sie folgende Informationen ein.

    • Logging aktivieren (optional): Konfigurieren Sie das Logging.
      • Compartment der Loggruppe: Wählen Sie das Compartment aus, das die Loggruppe enthält.
      • Loggruppe: Wählen Sie die Loggruppe aus.
      • Automatische Logerstellung aktivieren: Wählen Sie diese Option aus, um beim Start des Jobs automatisch ein Log zu erstellen. Das erstellte Log speichert alle stdout- und stderr-Meldungen.
      • Log auswählen: Wählen Sie diese Option aus (und wählen Sie ein vorhandenes Log), um alle stdout- und stderr-Nachrichten zu speichern.
    • BYOC aktivieren/Umgebungskonfiguration > Auswählen* (für Jobs mit mehreren Knoten erforderlich): Richten Sie eine Umgebung für Bring Your Own Container (BYOC) ein.
      • Compartment: Wählen Sie das Compartment aus, in dem das Repository enthalten ist.
      • Repository: Wählen Sie in der Liste ein Repository aus.
      • Bild: Wählen Sie das Bild aus, das Sie verwenden möchten.
      • Entrypoint: Geben Sie einen Einstiegspunkt ein.
      • CMD: Geben Sie einen Befehl ein.
        Hinweis

        Verwenden Sie CMD als Argumente für ENTRYPOINT oder den einzigen Befehl, der ohne ENTRYPOINT ausgeführt wird.
      • Imagedigest: Geben Sie einen Imagedigest ein.
      • Signatur-ID: Wenn Sie die Signaturverifizierung verwenden, geben Sie die OCID der Imagesignatur ein. Beispiel: ocid1.containerimagesignature.oc1.iad.aaaaaaaaab...
    • Dateispeicher-Mounts (optional): Wählen Sie Dateispeicher-Mount hinzufügen aus, und geben Sie die folgenden Informationen ein.
      • Compartment: Wählen Sie das Compartment mit dem Ziel aus, das Sie mounten möchten.
      • Mountziel: Das Mountziel, das Sie verwenden möchten.
      • Exportpfad: Der Exportpfad, den Sie verwenden möchten.
      • Zielpfad und Verzeichnis: Geben Sie den Pfad ein, der zum Mounten des Speichers verwendet werden soll.

        Der Pfad muss mit einem alphanumerischen Zeichen beginnen. Das Zielverzeichnis muss in allen angegebenen Speichermounts eindeutig sein. Die zulässigen Zeichen sind alphanumerische Zeichen, Bindestriche ( - ) und Unterstriche ( _ ).

        Sie können den vollständigen Pfad angeben, z.B. /opc/storage-directory. Wenn nur ein Verzeichnis angegeben wird, z.B. /storage-directory, wird es unter dem Standardverzeichnis /mnt gemountet. Sie können keine BS-spezifischen Verzeichnisse angeben, wie /bin oder /etc.

    • Object Storage-Mounts (optional): Wählen Sie Object Storage-Mount hinzufügen aus, und geben Sie die folgenden Informationen ein.
      • Compartment: Wählen Sie das Compartment mit dem Bucket aus, den Sie mounten möchten.
      • Bucket: Wählen Sie den Bucket aus, den Sie verwenden möchten.
      • Objektnamenpräfix (optional): Objektnamenpräfix. Das Präfix muss mit einem alphanumerischen Zeichen beginnen. Die zulässigen Zeichen sind alphanumerische Zeichen, Schrägstriche ( / ), Bindestriche ( - ) und Unterstriche ( _ ).
      • Zielpfad und Verzeichnis: Geben Sie den Pfad ein, der zum Mounten des Speichers verwendet werden soll.

        Der Pfad muss mit einem alphanumerischen Zeichen beginnen. Das Zielverzeichnis muss in allen angegebenen Speichermounts eindeutig sein. Die zulässigen Zeichen sind alphanumerische Zeichen, Bindestriche ( - ) und Unterstriche ( _ ).

        Sie können den vollständigen Pfad angeben, wie /opc/storage-directory. Wenn nur ein Verzeichnis angegeben wird, wie /storage-directory, wird es unter dem Standardverzeichnis /mnt gemountet. Sie können keine BS-spezifischen Verzeichnisse angeben, wie /bin oder /etc.

      Hinweis

      Wenn Sie benutzerdefiniertes Networking verwenden:
      1. Erstellen Sie das Servicegateway im VCN.
      2. Fügen Sie für die Routentabellenkonfigurationen im privaten Subnetz das Servicegateway hinzu.
      3. Ändern Sie die Egress-Regeln der Sicherheitsliste des erforderlichen Subnetzes, um Traffic zu allen Services im Netzwerk zuzulassen.
    • Probe* (für Jobs mit mehreren Knoten erforderlich): Konfigurieren Sie die Start-Probe.
      1. Wählen Sie Auswählen aus.
      2. Geben Sie im Bereich Probes die folgenden Informationen ein.
        • Befehl
        • Anfängliche Verzögerung (in Sekunden)
        • Punkt
        • Fehlerschwellenwert
      3. Wählen Sie Speichern aus.
    • Tags (unter Erweiterte Optionen): Fügen Sie dem Job Tags hinzu. Wenn Sie über Berechtigungen zum Erstellen von Ressourcen verfügt, sind Sie auch berechtigt: Freiformtags auf diese Ressource anwenden. Um ein definiertes Tag anzuwenden, benötigen Sie Die Berechtigungen zum Verwenden des Tag-Namespace. Weitere Informationen zu Tagging finden Sie unter Ressourcentags. Wenn Sie nicht sicher sind, ob Tags angewendet werden sollen, überspringen Sie diese Option, oder fragen Sie einen Administrator. Sie können Tags später anwenden.
    Hinweis

    Ein Sternchen (*) für ein Feld gibt eine andere Platzierung für Jobs mit mehreren Knoten an. Wenn Sie einen Job mit mehreren Knoten erstellen, suchen Sie das Feld, indem Sie eine Knotengruppe hinzufügen: Wählen Sie unter Konfiguration die Option Knotengruppe hinzufügen aus. Das Feld wird im Bereich Knotengruppe hinzufügen angezeigt.

    Prüfen und erstellen

    Prüfen Sie die Konfiguration, und wählen Sie Erstellen aus.

    Wenn der Job aktiv ist, können Sie ihn mit Jobläufen wiederholt ausführen.

  • Diese Umgebungsvariablen steuern den Job.

    Mit der Data Science-CLI können Sie einen Job wie in diesem Beispiel erstellen:

    1. Erstellen Sie einen Job mit:
      oci data-science job create \
      --display-name <job_name>\
      --compartment-id <compartment_ocid>\
      --project-id <project_ocid> \
      --configuration-details file://<jobs_configuration_json_file> \
      --infrastructure-configuration-details file://<jobs_infrastructure_configuration_json_file> \
      --log-configuration-details file://<optional_jobs_infrastructure_configuration_json_file>
                                      
    2. Verwenden Sie diese JSON-Datei für die Jobkonfiguration:
      {
        "jobType": "DEFAULT",
        "maximumRuntimeInMinutes": 240,
        "commandLineArguments" : "test-arg",
        "environmentVariables": {
          "SOME_ENV_KEY": "some_env_value" 
        }
      }
    3. Verwenden Sie die JSON-Datei für die Jobinfrastrukturkonfiguration:
      {
        "jobInfrastructureType": "STANDALONE",
        "shapeName": "VM.Standard2.1",
        "blockStorageSizeInGBs": "50",
        "subnetId": "<subnet_ocid>"
      }
    4. (Optional) Verwenden Sie diese JSON-Datei für die Jobloggingkonfiguration:
      {
        "enableLogging": true,
        "enableAutoLogCreation": true,
        "logGroupId": "<log_group_ocid>"
      }
    5. Laden Sie wie folgt eine Jobartefaktdatei für den erstellten Job hoch:
      oci data-science job create-job-artifact \
      --job-id <job_ocid> \
      --job-artifact-file <job_artifact_file_path> \
      --content-disposition "attachment; filename=<job_artifact_file_name>"
  • Das ADS-SDK ist auch eine öffentlich verfügbare Python-Library, die Sie mit diesem Befehl installieren können:

    pip install oracle-ads

    Es stellt den Wrapper zur Verfügung, der das Erstellen und Ausführen von Jobs aus Notizbüchern oder auf dem Clientrechner vereinfacht.

    Mit dem ADS-SDK können Sie Jobs erstellen und ausführen.