Joblauf starten

Mit Data Science-Jobläufen können Sie verschiedene Anwendungsfälle auf erstellte Jobs anwenden.

Bei der Joberstellung werden die Infrastruktur und das eigentliche Anwendungsfallartefakt festlegt, führt der Joblauf den Job jedoch mit den angegebenen Parametern durch. Jobläufe stellen die angegebene Infrastruktur bereitstellen, das Jobartefakt ausführen und dann das Provisioning der verwendeten Ressourcen aufheben und zerstören, wenn der Joblauf beendet ist.

- Wenn Sie eine Jobausführung mit einem Knoten starten, führen Sie die Schritte unter Einzelner Knoten aus.
- Wenn Sie eine Jobausführung mit mehreren Knoten starten, führen Sie die Schritte unter Mehrere Knoten aus.
Einzelknoten
Führen Sie diese Schritte aus, um einen Joblauf mit einem Knoten zu starten.
Wählen Sie auf der Listenseite Projekte das Projekt aus, das die Jobs enthält, mit denen Sie arbeiten möchten. Wenn Sie Hilfe beim Suchen der Listenseite oder des Projekts benötigen, finden Sie weitere Informationen unter Projekte auflisten.
Wählen Sie auf der Seite mit den Projektdetails Jobs aus.
Wählen Sie die Tätigkeit aus.
Wählen Sie Jobläufe aus.
Wählen Sie Joblauf starten aus.
Geben Sie auf der Seite Joblauf starten die folgenden Informationen ein.

Compartment (optional): Wählen Sie ein anderes Compartment für die Jobausführung aus.

Name (optional): Geben Sie einen Namen für den Joblauf (maximal 255 Zeichen) ein. Wenn Sie keinen Namen angeben, wird automatisch ein Name generiert. Beispiel: jobrun20210808222435

Benutzerdefinierter Umgebungsvariablenschlüssel* (optional): Umgebungsvariablen, die den Job steuern.

Wert* (optional): Wert des benutzerdefinierten Umgebungsvariablenschlüssels.

Befehlszeilenargumente* (Optional): Die Befehlszeilenargumenten, die Sie zum Ausführen des Jobs verwenden möchten.

Maximale Laufzeit (in Minuten) (optional): Die maximale Anzahl von Minuten, die der Job ausgeführt werden kann. Der Service bricht den Joblauf ab, wenn die Laufzeit den angegebenen Wert überschreitet. Die maximale Laufzeit beträgt 30 Tage (43.200 Minuten). Es wird empfohlen, eine maximale Laufzeit für alle Jobläufe zu konfigurieren, um langfristige Arbeitsspeicherbelegung durch Jobläufe zu verhindern.

Netzwerkressourcen: Wählen Sie die entsprechende Option aus.

Standardnetzwerk: Schränkt den Traffic nur auf Oracle-Services ein. Das System verwendet das vorhandene serviceverwaltete Netzwerk. Die Workload wird mit einer sekundären VNIC an ein vorkonfiguriertes, vom Service verwaltetes VCN und Subnetz angehängt. Mit diesem bereitgestellten Subnetz kann Egress-Traffic zum öffentlichen Internet über ein NAT-Gateway und Zugriff auf andere Oracle Cloud-Services über ein Servicegateway erfolgen.
Wenn Sie nur Zugriff auf das öffentliche Internet und die OCI-Services benötigen, empfehlen wir die Verwendung dieser Option. Damit müssen Sie keine Netzwerkressourcen erstellen oder Policys für Netzwerkberechtigungen schreiben.

Standardnetzwerk mit Internet: Ermöglicht ausgehenden Internetzugriff über das Data Science-NAT-Gateway.
Hinweis

Sie können Standardnetzwerk mit Internet nicht in getrennten Realms und Oracle-Entwicklungsmandanten verwenden. Wenn Ihr Mandant oder Compartment über eine Data Science-Sicherheitszonen-Policy verfügt, die den öffentlichen Netzwerkzugriff verweigert (z.B. deny model_deploy_public_network (siehe Data Science-Sicherheitszonen-Policy), ist die Option für den serviceverwalteten öffentlichen Internetzugriff deaktiviert. Wenn Sie versuchen, diese Option zu verwenden, erhalten Sie einen 404 NotAuthorizedOrNotFound-Fehler.

Benutzerdefiniertes Netzwerk: Wählen sie das VCN und Subnetz (nach Compartment) aus, das Sie verwenden möchten.
Verwenden Sie für den Egress-Zugriff auf das öffentliche Internet ein privates Subnetz mit einer Route zu einem NAT-Gateway.
Hinweis

Benutzerdefiniertes Networking muss verwendet werden, um einen Dateispeichermount zu verwenden.

Das Wechseln von benutzerdefiniertem Networking zu verwaltetem Networking wird nach dem Erstellen nicht unterstützt.

Wenn das Banner The specified subnet is not accessible. Select a different subnet. angezeigt wird, erstellen Sie eine Policy, mit der Data Science benutzerdefiniertes Networking verwenden kann. Siehe Policys.

Ausprägung ändern* (Optional): Ändern Sie die Compute-Ausprägung, indem Sie Ausprägung ändern auswählen. Führen Sie anschließend die folgenden Schritte im Bereich Compute-Ausprägung auswählen aus.

Wählen Sie einen Instanztyp aus.

Wählen Sie eine Ausprägungsreihe aus.

Wählen Sie eine der unterstützten Compute-Ausprägungen in der Reihe aus. Wählen Sie die Ausprägung, die am besten zur gewünschten Verwendung der Ressource passt.

Blenden Sie die ausgewählte Ausprägung ein, um OCPUs und Arbeitsspeicher zu konfigurieren.

Anzahl OCPUs

Arbeitsspeicher (GB): Wählen Sie für jede OCPU bis zu 64 GB Arbeitsspeicher und maximal 512 GB Arbeitsspeicher aus. Der zulässige Mindestarbeitsspeicher ist entweder 1 GB oder ein Wert, der mit der Anzahl der OCPUs übereinstimmt, je nachdem, welcher Wert größer ist.

Burstfähige Ausprägung aktivieren: Wählen Sie diese Option aus, wenn Sie burstfähige VMs verwenden, und wählen Sie unter Baselineauslastung pro OCPU den Prozentsatz der OCPUs aus, den Sie normalerweise verwenden möchten. Die unterstützten Werte lauten 12,5% und 50%. (Bei Modell-Deployments wird nur der Wert von 50% unterstützt.)

Wählen Sie Ausprägung auswählen aus.

Speicher-Override* (optional): Überschreiben Sie die Speicherkonfiguration. Geben Sie die Blockspeichermenge ein, die zwischen 50 GB und 10, 240 GB (10 TB) verwendet werden soll. Sie können den Wert in 1-GB-Inkrementen ändern.

BYOC-Override aktivieren/Umgebungskonfigurations-Override > Auswählen* (optional): Wählen Sie diese Option aus, um die definierte Umgebungskonfiguration des Jobs außer Kraft zu setzen:

Compartment: Wählen Sie das Compartment aus, in dem das Repository enthalten ist.

Repository: Wählen Sie in der Liste ein Repository aus.

Bild: Wählen Sie das Bild aus, das Sie verwenden möchten.

Entrypoint: Geben Sie einen Einstiegspunkt ein.

CMD: Geben Sie einen Befehl ein.
Hinweis

Verwenden Sie CMD als Argumente für ENTRYPOINT oder den einzigen Befehl, der ohne ENTRYPOINT ausgeführt wird.

Imagedigest: Geben Sie einen Imagedigest ein.

Signatur-ID: Wenn Sie die Signaturverifizierung verwenden, geben Sie die OCID der Imagesignatur ein. Beispiel: ocid1.containerimagesignature.oc1.iad.aaaaaaaaab...

Logging aktivieren (optional): Überschreiben Sie die Loggingkonfiguration.

Compartment der Loggruppe: Wählen Sie das Compartment aus, das die Loggruppe enthält.

Loggruppe: Wählen Sie die Loggruppe.

Automatische Logerstellung aktivieren: Wählen Sie diese Option aus, um beim Start des Jobs automatisch ein Log zu erstellen. Das erstellte Log speichert alle stdout- und stderr-Meldungen.

Log auswählen: Wählen Sie diese Option aus (und wählen Sie ein vorhandenes Log), um alle stdout- und stderr-Nachrichten zu speichern.

Probes-Override* (Optional): Setzen Sie die Start-Probe außer Kraft.

Wählen Sie Auswählen aus.

Geben Sie im Bereich Probes die folgenden Informationen ein.

Befehl

Anfängliche Verzögerung (in Sekunden)

Punkt

Fehlerschwellenwert

Wählen Sie Speichern aus.

Tags (unter Erweiterte Optionen): Fügen Sie dem Joblauf Tags hinzu. Wenn Sie über Berechtigungen zum Erstellen von Ressourcen verfügt, sind Sie auch berechtigt: Freiformtags auf diese Ressource anwenden. Um ein definiertes Tag anzuwenden, müssen Sie über Berechtigungen zum Verwenden des Tag-Namespace verfügen. Weitere Informationen zu Tagging finden Sie unter Ressourcentags. Wenn Sie nicht sicher sind, ob Tags angewendet werden sollen, überspringen Sie diese Option, oder fragen Sie einen Administrator. Sie können Tags später anwenden.

Hinweis

Ein Sternchen (*) für ein Feld gibt eine andere Platzierung für Jobs mit mehreren Knoten an. Wenn Sie einen Joblauf für einen Job mit mehreren Knoten starten, suchen Sie das Feld, indem Sie die Knotengruppe bearbeiten: Wählen Sie unter Knotengruppenkonfigurations-Override im Menü Aktionen (drei Punkte) für die Knotengruppe die Option Bearbeiten aus. Das Feld wird im resultierenden Bereich angezeigt.

Wählen Sie Start.
Mehrfachknoten
Führen Sie diese Schritte aus, um einen Joblauf mit mehreren Knoten zu starten.
Wählen Sie auf der Listenseite Projekte das Projekt aus, das die Jobs enthält, mit denen Sie arbeiten möchten. Wenn Sie Hilfe beim Suchen der Listenseite oder des Projekts benötigen, finden Sie weitere Informationen unter Projekte auflisten.
Wählen Sie auf der Seite mit den Projektdetails Jobs aus.
Wählen Sie die Tätigkeit aus.
Wählen Sie Jobläufe aus.
Wählen Sie Joblauf starten aus.
Geben Sie auf der Seite Joblauf starten die unter Einzelner Knoten beschriebenen Informationen ein.

Die Felder sind mit Jobläufen mit einem Knoten identisch. Dabei gelten die folgenden Unterschiede.

Mit Sternchen (*) markierte Felder werden im Fensterbereich zum Bearbeiten einer Knotengruppe angezeigt.

Die folgenden Felder sind nur für Jobs mit mehreren Knoten verfügbar. Im Bereich können Sie eine Knotengruppe bearbeiten.

Replikate (Anzahl der Replikate)

Replikate mit minimalem Erfolg (Anzahl der Replikate, die erfolgreich sein müssen)

So öffnen Sie den Fensterbereich zum Bearbeiten einer Knotengruppe: Wählen Sie unter Knotengruppenkonfigurations-Override im Menü Aktionen (drei Punkte) für die Knotengruppe die Option Bearbeiten aus.

Wählen Sie Start.

Diese Umgebungsvariablen steuern den Job.

Mit der Data Science-CLI können Sie Jobläufe wie in diesem Beispiel starten:

Starten Sie einen Joblauf mit:

oci data-science job-run create \
--display-name <job_run_name> \
--compartment-id <compartment_ocid> \
--project-id <project_ocid> \
--job-id <job_ocid> \
--configuration-override-details file://<optional_job_run_configuration_override_json_file> \
--log-configuration-override-details file://<optional_job_run_logging_configuration_override_json_file>

(Optional) Verwenden Sie diese JSON-Datei zum Override von Joblaufkonfigurationen, um die für den übergeordneten Job definierten Konfigurationen außer Kraft zu setzen:

jobEnvironmentConfigurationDetails: {
  jobEnvironmentType: "OCIR_CONTAINER",
    image: "iad.ocir.io/axoxdievda5j/odsc-byod-hello-wrld:0.1.3",
    imageDigest: "sha256",
  cmd: ["ls", "-h"],
  entrypoint: ["-l"],
    imageSignatureId: "ocid1.containerimagesignature.oc1.iad.0.ociodscdev.aaaaaaaaccutw5qdz6twjzkpgmbojdck3qotqqsbn7ph6xcumu4s32o6v5gq",
},
    jobConfigurationDetails: {
        jobType: "DEFAULT",
        environmentVariables: <envar-list-object>},
    ...
}

(Optional) Verwenden Sie diese JSON-Datei zum Override von Joblauf-Loggingkonfigurationen, um die für den übergeordneten Job definierte Loggingkonfiguration außer Kraft zu setzen:
```
{
  "enableLogging": true,
  "enableAutoLogCreation": true,
  "logGroupId": "<log_group_ocid>"
}
```

Das ADS-SDK ist auch eine öffentlich verfügbare Python-Library, die Sie mit diesem Befehl installieren können:
```
pip install oracle-ads
```
Es stellt den Wrapper bereit, der das Starten von Jobläufen aus Notizbüchern oder auf Ihrem Clientrechner vereinfacht.

Verwenden Sie das ADS-SDK, um Jobläufe zu starten.

Oracle Cloud Infrastructure - Dokumentation

Joblauf starten

Einzelknoten

Mehrfachknoten