Démarrage d'une exécution de travail

Utilisez les exécutions de travail du service de science des données pour appliquer divers cas d'utilisation aux tâches créées.

La création de travail définit l'infrastructure et l'artefact de cas d'utilisation réel, mais l'exécution de travail l'exécute avec les paramètres spécifiés. Les exécutions de travail provisionnent l'infrastructure spécifiée, exécutent l'artefact de travail, puis déprovisionnent et détruisent les ressources utilisées à la fin de l'exécution de travail.

- Si vous démarrez une exécution de travail sur un seul noeud, suivez les étapes sous Noeud unique.
- Si vous démarrez une exécution de travail sur plusieurs noeuds, suivez les étapes sous Noeuds multiples.
Mononoeud
Utilisez ces étapes pour démarrer une exécution de travail sur un seul noeud.
Dans la page de liste Projets, sélectionnez le projet qui contient les tâches avec lesquelles vous voulez travailler. Si vous avez besoin d'aide pour trouver la page de liste ou le projet, voir Liste des projets.
Dans la page des détails du projet, sélectionnez Travaux.
Sélectionnez l'emploi.
Sélectionnez Exécutions de travail.
Sélectionnez Démarrer une exécution de travail.
Dans la page Démarrer une exécution de travail, entrez les informations suivantes.

Compartiment (Facultatif) : Sélectionnez un autre compartiment pour l'exécution du travail.

Nom (Facultatif) : Entrez un nom pour l'exécution de travail (255 caractères au maximum). Si vous n'indiquez pas de nom, un nom est automatiquement généré. Exemple : jobrun20210808222435

Clé de variable d'environnement personnalisée* (Facultatif) : Variables d'environnement qui contrôlent le travail.

Valeur* (Facultatif) : Valeur de la clé de variable d'environnement personnalisée.

Arguments de ligne de commande* (Facultatif) : Arguments de ligne de commande à utiliser pour exécuter le travail.

Durée d'exécution maximale (en minutes) (Facultatif) : Nombre maximal de minutes pendant lesquelles le travail peut être exécuté. Le service annule l'exécution de travail si sa durée dépasse la valeur spécifiée. Le temps d'exécution maximal est de 30 jours (43 200 minutes). Nous vous recommandons de configurer un délai maximal afin d'éviter les exécutions de travail incontrôlées.

Ressources de réseau : Sélectionnez l'option pertinente.

Réseau par défaut : Restreint le trafic vers les services Oracle uniquement. Le système utilise le réseau géré par le service existant. La charge de travail est attachée à l'aide d'une carte VNIC secondaire à un VCN et à un sous-réseau préconfigurés gérés par le service. Ce sous-réseau donne accès à l'Internet public par l'intermédiaire d'une passerelle NAT et à d'autres services Oracle Cloud par l'intermédiaire d'une passerelle de service.
Si vous avez besoin d'un accès uniquement à l'Internet public et aux services OCI, nous vous recommandons d'utiliser cette option. Vous n'avez pas besoin de créer des ressources de réseau ni d'écrire des politiques pour les autorisations de réseau.

Réseau par défaut avec Internet : Autorise l'accès Internet sortant au moyen de la passerelle NAT du service de science des données.
Note

Vous ne pouvez pas utiliser le réseau par défaut avec Internet dans des domaines déconnectés et des locations de développement Oracle. Si votre location ou compartiment a une politique de zone de sécurité du service de science des données qui refuse l'accès au réseau public (par exemple, deny model_deploy_public_network—voir Politique de zone de sécurité du service de science des données), l'option d'accès à l'Internet public géré par le service est désactivée. Si vous essayez d'utiliser cette option, vous recevez une erreur 404 NotAuthorizedOrNotFound.

Réseau personnalisé : Sélectionnez le VCN et le sous-réseau (par compartiment) à utiliser.
Pour l'accès sortant à l'Internet public, utilisez un sous-réseau privé avec une route vers une passerelle NAT.
Note

Le réseau personnalisé doit être utilisé pour utiliser un montage de stockage de fichiers.

Le passage d'un réseau personnalisé à un réseau géré n'est pas pris en charge après la création.

Si la bannière The specified subnet is not accessible. Select a different subnet. s'affiche, créez une politique qui permet au service de science des données d'utiliser un réseau personnalisé. Voir Politiques.

Modifier la forme* (Facultatif) : Modifiez la forme du service de calcul en sélectionnant Modifier la forme. Suivez ensuite ces étapes dans le panneau Sélectionner une forme de calcul.

Sélectionner un type d'instance.

Sélectionnez une série de formes.

Sélectionnez une des formes de calcul prises en charge dans la série. Sélectionnez la forme qui convient le mieux à l'utilisation souhaitée de la ressource.

Développez la forme sélectionnée pour configurer les OCPU et la mémoire.

Nombre d'OCPU

Montant de mémoire (Go) : Pour chaque OCPU, sélectionnez jusqu'à 64 Go de mémoire et un total maximal de 512 Go. La quantité minimale de mémoire autorisée est de 1 Go ou une valeur correspondant au nombre d'OCPU, selon la valeur la plus élevée.

Activer la forme extensible : Sélectionnez cette option si vous utilisez des machines virtuelles extensibles, puis pour Utilisation de référence par OCPU, sélectionnez le pourcentage d'OCPU que vous voulez généralement utiliser. Les valeurs prises en charge sont 12,5 % et 50 %. (Pour les déploiements de modèle, seule la valeur de 50 % est prise en charge.)

Sélectionnez Sélectionner une forme.

Remplacement du stockage* (Facultatif) : Remplacez la configuration du stockage. Entrez la quantité de stockage par blocs à utiliser comprise entre 50 Go et 10, 240 Go (10 To). Vous pouvez modifier la valeur par incréments de 1 Go.

Activer le remplacement BYOC / Remplacement de la configuration d'environnement > Sélectionner* (Facultatif) : Sélectionnez cette option pour remplacer la configuration d'environnement définie par la tâche :

Compartiment : Sélectionnez le compartiment qui contient le référentiel.

Référentiel : Sélectionnez un référentiel dans la liste.

Image : Sélectionnez l'image à utiliser.

Point d'entrée : Entrez un point d'entrée.

CMD : Entrez une commande.
Note

Utilisez CMD comme arguments pour ENTRYPOINT ou la seule commande à exécuter en l'absence d'ENTRYPOINT.

Constatateur d'image : Entrez un condensé d'image.

ID signature : Si vous utilisez la vérification de signature, entrez l'OCID de la signature d'image. Exemple : ocid1.containerimagesignature.oc1.iad.aaaaaaaaab...

Activer la journalisation (Facultatif) : Remplacez la configuration de journalisation.

Compartiment du groupe de journaux : Sélectionnez le compartiment qui contient le groupe de journaux.

Groupe de journaux : Sélectionnez le groupe de journaux.

Activer la création automatique de journaux : Sélectionnez cette option pour créer automatiquement un journal au démarrage de la tâche. Le journal créé stocke tous les messages stdout et stderr.

Sélectionner un journal : Sélectionnez cette option (et sélectionnez un journal existant) pour stocker tous les messages stdout et stderr.

Remplacement des sondes* (Facultatif) : Remplacez la sonde de démarrage.

Sélectionnez Sélectionner.

Dans le panneau Sondes, entrez les informations suivantes.

Commande

Délai initial (en secondes)

Point

Seuil de défaillance

Sélectionnez enregistrer.

Marqueurs (sous Options avancées) : Ajoutez des marqueurs à l'exécution de travail. Si vous êtes autorisé à créer une ressource, vous pouvez également appliquer des marqueurs à structure libre à cette ressource. Pour appliquer un marqueur défini, vous devez être autorisé à utiliser l'espace de noms de marqueur. Pour plus d'informations sur le marquage, voir Marqueurs de ressource. Si vous ne savez pas si vous devez appliquer des marqueurs, ignorez cette option ou demandez à un administrateur. Vous pouvez appliquer des marqueurs plus tard.

Note

Un astérisque (*) pour un champ indique un positionnement différent pour les tâches multinoeud. Si vous démarrez une exécution de travail pour une tâche multinoeud, recherchez le champ en modifiant le groupe de noeuds : sous Remplacement de la configuration du groupe de noeuds, dans le menu Actions (trois points) du groupe de noeuds, sélectionnez Modifier. Le champ apparaît dans le panneau résultant.

Sélectionnez Démarrer.
Multinoeud
Utilisez ces étapes pour démarrer une exécution de travail sur plusieurs noeuds.
Dans la page de liste Projets, sélectionnez le projet qui contient les tâches avec lesquelles vous voulez travailler. Si vous avez besoin d'aide pour trouver la page de liste ou le projet, voir Liste des projets.
Dans la page des détails du projet, sélectionnez Travaux.
Sélectionnez le travail.
Sélectionnez Exécutions de travail.
Sélectionnez Démarrer une exécution de travail.
Dans la page Démarrer une exécution de travail, entrez les informations décrites sous Noeud unique.

Les champs sont identiques aux exécutions de travail à noeud unique avec les différences suivantes.

Les champs astérisqués (*) apparaissent dans le panneau pour modifier un groupe de noeuds.

Les champs suivants ne sont disponibles que pour les tâches multinoeud, dans le panneau pour modifier un groupe de noeuds.

Répliques (nombre de répliques)

Répliques avec succès minimum (nombre de répliques qui doivent réussir)

Pour ouvrir le panneau permettant de modifier un groupe de noeuds : Sous Remplacement de la configuration du groupe de noeuds, dans le menu Actions (trois points) du groupe de noeuds, sélectionnez Modifier.

Sélectionnez Démarrer.

Ces variables d'environnement contrôlent le travail.

Utilisez l'interface de ligne de commande du service de science des données pour démarrer les exécutions de travail comme dans cet exemple :

Démarrez une exécution de travail avec :

oci data-science job-run create \
--display-name <job_run_name> \
--compartment-id <compartment_ocid> \
--project-id <project_ocid> \
--job-id <job_ocid> \
--configuration-override-details file://<optional_job_run_configuration_override_json_file> \
--log-configuration-override-details file://<optional_job_run_logging_configuration_override_json_file>

(Facultatif) Utilisez ce fichier JSON de remplacement de configuration d'exécution de travail pour remplacer les configurations définies pour le travail parent :

jobEnvironmentConfigurationDetails: {
  jobEnvironmentType: "OCIR_CONTAINER",
    image: "iad.ocir.io/axoxdievda5j/odsc-byod-hello-wrld:0.1.3",
    imageDigest: "sha256",
  cmd: ["ls", "-h"],
  entrypoint: ["-l"],
    imageSignatureId: "ocid1.containerimagesignature.oc1.iad.0.ociodscdev.aaaaaaaaccutw5qdz6twjzkpgmbojdck3qotqqsbn7ph6xcumu4s32o6v5gq",
},
    jobConfigurationDetails: {
        jobType: "DEFAULT",
        environmentVariables: <envar-list-object>},
    ...
}

(Facultatif) Utilisez ce fichier JSON de remplacement de configuration de journalisation d'exécution de travail pour remplacer la configuration de journalisation définie pour le travail parent :
```
{
  "enableLogging": true,
  "enableAutoLogCreation": true,
  "logGroupId": "<log_group_ocid>"
}
```

La trousse SDK ADS est également une bibliothèque Python publique que vous pouvez installer avec cette commande :
```
pip install oracle-ads
```
Il fournit l'encapsuleur qui facilite le démarrage des exécutions de travail à partir de carnets ou sur votre machine client.

Utilisez la trousse SDK ADS pour démarrer les exécutions de travail.

Documentation sur Oracle Cloud Infrastructure

Démarrage d'une exécution de travail

Mononoeud

Multinoeud