Démarrage d'un traitement de travail
Utilisez les exécutions de travail Data Science pour appliquer différents cas d'emploi aux travaux créés.
La création de travaux définit l'infrastructure et l'artefact de cas d'emploi réel, mais l'exécution de travail exécute le travail avec les paramètres indiqués. Les traitements de Travail provisionnent l'infrastructure spécifiée, exécutent l'artefact de Travail, puis dé-provisionnent et dé-provisionnent les ressources utilisées à la fin du travail.
- Si vous démarrez un traitement de travail à noeud unique, suivez les étapes de la section Utilisation de la console pour démarrer des traitements de travail à noeud unique.
- Si vous démarrez un traitement de travail à plusieurs noeuds, suivez les étapes de la section Utilisation de la console pour démarrer des traitements de travail à plusieurs noeuds.
Utiliser la console pour démarrer des traitements de travail à noeud uniqueUtiliser la console pour démarrer des traitements de travail à noeud unique
- Sur la page de liste des travaux, sélectionnez le nom du travail à utiliser. Si vous avez besoin d'aide pour trouver la liste des travaux, reportez-vous à Liste des travaux.
- Sélectionnez Démarrer un traitement de travail.
- (Facultatif) Sélectionnez un autre compartiment pour le traitement de travail.
- (Facultatif) Entrez un nom de traitement du travail (limite de 255 caractères). Si vous n'indiquez aucun nom, un nom est automatiquement généré.
Par exemple,
jobrun20210808222435
. - (Facultatif) Remplacez la configuration de travail par défaut définie lors de la création du travail à l'aide des options suivantes :
Entrez ou sélectionnez l'une des valeurs suivantes :
- Clé de variable d'environnement personnalisée
-
Variables d'environnement qui contrôlent le travail.
- Valeur
-
Valeur de la clé de variable d'environnement personnalisée.
Vous pouvez sélectionner Clé d'environnement personnalisé supplémentaire pour spécifier d'autres variables.
- Arguments de ligne de commande
-
Arguments de ligne de commande à utiliser pour exécuter le travail.
- Durée d'exécution maximale (en minutes)
-
Nombre maximal de minutes pendant lesquelles le travail peut être exécuté. Le service annule le traitement de travail si sa durée dépasse la valeur indiquée. La durée d'exécution maximale est de 30 jours (43 200 minutes). Nous vous recommandons de configurer une durée d'exécution maximale pour tous les traitements de travail afin d'éviter les blocages.
- (Facultatif) Entrez une valeur pour le remplacement d'exécution maximal (en minutes).
-
Remplacez la configuration de ressource réseau définie lors de la création du travail.
Le type de réseau ne peut pas être modifié.
- Si la mise en réseau par défaut est configurée, rien ne peut être remplacé.
- Si la mise en réseau personnalisée est configurée, vous pouvez modifier le VCN et le sous-réseau sélectionnés.
- (Facultatif) Modifiez la forme de calcul en sélectionnant Modifier la forme. Ensuite, suivez les étapes ci-dessous dans le panneau Sélectionner un calcul.
- Sélectionner un type d'instance.
- Sélectionnez une série de formes.
- Sélectionnez l'une des formes de calcul prises en charge dans la série.
-
Sélectionnez la forme qui convient le mieux à l'utilisation de la ressource.
Pour chaque OCPU, sélectionnez jusqu'à 64 Go de mémoire et un total maximal de 512 Go. La quantité minimale de mémoire autorisée est 1 Go ou une valeur correspondant au nombre d'OCPU, la valeur la plus élevée étant retenue.
-
Si vous utilisez des machines virtuelles éclatables, basculez sur Burstable.
Dans Utilisation de référence par OCPU, sélectionnez le pourcentage d'OCPU que vous souhaitez généralement utiliser. Les valeurs prises en charge sont 12,5 % et 50 %.
- Sélectionnez Sélectionner une forme.
- (Facultatif) Remplacer la configuration de stockage.
Indiquez la quantité de stockage de blocs à utiliser entre 50 Go et 10, 240 Go (10 To). Vous pouvez modifier cette valeur par incrément de 1 Go.
-
Remplacez la configuration d'environnement définie lors de la création du travail à l'aide des options suivantes :
- Dans Configuration d'environnement, sélectionnez Sélectionner. Le panneau Définir votre environnement BYOC apparaît.
- Dans Référentiel, sélectionnez un référentiel dans la liste. Si le référentiel se trouve dans un autre compartiment, sélectionnez Modifier le compartiment.
- Dans Image, sélectionnez une image dans la liste.
- (Facultatif) Dans Point d'entrée, entrez un point d'entrée. Pour en ajouter un autre, sélectionnez paramètre +Add.
- (Facultatif) Dans CMD, saisissez un CMD. Pour en ajouter un autre, sélectionnez paramètre +Add.Remarque
Utilisez CMD comme arguments pour ENTRYPOINT ou comme seule commande à exécuter en l'absence de ENTRYPOINT. - (Facultatif) Dans Synthèse d'image, entrez une synthèse d'image.
- (Facultatif) Dans ID de signature, si vous utilisez la vérification de signature, entrez l'OCID de la signature d'image. Par exemple,
ocid1.containerimagesignature.oc1.iad.aaaaaaaaab...
. - Sélectionnez Sélectionner.
- (Facultatif) Remplacer la configuration de journalisation.
- Sélectionnez un groupe de journaux dans la liste. Vous pouvez passer à un autre compartiment pour indiquer un groupe de journaux qui n'est pas dans le même compartiment que le travail.
-
Sélectionnez l'une des options suivantes pour stocker tous les messages
stdout
etstderr
:- Activer la création automatique de journal
-
Data Science crée automatiquement un journal au démarrage du travail.
- Sélectionner un journal
-
Sélectionnez le journal à utiliser.
- (Facultatif) Remplacez la sonde de démarrage.
- Saisissez une commande.
- (Facultatif) Pour ajouter une autre commande, sélectionnez +Add, commande et répétez l'étape a.
- (Facultatif) Entrez une valeur pour le délai initial (en secondes).
- (Facultatif) Saisissez une valeur pour la période.
- (Facultatif) Entrez une valeur pour le seuil d'échec.
- Sélectionnez Enregistrer.
- (Facultatif) Sélectionnez Afficher les options avancées pour ajouter des balises à l'exécution de travail.
- (Facultatif) Dans la section Balises, ajoutez des balises au traitement de travail. Si vous êtes autorisé à créer un traitement de travail, vous disposez également des droits d'accès permettant d'appliquer des balises à format libre à ce traitement de travail. Pour appliquer une balise définie, vous devez disposer des droits d'accès permettant d'utiliser l'espace de noms de balise. Pour plus d'informations sur le balisage, reportez-vous à Balises de ressource. Si vous n'êtes pas certain d'appliquer des balises, ignorez cette option ou demandez à un administrateur. Vous pouvez appliquer des balises ultérieurement.
- Sélectionnez Démarrer.
Utilisation de la console pour démarrer des traitements de travail sur plusieurs noeudsUtilisation de la console pour démarrer des traitements de travail sur plusieurs noeuds
- Dans la page de liste des travaux, sélectionnez le nom du travail à utiliser. Si vous avez besoin d'aide pour trouver la liste des travaux, reportez-vous à Liste des travaux.
- Sélectionnez Démarrer un traitement de travaux.
- (Facultatif) Sélectionnez un autre compartiment pour le traitement de travail.
- (Facultatif) Entrez un nom de traitement du travail (limite de 255 caractères). Si vous n'indiquez aucun nom, un nom est automatiquement généré.
Par exemple,
jobrun20210808222435
. - (Facultatif) Entrez une valeur pour le remplacement d'exécution maximal (en minutes).
-
Remplacez la configuration de ressource réseau définie lors de la création du travail.
Le type de réseau ne peut pas être modifié.
- Si la mise en réseau par défaut est configurée, rien ne peut être remplacé.
- Si la mise en réseau personnalisée est configurée, vous pouvez modifier le VCN et le sous-réseau sélectionnés.
- (Facultatif) Remplacez la configuration de groupe de noeuds définie lors de la création du travail.
Vous pouvez remplacer individuellement les configurations de chaque groupe de noeuds en cliquant sur le menu Actions (trois points) du groupe de noeuds et en sélectionnant Modifier.
- (Facultatif) Remplacer le nombre de répliques.
- (Facultatif) Remplacez le nombre minimum de répliques devant réussir.
- (Facultatif) Remplacez le stockage. Indiquez la quantité de stockage de blocs à utiliser entre 50 Go et 10, 240 Go (10 To). Vous pouvez modifier cette valeur par incrément de 1 Go.
-
(Facultatif) Remplacez la configuration de travail par défaut à l'aide des options suivantes :
Entrez ou sélectionnez l'une des valeurs suivantes :- Clé de variable d'environnement personnalisée
-
Variables d'environnement qui contrôlent le travail.
- Valeur
-
Valeur de la clé de variable d'environnement personnalisée.
Vous pouvez sélectionner Clé d'environnement personnalisée supplémentaire pour indiquer d'autres variables.
- Arguments de ligne de commande
-
Arguments de ligne de commande à utiliser pour exécuter le travail.
-
Modifiez la forme Compute en sélectionnant Modifier la forme. Ensuite, suivez les étapes ci-dessous dans le panneau Sélectionner un calcul.
- Sélectionner un type d'instance.
- Sélectionnez une série de formes.
- Sélectionnez l'une des formes de calcul prises en charge dans la série.
-
Sélectionnez la forme qui convient le mieux à l'utilisation de la ressource.
Pour chaque OCPU, sélectionnez jusqu'à 64 Go de mémoire et un total maximal de 512 Go. La quantité minimale de mémoire autorisée est 1 Go ou une valeur correspondant au nombre d'OCPU, la valeur la plus élevée étant retenue.
-
Si vous utilisez des machines virtuelles éclatables, basculez sur Burstable.
Dans Utilisation de référence par OCPU, sélectionnez le pourcentage d'OCPU que vous souhaitez généralement utiliser. Les valeurs prises en charge sont 12,5 % et 50 %.
- Sélectionnez Sélectionner une forme.
- (Facultatif) Dérogation à la configuration des sondes :
- Saisissez une commande.
- (Facultatif) Pour ajouter une autre commande, sélectionnez +Add, commande et répétez l'étape a.
- (Facultatif) Entrez une valeur pour le délai initial (en secondes).
- (Facultatif) Saisissez une valeur pour la période.
- (Facultatif) Entrez une valeur pour le seuil d'échec.
- Sélectionnez Sauvegarder.
- (Facultatif) Remplacer la configuration de journalisation.
- Sélectionnez un groupe de journaux dans la liste. Vous pouvez passer à un autre compartiment pour indiquer un groupe de journaux qui n'est pas dans le même compartiment que le travail.
-
Sélectionnez l'une des options suivantes pour stocker tous les messages
stdout
etstderr
:- Activer la création automatique de journal
-
Data Science crée automatiquement un journal au démarrage du travail.
- Sélectionner un journal
-
Sélectionnez le journal à utiliser.
- (Facultatif) Sélectionnez Afficher les options avancées pour ajouter des balises au traitement de travail.
- (Facultatif) Dans la section Balises, ajoutez des balises au traitement de travail. Si vous êtes autorisé à créer un traitement de travail, vous disposez également des droits d'accès permettant d'appliquer des balises à format libre à ce traitement de travail. Pour appliquer une balise définie, vous devez disposer des droits d'accès permettant d'utiliser l'espace de noms de balise. Pour plus d'informations sur le balisage, reportez-vous à Balises de ressource. Si vous n'êtes pas certain d'appliquer des balises, ignorez cette option ou demandez à un administrateur. Vous pouvez appliquer des balises ultérieurement.
- Sélectionnez Démarrer.
Ces variables d'environnement contrôlent le travail.
Utilisez l'interface de ligne de commande Data Science pour démarrer les exécutions de travail comme dans l'exemple suivant :
-
Démarrez un traitement de travail avec la commande suivante :
oci data-science job-run create \ --display-name <job_run_name> \ --compartment-id <compartment_ocid> \ --project-id <project_ocid> \ --job-id <job_ocid> \ --configuration-override-details file://<optional_job_run_configuration_override_json_file> \ --log-configuration-override-details file://<optional_job_run_logging_configuration_override_json_file>
- (Facultatif) Utilisez le fichier JSON de remplacement de configuration de traitement de travail suivant pour remplacer les configurations définies sur le travail parent :
jobEnvironmentConfigurationDetails: { jobEnvironmentType: "OCIR_CONTAINER", image: "iad.ocir.io/axoxdievda5j/odsc-byod-hello-wrld:0.1.3", imageDigest: "sha256", cmd: ["ls", "-h"], entrypoint: ["-l"], imageSignatureId: "ocid1.containerimagesignature.oc1.iad.0.ociodscdev.aaaaaaaaccutw5qdz6twjzkpgmbojdck3qotqqsbn7ph6xcumu4s32o6v5gq", }, jobConfigurationDetails: { jobType: "DEFAULT", environmentVariables: <envar-list-object>}, ... }
- (Facultatif) Utilisez le fichier JSON suivant de remplacement de configuration de journalisation de traitement de travail pour remplacer la configuration de journalisation définie sur le travail parent :
{ "enableLogging": true, "enableAutoLogCreation": true, "logGroupId": "<log_group_ocid>" }
-
Démarrez un traitement de travail avec la commande suivante :
Le kit SDK ADS est également une bibliothèque Python publique que vous pouvez installer avec la commande suivante :
pip install oracle-ads
Il fournit le wrapper qui facilite le démarrage des travaux à partir de blocs-notes ou sur votre ordinateur client.
Utilisez le kit SDK ADS pour démarrer les exécutions de travail.