Démarrage d'un traitement de travail
Utilisez les exécutions de travail Data Science pour appliquer différents cas d'emploi aux travaux créés.
La création de travaux définit l'infrastructure et l'artefact de cas d'emploi réel, mais l'exécution de travail exécute le travail avec les paramètres indiqués. Les traitements de Travail provisionnent l'infrastructure spécifiée, exécutent l'artefact de Travail, puis dé-provisionnent et dé-provisionnent les ressources utilisées à la fin du travail.
- Si vous démarrez une exécution de travail sur un seul noeud, suivez les étapes de la section Noeud unique.
- Si vous démarrez une exécution de travail sur plusieurs noeuds, suivez les étapes de la section Multi-noeuds.
Mononoeud
Suivez ces étapes pour démarrer une exécution de travail sur un seul noeud. - Dans la page de liste Projets, sélectionnez le projet contenant les travaux à utiliser. Si vous avez besoin d'aide pour trouver la page de liste ou le projet, reportez-vous à la rubrique Liste des projets.
- Sur la page de détails du projet, sélectionnez Travaux.
- Sélectionnez le travail.
- Sélectionnez Exécutions de travail.
- Sélectionnez Démarrer un traitement de travail.
-
Sur la page Démarrer un traitement de travail, entrez les informations suivantes.
- Compartiment (facultatif) : sélectionnez un autre compartiment pour le traitement de travail.
- Nom (Facultatif) : entrez un nom pour le traitement du travail (limite de 255 caractères). Si vous n'indiquez aucun nom, un nom est automatiquement généré. Exemple :
jobrun20210808222435 - Clé de variable d'environnement personnalisée* (facultatif) : variables d'environnement qui contrôlent le travail.
- Valeur* (facultatif) : valeur de la clé de variable d'environnement personnalisée.
- Arguments de ligne de commande* (facultatif) : arguments de ligne de commande à utiliser pour exécuter le travail.
- Exécution maximale (en minutes) (facultatif) : nombre maximal de minutes durant lesquelles le travail peut être exécuté. Le service annule le traitement de travail si sa durée dépasse la valeur indiquée. La durée d'exécution maximale est de 30 jours (43 200 minutes). Nous vous recommandons de configurer une durée d'exécution maximale pour tous les traitements de travail afin d'éviter les blocages.
- Ressources réseau : sélectionnez l'option appropriée.
- Mise en réseau par défaut : limite le trafic aux services Oracle uniquement. Le système utilise le réseau géré par le service existant. La charge globale est attachée à l'aide d'une carte d'interface réseau virtuelle secondaire à un VCN et à un sous-réseau préconfigurés et gérés par le service. Ce sous-réseau fourni permet d'accéder au réseau Internet public via une passerelle NAT et d'accéder à d'autres services Oracle Cloud via une passerelle de service.
Si vous avez besoin d'accéder uniquement au réseau Internet public et aux services OCI, nous vous recommandons d'utiliser cette option. Vous n'avez pas à créer de ressources réseau ou à écrire des stratégies pour les droits d'accès réseau.
- Mise en réseau par défaut avec Internet : autorise l'accès Internet sortant via la passerelle NAT Data Science.Remarque
Vous ne pouvez pas utiliser la mise en réseau par défaut avec Internet dans les domaines déconnectés et les locations de développement Oracle. Si votre location ou votre compartiment dispose d'une stratégie de zone de sécurité Data Science qui refuse l'accès au réseau public (par exemple,deny model_deploy_public_network- Reportez-vous à Stratégie de zone de sécurité Data Science), l'option d'accès Internet public géré par le service est désactivée. Si vous essayez d'utiliser cette option, vous recevez une erreur404NotAuthorizedOrNotFound. - Mise en réseau personnalisée : sélectionnez le VCN et le sous-réseau (par compartiment) à utiliser.
Pour l'accès sortant au réseau Internet public, utilisez un sous-réseau privé doté d'un routage vers une passerelle NAT.
Remarque
- La mise en réseau personnalisée doit être utilisée pour utiliser un montage de stockage de fichiers.
- Le passage d'un réseau personnalisé à un réseau géré n'est pas pris en charge après sa création.
- Si la bannière
The specified subnet is not accessible. Select a different subnet.apparaît, créez une stratégie qui permet à Data Science d'utiliser des fonctions de réseau personnalisées. Reportez-vous à Stratégies.
- Mise en réseau par défaut : limite le trafic aux services Oracle uniquement. Le système utilise le réseau géré par le service existant. La charge globale est attachée à l'aide d'une carte d'interface réseau virtuelle secondaire à un VCN et à un sous-réseau préconfigurés et gérés par le service. Ce sous-réseau fourni permet d'accéder au réseau Internet public via une passerelle NAT et d'accéder à d'autres services Oracle Cloud via une passerelle de service.
- Modifier la forme* (facultatif) : modifiez la forme de calcul en sélectionnant Modifier la forme. Ensuite, suivez ces étapes dans le panneau Sélectionner une forme de calcul.
- Sélectionner un type d'instance.
- Sélectionnez une série de formes.
- Sélectionnez l'une des formes de calcul prises en charge dans la série. Sélectionnez la forme qui convient Le mieux à l'utilisation de la ressource.
- Développez la forme sélectionnée pour configurer les OCPU et la mémoire.
- Nombre d'OCPU
- Montant de mémoire (Go) : pour chaque OCPU, sélectionnez jusqu'à 64 Go de mémoire et un total maximal de 512 Go. La quantité minimale de mémoire autorisée est 1 Go ou une valeur correspondant au nombre d'OCPU, la valeur la plus élevée étant retenue.
- Activer la forme éclatable : sélectionnez cette option si vous utilisez des machines virtuelles éclatables, puis, pour Utilisation de référence par OCPU, sélectionnez le pourcentage d'OCPU que vous souhaitez généralement utiliser. Les valeurs prises en charge sont 12,5 % et 50 %. (Pour les déploiements de modèle, seule la valeur de 50 % est prise en charge.)
- Sélectionnez Sélectionner une forme.
- Remplacement de stockage* (facultatif) : remplacez la configuration de stockage. Indiquez la quantité de stockage de blocs à utiliser entre 50 Go et 10, 240 Go (10 To). Vous pouvez modifier cette valeur par incrément de 1 Go.
- Activer le remplacement BYOC / Remplacement de configuration d'environnement > Sélectionner* (facultatif) : sélectionnez cette option pour remplacer la configuration d'environnement définie du travail :
- Compartiment : sélectionnez le compartiment qui contient le référentiel.
- Référentiel : sélectionnez un référentiel dans l'arborescence.
- Image : sélectionnez l'image que vous souhaitez utiliser.
- Point d'entrée : entrez un point d'entrée.
- CMD : entrez une commande.Remarque
Utilisez CMD comme arguments pour ENTRYPOINT ou comme seule commande à exécuter en l'absence de ENTRYPOINT. - Condensé d'image : entrez un condensé d'image.
- ID de signature : si vous utilisez la vérification de signature, entrez l'OCID de la signature d'image. Exemple :
ocid1.containerimagesignature.oc1.iad.aaaaaaaaab...
- Activer la journalisation (facultatif) : remplacez la configuration de journalisation.
- Compartiment du groupe de journaux : sélectionnez le compartiment qui contient le groupe de journaux.
- Groupes de journaux : sélectionnez le groupe de fichiers journaux.
- Activer la création automatique de journal : sélectionnez cette option pour créer automatiquement un journal au démarrage du travail. Le journal créé stocke tous les messages
stdoutetstderr. - Sélectionner un journal : sélectionnez cette option (et sélectionnez un journal existant) pour stocker tous les messages
stdoutetstderr.
- Remplacement des sondes* (facultatif) : remplacez la sonde de démarrage.
- Sélectionnez Sélectionner.
- Dans le panneau Sondes, entrez les informations suivantes.
- Commande
- Délai initial (en secondes)
- Période
- Seuil d'échec
- Sélectionnez Enregistrer.
- Balises (sous Options avancées) : ajoutez des balises au traitement de travail. Si vous disposez des droits d'accès nécessaires pour créer une ressource, vous disposez également de droits d'accès permettant d'appliquer des balises à format libre à cette ressource. To apply a defined tag, you must have permissions to use the tag namespace. Pour plus d'informations sur le balisage, reportez-vous à Balises de ressource. Si vous n'êtes pas certain d'appliquer des balises, ignorez cette option ou demandez à un administrateur. Vous pouvez appliquer des balises ultérieurement.
Remarque
Un astérisque (*) pour un champ indique un placement différent pour les travaux à plusieurs noeuds. Si vous démarrez un traitement de travail pour un travail à plusieurs noeuds, recherchez le champ en modifiant le groupe de noeuds : sous Remplacement de configuration de groupe de noeuds, dans le menu Actions (trois points) du groupe de noeuds, sélectionnez Modifier. Le champ apparaît dans le panneau qui en résulte. - Sélectionnez Démarrer.
Multinoeud
Suivez ces étapes pour démarrer un traitement de travail sur plusieurs noeuds. - Dans la page de liste Projets, sélectionnez le projet contenant les travaux à utiliser. Si vous avez besoin d'aide pour trouver la page de liste ou le projet, reportez-vous à la rubrique Liste des projets.
- Sur la page de détails du projet, sélectionnez Travaux.
- Sélectionnez le travail.
- Sélectionnez Exécutions de travail.
- Sélectionnez Démarrer un traitement de travaux.
-
Sur la page Démarrer un traitement de travail, entrez les informations décrites dans Noeud unique.
Les champs sont identiques aux exécutions de travail à noeud unique avec les différences suivantes.
- Des champs astérisqués (*) apparaissent dans le panneau pour modifier un groupe de noeuds.
- Les champs suivants sont uniquement disponibles pour les travaux multinoeuds, dans le panneau de modification d'un groupe de noeuds.
- Répliques (nombre de répliques)
- Nombre minimal de répliques réussies (nombre de répliques devant réussir)
Pour ouvrir le panneau de modification d'un groupe de noeuds, sous Remplacement de configuration de groupe de noeuds, dans le menu Actions (trois points) du groupe de noeuds, sélectionnez Modifier.
- Sélectionnez Démarrer.
Ces variables d'environnement contrôlent le travail.
Utilisez l'interface de ligne de commande Data Science pour démarrer les exécutions de travail comme dans l'exemple suivant :
-
Démarrez un traitement de travail avec la commande suivante :
oci data-science job-run create \ --display-name <job_run_name> \ --compartment-id <compartment_ocid> \ --project-id <project_ocid> \ --job-id <job_ocid> \ --configuration-override-details file://<optional_job_run_configuration_override_json_file> \ --log-configuration-override-details file://<optional_job_run_logging_configuration_override_json_file> - (Facultatif) Utilisez le fichier JSON de remplacement de configuration de traitement de travail suivant pour remplacer les configurations définies sur le travail parent :
jobEnvironmentConfigurationDetails: { jobEnvironmentType: "OCIR_CONTAINER", image: "iad.ocir.io/axoxdievda5j/odsc-byod-hello-wrld:0.1.3", imageDigest: "sha256", cmd: ["ls", "-h"], entrypoint: ["-l"], imageSignatureId: "ocid1.containerimagesignature.oc1.iad.0.ociodscdev.aaaaaaaaccutw5qdz6twjzkpgmbojdck3qotqqsbn7ph6xcumu4s32o6v5gq", }, jobConfigurationDetails: { jobType: "DEFAULT", environmentVariables: <envar-list-object>}, ... } - (Facultatif) Utilisez le fichier JSON suivant de remplacement de configuration de journalisation de traitement de travail pour remplacer la configuration de journalisation définie sur le travail parent :
{ "enableLogging": true, "enableAutoLogCreation": true, "logGroupId": "<log_group_ocid>" }
-
Démarrez un traitement de travail avec la commande suivante :
Le kit SDK ADS est également une bibliothèque Python publique que vous pouvez installer avec la commande suivante :
pip install oracle-adsIl fournit le wrapper qui facilite le démarrage des travaux à partir de blocs-notes ou sur votre ordinateur client.
Utilisez le kit SDK ADS pour démarrer les exécutions de travail.