Création d'un travail

Créez et exécutez un travail dans le service de science des données.

Avant de commencer

    1. Dans la page de liste Projets, sélectionnez le projet qui contient les tâches avec lesquelles vous voulez travailler. Si vous avez besoin d'aide pour trouver la page de liste ou le projet, voir Liste des projets.
    2. Dans la page des détails du projet, sélectionnez Travaux.
    3. Sélectionnez Créer une tâche.
      La page Créer une tâche s'ouvre.

    Informations de base

    Sélectionnez un ou plusieurs noeuds et fournissez des données d'identification.

    • Type d'emploi : Sélectionnez l'option appropriée.
      • Noeud unique : Une machine pour le travail.
      • Plusieurs noeuds : Plusieurs noeuds pour un travail exigeant.
    • Compartiment (Facultatif) : Sélectionnez un autre compartiment pour le travail.
    • Nom (Facultatif) : Entrez un nom pour la tâche (255 caractères au maximum). Si vous n'indiquez pas de nom, un nom est automatiquement généré. Exemple : job20210808222435

    Configuration

    Entrez les informations suivantes.

    • Ajouter un groupe de noeuds (tâches à plusieurs noeuds uniquement) : Sélectionnez cette option pour ajouter une configuration de groupe de noeuds. Ajoutez jusqu'à 5 groupes de noeuds.
      • Nom : Entrez un nom unique pour le groupe de noeuds.
      • Répliques : Entrez le nombre de répliques.
      • Répliques avec succès minimum : Entrez le nombre minimal de répliques qui doivent réussir.
      • Champs astérisqués (*)
      • (Facultatif) Si vous avez plus d'un groupe de noeuds, indiquez l'ordre de démarrage du groupe de noeuds, en parallèle ou en séquence.
    • Clé de variable d'environnement personnalisée* (Facultatif) : Variables d'environnement qui contrôlent le travail.
      Note

      Si vous avez chargé un fichier zip ou tar compressé, ajoutez la variable d'environnement personnalisée JOB_RUN_ENTRYPOINT pour pointer vers le fichier.
    • Valeur* (Facultatif) : Valeur de la clé de variable d'environnement personnalisée.
    • Arguments de ligne de commande* (Facultatif) : Arguments de ligne de commande à utiliser pour exécuter le travail.
    • Durée d'exécution maximale (en minutes) (Facultatif) : Nombre maximal de minutes pendant lesquelles le travail peut être exécuté. Le service annule l'exécution de travail si sa durée dépasse la valeur spécifiée. Le temps d'exécution maximal est de 30 jours (43 200 minutes). Nous vous recommandons de configurer un délai maximal afin d'éviter les exécutions de travail incontrôlées.
    • Modifier la forme* (Facultatif) : Modifiez la forme du service de calcul en sélectionnant Modifier la forme. Suivez ensuite ces étapes dans le panneau Sélectionner une forme de calcul.
      • Sélectionner un type d'instance.
      • Sélectionnez une série de formes.
      • Sélectionnez une des formes de calcul prises en charge dans la série. Sélectionnez la forme qui convient le mieux à l'utilisation souhaitée de la ressource.
      • Développez la forme sélectionnée pour configurer les OCPU et la mémoire.
        • Nombre d'OCPU
        • Montant de mémoire (Go) : Pour chaque OCPU, sélectionnez jusqu'à 64 Go de mémoire et un total maximal de 512 Go. La quantité minimale de mémoire autorisée est de 1 Go ou une valeur correspondant au nombre d'OCPU, selon la valeur la plus élevée.
        • Activer la forme extensible : Sélectionnez cette option si vous utilisez des machines virtuelles extensibles, puis pour Utilisation de référence par OCPU, sélectionnez le pourcentage d'OCPU que vous voulez généralement utiliser. Les valeurs prises en charge sont 12,5 % et 50 %. (Pour les déploiements de modèle, seule la valeur de 50 % est prise en charge.)
      • Sélectionnez Sélectionner une forme.
    • Stockage : Entrez la quantité de stockage par blocs à utiliser entre 50 Go et 10, 240 Go (10 To). Vous pouvez modifier la valeur par incréments de 1 Go.
    • Ressources de réseau : Sélectionnez l'option pertinente.
      • Réseau par défaut : Restreint le trafic vers les services Oracle uniquement. Le système utilise le réseau géré par le service existant. La charge de travail est attachée à l'aide d'une carte VNIC secondaire à un VCN et à un sous-réseau préconfigurés gérés par le service. Ce sous-réseau donne accès à l'Internet public par l'intermédiaire d'une passerelle NAT et à d'autres services Oracle Cloud par l'intermédiaire d'une passerelle de service.

        Si vous avez besoin d'un accès uniquement à l'Internet public et aux services OCI, nous vous recommandons d'utiliser cette option. Vous n'avez pas besoin de créer des ressources de réseau ni d'écrire des politiques pour les autorisations de réseau.

      • Réseau par défaut avec Internet : Autorise l'accès Internet sortant au moyen de la passerelle NAT du service de science des données.
        Note

        Vous ne pouvez pas utiliser le réseau par défaut avec Internet dans des domaines déconnectés et des locations de développement Oracle. Si votre location ou compartiment a une politique de zone de sécurité du service de science des données qui refuse l'accès au réseau public (par exemple, deny model_deploy_public_network—voir Politique de zone de sécurité du service de science des données), l'option d'accès à l'Internet public géré par le service est désactivée. Si vous essayez d'utiliser cette option, vous recevez une erreur 404 NotAuthorizedOrNotFound.
      • Réseau personnalisé : Sélectionnez le VCN et le sous-réseau (par compartiment) à utiliser.

        Pour l'accès sortant à l'Internet public, utilisez un sous-réseau privé avec une route vers une passerelle NAT.

        Note

        • Le réseau personnalisé doit être utilisé pour utiliser un montage de stockage de fichiers.
        • Le passage d'un réseau personnalisé à un réseau géré n'est pas pris en charge après la création.
        • Si la bannière The specified subnet is not accessible. Select a different subnet. s'affiche, créez une politique qui permet au service de science des données d'utiliser un réseau personnalisé. Voir Politiques.
    • Charger l'artefact de travail (Facultatif si BYOC est configuré) : Chargez l'artefact de travail en faisant glisser le fichier d'artefact de travail requis dans la zone.
    Note

    Un astérisque (*) pour un champ indique un positionnement différent pour les tâches multinoeud. Si vous créez une tâche multinoeud, recherchez le champ en ajoutant un groupe de noeuds : Sous Configuration, sélectionnez Ajouter un groupe de noeuds. Le champ s'affiche dans le panneau Ajouter un groupe de noeuds.

    Configuration supplémentaire

    Entrez les informations suivantes.

    • Activer la journalisation (Facultatif) : Configurez la journalisation.
      • Compartiment du groupe de journaux : Sélectionnez le compartiment qui contient le groupe de journaux.
      • Groupe de journaux : Sélectionnez le groupe.
      • Activer la création automatique de journaux : Sélectionnez cette option pour créer automatiquement un journal au démarrage de la tâche. Le journal créé stocke tous les messages stdout et stderr.
      • Sélectionner un journal : Sélectionnez cette option (et sélectionnez un journal existant) pour stocker tous les messages stdout et stderr.
    • Activer BYOC / Configuration de l'environnement > Sélectionner* (Obligatoire pour les tâches à plusieurs noeuds) : Configurez un environnement pour Utiliser son propre conteneur (BYOC).
      • Compartiment : Sélectionnez le compartiment qui contient le référentiel.
      • Référentiel : Sélectionnez un référentiel dans la liste.
      • Image : Sélectionnez l'image à utiliser.
      • Point d'entrée : Entrez un point d'entrée.
      • CMD : Entrez une commande.
        Note

        Utilisez CMD comme arguments pour ENTRYPOINT ou la seule commande à exécuter en l'absence d'ENTRYPOINT.
      • Condensé d'image : Entrez un condensé d'image.
      • ID signature : Si vous utilisez la vérification de signature, entrez l'OCID de la signature d'image. Exemple : ocid1.containerimagesignature.oc1.iad.aaaaaaaaab...
    • Montages de stockage de fichiers (Facultatif) : Sélectionnez Ajouter un montage de stockage de fichiers et entrez les informations suivantes.
      • Compartiment : Sélectionnez le compartiment qui contient la cible à monter.
      • Cible de montage : Cible de montage à utiliser.
      • Chemin d'exportation : Chemin d'exportation à utiliser.
      • Chemin et répertoire de destination : Entrez le chemin à utiliser pour le montage du stockage.

        Le chemin doit commencer par un caractère alphanumérique. Le répertoire de destination doit être unique parmi les montages de stockage fournis. Les caractères autorisés sont les caractères alphanumériques, le tiret ( - ) et le trait de soulignement ( _ ).

        Vous pouvez spécifier le chemin complet, par exemple /opc/storage-directory. Si seul un répertoire est spécifié, par exemple /storage-directory, il est monté sous le répertoire /mnt par défaut. Vous ne pouvez pas spécifier des répertoires propres au système d'exploitation, tels que /bin ou /etc.

    • Montages de stockage d'objets (Facultatif) : Sélectionnez Ajouter un montage de stockage d'objets et entrez les informations suivantes.
      • Compartiment : Sélectionnez le compartiment contenant le seau à monter.
      • Seau : Sélectionnez le seau à utiliser.
      • Préfixe de nom d'objet (Facultatif) : Préfixe de nom d'objet. Le préfixe doit commencer par un caractère alphanumérique. Les caractères autorisés sont les caractères alphanumériques, la barre oblique ( / ), le tiret ( - ) et le trait de soulignement ( _ ).
      • Chemin et répertoire de destination : Entrez le chemin à utiliser pour le montage du stockage.

        Le chemin doit commencer par un caractère alphanumérique. Le répertoire de destination doit être unique parmi les montages de stockage fournis. Les caractères autorisés sont les caractères alphanumériques, le tiret ( - ) et le trait de soulignement ( _ ).

        Vous pouvez spécifier le chemin complet, par exemple /opc/storage-directory. Si seul un répertoire est spécifié, par exemple /storage-directory, il est monté sous le répertoire /mnt par défaut. Vous ne pouvez pas spécifier des répertoires propres au système d'exploitation, tels que /bin ou /etc.

      Note

      Si vous utilisez un réseau personnalisé :
      1. Créez la passerelle de service dans le réseau VCN.
      2. Pour les configurations de table de routage dans le sous-réseau privé, ajoutez la passerelle de service.
      3. Modifiez les règles de trafic sortant de la liste de sécurité du sous-réseau requis pour autoriser le trafic vers tous les services du réseau.
    • Sonde* (Obligatoire pour les tâches à plusieurs noeuds) : Configurez la sonde de démarrage.
      1. Sélectionnez Sélectionner.
      2. Dans le panneau Sondes, entrez les informations suivantes.
        • Commande
        • Délai initial (en secondes)
        • Point
        • Seuil de défaillance
      3. Sélectionnez enregistrer.
    • Marqueurs (sous Options avancées) : Ajoutez des marqueurs à la tâche. Si vous êtes autorisé à créer une ressource, vous pouvez également appliquer des marqueurs à structure libre à cette ressource. Pour appliquer un marqueur défini, vous devez être autorisé à utiliser l'espace de noms de marqueur. Pour plus d'informations sur le marquage, voir Marqueurs de ressource. Si vous ne savez pas si vous devez appliquer des marqueurs, ignorez cette option ou demandez à un administrateur. Vous pouvez appliquer des marqueurs plus tard.
    Note

    Un astérisque (*) pour un champ indique un positionnement différent pour les tâches multinoeud. Si vous créez une tâche multinoeud, recherchez le champ en ajoutant un groupe de noeuds : Sous Configuration, sélectionnez Ajouter un groupe de noeuds. Le champ s'affiche dans le panneau Ajouter un groupe de noeuds.

    Vérifier et créer

    Vérifiez la configuration, puis sélectionnez Créer.

    Une fois le travail actif, vous pouvez utiliser les exécutions de travail pour l'exécuter à plusieurs reprises.

  • Ces variables d'environnement contrôlent le travail.

    Utilisez l'interface de ligne de commande du service de science des données pour créer un travail comme dans l'exemple suivant :

    1. Créez un travail avec :
      oci data-science job create \
      --display-name <job_name>\
      --compartment-id <compartment_ocid>\
      --project-id <project_ocid> \
      --configuration-details file://<jobs_configuration_json_file> \
      --infrastructure-configuration-details file://<jobs_infrastructure_configuration_json_file> \
      --log-configuration-details file://<optional_jobs_infrastructure_configuration_json_file>
                                      
    2. Utilisez ce fichier JSON de configuration de travaux :
      {
        "jobType": "DEFAULT",
        "maximumRuntimeInMinutes": 240,
        "commandLineArguments" : "test-arg",
        "environmentVariables": {
          "SOME_ENV_KEY": "some_env_value" 
        }
      }
    3. Utilisez ce fichier JSON de configuration de l'infrastructure de travaux :
      {
        "jobInfrastructureType": "STANDALONE",
        "shapeName": "VM.Standard2.1",
        "blockStorageSizeInGBs": "50",
        "subnetId": "<subnet_ocid>"
      }
    4. (Facultatif) Utilisez ce fichier JSON de configuration de journalisation des travaux :
      {
        "enableLogging": true,
        "enableAutoLogCreation": true,
        "logGroupId": "<log_group_ocid>"
      }
    5. Chargez un fichier d'artefact de travail pour le travail que vous avez créé avec :
      oci data-science job create-job-artifact \
      --job-id <job_ocid> \
      --job-artifact-file <job_artifact_file_path> \
      --content-disposition "attachment; filename=<job_artifact_file_name>"
  • La trousse SDK ADS est également une bibliothèque Python publique que vous pouvez installer avec cette commande :

    pip install oracle-ads

    Elle fournit l'encapsuleur qui facilite la création et l'exécution des travaux à partir de carnets ou sur votre machine client.

    Utilisez la trousse SDK ADS pour créer et exécuter des travaux.