Création d'un travail

Créez et exécutez un travail dans le service de science des données.

Assurez-vous d'avoir créé les politiques, authentification et autorisation nécessaires pour vos travaux.

Avant de commencer :

  • Créez un fichier d'artefact de travail ou créez un conteneur personnalisé.

  • Pour stocker et gérer des journaux de travail, voir À propos des journaux.

  • Pour utiliser des montages de stockage, vous devez avoir une cible de montage et un chemin d'exportation pour le seau de stockage d'objets ou le service de stockage de fichiers pour OCI.

    Pour utiliser FSS, vous devez d'abord créer le système de fichiers et le point de montage. Utilisez l'option de réseau personnalisé et assurez-vous que la cible de montage et le carnet sont configurés avec le même sous-réseau. Configurez les règles de liste de sécurité pour le sous-réseau avec les ports et protocoles spécifiques.

    Assurez-vous que les limites de service sont affectées à file-system-count et mount-target-count.

  • Pour utiliser des montages de stockage, vous devez disposer d'un seau de stockage d'objets ou d'un point de montage FSS (Service de stockage de fichiers pour OCI).

    1. Dans la page de liste des tâches, sélectionnez Créer une tâche. Si vous avez besoin d'aide pour trouver la liste des tâches, voir Liste des tâches.
    2. (Facultatif) Sélectionnez un autre compartiment pour le travail.
    3. (Facultatif) Entrez un nom unique et une description pour le travail (255 caractères au maximum). Si vous ne fournissez pas de nom, un nom est automatiquement généré.

      Par exemple job20210808222435.

    4. (Facultatif) Pour utiliser Utiliser son propre conteneur, dans la configuration de l'environnement, sélectionnez Sélectionner.
      Dans le panneau Définir votre environnement BYOC, procédez comme suit :
      1. Dans Référentiel, sélectionnez un référentiel dans la liste. Si le référentiel se trouve dans un autre compartiment, sélectionnez Changer de compartiment.
      2. Dans Image, sélectionnez une image dans la liste.
      3. (Facultatif) Dans Point d'entrée, entrez un point d'entrée. Pour en ajouter un autre, sélectionnez Paramètre +Add.
      4. (Facultatif) Dans CMD, entrez un CMD. Pour en ajouter un autre, sélectionnez Paramètre +Add.
        Note

        Utilisez CMD comme arguments pour ENTRYPOINT ou la seule commande à exécuter en l'absence d'ENTRYPOINT.
      5. (Facultatif) Dans Condensé d'image, entrez un condensé d'image.
      6. (Facultatif) Dans ID signature, si vous utilisez la vérification de signature, entrez l'OCID de la signature d'image. Par exemple ocid1.containerimagesignature.oc1.iad.aaaaaaaaab....
      7. Sélectionnez Sélectionner.
    5. (Facultatif) Cette étape n'est facultative que si BYOC est configuré. Chargez l'artefact de travail en faisant glisser le fichier d'artefact de travail requis dans la zone.
    6. (Facultatif) Créez une configuration de travail par défaut qui est utilisée lorsque le travail est exécuté à l'aide de ces options.

      Entrez ou sélectionnez l'une des valeurs suivantes :

      Clé de variable d'environnement personnalisée

      Les variables d'environnement qui contrôlent le travail.

      Note

      Si vous avez chargé un fichier zip ou tar compressé, ajoutez la variable d'environnement personnalisée JOB_RUN_ENTRYPOINT pour pointer vers le fichier.

      Valeur

      Valeur de la clé de variable d'environnement personnalisée.

      Vous pouvez sélectionner Clé d'environnement personnalisée supplémentaire pour spécifier d'autres variables.

      Arguments de ligne de commande

      Arguments de ligne de commande à utiliser pour exécuter le travail.

      Délai d'exécution maximal (en minutes)

      Nombre maximal de minutes pendant lesquelles le travail peut être exécuté. Le service annule l'exécution de travail si sa durée dépasse la valeur spécifiée. Le temps d'exécution maximal est de 30 jours (43 200 minutes). Nous vous recommandons de configurer un délai maximal afin d'éviter les exécutions de travail incontrôlées.

    7. Sélectionnez une forme de calcul.
    8. (Facultatif) Modifiez la forme du service de calcul en sélectionnant Modifier la forme. Suivez ensuite ces étapes dans le panneau Sélectionner le service de calcul.
      1. Sélectionner un type d'instance.
      2. Sélectionnez une série de formes.
      3. Sélectionnez une des formes de calcul prises en charge dans la série.
      4. Sélectionnez la forme qui convient le mieux à l'utilisation souhaitée de la ressource.

        Pour chaque OCPU, sélectionnez jusqu'à 64 Go de mémoire et un total maximal de 512 Go. La quantité minimale de mémoire autorisée est de 1 Go ou une valeur correspondant au nombre d'OCPU, selon la valeur la plus élevée.

      5. Si vous utilisez des machines virtuelles à capacité extensible, activez/désactivez Burstable.
        Dans Utilisation de référence par OCPU, sélectionnez le pourcentage d'OCPU que vous voulez généralement utiliser. Les valeurs prises en charge sont 12,5 % et 50 %.
      6. Sélectionnez Sélectionner une forme.
    9. (Facultatif) Pour utiliser la journalisation, sélectionnez Sélectionner, puis assurez-vous que l'option Activer la journalisation est sélectionnée.
      1. Sélectionnez un groupe de journaux dans la liste. Vous pouvez passer à un autre compartiment pour spécifier un groupe de journaux dans un compartiment différent de celui du travail.
      2. Sélectionnez l'une des options suivantes pour stocker tous les messages stdout et stderr :
        Activer la création automatique des journaux

        Le service de science des données crée automatiquement un journal au démarrage du travail.

        Sélectionner un journal

        Sélectionnez un journal à utiliser.

      3. Sélectionnez Sélectionner pour retourner à la page de création de l'exécution de travail.
    10. Pour Stockage. Entrez la quantité de stockage par blocs à utiliser entre 50 Go et 10, 240 Go (10 To). Vous pouvez modifier la valeur par incréments de 1 Go. La valeur par défaut est 100 Go.
    11. Sélectionnez l'une des options suivantes pour configurer le type de réseau :
      • Réseau par défaut — La charge de travail est attachée à l'aide d'une carte VNIC secondaire à un VCN et à un sous-réseau préconfigurés gérés par le service. Ce sous-réseau donne accès à l'Internet public par l'intermédiaire d'une passerelle NAT et à d'autres services Oracle Cloud par l'intermédiaire d'une passerelle de service.

        Si vous avez besoin d'un accès uniquement à l'Internet public et aux services OCI, nous vous recommandons d'utiliser cette option. Vous n'avez pas besoin de créer des ressources de réseau ni d'écrire des politiques pour les autorisations de réseau.

      • Réseau personnalisé — Sélectionnez le VCN et le sous-réseau à utiliser pour la ressource (session de carnet ou tâche).

        Pour l'accès sortant à l'Internet public, utilisez un sous-réseau privé avec une route vers une passerelle NAT.

        Si vous ne voyez pas le VCN ou le sous-réseau à utiliser, cliquez sur Changer de compartiment, puis sélectionnez le compartiment qui contient le VCN ou le sous-réseau.

        Important

        Le réseau personnalisé doit être utilisé pour utiliser un montage de stockage de fichiers.

    12. (Facultatif) Pour utiliser des montages de stockage, sélectionnez +Add Montage de stockage.
      1. Sélectionnez un type de montage de stockage, OCI Object Storage ou OCI File Storage.
      2. Sélectionnez un compartiment contenant la ressource de stockage que vous voulez monter.
      3. Sélectionnez une des options suivantes :
        Stockage d'objets
        Si vous utilisez un réseau personnalisé :
        1. Créez la passerelle de service dans le réseau VCN.
        2. Pour les configurations de table de routage dans le sous-réseau privé, ajoutez la passerelle de service.
        3. Modifiez les règles de trafic sortant de la liste de sécurité du sous-réseau requis pour autoriser le trafic vers tous les services du réseau.

        Seau à utiliser.

        Vous pouvez ajouter un préfixe de nom d'objet. Le préfixe doit commencer par un caractère alphanumérique. Les caractères autorisés sont les caractères alphanumériques, la barre oblique ( / ), le tiret ( - ) et le trait de soulignement ( _ ).

        Stockage de fichiers

        Cible de montage et chemin d'exportation à utiliser. Vous devez avoir créé le système de fichiers. Spécifiez une cible de montage existante ou créez-en une nouvelle.

        Vous devez utiliser un réseau personnalisé pour utiliser le stockage de fichiers.

        Suivez les règles de liste de sécurité du sous-réseau.
        Note

        Avant de monter un système de fichiers, vous devez configurer des règles de sécurité dans le sous-réseau VCN pour permettre le trafic réseau vers et depuis la cible de montage. Vous pouvez configurer des règles de sécurité dans des listes de sécurité de sous-réseau ou des groupes de sécurité de réseau, ou en utilisant une combinaison des deux. Pour plus d'informations, voir Configuration de règles de sécurité de réseau VCN pour le service de stockage de fichiers.
        • Trafic entrant avec état vers les ports TCP 111, 2048, 2049 et 2050, et les ports UDP 111 et 2048.
        • Trafic sortant avec état pour les ports TCP sources 111, 2048, 2049 et 2050, et le port UDP source 111.
      4. Entrez le chemin sous lequel le stockage doit être monté.

        Le stockage est monté sous le chemin de montage spécifié. Le chemin doit commencer par un caractère alphanumérique. Le répertoire de destination doit être unique parmi les montages de stockage fournis. Les caractères autorisés sont les caractères alphanumériques, le tiret ( - ) et le trait de soulignement ( _ ).

        Vous pouvez spécifier le chemin complet, par exemple /opc/storage-directory. Si seul un répertoire est spécifié, par exemple /storage-directory, il est monté sous le répertoire /mnt par défaut. Vous ne pouvez pas spécifier des répertoires propres au système d'exploitation, tels que /bin ou /etc.

      5. Sélectionnez Soumettre.

        Répétez ces étapes pour ajouter jusqu'à deux montages de stockage pour les sessions de carnet.

    13. (Facultatif) Sélectionnez Afficher les options avancées pour ajouter des marqueurs au travail.
    14. (Facultatif) Dans la section Marqueurs, ajoutez un ou plusieurs marqueurs à <resourceType>. Si vous êtes autorisé à créer une ressource, vous disposez également des autorisations nécessaires pour appliquer des marqueurs de formulaire libre à cette ressource. Pour appliquer un marqueur défini, vous devez être autorisé à utiliser l'espace de noms de marqueur. Pour plus d'informations sur le marquage, voir Marqueurs de ressource. Si vous ne savez pas si vous devez appliquer des marqueurs, ignorez cette option ou demandez à un administrateur. Vous pouvez appliquer des marqueurs plus tard.
    15. Sélectionnez Créer.

      Une fois le travail actif, vous pouvez utiliser les exécutions de travail pour l'exécuter à plusieurs reprises.

  • Ces variables d'environnement contrôlent le travail.

    Utilisez l'interface de ligne de commande du service de science des données pour créer un travail comme dans l'exemple suivant :

    1. Créez un travail avec :
      oci data-science job create \
      --display-name <job_name>\
      --compartment-id <compartment_ocid>\
      --project-id <project_ocid> \
      --configuration-details file://<jobs_configuration_json_file> \
      --infrastructure-configuration-details file://<jobs_infrastructure_configuration_json_file> \
      --log-configuration-details file://<optional_jobs_infrastructure_configuration_json_file>
    2. Utilisez ce fichier JSON de configuration de travaux :
      {
        "jobType": "DEFAULT",
        "maximumRuntimeInMinutes": 240,
        "commandLineArguments" : "test-arg",
        "environmentVariables": {
          "SOME_ENV_KEY": "some_env_value" 
        }
      }
    3. Utilisez ce fichier JSON de configuration de l'infrastructure de travaux :
      {
        "jobInfrastructureType": "STANDALONE",
        "shapeName": "VM.Standard2.1",
        "blockStorageSizeInGBs": "50",
        "subnetId": "<subnet_ocid>"
      }
    4. (Facultatif) Utilisez ce fichier JSON de configuration de journalisation des travaux :
      {
        "enableLogging": true,
        "enableAutoLogCreation": true,
        "logGroupId": "<log_group_ocid>"
      }
    5. Chargez un fichier d'artefact de travail pour le travail que vous avez créé avec :
      oci data-science job create-job-artifact \
      --job-id <job_ocid> \
      --job-artifact-file <job_artifact_file_path> \
      --content-disposition "attachment; filename=<job_artifact_file_name>"
  • La trousse SDK ADS est également une bibliothèque Python publique que vous pouvez installer avec cette commande :

    pip install oracle-ads

    Elle fournit l'encapsuleur qui facilite la création et l'exécution des travaux à partir de carnets ou sur votre machine client.

    Utilisez la trousse SDK ADS pour créer et exécuter des travaux.