Création d'un travail

Créez et exécutez un travail dans Data Science.

Assurez-vous que vous avez créé les stratégies, l'authentification et l'autorisation nécessaires pour vos travaux.

Avant de commencer :

  • Créez un fichier d'artefact de travail ou créez un conteneur personnalisé.

  • Pour stocker et gérer les journaux de travail, apprenez-en plus sur la journalisation.

  • Pour utiliser les montages de stockage, vous devez disposer d'un bucket Object Storage ou d'une cible de montage et d'un chemin d'export OCI File Storage Service (FSS).

    Pour utiliser FSS, vous devez d'abord créer le système de fichiers et le point de montage. Utilisez l'option de mise en réseau personnalisée et assurez-vous que la cible de montage et le bloc-notes sont configurés avec le même sous-réseau. Configurez des règles de liste de sécurité pour le sous-réseau avec les ports et protocoles spécifiques.

    Assurez-vous que les limites de service sont allouées à file-system-count et à mount-target-count.

  • Pour utiliser les montages de stockage, vous devez disposer d'un bucket Object Storage ou d'un point de montage OCI File Storage Service (FSS).

  • Ajoutez des informations de base pour le travail que vous créez.
    1. Sur la page de liste des travaux, sélectionnez Créer un travail. Si vous avez besoin d'aide pour trouver la liste des travaux, reportez-vous à Liste des travaux.
    2. Sélectionnez Noeud unique si vous utilisez une seule machine pour le travail ou Multinoeud pour les travaux exigeants qui doivent être exécutés sur plusieurs noeuds.
    3. (Facultatif) Sélectionnez un autre compartiment pour le travail.
    4. (Facultatif) Entrez le nom et la description du travail (limite de 255 caractères). Si vous n'indiquez aucun nom, un nom est automatiquement généré.

      Par exemple, job20210808222435

    5. Etapes de configuration à noeud unique ou à noeuds multiples
    Utilisation de la console pour les travaux à noeud unique
    Utilisation de la console pour les travaux sur plusieurs noeuds
  • Ces variables d'environnement contrôlent le travail.

    Utilisez l'interface de ligne de commande Data Science pour créer un travail, comme dans l'exemple suivant :

    1. Créez un travail :
      oci data-science job create \
      --display-name <job_name>\
      --compartment-id <compartment_ocid>\
      --project-id <project_ocid> \
      --configuration-details file://<jobs_configuration_json_file> \
      --infrastructure-configuration-details file://<jobs_infrastructure_configuration_json_file> \
      --log-configuration-details file://<optional_jobs_infrastructure_configuration_json_file>
    2. Utilisez le fichier JSON de configuration des travaux suivant :
      {
        "jobType": "DEFAULT",
        "maximumRuntimeInMinutes": 240,
        "commandLineArguments" : "test-arg",
        "environmentVariables": {
          "SOME_ENV_KEY": "some_env_value" 
        }
      }
    3. Utilisez le fichier JSON de configuration d'infrastructure des travaux suivant :
      {
        "jobInfrastructureType": "STANDALONE",
        "shapeName": "VM.Standard2.1",
        "blockStorageSizeInGBs": "50",
        "subnetId": "<subnet_ocid>"
      }
    4. (Facultatif) Utilisez le fichier JSON de configuration de journalisation des travaux suivant :
      {
        "enableLogging": true,
        "enableAutoLogCreation": true,
        "logGroupId": "<log_group_ocid>"
      }
    5. Téléchargez vers le serveur un fichier d'artefact pour le travail que vous avez créé :
      oci data-science job create-job-artifact \
      --job-id <job_ocid> \
      --job-artifact-file <job_artifact_file_path> \
      --content-disposition "attachment; filename=<job_artifact_file_name>"
  • Le kit SDK ADS est également une bibliothèque Python publique que vous pouvez installer avec la commande suivante :

    pip install oracle-ads

    Il fournit le wrapper qui facilite la création et l'exécution de travaux à partir de blocs-notes ou sur l'ordinateur client.

    Utilisez le SDK ADS pour créer et exécuter des travaux.