Avvio dell'esecuzione di un job

Utilizzare le esecuzioni dei job Data Science per applicare vari casi d'uso ai job creati.

La creazione del job imposta l'infrastruttura e l'artifact caso d'uso effettivo, ma l'esecuzione del job esegue il job con i parametri specificati. Le esecuzioni del job eseguono il provisioning dell'infrastruttura specificata, eseguono l'artifact del job, quindi annullano il provisioning e distruggono le risorse utilizzate al termine dell'esecuzione del job.

    • Se si avvia un'esecuzione di job a nodo singolo, attenersi alla procedura descritta in Nodo singolo.
    • Se si sta avviando un'esecuzione di job multi-nodo, attenersi alla procedura descritta in Multi-nodo.

    Nodo singolo

    Per avviare un'esecuzione di job a nodo singolo, attenersi alla procedura riportata di seguito.
    1. Nella pagina di elenco Progetti, selezionare il progetto contenente i job che si desidera utilizzare. Per assistenza nella ricerca della pagina elenco o del progetto, vedere Elenca progetti.
    2. Nella pagina dei dettagli del progetto, selezionare Job.
    3. Selezionare la mansione.
    4. Selezionare Esecuzioni job.
    5. Selezionare Avvia esecuzione di un job.
    6. Nella pagina Avvia esecuzione job immettere le informazioni riportate di seguito.
      • Compartimento (facoltativo): selezionare un compartimento diverso per l'esecuzione del job.
      • Nome (facoltativo): immettere un nome per l'esecuzione del job (limite di 255 caratteri). Se non si fornisce un nome, il nome viene generato automaticamente. Esempio: jobrun20210808222435
      • Chiave variabile di ambiente personalizzata* (facoltativo): variabili di ambiente che controllano il job.
      • Valore* (facoltativo): valore della chiave della variabile di ambiente personalizzata.
      • Argomenti della riga di comando* (facoltativo): gli argomenti della riga di comando che si desidera utilizzare per l'esecuzione del job.
      • Runtime massimo (in minuti) (facoltativo): il numero massimo di minuti che il job può eseguire. Il servizio annulla l'esecuzione del job se il relativo runtime supera il valore specificato. Il runtime massimo è di 30 giorni (43.200 minuti). Si consiglia di configurare un runtime massimo su tutte le esecuzioni di job per evitare l'esecuzione di job in esecuzione.
      • Risorse di networking: selezionare l'opzione pertinente.
        • Networking predefinito: limita solo il traffico verso i servizi Oracle. Il sistema utilizza la rete esistente gestita dal servizio. Il carico di lavoro viene collegato utilizzando una VNIC secondaria a una VCN e a una subnet preconfigurate e gestite dal servizio. Questa subnet fornita consente l'uscita alla rete Internet pubblica tramite un gateway NAT e l'accesso ad altri servizi Oracle Cloud tramite un gateway di servizi.

          Se hai bisogno dell'accesso solo alla rete Internet pubblica e ai servizi OCI, ti consigliamo di utilizzare questa opzione. Non richiede la creazione di risorse di rete o la scrittura di criteri per le autorizzazioni di rete.

        • Networking predefinito con Internet: consente l'accesso a Internet in uscita tramite il gateway NAT di Data Science.
          Nota

          Non è possibile utilizzare la rete predefinita con Internet in realm disconnessi e tenancy di sviluppo Oracle. Se la tenancy o il compartimento in uso dispone di un criterio della zona di sicurezza di Data Science che nega l'accesso alla rete pubblica (ad esempio, deny model_deploy_public_network, vedere Criterio della zona di sicurezza di Data Science), l'opzione di accesso alla rete Internet pubblica gestita dal servizio è disabilitata. Se si tenta di utilizzare questa opzione, viene visualizzato un errore 404 NotAuthorizedOrNotFound.
        • Networking personalizzato: selezionare la VCN e la subnet (per compartimento) che si desidera utilizzare.

          Per l'accesso in uscita alla rete Internet pubblica, utilizza una subnet privata con un instradamento a un Gateway NAT.

          Nota

          • Per utilizzare un accesso di storage dei file, è necessario utilizzare la rete personalizzata.
          • Il passaggio dalla rete personalizzata alla rete gestita non è supportato dopo la creazione.
          • Se viene visualizzato il banner The specified subnet is not accessible. Select a different subnet., creare un criterio che consenta a Data Science di utilizzare la rete personalizzata. Vedere Criteri.
      • Modifica forma* (facoltativo): modificare la forma di computazione selezionando Modifica forma. Quindi, attenersi alla procedura riportata di seguito nel pannello Seleziona forma di computazione.
        • Selezionare un tipo di istanza.
        • Selezionare una serie di forme.
        • Selezionare una delle forme di computazione supportate nella serie. Selezionare la forma più adatta a come si desidera utilizzare la risorsa.
        • Espandere la forma selezionata per configurare OCPU e memoria.
          • Numero di OCPU
          • Quantità di memoria (GB): per ogni OCPU, selezionare fino a 64 GB di memoria e un totale massimo di 512 GB. La quantità minima di memoria consentita è pari a 1 GB o a un valore corrispondente al numero di OCPU, a seconda di quale dei due valori è maggiore.
          • Abilita forma espandibile: selezionare questa opzione se si utilizzano VM espandibili, quindi per Utilizzo di base per OCPU selezionare la percentuale di OCPU che in genere si desidera utilizzare. I valori supportati sono 12,5% e 50%. (Per le distribuzioni di modelli, è supportato solo il valore del 50%).
        • Selezionare Seleziona forma.
      • Sostituzione storage* (facoltativo): esegue l'override della configurazione storage. Immettere la quantità di storage a blocchi da utilizzare tra 50 GB e 10, 240 GB (10 TB). È possibile modificare il valore con incrementi di 1 GB.
      • Abilita override BYOC/Sostituzione configurazione ambiente > Seleziona* (facoltativo): selezionare questa opzione per sostituire la configurazione dell'ambiente definita del job.
        • Compartimento: selezionare il compartimento che contiene il repository.
        • Repository: selezionare un repository dalla lista.
        • Immagine: selezionare l'immagine che si desidera usare.
        • Punto di ingresso: immettere un punto di ingresso.
        • CMD: immettere un comando.
          Nota

          Utilizzare CMD come argomenti per ENTRYPOINT o l'unico comando da eseguire in assenza di ENTRYPOINT.
        • Immagine digest: immettere un digest immagine.
        • ID firma: se si utilizza la verifica della firma, immettere l'OCID della firma dell'immagine. Esempio: ocid1.containerimagesignature.oc1.iad.aaaaaaaaab...
      • Abilita log (facoltativo): sostituire la configurazione di log.
        • Compartimento gruppo di log: selezionare il compartimento che contiene il gruppo di log.
        • Gruppo di log: selezionare il gruppo di login.
        • Abilita creazione automatica log: selezionare questa opzione per creare automaticamente un log all'avvio del job. Il log creato memorizza tutti i messaggi stdout e stderr.
        • Selezionare un log: selezionare questa opzione (e selezionare un log esistente) per memorizzare tutti i messaggi stdout e stderr.
      • Override sonde* (facoltativo): eseguire l'override della sonda di avvio.
        1. Selezionare Seleziona.
        2. Nel pannello Probes immettere le informazioni riportate di seguito.
          • Comando
          • Ritardo iniziale (in secondi)
          • Periodo
          • Soglia di errore
        3. Selezionare Salva.
      • Tag (sotto Opzioni avanzate): aggiunge tag all'esecuzione del job. Se si dispone delle autorizzazioni per creare una risorsa, si dispone anche delle autorizzazioni per applicare tag in formato libero a tale risorsa. Per applicare una tag defined, è necessario disporre delle autorizzazioni per utilizzare la tag namespace. Per ulteriori informazioni sull'applicazione di tag, vedere Tag risorsa. Se non sei sicuro di applicare le tag, salta questa opzione o chiedi a un amministratore. È possibile applicare le tag in un secondo momento.
      Nota

      Un asterisco (*) per un campo indica una posizione diversa per i job a più nodi. Se si sta avviando un'esecuzione job per un job a più nodi, trovare il campo modificando il gruppo di nodi: in Sostituzione configurazione gruppo di nodi, dal menu Azioni (tre punti) per il gruppo di nodi, selezionare Modifica. Il campo viene visualizzato nel pannello risultante.
    7. Selezionare Start.

    Nodo multiplo

    Per avviare un'esecuzione di job multi-nodo, attenersi alla procedura riportata di seguito.
    1. Nella pagina di elenco Progetti, selezionare il progetto contenente i job che si desidera utilizzare. Se è necessaria assistenza per trovare la pagina elenco o il progetto, vedere Elenca progetti.
    2. Nella pagina dei dettagli del progetto, selezionare Job.
    3. Selezionare la mansione.
    4. Selezionare Esecuzioni job.
    5. Selezionare Avvia esecuzione job.
    6. Nella pagina Avvia esecuzione job, immettere le informazioni descritte in Nodo singolo.

      I campi sono identici alle esecuzioni di job a nodo singolo con le seguenti differenze.

      • I campi contrassegnati con (*) vengono visualizzati nel pannello per la modifica di un gruppo di nodi.
      • I seguenti campi sono disponibili solo per i job multi-nodo, nel pannello per la modifica di un gruppo di nodi.
        • Repliche (numero di repliche)
        • Numero minimo di repliche riuscite (numero di repliche che devono avere esito positivo)

        To open the panel for editing a node group: Under Node group configuration override, from the Actions menu (three dots) for the node group, select Edit.

    7. Selezionare Start.
  • Queste variabili di ambiente controllano il job.

    Utilizzare l'interfaccia CLI di Data Science per avviare le esecuzioni dei job come nell'esempio riportato di seguito.

    1. Avviare l'esecuzione di un job con:
      oci data-science job-run create \
      --display-name <job_run_name> \
      --compartment-id <compartment_ocid> \
      --project-id <project_ocid> \
      --job-id <job_ocid> \
      --configuration-override-details file://<optional_job_run_configuration_override_json_file> \
      --log-configuration-override-details file://<optional_job_run_logging_configuration_override_json_file>
                                      
    2. (Facoltativo) Utilizzare questo file JSON di override della configurazione di esecuzione job per sostituire le configurazioni definite nel job padre:
      jobEnvironmentConfigurationDetails: {
        jobEnvironmentType: "OCIR_CONTAINER",
          image: "iad.ocir.io/axoxdievda5j/odsc-byod-hello-wrld:0.1.3",
          imageDigest: "sha256",
        cmd: ["ls", "-h"],
        entrypoint: ["-l"],
          imageSignatureId: "ocid1.containerimagesignature.oc1.iad.0.ociodscdev.aaaaaaaaccutw5qdz6twjzkpgmbojdck3qotqqsbn7ph6xcumu4s32o6v5gq",
      },
          jobConfigurationDetails: {
              jobType: "DEFAULT",
              environmentVariables: <envar-list-object>},
          ...
      }
    3. (Facoltativo) Utilizzare questo file JSON di override della configurazione del log di esecuzione job per sostituire la configurazione del log definita nel job padre:
      {
        "enableLogging": true,
        "enableAutoLogCreation": true,
        "logGroupId": "<log_group_ocid>"
      }
  • ADS SDK è anche una libreria Python disponibile pubblicamente che è possibile installare con questo comando:

    pip install oracle-ads

    Fornisce il wrapper che semplifica l'esecuzione dei job di avvio dai notebook o dalla macchina client.

    Utilizzare l'SDK ADS per avviare le esecuzioni dei job.