Avvio dell'esecuzione di un job
Utilizzare le esecuzioni dei job Data Science per applicare vari casi d'uso ai job creati.
La creazione del job imposta l'infrastruttura e l'artifact caso d'uso effettivo, ma l'esecuzione del job esegue il job con i parametri specificati. Le esecuzioni del job eseguono il provisioning dell'infrastruttura specificata, eseguono l'artifact del job, quindi annullano il provisioning e distruggono le risorse utilizzate al termine dell'esecuzione del job.
- Se si avvia un'esecuzione di job a nodo singolo, attenersi alla procedura descritta in Nodo singolo.
- Se si sta avviando un'esecuzione di job multi-nodo, attenersi alla procedura descritta in Multi-nodo.
Nodo singolo
Per avviare un'esecuzione di job a nodo singolo, attenersi alla procedura riportata di seguito. - Nella pagina di elenco Progetti, selezionare il progetto contenente i job che si desidera utilizzare. Per assistenza nella ricerca della pagina elenco o del progetto, vedere Elenca progetti.
- Nella pagina dei dettagli del progetto, selezionare Job.
- Selezionare la mansione.
- Selezionare Esecuzioni job.
- Selezionare Avvia esecuzione di un job.
-
Nella pagina Avvia esecuzione job immettere le informazioni riportate di seguito.
- Compartimento (facoltativo): selezionare un compartimento diverso per l'esecuzione del job.
- Nome (facoltativo): immettere un nome per l'esecuzione del job (limite di 255 caratteri). Se non si fornisce un nome, il nome viene generato automaticamente. Esempio:
jobrun20210808222435 - Chiave variabile di ambiente personalizzata* (facoltativo): variabili di ambiente che controllano il job.
- Valore* (facoltativo): valore della chiave della variabile di ambiente personalizzata.
- Argomenti della riga di comando* (facoltativo): gli argomenti della riga di comando che si desidera utilizzare per l'esecuzione del job.
- Runtime massimo (in minuti) (facoltativo): il numero massimo di minuti che il job può eseguire. Il servizio annulla l'esecuzione del job se il relativo runtime supera il valore specificato. Il runtime massimo è di 30 giorni (43.200 minuti). Si consiglia di configurare un runtime massimo su tutte le esecuzioni di job per evitare l'esecuzione di job in esecuzione.
- Risorse di networking: selezionare l'opzione pertinente.
- Networking predefinito: limita solo il traffico verso i servizi Oracle. Il sistema utilizza la rete esistente gestita dal servizio. Il carico di lavoro viene collegato utilizzando una VNIC secondaria a una VCN e a una subnet preconfigurate e gestite dal servizio. Questa subnet fornita consente l'uscita alla rete Internet pubblica tramite un gateway NAT e l'accesso ad altri servizi Oracle Cloud tramite un gateway di servizi.
Se hai bisogno dell'accesso solo alla rete Internet pubblica e ai servizi OCI, ti consigliamo di utilizzare questa opzione. Non richiede la creazione di risorse di rete o la scrittura di criteri per le autorizzazioni di rete.
- Networking predefinito con Internet: consente l'accesso a Internet in uscita tramite il gateway NAT di Data Science.Nota
Non è possibile utilizzare la rete predefinita con Internet in realm disconnessi e tenancy di sviluppo Oracle. Se la tenancy o il compartimento in uso dispone di un criterio della zona di sicurezza di Data Science che nega l'accesso alla rete pubblica (ad esempio,deny model_deploy_public_network, vedere Criterio della zona di sicurezza di Data Science), l'opzione di accesso alla rete Internet pubblica gestita dal servizio è disabilitata. Se si tenta di utilizzare questa opzione, viene visualizzato un errore404NotAuthorizedOrNotFound. - Networking personalizzato: selezionare la VCN e la subnet (per compartimento) che si desidera utilizzare.
Per l'accesso in uscita alla rete Internet pubblica, utilizza una subnet privata con un instradamento a un Gateway NAT.
Nota
- Per utilizzare un accesso di storage dei file, è necessario utilizzare la rete personalizzata.
- Il passaggio dalla rete personalizzata alla rete gestita non è supportato dopo la creazione.
- Se viene visualizzato il banner
The specified subnet is not accessible. Select a different subnet., creare un criterio che consenta a Data Science di utilizzare la rete personalizzata. Vedere Criteri.
- Networking predefinito: limita solo il traffico verso i servizi Oracle. Il sistema utilizza la rete esistente gestita dal servizio. Il carico di lavoro viene collegato utilizzando una VNIC secondaria a una VCN e a una subnet preconfigurate e gestite dal servizio. Questa subnet fornita consente l'uscita alla rete Internet pubblica tramite un gateway NAT e l'accesso ad altri servizi Oracle Cloud tramite un gateway di servizi.
- Modifica forma* (facoltativo): modificare la forma di computazione selezionando Modifica forma. Quindi, attenersi alla procedura riportata di seguito nel pannello Seleziona forma di computazione.
- Selezionare un tipo di istanza.
- Selezionare una serie di forme.
- Selezionare una delle forme di computazione supportate nella serie. Selezionare la forma più adatta a come si desidera utilizzare la risorsa.
- Espandere la forma selezionata per configurare OCPU e memoria.
- Numero di OCPU
- Quantità di memoria (GB): per ogni OCPU, selezionare fino a 64 GB di memoria e un totale massimo di 512 GB. La quantità minima di memoria consentita è pari a 1 GB o a un valore corrispondente al numero di OCPU, a seconda di quale dei due valori è maggiore.
- Abilita forma espandibile: selezionare questa opzione se si utilizzano VM espandibili, quindi per Utilizzo di base per OCPU selezionare la percentuale di OCPU che in genere si desidera utilizzare. I valori supportati sono 12,5% e 50%. (Per le distribuzioni di modelli, è supportato solo il valore del 50%).
- Selezionare Seleziona forma.
- Sostituzione storage* (facoltativo): esegue l'override della configurazione storage. Immettere la quantità di storage a blocchi da utilizzare tra 50 GB e 10, 240 GB (10 TB). È possibile modificare il valore con incrementi di 1 GB.
- Abilita override BYOC/Sostituzione configurazione ambiente > Seleziona* (facoltativo): selezionare questa opzione per sostituire la configurazione dell'ambiente definita del job.
- Compartimento: selezionare il compartimento che contiene il repository.
- Repository: selezionare un repository dalla lista.
- Immagine: selezionare l'immagine che si desidera usare.
- Punto di ingresso: immettere un punto di ingresso.
- CMD: immettere un comando.Nota
Utilizzare CMD come argomenti per ENTRYPOINT o l'unico comando da eseguire in assenza di ENTRYPOINT. - Immagine digest: immettere un digest immagine.
- ID firma: se si utilizza la verifica della firma, immettere l'OCID della firma dell'immagine. Esempio:
ocid1.containerimagesignature.oc1.iad.aaaaaaaaab...
- Abilita log (facoltativo): sostituire la configurazione di log.
- Compartimento gruppo di log: selezionare il compartimento che contiene il gruppo di log.
- Gruppo di log: selezionare il gruppo di login.
- Abilita creazione automatica log: selezionare questa opzione per creare automaticamente un log all'avvio del job. Il log creato memorizza tutti i messaggi
stdoutestderr. - Selezionare un log: selezionare questa opzione (e selezionare un log esistente) per memorizzare tutti i messaggi
stdoutestderr.
- Override sonde* (facoltativo): eseguire l'override della sonda di avvio.
- Selezionare Seleziona.
- Nel pannello Probes immettere le informazioni riportate di seguito.
- Comando
- Ritardo iniziale (in secondi)
- Periodo
- Soglia di errore
- Selezionare Salva.
- Tag (sotto Opzioni avanzate): aggiunge tag all'esecuzione del job. Se si dispone delle autorizzazioni per creare una risorsa, si dispone anche delle autorizzazioni per applicare tag in formato libero a tale risorsa. Per applicare una tag defined, è necessario disporre delle autorizzazioni per utilizzare la tag namespace. Per ulteriori informazioni sull'applicazione di tag, vedere Tag risorsa. Se non sei sicuro di applicare le tag, salta questa opzione o chiedi a un amministratore. È possibile applicare le tag in un secondo momento.
Nota
Un asterisco (*) per un campo indica una posizione diversa per i job a più nodi. Se si sta avviando un'esecuzione job per un job a più nodi, trovare il campo modificando il gruppo di nodi: in Sostituzione configurazione gruppo di nodi, dal menu Azioni (tre punti) per il gruppo di nodi, selezionare Modifica. Il campo viene visualizzato nel pannello risultante. - Selezionare Start.
Nodo multiplo
Per avviare un'esecuzione di job multi-nodo, attenersi alla procedura riportata di seguito. - Nella pagina di elenco Progetti, selezionare il progetto contenente i job che si desidera utilizzare. Se è necessaria assistenza per trovare la pagina elenco o il progetto, vedere Elenca progetti.
- Nella pagina dei dettagli del progetto, selezionare Job.
- Selezionare la mansione.
- Selezionare Esecuzioni job.
- Selezionare Avvia esecuzione job.
-
Nella pagina Avvia esecuzione job, immettere le informazioni descritte in Nodo singolo.
I campi sono identici alle esecuzioni di job a nodo singolo con le seguenti differenze.
- I campi contrassegnati con (*) vengono visualizzati nel pannello per la modifica di un gruppo di nodi.
- I seguenti campi sono disponibili solo per i job multi-nodo, nel pannello per la modifica di un gruppo di nodi.
- Repliche (numero di repliche)
- Numero minimo di repliche riuscite (numero di repliche che devono avere esito positivo)
To open the panel for editing a node group: Under Node group configuration override, from the Actions menu (three dots) for the node group, select Edit.
- Selezionare Start.
Queste variabili di ambiente controllano il job.
Utilizzare l'interfaccia CLI di Data Science per avviare le esecuzioni dei job come nell'esempio riportato di seguito.
-
Avviare l'esecuzione di un job con:
oci data-science job-run create \ --display-name <job_run_name> \ --compartment-id <compartment_ocid> \ --project-id <project_ocid> \ --job-id <job_ocid> \ --configuration-override-details file://<optional_job_run_configuration_override_json_file> \ --log-configuration-override-details file://<optional_job_run_logging_configuration_override_json_file> - (Facoltativo) Utilizzare questo file JSON di override della configurazione di esecuzione job per sostituire le configurazioni definite nel job padre:
jobEnvironmentConfigurationDetails: { jobEnvironmentType: "OCIR_CONTAINER", image: "iad.ocir.io/axoxdievda5j/odsc-byod-hello-wrld:0.1.3", imageDigest: "sha256", cmd: ["ls", "-h"], entrypoint: ["-l"], imageSignatureId: "ocid1.containerimagesignature.oc1.iad.0.ociodscdev.aaaaaaaaccutw5qdz6twjzkpgmbojdck3qotqqsbn7ph6xcumu4s32o6v5gq", }, jobConfigurationDetails: { jobType: "DEFAULT", environmentVariables: <envar-list-object>}, ... } - (Facoltativo) Utilizzare questo file JSON di override della configurazione del log di esecuzione job per sostituire la configurazione del log definita nel job padre:
{ "enableLogging": true, "enableAutoLogCreation": true, "logGroupId": "<log_group_ocid>" }
-
Avviare l'esecuzione di un job con:
ADS SDK è anche una libreria Python disponibile pubblicamente che è possibile installare con questo comando:
pip install oracle-adsFornisce il wrapper che semplifica l'esecuzione dei job di avvio dai notebook o dalla macchina client.
Utilizzare l'SDK ADS per avviare le esecuzioni dei job.