Creazione di un job
Creare ed eseguire un job in Data Science.
Prima di iniziare
- Assicurarsi di aver creato i criteri, l'autenticazione e l'autorizzazione necessari per i job.
- Creare un file artifact job o creare un contenitore personalizzato.
- Per memorizzare e gestire i log dei job, apprendere informazioni sul log.
- Per utilizzare gli accessi di storage, è necessario disporre di un bucket di storage degli oggetti o di una destinazione di accesso e di un percorso di esportazione FSS (File Storage Service) OCI.
- Per gli accessi di storage, assicurarsi di disporre dell'autorizzazione per l'uso degli accessi di storage.
-
Per utilizzare FSS, è necessario prima creare il file system e il punto di attivazione. Utilizzare l'opzione di rete personalizzata e assicurarsi che la destinazione di accesso e il notebook siano configurati con la stessa subnet. Configurare le regole dell'elenco di sicurezza per la sottorete con porte e protocolli specifici.
Assicurarsi che i limiti del servizio siano allocati a
file-system-countemount-target-count.
Informazioni di base
Selezionare uno o più nodi e fornire informazioni di identificazione.
- Tipo di mansione: selezionare l'opzione pertinente.
- Nodo singolo: un computer per il job.
- Multinodo: diversi nodi per un job impegnativo.
- Compartimento (facoltativo): selezionare un compartimento diverso per il job.
- Nome (facoltativo): immettere un nome per il job (limite di 255 caratteri). Se non si fornisce un nome, il nome viene generato automaticamente. Esempio:
job20210808222435
Configurazione
Immettere le informazioni riportate di seguito.
- Aggiungi gruppo di nodi (solo job a più nodi): selezionare questa opzione per aggiungere la configurazione di un gruppo di nodi. Aggiungere fino a 5 gruppi di nodi.
- Nome: immettere un nome univoco per il gruppo di nodi.
- Repliche: immettere il numero di repliche.
- Numero minimo di repliche riuscite: immettere il numero minimo di repliche che devono avere esito positivo.
- Campi asterischi (*)
- (Facoltativo) Se si dispone di più gruppi di nodi, specificare l'ordine di avvio del gruppo di nodi, in parallelo o in sequenza.
- Chiave variabile di ambiente personalizzata* (facoltativo): variabili di ambiente che controllano il job.Nota
Se è stato caricato un file zip o un file tar compresso, aggiungereJOB_RUN_ENTRYPOINTcome variabile di ambiente personalizzata per puntare al file. - Valore* (facoltativo): valore della chiave della variabile di ambiente personalizzata.
- Argomenti della riga di comando* (facoltativo): gli argomenti della riga di comando che si desidera utilizzare per l'esecuzione del job.
- Runtime massimo (in minuti) (facoltativo): il numero massimo di minuti che il job può eseguire. Il servizio annulla l'esecuzione del job se il relativo runtime supera il valore specificato. Il runtime massimo è di 30 giorni (43.200 minuti). Si consiglia di configurare un runtime massimo su tutte le esecuzioni di job per evitare l'esecuzione di job in esecuzione.
- Modifica forma* (facoltativo): modificare la forma di computazione selezionando Modifica forma. Quindi, attenersi alla procedura riportata di seguito nel pannello Seleziona forma di computazione.
- Selezionare un tipo di istanza.
- Selezionare una serie di forme.
- Selezionare una delle forme di computazione supportate nella serie. Selezionare la forma più adatta a come si desidera utilizzare la risorsa.
- Espandere la forma selezionata per configurare OCPU e memoria.
- Numero di OCPU
- Quantità di memoria (GB): per ogni OCPU, selezionare fino a 64 GB di memoria e un totale massimo di 512 GB. La quantità minima di memoria consentita è pari a 1 GB o a un valore corrispondente al numero di OCPU, a seconda di quale dei due valori è maggiore.
- Abilita forma espandibile: selezionare questa opzione se si utilizzano VM espandibili, quindi per Utilizzo di base per OCPU selezionare la percentuale di OCPU che in genere si desidera utilizzare. I valori supportati sono 12,5% e 50%. (Per le distribuzioni di modelli, è supportato solo il valore del 50%).
- Selezionare Seleziona forma.
- Storage: immettere la quantità di storage a blocchi da utilizzare tra 50 GB e 10, 240 GB (10 TB). È possibile modificare il valore con incrementi di 1 GB.
- Risorse di networking: selezionare l'opzione pertinente.
- Networking predefinito: limita solo il traffico verso i servizi Oracle. Il sistema utilizza la rete esistente gestita dal servizio. Il carico di lavoro viene collegato utilizzando una VNIC secondaria a una VCN e a una subnet preconfigurate e gestite dal servizio. Questa subnet fornita consente l'uscita alla rete Internet pubblica tramite un gateway NAT e l'accesso ad altri servizi Oracle Cloud tramite un gateway di servizi.
Se hai bisogno di accedere solo alla rete Internet pubblica e ai servizi OCI, ti consigliamo di utilizzare questa opzione. Non richiede la creazione di risorse di rete o la scrittura di criteri per le autorizzazioni di rete.
- Networking predefinito con Internet: consente l'accesso a Internet in uscita tramite il gateway NAT di Data Science.Nota
Non è possibile utilizzare la rete predefinita con Internet in realm disconnessi e tenancy di sviluppo Oracle. Se la tenancy o il compartimento in uso dispone di un criterio della zona di sicurezza di Data Science che nega l'accesso alla rete pubblica (ad esempio,deny model_deploy_public_network, vedere Criterio della zona di sicurezza di Data Science), l'opzione di accesso alla rete Internet pubblica gestita dal servizio è disabilitata. Se si tenta di utilizzare questa opzione, viene visualizzato un errore404NotAuthorizedOrNotFound. - Networking personalizzato: selezionare la VCN e la subnet (per compartimento) che si desidera utilizzare.
Per l'accesso in uscita alla rete Internet pubblica, utilizzare una subnet privata con un instradamento a un gateway NAT.
Nota
- Per utilizzare un accesso allo storage di file, è necessario utilizzare la rete personalizzata.
- Il passaggio dalla rete personalizzata alla rete gestita non è supportato dopo la creazione.
- Se viene visualizzato il banner
The specified subnet is not accessible. Select a different subnet., creare un criterio che consenta a Data Science di utilizzare la rete personalizzata. Vedere Criteri.
- Networking predefinito: limita solo il traffico verso i servizi Oracle. Il sistema utilizza la rete esistente gestita dal servizio. Il carico di lavoro viene collegato utilizzando una VNIC secondaria a una VCN e a una subnet preconfigurate e gestite dal servizio. Questa subnet fornita consente l'uscita alla rete Internet pubblica tramite un gateway NAT e l'accesso ad altri servizi Oracle Cloud tramite un gateway di servizi.
- Carica artifact job (facoltativo se BYOC è configurato): caricare l'artifact job trascinando il file artifact job richiesto nella casella.
Nota
Un asterisco (*) per un campo indica una posizione diversa per i job a più nodi. Se si sta creando un job a più nodi, trovare il campo aggiungendo un gruppo di nodi. In Configurazione, selezionare Aggiungi gruppo di nodi. Il campo viene visualizzato nel pannello Aggiungi gruppo di nodi.Ulteriore configurazione
Immettere le informazioni riportate di seguito.
- Abilita log (facoltativo): configurare il log.
- Compartimento gruppo di log: selezionare il compartimento che contiene il gruppo di log.
- Gruppo di log: selezionare il gruppo di login.
- Abilita creazione automatica log: selezionare questa opzione per creare automaticamente un log all'avvio del job. Il log creato memorizza tutti i messaggi
stdoutestderr. - Selezionare un log: selezionare questa opzione (e selezionare un log esistente) per memorizzare tutti i messaggi
stdoutestderr.
- Abilita BYOC/Configurazione dell'ambiente > Seleziona* (obbligatorio per i job a più nodi): impostare un ambiente per il modello BYOC (Bring Your Own Container).
- Compartimento: selezionare il compartimento che contiene il repository.
- Repository: selezionare un repository dalla lista.
- Immagine: selezionare l'immagine che si desidera usare.
- Punto di ingresso: immettere un punto di ingresso.
- CMD: immettere un comando.Nota
Utilizzare CMD come argomenti per ENTRYPOINT o l'unico comando da eseguire in assenza di ENTRYPOINT. - Immagine digest: immettere un digest immagine.
- ID firma: se si utilizza la verifica della firma, immettere l'OCID della firma dell'immagine. Esempio:
ocid1.containerimagesignature.oc1.iad.aaaaaaaaab...
- Installazioni di storage dei file (facoltativo): selezionare Aggiungi accesso allo storage dei file e immettere le informazioni riportate di seguito.
- Compartimento: selezionare il compartimento contenente la destinazione di cui si desidera eseguire il MOUNT.
- Destinazione di accesso: la destinazione di accesso che si desidera utilizzare.
- Percorso esportazione: il percorso di esportazione che si desidera utilizzare.
- Percorso e directory di destinazione: immettere il percorso da utilizzare per il MOUNT dello storage.
Il percorso deve iniziare con un carattere alfanumerico. La directory di destinazione deve essere univoca tra gli accessi di storage forniti. I caratteri consentiti sono alfanumerici, trattini ( - ) e caratteri di sottolineatura ( _ ).
È possibile specificare il percorso completo, ad esempio
/opc/storage-directory. Se viene specificata solo una directory, ad esempio/storage-directory, viene attivata nella directory/mntpredefinita. Non è possibile specificare directory specifiche del sistema operativo, ad esempio/bino/etc.
- Accessi allo storage degli oggetti (facoltativo): selezionare Aggiungi accesso allo storage degli oggetti e immettere le informazioni riportate di seguito.
- Compartimento: selezionare il compartimento che contiene il bucket che si desidera installare.
- Bucket: selezionare il bucket che si desidera utilizzare.
- Prefisso nome oggetto (facoltativo): prefisso del nome oggetto. Il prefisso deve iniziare con un carattere alfanumerico. I caratteri consentiti sono alfanumerici, barre ( / ), trattini ( - ) e caratteri di sottolineatura ( _ ).
- Percorso e directory di destinazione: immettere il percorso da utilizzare per il MOUNT dello storage.
Il percorso deve iniziare con un carattere alfanumerico. La directory di destinazione deve essere univoca tra gli accessi di storage forniti. I caratteri consentiti sono alfanumerici, trattini ( - ) e caratteri di sottolineatura ( _ ).
È possibile specificare il percorso completo, ad esempio
/opc/storage-directory. Se viene specificata solo una directory, ad esempio/storage-directory, viene attivata nella directory/mntpredefinita. Non è possibile specificare directory specifiche del sistema operativo come/bino/etc.
Nota
Se si utilizza una rete personalizzata:- Crea il gateway di servizi nella VCN.
- Per le configurazioni della tabella di instradamento nella subnet privata, aggiungere il gateway del servizio.
- Modificare le regole di uscita della lista di sicurezza della subnet richiesta per consentire il traffico a tutti i servizi della rete.
- Probe* (obbligatorio per i job multi-nodo): configurare la sonda di avvio.
- Selezionare Seleziona.
- Nel pannello Probes immettere le informazioni riportate di seguito.
- Comando
- Ritardo iniziale (in secondi)
- Periodo
- Soglia di errore
- Selezionare Salva.
- Tag (sotto Opzioni avanzate): aggiunge tag al job. Se si dispone delle autorizzazioni per creare una risorsa, si dispone anche delle autorizzazioni per applicare tag in formato libero a tale risorsa. Per applicare una tag defined, è necessario disporre delle autorizzazioni per utilizzare la tag namespace. Per ulteriori informazioni sull'applicazione di tag, vedere Tag risorsa. Se non sei sicuro di applicare le tag, salta questa opzione o chiedi a un amministratore. È possibile applicare le tag in un secondo momento.
Nota
Un asterisco (*) per un campo indica una posizione diversa per i job a più nodi. Se si sta creando un job a più nodi, trovare il campo aggiungendo un gruppo di nodi. In Configurazione, selezionare Aggiungi gruppo di nodi. Il campo viene visualizzato nel pannello Aggiungi gruppo di nodi.Rivedi e crea
Rivedere la configurazione, quindi selezionare Crea.
Dopo che il job è stato attivo, è possibile utilizzare le esecuzioni dei job per eseguire ripetutamente il job.
- Tipo di mansione: selezionare l'opzione pertinente.
Queste variabili di ambiente controllano il job.
Utilizzare l'interfaccia CLI di Data Science per creare un job come nell'esempio riportato di seguito.
ADS SDK è anche una libreria Python disponibile pubblicamente che è possibile installare con questo comando:
pip install oracle-adsFornisce il wrapper che semplifica la creazione e l'esecuzione dei job dai notebook o dalla macchina client.
Utilizzare l'SDK ADS per creare ed eseguire job.