Configurazione manuale di una tenancy di Data Science
In questa esercitazione è possibile impostare la tenancy per Data Science e testarla creando una sessione notebook.
Questa esercitazione è rivolta agli utenti amministratori perché dispongono delle autorizzazioni di accesso necessarie.
In questa esercitazione:
1. Creazione di un gruppo di utenti di data scientist.
2. Creazione di un compartimento per il proprio lavoro.
3. (Facoltativo) Creazione di una VCN e di una subnet.
Informazioni preliminari
Per eseguire questa esercitazione, è necessario disporre dei seguenti elementi:
-
Un account a pagamento Oracle Cloud Infrastructure (OCI) o un nuovo account con le promozioni di Oracle Cloud. Vedi Richiedi e gestisci le promozioni gratuite su Oracle Cloud.
- Privilegio di amministratore per l'account OCI.
-
Almeno un utente nella tenancy che desidera accedere al servizio Data Science. Questo utente deve essere creato in IAM.
1. Creazione di un gruppo di utenti di data scientist
Creare un gruppo di utenti in cui i data scientist possano lavorare.
2. Creazione di un compartimento per il lavoro
Crea un compartimento per le tue risorse di data science.
- Attenersi alla procedura descritta in Creazione di un compartimento per creare un compartimento.
- Assegnare un nome al nuovo compartimento data-science-work e immettere una descrizione.
- Verificare che il compartimento venga visualizzato nella lista dei compartimenti.
3 (Facoltativo) Creazione di una VCN e di una subnet
Questo passo è facoltativo. Quando si crea una sessione notebook al Passo 6. Creazione di una sessione notebook: è possibile scegliere di creare una rete predefinita con l'impostazione appropriata per le sessioni notebook.
È possibile saltare la creazione di una rete e impostare subnet e gateway se si seleziona la rete predefinita durante la creazione di un notebook. Se la rete predefinita è configurata in un notebook, non è possibile modificarla durante la riattivazione del notebook.
Questa sezione mostra agli utenti che richiedono l'accesso alle proprie VCN, come creare una VCN e, in seguito, come selezionare la subnet consigliata per le sessioni notebook. Ad esempio, se si sta eseguendo l'esercitazione Programmazione delle esecuzioni dei job di Data Science, è possibile creare questa rete e utilizzarla sia per la sessione notebook in Data Science che per l'area di lavoro nel servizio Data Integration.
Per l'accesso in uscita alla rete Internet pubblica, si consiglia di utilizzare una subnet privata con un instradamento a un gateway NAT. Un gateway NAT consente alle istanze di una subnet privata di accedere a Internet. La VCN creata in questo passo crea una subnet privata con accesso in uscita a Internet tramite il gateway NAT della VCN.
4. Creazione dei criteri
Prima di avviare le sessioni notebook, è necessario configurare i criteri di Data Science.
Spiegazione delle politiche:
-
Per consentire al servizio Data Science di collegare la VCN alla sessione notebook e di instradare il traffico in uscita dall'ambiente notebook, aggiungere:
allow service datascience to use virtual-network-family in compartment data-science-work
-
Per consentire al gruppo
data-scientists
di eseguire operazioni su tutte le risorse di Data Science nel compartimentodata-science-work
(progetti, sessioni notebook, modelli, distribuzioni di modelli, richieste di lavoro, job ed esecuzioni di job), aggiungere:allow group data-scientists to manage data-science-family in compartment data-science-work
-
Per consentire ai data scientist di utilizzare la VCN, è stato creato e collegato alla sessione notebook, aggiungere:
allow group data-scientists to use virtual-network-family in compartment data-science-work
-
Per consentire ai data scientist di creare e gestire i bucket, ad esempio l'aggiunta di artifact e ambienti Conda ai bucket, aggiungere:
allow group data-scientists to manage buckets in compartment data-science-work allow group data-scientists to manage objects in compartment data-science-work
Invece di specificare quali risorse gestire, ad esempio bucket, oggetti o famiglia di reti virtuali, per consentire ai data scientist di accedere ai diritti amministrativi del proprio compartimento, in cui gestire tutte le risorse dei servizi OCI, sostituire i cinque criteri precedenti con i due criteri seguenti:
allow group data-scientists to manage all-resources in compartment data-science-work
allow service datascience to use virtual-network-family in compartment data-science-work
5. Creazione di un gruppo dinamico con i criteri
Crea un gruppo dinamico per le risorse di Data Science e consenti a questo gruppo dinamico di accedere ad altre risorse OCI, come lo storage degli oggetti e il log.
Per concedere l'autorizzazione alle risorse OCI per accedere ad altre risorse OCI, in primo luogo, è necessario aggiungere le risorse a un gruppo dinamico anziché a un gruppo di utenti. Quindi si scrivono i criteri per consentire al gruppo dinamico di accedere alle risorse specificate. In questo caso, il gruppo dinamico dispone di tre risorse di Data Science: sessioni di notebook, distribuzioni di modelli e esecuzione di job.
È possibile utilizzare questo gruppo dinamico per concedere alle sessioni notebook e alle distribuzioni dei modelli presenti nel compartimento data-science-work
l'accesso ad altre risorse OCI nella tenancy.
Spiegazione delle politiche:
-
Per consentire alle sessioni notebook di eseguire operazioni CRUD sulle voci del catalogo modelli, dei progetti e delle risorse delle sessioni notebook, aggiungere:
allow dynamic-group data-science-dynamic-group to manage data-science-family in compartment data-science-work
-
Per consentire alle sessioni notebook di eseguire operazioni CRUD sulle applicazioni e sulle esecuzioni di Data Flow, aggiungere:
allow dynamic-group data-science-dynamic-group to manage dataflow-family in compartment data-science-work
-
Per consentire alle sessioni notebook di elencare e leggere i compartimenti e i nomi utente presenti nella tenancy, aggiungere:
allow dynamic-group data-science-dynamic-group to read compartments in tenancy allow dynamic-group data-science-dynamic-group to read users in tenancy
-
Per consentire alle distribuzioni dei modelli di emettere log nel servizio di log, aggiungere:
allow dynamic-group data-science-dynamic-group to use log-content in compartment data-science-work
-
Per consentire le esecuzioni dei job per creare log e registrare i dettagli di esecuzione dei job nel servizio di log, aggiungere:
allow dynamic-group data-science-dynamic-group to use log-groups in compartment data-science-work
-
Per consentire alle sessioni notebook e alle distribuzioni dei modelli di leggere e scrivere file nei bucket di storage degli oggetti, nel compartimento
data-science-work
aggiungere:allow dynamic-group data-science-dynamic-group to manage object-family in compartment data-science-work
- Il criterio precedente consente alle distribuzioni di modelli di accedere a qualsiasi bucket nel compartimento data-science-work.
- Per concedere alle distribuzioni di modelli l'accesso in lettura a bucket specifici esterni al compartimento data-science-work, specificare i nomi dei bucket e i relativi compartimenti nel criterio.
- Esempio: per consentire alle distribuzioni dei modelli di accedere agli ambienti Conda pubblicati dal bucket
published-conda-env
e agli artifact dei modelli dal bucketmodel-artifacts
, aggiungere:allow dynamic-group data-science-dynamic-group to read objects in compartment <another-compartment> where ANY {target.bucket.name='published-conda-envs', target.bucket.name='model-artifacts'}
- Se le istruzioni dei criteri menzionano la tenancy o includono compartimenti esterni al compartimento
data-science-work
, nella finestra di dialogo Crea criterio, per l'opzione Compartimento selezionare <your-tenancy> (root). In questo modo, oltre al compartimento, il criterio può includere regole per altri compartimenti nella tenancy.
6. Creazione di una sessione notebook
Infine, creare una sessione notebook e testarne l'accesso alla rete Internet pubblica.
Pagina successiva
Impostazione di una tenancy Data Science riuscita e creazione di un progetto Data Science che include una sessione notebook. Ora è possibile procedere con i seguenti task: