Informazioni sulla creazione di un sandbox Machine Learning
Se si desidera impostare uno o più ambienti isolati su un singolo computer in cui è possibile eseguire i dati utilizzando le librerie e gli strumenti di apprendimento automatico più diffusi, installare Distribuzione Anaconda su Oracle Cloud Infrastructure Compute.
Anaconda è uno strumento generico per progettare, creare e gestire progetti di data science. Anaconda ti ti ha accesso a oltre 1,500 package di data science in R e Python. Gestisce librerie quali TensorFlow, NumPy, pandas, scikit-learn e così via. Gestisce inoltre l'installazione e l'aggiornamento di ambienti Machine Learning quali Jupyter Notebook e RStudio.
Architettura
Questa architettura mostra un sandbox di esempio con numerosi ambienti di apprendimento automatico installati su una singola istanza di computazione in Oracle Cloud Infrastructure.
Ogni ambiente è indipendente e isolato dagli altri. Ogni versione può essere Python o R o qualsiasi altra combinazione di lingua, strumenti e librerie. Questa configurazione consente di disporre di numerosi progetti indipendenti in un sistema in cui è possibile passare facilmente da un ambiente all'altro.

Descrizione dell'immagine architecture-oci-compute-environments.png
Prerequisiti
Sebbene non sia necessario conoscere le competenze dei sistemi di apprendimento automatico e computer da questa soluzione, è necessario disporre di almeno delle tecnologie e dei processi utilizzati per raccogliere, spostare e trasformare i dati.
In particolare, è necessario disporre delle seguenti capacità:
-
Familiarità con Python.
-
Familiarità con il Blocco appunti Jupyter.
-
Alcune conoscenze dei processi e dei metodi di Machine Learning.
-
Familiarità con la riga di comando Linux.
-
Possibilità di usare SSH o PuTTY per la connessione a un computer remoto.
Informazioni su servizi e prodotti richiesti
È necessario disporre dell'accesso a Oracle Cloud Infrastructure Compute su cui viene eseguito Linux.
È possibile utilizzare Oracle Linux 7.7 o Ubuntu 18.04. In questa soluzione viene illustrato come utilizzare entrambe le soluzioni. Utilizza la forma di computazione GPU VM.GPU3.1 che dispone di una GPU NVIDIA Tesla V100 e 6 OCPU, ma puoi anche impostare un sandbox in una forma non GPU.