機械学習サンドボックスの構築について

単一マシン上に1つ以上の独立した環境を設定し、人気のある機械学習ツールおよびライブラリを使用してデータとともに再生できるようにする場合は、Oracle Cloud Infrastructure ComputeにAnaconda Distributionをインストールします。

Anacondaは、データ科学プロジェクトを設計、構築および管理するための一般的な目的ツールです。Anacondaを使用すると、RおよびPython内の1,500を超えるデータ科学パッケージにアクセスできます。TensorFlow、NumPy、パン、科学科学などのライブラリを管理します。また、Jupyter NotebookやRStudioなどのマシン学習環境のインストールおよび更新も処理します。

アーキテクチャ

このアーキテクチャは、複数の機械学習環境がOracle Cloud Infrastructureの1つのコンピュート・インスタンスにインストールされているサンプル・サンドボックスを示しています。

各環境は独立しており、他の環境から分離されています。それぞれ独自バージョンのPythonまたはR、あるいはその他の言語、ツールおよびライブラリの組合せを持つことができます。この設定により、複数の独立したプロジェクトを1つのシステムに配置し、ある環境から別の環境に簡単に切り替えることができます。

アーキテクチャの説明(Entity - mpute-environments.png)が続きます

図アーキテクトの説明: ci - mpute-environments.png

前提条件

機械学習とコンピュータ・システムの専門知識はこのソリューションから学習する必要はありませんが、データの収集、移動および変換に使用するテクノロジとプロセスに関する知識が少なくとも必要です。

具体的には、次のスキルが必要です。

Pythonに精通しています。
Jupyter Notebookに精通しています。
機械学習のプロセスおよび方法に関する知識があります。
Linuxコマンド行に精通しています。
SSHまたはPuTTYを使用してリモート・マシンに接続する機能。

必要なサービスおよび製品について

Linuxを実行しているOracle Cloud Infrastructure Computeへのアクセス権が必要です。

Oracle Linux 7 .7またはUbuntu 18 .04を使用できます。このソリューションでは、両方の使用方法を示しています。GPUコンピュート・シェイプ「VM.GPU 3.1」を使用します。これにはNVIDIA Tesla v 100 GPU 1と6 ocpuが1つありますが、GPU以外のシェイプでサンドボックスを設定することもできます。

必要なクラウド・サービスを取得するために、OracleソリューションのOracle Cloudサービスを取得する方法について説明します。