Oracle Cloud Infrastructureドキュメント

Oracle Cloud InfrastructureでNVIDIA GPUクラウドを使用

NVIDIA GPU Cloud (NGC)は、深層学習と科学的コンピューティングのために最適化されたGPUアクセラレーション・クラウド・プラットフォームです。 このトピックでは、Oracle Cloud InfrastructureでNGCを使用する方法の概要を説明します。

NVIDIAは、Oracle Cloud Infrastructureで、NVIDIA®Tesla Volta™およびPascal™GPUに最適化されたカスタマイズされたComputeイメージを提供します。 このインスタンスでNGCコンテナを実行すると、深層学習のジョブに最適なパフォーマンスが得られます。

Oracle Cloud Infrastructureに精通している方は、NGCを使用するには、コンソールにログインし、必要に応じて構成を行い、イメージOCIDを指定してNGCイメージに基づいてインスタンスを作成する必要があります。 インスタンスを起動すると、インスタンスにSSHを実行し、NGCコンテナ・レジストリからフレームワーク・コンテナを使用して詳細な学習ジョブを実行することができます。

前提条件

あなたのNGC APIキーを生成するには

NGCイメージに基づくインスタンスの起動

コンソールの使用

  1. コンソールを開きます。これについては、「コンソールにサインイン」のステップを参照してください。

  2. Computeをクリックし、作業する権限を持つコンパートメントを選択して、「インスタンスの作成」をクリックします。

  3. 「インスタンスの作成」ダイアログ・ボックスで、インスタンス名を指定し、そのインスタンスの可用性ドメインを選択します。

  4. 「ブート・ボリューム」に対して「イメージOCID」を選択します。

  5. リージョンに適用可能なイメージOCIDを「イメージOCID」として指定します。

    Region イメージOCID
    us-ashburn-1 ocid1.image.oc1.iad.aaaaaaaaikn6ub6heefqxbe5fkiv4otbfe6ivza6y7di5khnkxkyvf2bkdta
    eu-frankfurt-1 ocid1.image.oc1.eu-frankfurt-1.aaaaaaaauwuafl6uze6bnusphnn6y2mr5y7ajavx4kza7glyrqggxlnbo4zq
  6. 「シェイプ・タイプ」に対して「Bare Metalマシン」を選択します。

  7. 「シェイプ」に使用するシェイプを選択します。

  8. 「SSHキー」については、「SSHキー・ファイルを選択」をクリックし、作成したSSHキー・ファイルの公開キー部分(.pub)を保存したロケーションに移動し、ファイルを選択して「オープン」をクリックします。

  9. 仮想クラウド・ネットワークを選択し、「インスタンスの作成」をクリックします。

これで、「プロビジョニング」というステータスのNGCインスタンスが表示されるはずです。 ステータスが「ランニング」に変更されると、インスタンスに接続できます。 Computeインスタンスの起動に関する一般的な情報は、「インスタンスの作成」を参照してください。

インスタンスにアクセスして作業するには、次のトピックを参照してください:

SSHを使用してインスタンスに接続すると、NGC APIキーの入力を求められます。 プロンプトでAPIキーを入力すると、インスタンスは自動的にNGCコンテナ・レジストリにログインし、レジストリからコンテナを実行できるようにします。 プロンプトでAPIキーを入力しないで、引き続きインスタンスにログインすることもできます。 その後、NGCコンテナ・レジストリに後でログインできます。詳しくは、NGCコンテナ・レジストリへのログインを参照してください。

CLIの使用

Oracle Cloud Infrastructureは、タスクを完了するために使用できる「コマンド・ライン・インタフェース(CLI)」を提供します。 詳細は、「クイックスタート」および「構成」を参照してください。 launchコマンドを使用して、sourceTypeInstanceSourceDetailsLaunchInstanceDetailsimageIdimageIdの下の表の該当するイメージOCIDを指定して、インスタンスを作成します。

Region イメージOCID
us-ashburn-1 ocid1.image.oc1.iad.aaaaaaaaikn6ub6heefqxbe5fkiv4otbfe6ivza6y7di5khnkxkyvf2bkdta
eu-frankfurt-1

ocid1.image.oc1.eu-frankfurt-1.aaaaaaaauwuafl6uze6bnusphnn6y2mr5y7ajavx4kza7glyrqggxlnbo4zq

CLIを使用してインスタンスを開始および停止するには、actionコマンドを使用します。 インスタンスを終了するには、terminateコマンドを使用します。

永続データ・ストレージにFile Storageサービスの使用

NGCを使用する場合は、「File Storageの概要」をデータ・ストレージとして使用できます。 File Storageサービスの作成と操作については、次のタスクを参照してください:

永続データ・ストレージにBlock Volumeサービスの使用

NGCを使用する場合は、データ・ストレージにBlock Volumeサービスを使用できます。 詳細は、「Block Volumeの概要」を参照してください。 Block Volumeサービスの作成と操作については、次のタスクを参照してください:

また、CLIを使用してブロック・ボリュームを管理することもできます。volumeコマンドを参照してください。

Containersの実行例

まず、NGCコンテナ・レジストリにログインする必要があります。 SSH経由でインスタンスにログインするときにAPIキーを指定した場合、このセクションはスキップできます。 インスタンスに接続するときにAPIキーを指定しなかった場合は、このステップを実行する必要があります。

NGCコンテナ・レジストリにログインするには

この時点で、Dockerコマンドを実行し、インスタンスからNGCコンテナ・レジストリにアクセスできます。

例: PyTorchコンテナを使用したMNISTトレーニングの実行
例: TensorFlowコンテナを使用したMNISTトレーニングの実行