Oracle Cloud Infrastructureドキュメント

Oracle Cloud InfrastructureでNVIDIA GPUクラウドを使用

NVIDIA GPU Cloud (NGC)は、深層学習と科学的コンピューティングのために最適化されたGPUアクセラレーション・クラウド・プラットフォームです。 このトピックでは、Oracle Cloud InfrastructureでNGCを使用する方法の概要を説明します。

NVIDIAは、Oracle Cloud Infrastructureで、NVIDIA®Tesla Volta™およびPascal™GPUに最適化されたカスタマイズされたコンピュート・イメージを提供します。 このインスタンスでNGCコンテナを実行すると、深層学習のジョブに最適なパフォーマンスが得られます。

前提条件

あなたのNGC APIキーを生成するには

NGCイメージに基づくインスタンスの起動

コンソールの使用

  1. コンソールを開きます。これについては、「コンソールにサインイン」のステップを参照してください。

  2. コンピュートをクリックし、作業する権限を持つコンパートメントを選択して、「インスタンスの作成」をクリックします。

  3. 「インスタンスの作成」ダイアログ・ボックスで、インスタンス名を指定し、そのインスタンスの可用性ドメインを選択します。

  4. 「イメージ・ソースの変更」をクリックします。

  5. 「Oracleイメージ」タブで、「NVIDIA GPU Cloudマシン・イメージ」を選択して「Oracle Appの契約"NVIDIA GPU Cloud Machine Image"」を確認し、受け入れてから、「イメージの選択」をクリックします。

  6. 「仮想マシン」または「ベア・メタル・マシン」を選択して、「インスタンスのタイプ」を転送します。

  7. 「シェイプ」に使用するシェイプを選択します。

  8. 「SSHキー」については、「SSHキー・ファイルを選択」をクリックし、作成したSSHキー・ファイルの公開キー部分(.pub)を保存したロケーションに移動し、ファイルを選択して「オープン」をクリックします。

  9. 「ネットワーキングの構成」セクションで、仮想クラウド・ネットワーク(VCN)コンパートメント、VCN、サブネット・コンパートメントおよびサブネットを選択します。

  10. 「インスタンスの作成」をクリックします。

これで、「プロビジョニング」というステータスのNGCインスタンスが表示されるはずです。 ステータスが「ランニング」に変更されると、インスタンスに接続できます。 コンピュート・インスタンスの起動に関する一般的な情報は、「インスタンスの作成」を参照してください。

インスタンスにアクセスして作業するには、次のトピックを参照してください:

SSHを使用してインスタンスに接続すると、NGC APIキーの入力を求められます。 プロンプトでAPIキーを入力すると、インスタンスは自動的にNGCコンテナ・レジストリにログインし、レジストリからコンテナを実行できるようにします。 プロンプトでAPIキーを入力しないで、引き続きインスタンスにログインすることもできます。 その後、後からNGCコンテナ・レジストリにログインできます。「詳細は、NGCコンテナ・レジストリへのログインを参照してください」を参照してください。

CLIの使用

Oracle Cloud Infrastructureは、タスクを完了するために使用できる「コマンド・ライン・インタフェース(CLI)」を提供します。 詳細は、「クイックスタート」および「構成」を参照してください。 launchコマンドを使用してインスタンスを作成し、sourceTypeimageを指定し、LaunchInstanceDetailsInstanceSourceDetailsにイメージOCID ocid1.image.oc1..aaaaaaaaknl6phck7e3iuii4r4axpwhenw5qtnnsk3tqppajdjzb5nhoma3qを指定します。

永続データ・ストレージにファイル・ストレージ・サービスの使用

NGCを使用する場合は、「ファイル・ストレージの概要」をデータ・ストレージとして使用できます。 ファイル・ストレージ・サービスの作成と操作については、次のタスクを参照してください:

永続データ・ストレージにブロック・ボリューム・サービスの使用

NGCを使用する場合は、データ・ストレージにブロック・ボリューム・サービスを使用できます。 詳細は、「ブロック・ボリュームの概要」を参照してください。 ブロック・ボリューム・サービスの作成と操作については、次のタスクを参照してください:

また、CLIを使用してブロック・ボリュームを管理することもできます。volumeコマンドを参照してください。

コンテナの実行例

まず、NGCコンテナ・レジストリにログインする必要があります。 SSH経由でインスタンスにログインするときにAPIキーを指定した場合、このセクションはスキップできます。 インスタンスに接続するときにAPIキーを指定しなかった場合は、このステップを実行する必要があります。

NGCコンテナ・レジストリにログインするには

この時点で、Dockerコマンドを実行し、インスタンスからNGCコンテナ・レジストリにアクセスできます。

例: PyTorchコンテナを使用したMNISTトレーニングの実行
例: TensorFlowコンテナを使用したMNISTトレーニングの実行