ノート:

Oracle Cloud InfrastructureへのNVIDIA RTX仮想ワークステーションの導入

イントロダクション

NVIDIA RTX仮想ワークステーション・ソフトウェアを使用すると、ユーザーは、高パフォーマンスのシミュレーション、グラフィック・レンダリング、およびネイティブのワークステーションのようなパフォーマンスでクラウド上のワークロードの設計を実行できます。OpenGLやDirectXなどのグラフィックAPIによって提供される強力なレンダリング機能をロック解除し、画期的なグラフィック・パフォーマンスをクラウドにもたらします。

目標

タスク1: OCIでのNVIDIA RTX仮想ワークステーション用のコンピュート・インスタンスのプロビジョニング

  1. Virtual Cloud Network (VCN)を作成し、OCIでコンピュート・インスタンスを起動します。詳細は、VCNの作成およびコンピュート・インスタンスの起動を参照してください。

  2. 使用可能なGPU.A10シェイプから1つ選択します。

    VM.GPU.A10.1
    
    VM.GPU.A10.2
    
    BM.GPU.A10.4
    
  3. コンピュート・インスタンスの起動時に、前述のシェイプのいずれかにシェイプを変更します。GPU.A10 VMを起動するには、「専門と前世代」をクリックし、VM.GPU.A10シェイプのいずれかを選択します。ベア・メタル・サーバーの場合は、「ベア・メタル・マシン」をクリックし、「BM.GPU.A10.4」シェイプを選択します。

  4. テナンシにGPU.A10のサービス制限が設定されていない場合、これらのシェイプはシェイプ・リストに含まれません。

    1. OCIコンソールでテナンシ制限を確認するには、GPU.A10コンピュート・インスタンスをプロビジョニングするリージョンを設定し、ナビゲーション・メニューを開いて「ガバナンスと管理」をクリックします。

    2. 「テナント管理」で、「制限、割当ておよび使用状況」を選択します。

    3. サービスを「コンピュート」に設定し、「スコープ」でいずれかの可用性ドメインを選択し、「リソース」GPU.A10と入力します。

    4. A10ベースのVMおよびBMインスタンスのGPUを選択します。

    Image1

  5. コンピュート制限はアベイラビリティ・ドメインごとです。リージョンのいずれかの可用性ドメインに制限が設定されているかどうかを確認します。すべての可用性ドメインでサービス制限が0に設定されている場合は、「サービス制限引上げのリクエスト」をクリックし、このリソースに対する制限引上げリクエストを送信します。サービス制限の詳細は、サービス制限を参照してください。

    ノート: 「制限」「割当て制限」および「使用」にアクセスするには、テナンシ管理者グループのメンバーであるか、LimitsAndUsageViewersを読み取るポリシーがグループに割り当てられている必要があります。

  6. 現在、OCI GPU.A10コンピュート・シェイプは、Oracle Linux、UbuntuおよびRocky Linuxをサポートしています。Windowsは、VMシェイプでのみサポートされています。

    ノート: Rocky Linuxは、NVIDIAでは公式にサポートされていません。

  7. OCIでコンピュート・インスタンスをプロビジョニングする場合は、標準のOSイメージを使用します。インストールされているNVIDIA GPUドライバは、NVIDIA vGPUドライバをインストールする必要があるRTX仮想ワークステーション(vWS)をサポートしていないため、GPU対応イメージを使用しないでください。

    Image2

タスク2: NVIDIA vGPUドライバのダウンロードとインストール

  1. NVIDIA vGPUソフトウェアのダウンロードの説明に従って、NVIDIA vGPUドライバをダウンロードします。NVIDIAのエンタープライズ・アカウントをお持ちでない場合は、仮想GPU (vGPU)ソフトウェア無料90Daysトライアル- NVIDIAでトライアルに登録できます。

  2. NVIDIA Enterpriseアカウントを使用してNVIDIA Enterprise Application HUBにログインします。

  3. NVIDIAライセンス・ポータルを開き、「ソフトウェアのダウンロード」を選択します。次のフィルタを適用します。

    • 製品ファミリ: VGPUと入力します。

    • プラットフォーム: Linux KVMと入力します。

    Image3

  4. リリース日でソートし、Linux KVMプラットフォームの最新のvGPUドライバ・バージョンを含むパッケージをダウンロードします。たとえば、現在、最新のvGPUバージョンは17.4です。

  5. ファイルを解凍し、Guest_Driversフォルダに移動します。WindowsおよびLinux用のvGPUドライバのインストール・ファイルがあります。

ノート: Linuxを使用している場合は、タスク3、4、5に従い、Windowsを使用している場合はタスク6に進みます。

タスク3: LinuxへのNVIDIA vGPUドライバのインストール

タスク4: NVIDIA vGPUドライバのインストールの確認

タスク5: NVIDIA RTX仮想ワークステーションの有効化

  1. NVIDIA RTX仮想ワークステーション機能を有効にするには、edit /etc/nvidia/gridd.confを更新します。

    sudo vi /etc/nvidia/gridd.conf
    
  2. 線を追加します。

    FeatureType=2
    
  3. 変更を保存します。

  4. GSPファームウェアが有効になっているかどうかを確認します。

    nvidia-smi -q | grep GSP
    
  5. GSPファームウェアが有効になっている場合、このコマンドはGSPファームウェアバージョンを表示します。

    GSP Firmware Version                  : 525.85.05
    
  6. GSPファームウェアが有効になっている場合は、NVIDIAモジュールパラメータ NVreg_EnableGpuFirmwareを0に設定して無効にします。このパラメータを設定するには、/etc/modprobe.d/nvidia.confファイルを編集します。/etc/modprobe.d/nvidia.confファイルが存在しない場合は作成します。

    sudo vi /etc/modprobe.d/nvidia.conf
    

    次の行を追加します(まだ行っていない場合)。

    options nvidia NVreg_EnableGpuFirmware=0
    
  7. GSPを無効にしたあと、サーバーをリブートする必要があります。

    sudo reboot
    
  8. NVIDIA Licensing PortalまたはDLSアプライアンスからクライアント構成トークンをダウンロードします。NVIDIA vGPUライセンスの登録方法の詳細は、タスク7: NVIDIA vGPUソフトウェア・ライセンス・サーバーへの登録を参照してください。

  9. クライアント構成トークンを/etc/nvidia/ClientConfigTokenのデフォルトの場所にコピーし、ファイル権限を744に設定します。

    sudo chmod 744 /etc/nvidia/ClientConfigToken/client_configuration_token_*.tok
    

    ノート:クライアント構成トークンをカスタムの場所に格納する場合は、作成したディレクトリにトークンをコピーし、このディレクトリを指すように/etc/nvidia/gridd.confClientConfigTokenPath構成パラメータを設定します。

  10. nvidia-griddサービスを再起動します。

    sudo systemctl restart nvidia-gridd
    
  11. nvidia-smi -qコマンドを実行して、「製品ブランド」「NVIDIA RTX」に設定され、「ライセンス・ステータス」「ライセンス済」が表示されていることを確認します。

    Image5

  12. ライセンスの取得に失敗し、「ライセンス・ステータス」「ライセンスなし」と表示されている場合は、nvidia-griddサービス・ログを確認します。

    sudo grep gridd /var/log/messages
    

タスク6: WindowsへのNVIDIA vGPUドライバのインストール

  1. ドライバをインストールするゲスト VMまたは物理ホストにNVIDIA Windowsドライバパッケージをコピーします。パッケージを実行してドライバインストーラを展開し、実行します。ライセンス契約に同意し、「簡易インストール」を選択します。

    Image6

  2. OCI A10 GPU VMはGPUパススルーで構成されているため、regeditを介してvGPUドライバの動作を設定する必要があります。詳細は、仮想GPUクライアント・ライセンス・ユーザー・ガイドを参照してください。

  3. FeatureType DWord (REG_DWORD)レジストリ値をWindowsレジストリ・キーに追加します。

    HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\nvlddmkm\Global\GridLicensing
    
  4. NVIDIA RTX Virtual Workstationライセンスを有効にするには、この値を2に設定します。

  5. NVIDIA Display Container LSサービスを再起動します。

  6. NVIDIA Licensing PortalまたはDLSアプライアンスからクライアント構成トークンをダウンロードします。NVIDIA vGPUライセンスの登録方法の詳細は、タスク7: NVIDIA vGPUソフトウェア・ライセンス・サーバーへの登録を参照してください。

  7. クライアント構成トークンをフォルダにコピーします。

    %SystemDrive%:\Program Files\NVIDIA Corporation\GRID Licensing\ClientConfigToken
    
  8. コマンドラインまたはPowerShellから、nvidia-smi -qコマンドを実行し、「製品ブランド」「NVIDIA RTX」に設定され、「ライセンス・ステータス」「ライセンス」が表示されていることを確認します。

    Image7

    ノート: Windowsでは、nvidia-smi.exeはデフォルトでC:\Program Files\NVIDIA Corporation\NVSMIフォルダにインストールされます。

  9. ライセンスの取得に失敗し、「ライセンス・ステータス」「ライセンスなし」と表示されている場合は、ログのライセンス・メッセージを確認します。

    %SystemDrive%\Users\Public\Documents\NvidiaLogging\Log.NVDisplay.Container.exe.log
    

タスク7: NVIDIA vGPUソフトウェア・ライセンス・サーバーへのvGPUSの登録

vGPUライセンスはNVIDIAソフトウェアを介して適用され、VMがライセンスを取得できない場合、仮想GPUのパフォーマンスは時間の経過とともに低下します。vGPUバージョン13.0以降、NVIDIAライセンス・システムでは、次のタイプのサービス・インスタンスがサポートされます。

NVIDIA Licensing PortalからDLS仮想アプライアンスをダウンロードできます。

  1. 「Software Downloads」に移動し、「Non-Driver downloads」を選択してダウンロードし、「Platform」を「Linux KVM」に設定し、「NLS License Server (DLS) ... for Linux KVM」の最新バージョンをダウンロードします。

    Image8

  2. ファイルを解凍し、DLS仮想アプライアンスのQCOW2ファイルをOCIオブジェクト・ストレージにアップロードします。その後、それを準仮想化カスタム・イメージとしてOCIにインポートし、そこからVMを作成できます。または、KVM環境でDLS仮想アプライアンスをいずれかのVMとして実行できます。

  3. vGPUライセンスがNVIDIA vGPUソフトウェア・ライセンス・サーバーに登録されると、nvidia-smi -qコマンドの出力で「ライセンス・ステータス」を確認することで確認できます。

承認

その他の学習リソース

docs.oracle.com/learnの他のラボを確認するか、Oracle Learning YouTubeチャネルで無料のラーニング・コンテンツにアクセスしてください。また、education.oracle.com/learning-explorerにアクセスしてOracle Learning Explorerになります。

製品ドキュメントは、Oracle Help Centerを参照してください。