ノート:
- このチュートリアルでは、Oracle Cloudへのアクセスが必要です。無料アカウントにサインアップするには、Oracle Cloud Infrastructure Free Tierの開始を参照してください。
- Oracle Cloud Infrastructureの資格証明、テナンシおよびコンパートメントの値の例を使用します。演習を完了するときに、これらの値をクラウド環境に固有の値に置き換えます。
Oracle Cloud InfrastructureへのNVIDIA RTX仮想ワークステーションの導入
イントロダクション
NVIDIA RTX仮想ワークステーション・ソフトウェアを使用すると、ユーザーは、高パフォーマンスのシミュレーション、グラフィック・レンダリング、およびネイティブのワークステーションのようなパフォーマンスでクラウド上のワークロードの設計を実行できます。OpenGLやDirectXなどのグラフィックAPIによって提供される強力なレンダリング機能をロック解除し、画期的なグラフィック・パフォーマンスをクラウドにもたらします。
目標
- Oracle Cloud Infrastructure(OCI)上のNVIDIA A10 GPU対応コンピュート・シェイプを使用して、RTXおよびNVIDIA仮想GPUテクノロジを活用します。
タスク1: OCIでのNVIDIA RTX仮想ワークステーション用のコンピュート・インスタンスのプロビジョニング
-
Virtual Cloud Network (VCN)を作成し、OCIでコンピュート・インスタンスを起動します。詳細は、VCNの作成およびコンピュート・インスタンスの起動を参照してください。
-
使用可能なGPU.A10シェイプから1つ選択します。
VM.GPU.A10.1 VM.GPU.A10.2 BM.GPU.A10.4
-
コンピュート・インスタンスの起動時に、前述のシェイプのいずれかにシェイプを変更します。GPU.A10 VMを起動するには、「専門と前世代」をクリックし、VM.GPU.A10シェイプのいずれかを選択します。ベア・メタル・サーバーの場合は、「ベア・メタル・マシン」をクリックし、「BM.GPU.A10.4」シェイプを選択します。
-
テナンシにGPU.A10のサービス制限が設定されていない場合、これらのシェイプはシェイプ・リストに含まれません。
-
OCIコンソールでテナンシ制限を確認するには、GPU.A10コンピュート・インスタンスをプロビジョニングするリージョンを設定し、ナビゲーション・メニューを開いて「ガバナンスと管理」をクリックします。
-
「テナント管理」で、「制限、割当ておよび使用状況」を選択します。
-
サービスを「コンピュート」に設定し、「スコープ」でいずれかの可用性ドメインを選択し、「リソース」にGPU.A10と入力します。
-
A10ベースのVMおよびBMインスタンスのGPUを選択します。
-
-
コンピュート制限はアベイラビリティ・ドメインごとです。リージョンのいずれかの可用性ドメインに制限が設定されているかどうかを確認します。すべての可用性ドメインでサービス制限が0に設定されている場合は、「サービス制限引上げのリクエスト」をクリックし、このリソースに対する制限引上げリクエストを送信します。サービス制限の詳細は、サービス制限を参照してください。
ノート: 「制限」、「割当て制限」および「使用」にアクセスするには、テナンシ管理者グループのメンバーであるか、LimitsAndUsageViewersを読み取るポリシーがグループに割り当てられている必要があります。
-
現在、OCI GPU.A10コンピュート・シェイプは、Oracle Linux、UbuntuおよびRocky Linuxをサポートしています。Windowsは、VMシェイプでのみサポートされています。
ノート: Rocky Linuxは、NVIDIAでは公式にサポートされていません。
-
OCIでコンピュート・インスタンスをプロビジョニングする場合は、標準のOSイメージを使用します。インストールされているNVIDIA GPUドライバは、NVIDIA vGPUドライバをインストールする必要があるRTX仮想ワークステーション(vWS)をサポートしていないため、GPU対応イメージを使用しないでください。
タスク2: NVIDIA vGPUドライバのダウンロードとインストール
-
NVIDIA vGPUソフトウェアのダウンロードの説明に従って、NVIDIA vGPUドライバをダウンロードします。NVIDIAのエンタープライズ・アカウントをお持ちでない場合は、仮想GPU (vGPU)ソフトウェア無料90Daysトライアル- NVIDIAでトライアルに登録できます。
-
NVIDIA Enterpriseアカウントを使用してNVIDIA Enterprise Application HUBにログインします。
-
NVIDIAライセンス・ポータルを開き、「ソフトウェアのダウンロード」を選択します。次のフィルタを適用します。
-
製品ファミリ: VGPUと入力します。
-
プラットフォーム: Linux KVMと入力します。
-
-
リリース日でソートし、Linux KVMプラットフォームの最新のvGPUドライバ・バージョンを含むパッケージをダウンロードします。たとえば、現在、最新のvGPUバージョンは17.4です。
-
ファイルを解凍し、
Guest_Drivers
フォルダに移動します。WindowsおよびLinux用のvGPUドライバのインストール・ファイルがあります。
ノート: Linuxを使用している場合は、タスク3、4、5に従い、Windowsを使用している場合はタスク6に進みます。
タスク3: LinuxへのNVIDIA vGPUドライバのインストール
-
Oracle Linux 8
-
NVIDIA Linuxドライバ
NVIDIA-Linux-x86_64-xxx.xx.xx-grid.run
をプロビジョニングされたコンピュート・インスタンスにコピーします。 -
NVIDIAドライバをインストールする前に、次のコマンドを実行して、
gcc-12
ツールセットをインストールして有効にします。sudo dnf install gcc-toolset-12 scl enable gcc-toolset-12 bash
-
また、NVIDIAドライバと競合する
nouveau
ドライバを無効にする必要があります。次のコマンドを実行して、nouveau
ドライバがロードされているかどうかを確認します。lsmod | grep nouveau
-
コマンドの出力に
nouveau
ドライバが表示されている場合は、最初に無効にする必要があります。Oracle Linuxでnouveau
ドライバを無効にするには、/etc/modprobe.d/blacklist-nouveau.conf
ファイルを作成し、次の内容を追加します。blacklist nouveau options nouveau modeset=0
-
ファイルを保存し、initramfsを再生成します。
sudo dracut --force
-
ドライバを無効にしたあと、サーバーをリブートします。
sudo reboot
-
次のコマンドを実行して、NVIDIA vGPUドライバをインストールします。
sudo bash ./NVIDIA-Linux-x86_64-xxx.xxx.xx-grid.run
-
警告を無視して「OK」をクリックし、インストールを続行してください。サーバーを再起動します。
sudo reboot
-
-
Oracle Linux 9
-
NVIDIA Linuxドライバ
NVIDIA-Linux-x86_64-xxx.xx.xx-grid.run
をプロビジョニングされたコンピュート・インスタンスにコピーします。 -
また、NVIDIAドライバと競合する
nouveau
ドライバを無効にする必要があります。次を実行して、nouveau
ドライバがロードされているかどうかを確認します。lsmod | grep nouveau
-
コマンドの出力に
nouveau
ドライバが表示されている場合は、最初に無効にする必要があります。Oracle Linuxでnouveau
ドライバを無効にするには、/etc/modprobe.d/blacklist-nouveau.conf
ファイルを作成し、次の内容を追加します。blacklist nouveau options nouveau modeset=0
-
ファイルを保存し、initramfsを再生成します。
sudo dracut --force
-
ドライバを無効にしたあと、サーバーをリブートします。
sudo reboot
-
NVIDIA vGPUドライバをインストールするには、次を実行します。
sudo bash ./NVIDIA-Linux-x86_64-xxx.xxx.xx-grid.run
-
警告を無視して「OK」をクリックし、インストールを続行してください。サーバーを再起動します。
sudo reboot
-
-
ロッキーLinux 9
-
NVIDIA Linuxドライバ
NVIDIA-Linux-x86_64-xxx.xx.xx-grid.run
をプロビジョニングされたコンピュート・インスタンスにコピーします。 -
Linuxカーネルのバージョンと一致するLinuxヘッダーをインストールします。
sudo dnf install kernel-devel-$(uname -r)
-
カーネルバージョンに一致する Linuxヘッダーが見つからない場合は、Linuxカーネルをアップグレードし、サーバーをリブートします。
sudo dnf install kernel sudo reboot
再起動後、Linuxカーネルのバージョンと一致するようにLinuxヘッダーを再インストールします。
sudo dnf install kernel-devel-$(uname -r)
-
次のコマンドを実行して、
nouveau
ドライバがロードされているかどうかを確認します。lsmod | grep nouveau
-
コマンドの出力に
nouveau
ドライバが表示されている場合は、最初に無効にする必要があります。Oracle Linuxでnouveau
ドライバを無効にするには、/etc/modprobe.d/blacklist-nouveau.conf
ファイルを作成し、次の内容を追加します。blacklist nouveau options nouveau modeset=0
-
ファイルを保存し、initramfsを再生成します。
sudo dracut --force
-
ドライバを無効にしたあと、サーバーをリブートします。
sudo reboot
-
次のコマンドを実行して、NVIDIA vGPUドライバをインストールします。
sudo bash ./NVIDIA-Linux-x86_64-xxx.xxx.xx-grid.run
-
警告を無視して「OK」をクリックし、インストールを続行してください。サーバーを再起動します。
sudo reboot
-
-
Ubuntu 22
-
NVIDIA Linuxドライバ
NVIDIA-Linux-grid-xxx.xx.xx_amd64.deb
をプロビジョニングされたコンピュート・インスタンスにコピーします。 -
次のコマンドを実行して、
nouveau
ドライバがロードされているかどうかを確認します。lsmod | grep nouveau
-
コマンドの出力に
nouveau
ドライバが表示されている場合は、最初に無効にする必要があります。Oracle Linuxでnouveau
ドライバを無効にするには、/etc/modprobe.d/blacklist-nouveau.conf
ファイルを作成し、次の内容を追加します。blacklist nouveau options nouveau modeset=0
-
ファイルを保存し、initramfsを再生成します。
sudo dracut --force
-
ドライバを無効にしたあと、サーバーをリブートします。
sudo reboot
-
次のコマンドを実行して、NVIDIA vGPUドライバをインストールします。
sudo apt install ./NVIDIA-Linux-grid-xxx.xxx.xx_amd64.deb
-
サーバーを再起動します。
sudo reboot
-
タスク4: NVIDIA vGPUドライバのインストールの確認
-
nvidia-smi
コマンドを実行して、NVIDIA vGPUドライバのインストールを確認します。
タスク5: NVIDIA RTX仮想ワークステーションの有効化
-
NVIDIA RTX仮想ワークステーション機能を有効にするには、
edit /etc/nvidia/gridd.conf
を更新します。sudo vi /etc/nvidia/gridd.conf
-
線を追加します。
FeatureType=2
-
変更を保存します。
-
GSPファームウェアが有効になっているかどうかを確認します。
nvidia-smi -q | grep GSP
-
GSPファームウェアが有効になっている場合、このコマンドはGSPファームウェアバージョンを表示します。
GSP Firmware Version : 525.85.05
-
GSPファームウェアが有効になっている場合は、NVIDIAモジュールパラメータ
NVreg_EnableGpuFirmware
を0に設定して無効にします。このパラメータを設定するには、/etc/modprobe.d/nvidia.conf
ファイルを編集します。/etc/modprobe.d/nvidia.conf
ファイルが存在しない場合は作成します。sudo vi /etc/modprobe.d/nvidia.conf
次の行を追加します(まだ行っていない場合)。
options nvidia NVreg_EnableGpuFirmware=0
-
GSPを無効にしたあと、サーバーをリブートする必要があります。
sudo reboot
-
NVIDIA Licensing PortalまたはDLSアプライアンスからクライアント構成トークンをダウンロードします。NVIDIA vGPUライセンスの登録方法の詳細は、タスク7: NVIDIA vGPUソフトウェア・ライセンス・サーバーへの登録を参照してください。
-
クライアント構成トークンを
/etc/nvidia/ClientConfigToken
のデフォルトの場所にコピーし、ファイル権限を744に設定します。sudo chmod 744 /etc/nvidia/ClientConfigToken/client_configuration_token_*.tok
ノート:クライアント構成トークンをカスタムの場所に格納する場合は、作成したディレクトリにトークンをコピーし、このディレクトリを指すように
/etc/nvidia/gridd.conf
のClientConfigTokenPath
構成パラメータを設定します。 -
nvidia-gridd
サービスを再起動します。sudo systemctl restart nvidia-gridd
-
nvidia-smi -q
コマンドを実行して、「製品ブランド」が「NVIDIA RTX」に設定され、「ライセンス・ステータス」に「ライセンス済」が表示されていることを確認します。 -
ライセンスの取得に失敗し、「ライセンス・ステータス」が「ライセンスなし」と表示されている場合は、nvidia-griddサービス・ログを確認します。
sudo grep gridd /var/log/messages
タスク6: WindowsへのNVIDIA vGPUドライバのインストール
-
ドライバをインストールするゲスト VMまたは物理ホストにNVIDIA Windowsドライバパッケージをコピーします。パッケージを実行してドライバインストーラを展開し、実行します。ライセンス契約に同意し、「簡易インストール」を選択します。
-
OCI A10 GPU VMはGPUパススルーで構成されているため、regeditを介してvGPUドライバの動作を設定する必要があります。詳細は、仮想GPUクライアント・ライセンス・ユーザー・ガイドを参照してください。
-
FeatureType DWord (REG_DWORD)
レジストリ値をWindowsレジストリ・キーに追加します。HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\nvlddmkm\Global\GridLicensing
-
NVIDIA RTX Virtual Workstationライセンスを有効にするには、この値を2に設定します。
-
NVIDIA Display Container LSサービスを再起動します。
-
NVIDIA Licensing PortalまたはDLSアプライアンスからクライアント構成トークンをダウンロードします。NVIDIA vGPUライセンスの登録方法の詳細は、タスク7: NVIDIA vGPUソフトウェア・ライセンス・サーバーへの登録を参照してください。
-
クライアント構成トークンをフォルダにコピーします。
%SystemDrive%:\Program Files\NVIDIA Corporation\GRID Licensing\ClientConfigToken
-
コマンドラインまたはPowerShellから、
nvidia-smi -q
コマンドを実行し、「製品ブランド」が「NVIDIA RTX」に設定され、「ライセンス・ステータス」に「ライセンス」が表示されていることを確認します。ノート: Windowsでは、
nvidia-smi.exe
はデフォルトでC:\Program Files\NVIDIA Corporation\NVSMI
フォルダにインストールされます。 -
ライセンスの取得に失敗し、「ライセンス・ステータス」が「ライセンスなし」と表示されている場合は、ログのライセンス・メッセージを確認します。
%SystemDrive%\Users\Public\Documents\NvidiaLogging\Log.NVDisplay.Container.exe.log
タスク7: NVIDIA vGPUソフトウェア・ライセンス・サーバーへのvGPUSの登録
vGPUライセンスはNVIDIAソフトウェアを介して適用され、VMがライセンスを取得できない場合、仮想GPUのパフォーマンスは時間の経過とともに低下します。vGPUバージョン13.0以降、NVIDIAライセンス・システムでは、次のタイプのサービス・インスタンスがサポートされます。
-
クラウド・ライセンス・サービス(CLS)インスタンス: CLSインスタンスはNVIDIAライセンス・ポータルでホストされます。
-
委任ライセンス・サービス(DLS)インスタンス: DLSインスタンスは、プライベート・ネットワークからアクセス可能な場所でオンプレミスでホストされます。
NVIDIA Licensing PortalからDLS仮想アプライアンスをダウンロードできます。
-
「Software Downloads」に移動し、「Non-Driver downloads」を選択してダウンロードし、「Platform」を「Linux KVM」に設定し、「NLS License Server (DLS) ... for Linux KVM」の最新バージョンをダウンロードします。
-
ファイルを解凍し、DLS仮想アプライアンスのQCOW2ファイルをOCIオブジェクト・ストレージにアップロードします。その後、それを準仮想化カスタム・イメージとしてOCIにインポートし、そこからVMを作成できます。または、KVM環境でDLS仮想アプライアンスをいずれかのVMとして実行できます。
- NVIDIA vGPUライセンスの取得および登録方法とDLSライセンス・サーバーの構成方法の詳細は、NVIDIAライセンス・システム・ユーザー・ガイドおよびNVIDIAライセンス・システム・クイック・スタート・ガイドを参照してください。
-
vGPUライセンスがNVIDIA vGPUソフトウェア・ライセンス・サーバーに登録されると、
nvidia-smi -q
コマンドの出力で「ライセンス・ステータス」を確認することで確認できます。
関連リンク
承認
- 著者 - Michael Prestin (マスター・プリンシパル・クラウド・アーキテクト)
その他の学習リソース
docs.oracle.com/learnの他のラボを確認するか、Oracle Learning YouTubeチャネルで無料のラーニング・コンテンツにアクセスしてください。また、education.oracle.com/learning-explorerにアクセスしてOracle Learning Explorerになります。
製品ドキュメントは、Oracle Help Centerを参照してください。
Deploy NVIDIA RTX Virtual Workstation on Oracle Cloud Infrastructure
F80548-04
November 2024