AMD GPUプラグイン

AMD GPUプラグイン・クラスタ・アドオンを有効にすると、次のキー/値ペアを引数として渡すことができます。

AMD GPUワーカー・ノードで実行されているワークロードが予期せず中断されないようにするために、Oracleでアドオンを自動的に更新するように指定するのではなく、デプロイするAMD GPUプラグイン・アドオンのバージョンを選択することをお薦めします。

すべてのクラスタ・アドオンに共通の構成引数
キー(APIおよびCLI) キーの表示名(コンソール) 説明 必須/オプション デフォルト値 値の例
affinity affinity

アフィニティ・スケジューリング・ルールのグループ。

プレーン・テキストまたはBase64エンコードされたJSON形式。

オプション null null
nodeSelectors ノード・セレクター

ノード・セレクタおよびノード・ラベルを使用して、アドオン・ポッドが実行されるワーカー・ノードを制御できます。

ポッドをノードで実行するには、ポッドのノード・セレクタのキー/値がノードのラベルと同じである必要があります。

nodeSelectorsを、ポッドのノード・セレクタとワーカー・ノードのラベルの両方と一致するキー/値のペアに設定します。

プレーン・テキストまたはBase64エンコードされたJSON形式。

オプション null {"foo":"bar", "foo2": "bar2"}

ポッドは、foo=barまたはfoo2=bar2ラベルを持つノードでのみ実行されます。

numOfReplicas numOfReplicas アドオン・デプロイメントのレプリカの数。

AMD GPUプラグインの場合、使用されません。

CoreDNSの場合は、かわりにnodesPerReplicaを使用します。

必須 1

クラスタごとにアドオン・デプロイメントのレプリカを1つ作成します。

2

クラスタごとにアドオン・デプロイメントのレプリカを2つ作成します。

rollingUpdate rollingUpdate

maxSurgeおよびmaxUnavailableによるローリング更新の望ましい動作を制御します。

プレーン・テキストまたはBase64エンコードされたJSON形式。

オプション null null
tolerations 許容範囲

taintおよびtolerationsを使用して、アドオン・ポッドが実行されるワーカー・ノードを制御できます。

taintがあるノード上でポッドを実行するには、ポッドに対応する許容範囲が必要です。

tolerationsを、ポッドの許容範囲とワーカー・ノードのtaintの両方と一致するキー/値のペアに設定します。

プレーン・テキストまたはBase64エンコードされたJSON形式。

オプション null [{"key":"tolerationKeyFoo", "value":"tolerationValBar", "effect":"noSchedule", "operator":"exists"}]

この許容値を持つポッドのみが、tolerationKeyFoo=tolerationValBar:noSchedule taintを持つワーカー・ノードで実行できます。

topologySpreadConstraints topologySpreadConstraints

指定されたトポロジ間で一致するポッドを分散する方法。

プレーン・テキストまたはBase64エンコードされたJSON形式。

オプション null null
このクラスタ・アドオンに固有の構成引数
キー(APIおよびCLI) キーの表示名(コンソール) 説明 必須/オプション デフォルト値 値の例
amd-gpu-device-plugin.ContainerResources amd-gpu-device-pluginコンテナリソース

アドオン・コンテナがリクエストするリソース数量を指定し、アドオン・コンテナが超過できないリソース使用量制限を設定できます。

プレーン・テキストまたはBase64エンコードされたJSON形式。

オプション null {"limits": {"cpu": "500m", "memory": "200Mi" }, "requests": {"cpu": "100m", "memory": "100Mi"}}

100ミリコアのCPUと100メガバイトのメモリーをリクエストするアドオン・コンテナを作成します。アドオンコンテナを500ミリコアのCPUと200メビバイトのメモリーに制限します。

pulse ヘルス・チェックの有効化

プラグインがデバイス・ヘルス・ステータスでkubeletを更新する時間間隔(秒)。

ヘルス・チェックを無効にするには、0に設定します。

オプション 0