Module d'extension GPU AMD

Lorsque vous activez l'extension de cluster de modules d'extension GPU AMD, vous pouvez transmettre les paires clé/valeur suivantes en tant qu'arguments.

Notez que pour vous assurer que les charges de travail exécutées sur les noeuds de processus actif de GPU AMD ne sont pas interrompues de manière inattendue, nous vous recommandons de choisir la version du module d'extension de GPU AMD à déployer, plutôt que d'indiquer que vous souhaitez qu'Oracle mette à jour le module automatiquement.

Arguments de configuration communs à tous les modules de cluster


Clé (API et CLI)	Nom d'affichage de la clé (console)	Description	Obligatoire/Facultatif	Valeur par défaut	Exemple de valeur
`affinity`	affinité	Groupe de règles de programmation d'affinité. Format JSON en texte brut ou encodé Base64. Non utilisé par: Opérateur GPU Nvidia Equivalents possibles : Repérage des fonctionnalités de noeud, utilisez `master.affinity` Opérateur réseau NVIDIA, utilisez `operator.affinity` Pilote CSI SMB, utilisez `contoller.affinity`	Facultatif	NULL	NULL
`nodeSelectors`	Sélecteurs de noeud	Vous pouvez utiliser des sélecteurs de noeud et des libellés de noeud pour contrôler les noeuds de processus actif sur lesquels les pods d'extension sont exécutés. Pour qu'un pod s'exécute sur un noeud, le sélecteur de noeud du pod doit avoir la même clé/valeur que l'étiquette du noeud. Définissez `nodeSelectors` sur une paire clé/valeur correspondant à la fois au sélecteur de noeud du pod et au libellé du noeud de processus actif. Format JSON en texte brut ou encodé Base64. Non utilisé par: Opérateur GPU NVIDIA Pilote CSI SMB Equivalents possibles : Repérage des fonctionnalités de noeud, utilisez `worker.nodeSelector` Opérateur réseau NVIDIA, utilisez `operator.nodeSelectors`	Facultatif	NULL	`{"foo":"bar", "foo2": "bar2"}` Le pod s'exécutera uniquement sur les noeuds possédant le libellé `foo=bar` ou `foo2=bar2`.
`numOfReplicas`	numOfReplicas	Nombre de répliques du déploiement de l'extension. Non utilisé par: Module d'extension GPU AMD Opérateur GPU NVIDIA Opérateur réseau NVIDIA Pilote CSI SMB Equivalents possibles : CoreDNS, utilisez `nodesPerReplica` Repérage des fonctionnalités de noeud, utilisez `master.replicaCount`	Requis	`1` Crée une réplique du déploiement d'extension par cluster.	`2` Crée deux répliques du déploiement d'extension par cluster.
`rollingUpdate`	rollingUpdate	Contrôle le comportement souhaité de la mise à jour non simultanée par maxSurge et maxUnavailable. Format JSON en texte brut ou encodé Base64. Non utilisé par: Repérage des fonctionnalités du noeud Opérateur réseau NVIDIA Pilote CSI SMB Equivalents possibles : Opérateur de GPU NVIDIA, utilisez `daemonsets.rollingUpdate.maxUnavailable`	Facultatif	NULL	NULL
`tolerations`	tolérances	Vous pouvez utiliser des tolérances et des taches pour contrôler les noeuds de processus actif sur lesquels les pods d'extension s'exécutent. Pour qu'un pod s'exécute sur un noeud présentant une entorse, le pod doit avoir une tolérance correspondante. Définissez `tolerations` sur une paire clé/valeur correspondant à la fois à la tolérance du pod et à la tache du noeud de processus actif. Format JSON en texte brut ou encodé Base64. Equivalents possibles : Repérage des fonctionnalités de noeud, utilisez `master.tolerations` et/ou `worker.tolerations` Opérateur de GPU NVIDIA, utilisez `daemonsets.tolerations` Opérateur réseau NVIDIA, utilisez `operator.tolerations` Pilote CSI SMB, utilisez `controller.tolerations`	Facultatif	NULL	`[{"key":"tolerationKeyFoo", "value":"tolerationValBar", "effect":"noSchedule", "operator":"exists"}]` Seuls les pods présentant cette tolérance peuvent être exécutés sur des noeuds de processus actif présentant la tache `tolerationKeyFoo=tolerationValBar:noSchedule`.
`topologySpreadConstraints`	topologySpreadConstraints	Comment répartir les pods correspondants entre la topologie donnée. Format JSON en texte brut ou encodé Base64. Non utilisé par: Repérage des fonctionnalités du noeud Opérateur GPU NVIDIA Opérateur réseau NVIDIA Pilote CSI SMB	Facultatif	NULL	NULL

Arguments de configuration propres à ce module complémentaire de cluster


Clé (API et CLI)	Nom d'affichage de la clé (console)	Description	Obligatoire/Facultatif	Valeur par défaut	Exemple de valeur
`amd-gpu-device-plugin.ContainerResources`	ressources de conteneur amd-gpu-device-plugin	Vous pouvez spécifier les quantités de ressources demandées par les conteneurs d'extension et définir les limites d'utilisation des ressources que les conteneurs d'extension ne peuvent pas dépasser. Format JSON en texte brut ou encodé Base64.	Facultatif	NULL	`{"limits": {"cpu": "500m", "memory": "200Mi" }, "requests": {"cpu": "100m", "memory": "100Mi"}}` Créez des conteneurs d'extension qui demandent 100 milllicores de CPU et 100 mégaoctets de mémoire. Limitez les conteneurs d'extension à 500 milllicores de CPU et 200 mégaoctets de mémoire.
`pulse`	Activer les vérifications de l'état	Intervalle (en secondes) entre la mise à jour du kubelet avec l'état d'intégrité du périphérique par le module d'extension. Définissez la valeur sur `0` pour désactiver la vérification de l'état.	Facultatif	`0`

Documentation Oracle Cloud Infrastructure

Module d'extension GPU AMD