Gestion des modules complémentaires de cluster OKE

Sur Private Cloud Appliance, les extensions de cluster sont des composants que vous pouvez choisir de déployer sur un cluster Kubernetes. Les modules complémentaires de cluster étendent les fonctionnalités de base de Kubernetes et améliorent les performances et la gestion des clusters. Cette section explique comment installer et gérer les modules pris en charge suivants.

  • L'extension d'opérateur Kubernetes WebLogic, qui prend en charge l'exécution des domaines d'appliance WebLogic Server et Fusion Middleware sur Kubernetes. Pour plus d'informations sur l'opérateur Kubernetes WebLogic, reportez-vous à la documentation publique à l'adresse https://github.com/oracle/weblogic-kubernetes-operator.

  • Le module complémentaire Database Operator for Kubernetes (OraOperator) aide les développeurs, les administrateurs de base de données, les équipes DevOps et GitOps à réduire le temps et la complexité du déploiement et de la gestion des bases de données Oracle. Pour plus d'informations, reportez-vous à la documentation publique sur le site https://github.com/oracle/oracle-database-operator/tree/main. Pour obtenir des instructions sur le déploiement et la configuration de l'extension, nous vous recommandons ce document de solution : Déploiement d'Oracle Database Operator Cluster Add-on for Oracle Kubernetes Engine (OKE).

  • Le module d'extension de GPU NVIDIA est un moyen pratique de gérer le module d'extension de périphérique NVIDIA pour Kubernetes. Le module d'extension de périphérique NVIDIA pour Kubernetes est l'implémentation NVIDIA de la structure de module d'extension de périphérique Kubernetes pour exposer le nombre de GPU NVIDIA sur chaque noeud de processus actif et suivre l'état de ces GPU. Pour plus d'informations sur le module d'extension de périphérique NVIDIA pour Kubernetes, reportez-vous à https://github.com/NVIDIA/k8s-device-plugin.
  • L'extension facultative de gestionnaire de certificats, également appelée gestionnaire de certificats, ajoute les certificats et les émetteurs de certificats aux clusters Kubernetes en tant que types de ressource. Le gestionnaire de certificats simplifie également le processus d'obtention, d'utilisation et de renouvellement de ces certificats. Pour plus d'informations, reportez-vous à https://github.com/cert-manager/cert-manager.

Prérequis du module

Vérifiez les conditions suivantes avant d'installer les modules complémentaires.

Module complémentaire Oracle Database Operator

  • L'opérateur de base de données ne peut être activé que sur un cluster existant.

  • Le module complémentaire Certificate Manager doit être installé, activé et dans l'état ACTIVE pour que vous puissiez utiliser le module complémentaire Database Operator. Reportez-vous à Installation d'une extension pour un cluster existant.

Module complémentaire Nvidia GPU Plugin

  • Pour le cluster et le pool de noeuds, Kubernetes version 1.29.14 ou supérieure est requis
  • Activez le module d'extension GPU Nvidia avant de créer un pool de noeuds GPU.
  • Une fois qu'un pool de noeuds est créé en tant que GPU ou non-GPU, son type ne peut pas être changé.

  • Utilisez l'image de base requise pour votre cas d'emploi.

    Image de base

    Cas d'emploi

    nvcr.io/nvidia/cuda:12.9.0-runtime-ubi9 ou équivalent en tant qu'environnement d'exécution

    Déploiement d'une application d'IA prédéfinie

    nvcr.io/nvidia/cuda:12.9.0-devel-ubi9 ou équivalent en tant qu'environnement de développement

    Développer, compiler ou entraîner l'IA avec du code CUDA/C++ natif.

  • Tous les noeuds de processus actif ont une taille de volume de blocs par défaut de 50 Go. Cependant, les applications GPU utilisées avec l'image de base requise peuvent manquer d'espace disque. Veillez à utiliser la demande de volume persistant dans les applications GPU.

  • Pour éviter toute planification involontaire, les noeuds GPU sont endommagés par défaut. Sans cette entorse, tout pod peut être programmé sur un noeud de GPU, même s'il n'a pas besoin de GPU. Cela signifie que seuls les pods qui demandent explicitement des ressources GPU et tolèrent la tache sont programmés sur les noeuds GPU.

  • Pour garantir que les pods de module d'extension de périphérique NVIDIA sont planifiés et exécutés uniquement sur les noeuds qui possèdent du matériel GPU NVIDIA, les noeuds GPU sont étiquetés par défaut. Le contrôleur OKE étiquette les noeuds GPU avec le libellé de noeud suivant "nvidia.com/gpu": "true".

WebLogic Extension d'opérateur Kubernetes

Reportez-vous à Déploiement de l'extension d'opérateur Kubernetes WebLogic.