Gestión de complementos del cluster de OKE

En Private Cloud Appliance, los complementos de cluster son componentes que puede elegir desplegar en un cluster de Kubernetes. Los complementos de clúster amplían las funcionalidades principales de Kubernetes y mejoran la capacidad para gestionar y mejorar el rendimiento de clúster. En esta sección se describe cómo instalar y gestionar los siguientes complementos compatibles.

  • Complemento de operador de Kubernetes WebLogic, que soporta la ejecución de dominios del servidor WebLogic y del dispositivo Fusion Middleware en Kubernetes. Para obtener más información sobre el operador de Kubernetes WebLogic, consulte la documentación pública en https://github.com/oracle/weblogic-kubernetes-operator.

  • El complemento Database Operator for Kubernetes (OraOperator) ayuda a desarrolladores, administradores de bases de datos, equipos DevOps y GitOps a reducir el tiempo y la complejidad de desplegar y gestionar bases de datos Oracle. Para obtener más información, consulte la documentación pública en https://github.com/oracle/oracle-database-operator/tree/main. Para obtener información sobre cómo desplegar y configurar el complemento, recomendamos este documento de la solución: Despliegue del complemento de cluster de Oracle Database Operator para Oracle Kubernetes Engine (OKE).

  • El complemento NVIDIA GPU Plugin es una forma práctica de gestionar el plugin de dispositivos NVIDIA para Kubernetes. El plugin de dispositivos NVIDIA para Kubernetes es la implementación de NVIDIA del marco de plugins de dispositivos de Kubernetes para exponer el número de GPU NVIDIA en cada nodo de trabajador y realizar un seguimiento del estado de esas GPU. Para obtener más información sobre el plugin de dispositivos NVIDIA para Kubernetes, consulte https://github.com/NVIDIA/k8s-device-plugin.
  • El complemento opcional de Certificate Manager, también conocido como cert-manager, agrega certificados y emisores de certificados a los clusters de Kubernetes como tipos de recursos. El gestor de certificados también simplifica el proceso de obtención, uso y renovación de dichos certificados. Para obtener más información, consulte https://github.com/cert-manager/cert-manager.

Requisitos previos del complemento

Revisa los siguientes requisitos antes de instalar los complementos.

Complemento del operador de Oracle Database

  • El operador de base de datos solo se puede activar en un cluster existente.

  • El complemento Certificate Manager debe estar instalado, activado y en el estado ACTIVE antes de poder utilizar el complemento Database Operator. Consulte Instalación de un complemento para un cluster existente.

Complemento de plugin de GPU Nvidia

  • Para el cluster y el pool de nodos, se necesita la versión 1.29.14 o superior de Kubernetes
  • Active el plugin de GPU de Nvidia antes de crear un pool de nodos de GPU.
  • Una vez que se crea un pool de nodos como GPU o no GPU, no se puede cambiar su tipo.

  • Utilice la imagen base necesaria adecuada para su caso de uso.

    Imagen Base

    Caso de uso

    nvcr.io/nvidia/cuda:12.9.0-runtime-ubi9 o igual que un entorno de tiempo de ejecución

    Despliegue de una aplicación de IA predefinida

    nvcr.io/nvidia/cuda:12.9.0-devel-ubi9 o igual que un entorno de desarrollo

    Desarrollar, compilar o entrenar IA con código CUDA/C++ nativo.

  • Todos los nodos de trabajador vienen con un tamaño de volumen en bloque por defecto de 50 GB; sin embargo, las aplicaciones de GPU cuando se utilizan con la imagen base necesaria pueden quedarse sin espacio en disco. Asegúrese de usar Solicitud de volumen persistente en las aplicaciones de GPU.

  • Para evitar la programación no deseada, los nodos de GPU están contaminados por defecto. Sin esta mancha, cualquier pod podría programarse en un nodo de GPU, incluso si no necesita una GPU. Esto significa que solo los pods que solicitan explícitamente recursos de GPU y toleran el mantenimiento se programan en nodos de GPU.

  • Para garantizar que los pods de conexión de dispositivos de NVIDIA estén programados y se ejecuten solo en nodos que posean hardware de GPU de NVIDIA, los nodos de GPU están etiquetados por defecto. El controlador de OKE etiqueta los nodos de GPU con la siguiente etiqueta de nodo "nvidia.com/gpu": "true".

WebLogic Complemento del operador de Kubernetes

Consulte Despliegue del complemento de operador de Kubernetes WebLogic.