Límites de servicios para Generative AI

Obtén más información sobre los límites de los recursos de clústeres de IA dedicados en OCI Generative AI.

Por defecto, el número de clusters de IA dedicados que obtiene por arrendamiento es 0. Para conocer el nombre del cluster de IA dedicado para el que está solicitando un aumento, vaya a Offered Pretrained Foundational Models in Generative AI, seleccione una tarjeta modelo y consulte la sección sobre el cluster de IA dedicada para el modelo. Tenga en cuenta que los modelos (solo bajo demanda) no tienen una opción de cluster de IA dedicada.

Para los modelos importados, consulte Solicitud de recursos y precios.

Para solicitar clusters de AI dedicados para un arrendamiento, consulte Creación de una solicitud de aumento del límite.

Límites de proyecto

En un arrendamiento, puedes tener hasta 50 proyectos en OCI Generative AI.

Límites de aplicación

En la siguiente tabla, se muestran los límites de las aplicaciones de OCI Generative AI.

Límites de aplicación
Límite Valor por defecto Máximo Puede solicitar un aumento del límite de servicio Nombre de límite
Aplicaciones por arrendamiento 10 50 hosted-application-count
Artefactos por aplicación 20 50 artifacts-per-application-count
Opciones de almacenamiento gestionado por aplicación 3 3 No
Variables de entorno por aplicación 20 100 environment-variables-per-application-count
Número máximo de réplicas por aplicación 30 50 max-replicas-per-application-count
Proxies DNS PE/RCE por arrendamiento 3 10 pe-rce-dns-proxy-count
Sistemas de almacenamiento gestionados por tipo de almacenamiento por arrendamiento 3 10 managed-storage-per-type-count