Creación de un cluster de IA dedicado para alojar modelos
Crea un recurso de cluster de IA dedicado en OCI Generative AI para alojar puntos finales para modelos base preentrenados y modelos personalizados.
Importante
- No disponible bajo demanda: todos los modelos preentrenados fundamentales de OCI Generative AI soportados para el modo de servicio bajo demanda que utilizan las API de generación y resumen de texto (incluido el patio de recreo) ahora están retirados. Le recomendamos que utilice las modelos de chat en su lugar.
- Se puede alojar en clusters: si aloja un modelo de generación o resumen, como
cohere.command
, en un cluster de IA dedicado (modo de servicio dedicado), puede seguir utilizando ese modelo hasta que se reciba. Estos modelos, cuando se alojan en un cluster de IA dedicado, solo están disponibles en el medio oeste de EE. UU. (Chicago). Consulte Baja de los modelos para conocer las fechas y definiciones de baja.
- Nota
Los clusters tardan unos minutos en crearse. Después de que el cluster esté en estado activo, puede seleccionar ese cluster para alojar un modelo al crear un punto final para ese modelo. Utilice el comando dedicated-AI-cluster create y los parámetros necesarios para crear un cluster de AI dedicado:
oci generative-ai dedicated-ai-cluster create --compartment-id <compartment-OCID> --type HOSTING --unit-count [integer] --unit-shape [text] [OPTIONS]
Para obtener una lista completa de parámetros y valores para los comandos de la CLI, consulte la Referencia de comandos de la CLI.
Ejecute la operación CreateDedicatedAiCluster para crear un cluster dedicado.