Gestión de modelos importados (nuevo)

Además de utilizar los modelos previamente entrenados alojados en OCI Generative AI, puedes importar modelos de código abierto y de terceros compatibles (por ejemplo, desde Hugging Face) a OCI Generative AI, alojarlos, crear puntos finales y usarlos como cualquier otro modelo.

Requisitos previos para abrazar Face

Antes de importar un modelo directamente desde Hugging Face:

  • Decida qué modelo admitido de Hugging Face importar y observe su tamaño de unidad de cluster de AI dedicado recomendado.
  • Para acceder a algunos modelos y utilizarlos, necesita un token Hugging Face, especialmente las versiones más recientes y cerradas, como Llama 3 y Llama 3.1. Para estos modelos, genere un token de acceso desde la configuración de su cuenta Hugging Face en Tokens de acceso. Asegúrese de que tiene los permisos necesarios (al menos acceso de "lectura").

Requisitos de Object Storage

Antes de importar un modelo desde un cubo de Object Storage:

  • Si no es un administrador de OCI, solicite a uno que le otorgue permiso de IAM para gestionar Object Storage en el compartimento:
    allow group <your-group-name> to manage object-family in compartment <compartment-with-bucket>
                                
  • Decida un modelo que funcione con el punto final /v1/chat/completions: solo están soportados estos modelos.
  • Asegúrese de que el modelo solo soporta una de estas capacidades:
    • TEXT_TO_TEXT: texto en, texto fuera
    • IMAGE_TEXT_TO_TEXT: imagen o texto, o ambos,
    • EMBEDDING: texto en incrustaciones de vectores
    • RERANK: consulta y documentos candidatos, puntuaciones de relevancia y una lista ordenada.
  • Guardar artefactos de modelo en un cubo de Object Storage.
  • Importante: El archivo de configuración se debe llamar config.json para una importación correcta, similar a la mayoría de los modelos Hugging Face.

Solicitud de recursos y precios

Para acceder a un modelo importado, cree un punto final para ese modelo en un cluster de IA dedicado. Utilice la siguiente tabla para solicitar recursos de cluster de AI dedicados antes de importar un modelo.

Tamaños de unidades de cluster de IA dedicados para modelos importados
Tamaño de unidad de cluster de IA dedicado Nombre de límite Unidades necesarias de solicitud Recuento de unidades de IA
A10_X1 dedicated-unit-a10-count 1 1,77
A10_X2 dedicated-unit-a10-count 2 3,54
A10_X4 dedicated-unit-a10-count 4 7,08
A100_40G_X1 dedicated-unit-a100-40g-count 1 2,7
A100_40G_X2 dedicated-unit-a100-40g-count 2 5,4
A100_40G_X4 dedicated-unit-a100-40g-count 4 10,8
A100_40G_X8 dedicated-unit-a100-40g-count 8 21,6
A100_80G_X1 dedicated-unit-a100-80g-count 1 3,24
A100_80G_X2 dedicated-unit-a100-80g-count 2 6,48
A100_80G_X4 dedicated-unit-a100-80g-count 4 12,96
A100_80G_X8 dedicated-unit-a100-80g-count 8 25,92
H100_X1 dedicated-unit-h100-count 1 6,01
H100_X2 dedicated-unit-h100-count 2 12,02
H100_X4 dedicated-unit-h100-count 4 24,04
H100_X8 dedicated-unit-h100-count 8 48,08
H200_X1 dedicated-unit-h200-count 1 6,22
H200_X2 dedicated-unit-h200-count 2 12,44
H200_X4 dedicated-unit-h200-count 4 24,88
H200_X8 dedicated-unit-h200-count 8 49,76
Consejo

Para solicitar los recursos para el tamaño de unidad de cluster de AI dedicado recomendado, consulte requesting a resource limit.

Para calcular el precio, multiplique el precio de Unidad de IA por hora para Importación de modelo de Oracle Cloud Infrastructure Generative AI en la página Información de página de precios al recuento de unidades de IA en esta página.