Gestión de modelos importados (nuevo)
Además de utilizar los modelos previamente entrenados alojados en OCI Generative AI, puedes importar modelos de código abierto y de terceros compatibles (por ejemplo, desde Hugging Face) a OCI Generative AI, alojarlos, crear puntos finales y usarlos como cualquier otro modelo.
Requisitos previos para abrazar Face
Antes de importar un modelo directamente desde Hugging Face:
- Decida qué modelo admitido de Hugging Face importar y observe su tamaño de unidad de cluster de AI dedicado recomendado.
- Para acceder a algunos modelos y utilizarlos, necesita un token Hugging Face, especialmente las versiones más recientes y cerradas, como Llama 3 y Llama 3.1. Para estos modelos, genere un token de acceso desde la configuración de su cuenta Hugging Face en Tokens de acceso. Asegúrese de que tiene los permisos necesarios (al menos acceso de "lectura").
Requisitos de Object Storage
Antes de importar un modelo desde un cubo de Object Storage:
- Si no es un administrador de OCI, solicite a uno que le otorgue permiso de IAM para gestionar Object Storage en el compartimento:
allow group <your-group-name> to manage object-family in compartment <compartment-with-bucket> - Decida un modelo que funcione con el punto final
/v1/chat/completions: solo están soportados estos modelos. - Asegúrese de que el modelo solo soporta una de estas capacidades:
- TEXT_TO_TEXT: texto en, texto fuera
- IMAGE_TEXT_TO_TEXT: imagen o texto, o ambos,
- EMBEDDING: texto en incrustaciones de vectores
- RERANK: consulta y documentos candidatos, puntuaciones de relevancia y una lista ordenada.
- Guardar artefactos de modelo en un cubo de Object Storage.
- Importante: El archivo de configuración se debe llamar
config.jsonpara una importación correcta, similar a la mayoría de los modelos Hugging Face.
Solicitud de recursos y precios
Para acceder a un modelo importado, cree un punto final para ese modelo en un cluster de IA dedicado. Utilice la siguiente tabla para solicitar recursos de cluster de AI dedicados antes de importar un modelo.
| Tamaño de unidad de cluster de IA dedicado | Nombre de límite | Unidades necesarias de solicitud | Recuento de unidades de IA |
|---|---|---|---|
| A10_X1 | dedicated-unit-a10-count |
1 | 1,77 |
| A10_X2 | dedicated-unit-a10-count |
2 | 3,54 |
| A10_X4 | dedicated-unit-a10-count |
4 | 7,08 |
| A100_40G_X1 | dedicated-unit-a100-40g-count |
1 | 2,7 |
| A100_40G_X2 | dedicated-unit-a100-40g-count |
2 | 5,4 |
| A100_40G_X4 | dedicated-unit-a100-40g-count |
4 | 10,8 |
| A100_40G_X8 | dedicated-unit-a100-40g-count |
8 | 21,6 |
| A100_80G_X1 | dedicated-unit-a100-80g-count |
1 | 3,24 |
| A100_80G_X2 | dedicated-unit-a100-80g-count |
2 | 6,48 |
| A100_80G_X4 | dedicated-unit-a100-80g-count |
4 | 12,96 |
| A100_80G_X8 | dedicated-unit-a100-80g-count |
8 | 25,92 |
| H100_X1 | dedicated-unit-h100-count |
1 | 6,01 |
| H100_X2 | dedicated-unit-h100-count |
2 | 12,02 |
| H100_X4 | dedicated-unit-h100-count |
4 | 24,04 |
| H100_X8 | dedicated-unit-h100-count |
8 | 48,08 |
| H200_X1 | dedicated-unit-h200-count |
1 | 6,22 |
| H200_X2 | dedicated-unit-h200-count |
2 | 12,44 |
| H200_X4 | dedicated-unit-h200-count |
4 | 24,88 |
| H200_X8 | dedicated-unit-h200-count |
8 | 49,76 |
Para solicitar los recursos para el tamaño de unidad de cluster de AI dedicado recomendado, consulte requesting a resource limit.
Para calcular el precio, multiplique el precio de Unidad de IA por hora para Importación de modelo de Oracle Cloud Infrastructure Generative AI en la página Información de página de precios al recuento de unidades de IA en esta página.
Tareas para importar un modelo
- Importe el modelo mediante una de estas opciones:
- Cree un cluster de AI dedicado de alojamiento para el modelo importado con una unidad recomendada.
- Crear un punto final.
- Llama al modelo a través de la API de IA generativa de OCI, el SDK o utiliza el modelo en el patio.
Gestión de los modelos importados
Después de realizar los requisitos previos y de importar un modelo, puede realizar las siguientes tareas en los modelos importados: