Metamodelos soportados
Puede importar modelos de lenguaje grandes de cubos de Hugging Face y OCI Object Storage a OCI Generative AI, crear puntos finales para esos modelos y utilizarlos en el servicio Generative AI.
Estos modelos son una versión mejorada de los modelos Meta Llama con atención de consulta agrupada (GQA). Para obtener más información, consulte Llama 2, Llama 3, Llama 3.1, Llama 3.2, Llama 3.3, Llama 4 en la documentación de Hugging Face.
Meta Llama
Nota
- Para importar una versión ajustada de un modelo, solo se admiten los modelos ajustados que utilizan la misma versión de transformadores que el modelo original y tienen un recuento de parámetros dentro del ±10% del original.
- Si el tipo de instancia de la unidad recomendada no está disponible en la región, seleccione una instancia de nivel superior (por ejemplo, seleccione una unidad H100 en lugar de una unidad A100-80G).
- Para conocer los requisitos previos y cómo importar modelos, consulte Gestión de modelos importados (nuevos).