Gerenciando Modelos Importados
Além de usar os modelos pré-treinados hospedados na OCI Generative AI, você pode importar modelos de código aberto e de terceiros validados (por exemplo, do Hugging Face) para a OCI Generative AI, hospedá-los, criar pontos finais e usá-los como qualquer outro modelo.
Saiba mais sobre Modelos Compatíveis para Importação.
Abraçando Pré-requisitos de Rosto
Antes de importar um modelo diretamente do Hugging Face:
- Decida qual modelo validado do Hugging Face importar e anote seu tamanho de unidade de cluster de IA dedicado recomendado.
- Para acessar e usar alguns modelos, você precisa de um token do Hugging Face, especialmente as versões mais recentes e fechadas, como Llama 3 e Llama 3.1 Para esses modelos, gere um token de acesso nas configurações da sua conta do Hugging Face em Tokens de Acesso. Certifique-se de que ele tenha as permissões necessárias (pelo menos acesso "read").
Pré-requisitos do Serviço Object Storage
Antes de importar um modelo de um bucket do serviço Object Storage:
- Se você não for um administrador do OCI, peça a um para conceder a você permissão do IAM para gerenciar o Object Storage em seu compartimento:
allow group <your-group-name> to manage object-family in compartment <compartment-with-bucket> - Decida um modelo que funcione com o ponto final
/v1/chat/completions— somente esses modelos são suportados. - Certifique-se de que o modelo suporte apenas um destes recursos:
- TEXT_TO_TEXT: entrada de texto, saída de texto
- IMAGE_TEXT_TO_TEXT: imagem, texto interno ou ambos, texto externo
- EMBOLSO: entrada de texto, incorporações de vetor
- RERANK: consulta e documentos do candidato, pontuações de relevância e uma lista reordenada
- Salve artefatos de modelo em um bucket do Object Storage.
- Importante: O arquivo de configuração deve ser chamado
config.jsonpara uma importação bem-sucedida, semelhante à maioria dos modelos Hugging Face.
Solicitação de recursos e preços
Para acessar um modelo importado, crie um ponto final para esse modelo em um cluster de IA dedicado.
Os modelos importados não exigem um compromisso de hospedagem de 744 horas por unidade. Se você criar um cluster de IA dedicado para hospedar um modelo importado, poderá hospedar o modelo sem se comprometer com o compromisso mínimo de hospedagem que se aplica aos modelos pré-treinados e ajustados do OCI Generative AI.
Use a tabela a seguir para solicitar recursos de cluster de IA dedicados antes de importar um modelo.
| Tamanho da Unidade do Cluster de IA Dedicado | Nome do Limite | Unidades Necessárias de Solicitação | Contagem de Unidades de IA |
|---|---|---|---|
| A10_X1 | dedicated-unit-a10-count |
1 | 1,77 |
| A10_X2 | dedicated-unit-a10-count |
2 | 3,54 |
| A10_X4 | dedicated-unit-a10-count |
4 | 7,08 |
| A100_40G_X1 | dedicated-unit-a100-40g-count |
1 | 2,7 |
| A100_40G_X2 | dedicated-unit-a100-40g-count |
2 | 5,4 |
| A100_40G_X4 | dedicated-unit-a100-40g-count |
4 | 10,8 |
| A100_40G_X8 | dedicated-unit-a100-40g-count |
8 | 21,6 |
| A100_80G_X1 | dedicated-unit-a100-80g-count |
1 | 3,24 |
| A100_80G_X2 | dedicated-unit-a100-80g-count |
2 | 6,48 |
| A100_80G_X4 | dedicated-unit-a100-80g-count |
4 | 12,96 |
| A100_80G_X8 | dedicated-unit-a100-80g-count |
8 | 25,92 |
| H100_X1 | dedicated-unit-h100-count |
1 | 6,01 |
| H100_X2 | dedicated-unit-h100-count |
2 | 12,02 |
| H100_X4 | dedicated-unit-h100-count |
4 | 24,04 |
| H100_X8 | dedicated-unit-h100-count |
8 | 48,08 |
| H200_X1 | dedicated-unit-h200-count |
1 | 6,22 |
| H200_X2 | dedicated-unit-h200-count |
2 | 12,44 |
| H200_X4 | dedicated-unit-h200-count |
4 | 24,88 |
| H200_X8 | dedicated-unit-h200-count |
8 | 49,76 |
Para solicitar os recursos para o tamanho de unidade de cluster de IA dedicado recomendado, consulte solicitando um limite de recursos.
Para calcular o preço, multiplique o preço de Unidade de IA por hora para Oracle Cloud Infrastructure Generative AI - Importação de Modelo na página Informações da Página de Preços para a contagem de unidades de IA nesta página.
Tarefas para Importar um Modelo
- Importe o modelo usando uma destas opções:
- Crie um cluster de IA dedicado de hospedagem para o modelo importado com uma forma de unidade recomendada.
- Crie um ponto final.
- Chame o modelo por meio da API do OCI Generative AI, SDK ou use o modelo no playground.
Gerenciando os Modelos Importados
Depois de executar os pré-requisitos e importar um modelo, você poderá executar as seguintes tarefas nos modelos importados: