Gerenciando Modelos Importados (Novo)
Além de usar os modelos pré-treinados hospedados na OCI Generative AI, você pode importar modelos de código aberto e de terceiros suportados (por exemplo, do Hugging Face) para a OCI Generative AI, hospedá-los, criar pontos finais e usá-los como qualquer outro modelo.
Abraçando Pré-requisitos de Rosto
Antes de importar um modelo diretamente do Hugging Face:
- Decida qual modelo suportado do Hugging Face importar e anote seu tamanho de unidade de cluster de IA dedicado recomendado.
- Para acessar e usar alguns modelos, você precisa de um token do Hugging Face, especialmente as versões mais recentes e fechadas, como Llama 3 e Llama 3.1 Para esses modelos, gere um token de acesso nas configurações da sua conta do Hugging Face em Tokens de Acesso. Certifique-se de que ele tenha as permissões necessárias (pelo menos acesso "read").
Pré-requisitos do Serviço Object Storage
Antes de importar um modelo de um bucket do serviço Object Storage:
- Se você não for um administrador do OCI, peça a um para conceder a você permissão do IAM para gerenciar o Object Storage em seu compartimento:
allow group <your-group-name> to manage object-family in compartment <compartment-with-bucket> - Decida um modelo que funcione com o ponto final
/v1/chat/completions— somente esses modelos são suportados. - Certifique-se de que o modelo suporte apenas um destes recursos:
- TEXT_TO_TEXT: entrada de texto, saída de texto
- IMAGE_TEXT_TO_TEXT: imagem, texto interno ou ambos, texto externo
- EMBOLSO: entrada de texto, incorporações de vetor
- RERANK: consulta e documentos do candidato, pontuações de relevância e uma lista reordenada
- Salve artefatos de modelo em um bucket do Object Storage.
- Importante: O arquivo de configuração deve ser chamado
config.jsonpara uma importação bem-sucedida, semelhante à maioria dos modelos Hugging Face.
Solicitação de recursos e preços
Para acessar um modelo importado, crie um ponto final para esse modelo em um cluster de IA dedicado. Use a tabela a seguir para solicitar recursos de cluster de IA dedicados antes de importar um modelo.
| Tamanho da Unidade do Cluster de IA Dedicado | Nome do Limite | Unidades Necessárias de Solicitação | Contagem de Unidades de IA |
|---|---|---|---|
| A10_X1 | dedicated-unit-a10-count |
1 | 1,77 |
| A10_X2 | dedicated-unit-a10-count |
2 | 3,54 |
| A10_X4 | dedicated-unit-a10-count |
4 | 7,08 |
| A100_40G_X1 | dedicated-unit-a100-40g-count |
1 | 2,7 |
| A100_40G_X2 | dedicated-unit-a100-40g-count |
2 | 5,4 |
| A100_40G_X4 | dedicated-unit-a100-40g-count |
4 | 10,8 |
| A100_40G_X8 | dedicated-unit-a100-40g-count |
8 | 21,6 |
| A100_80G_X1 | dedicated-unit-a100-80g-count |
1 | 3,24 |
| A100_80G_X2 | dedicated-unit-a100-80g-count |
2 | 6,48 |
| A100_80G_X4 | dedicated-unit-a100-80g-count |
4 | 12,96 |
| A100_80G_X8 | dedicated-unit-a100-80g-count |
8 | 25,92 |
| H100_X1 | dedicated-unit-h100-count |
1 | 6,01 |
| H100_X2 | dedicated-unit-h100-count |
2 | 12,02 |
| H100_X4 | dedicated-unit-h100-count |
4 | 24,04 |
| H100_X8 | dedicated-unit-h100-count |
8 | 48,08 |
| H200_X1 | dedicated-unit-h200-count |
1 | 6,22 |
| H200_X2 | dedicated-unit-h200-count |
2 | 12,44 |
| H200_X4 | dedicated-unit-h200-count |
4 | 24,88 |
| H200_X8 | dedicated-unit-h200-count |
8 | 49,76 |
Para solicitar os recursos para o tamanho de unidade de cluster de IA dedicado recomendado, consulte solicitando um limite de recursos.
Para calcular o preço, multiplique o preço de Unidade de IA por hora para Oracle Cloud Infrastructure Generative AI - Importação de Modelo na página Informações da Página de Preços para a contagem de unidades de IA nesta página.
Tarefas para Importar um Modelo
- Importe o modelo usando uma destas opções:
- Crie um cluster de IA dedicado de hospedagem para o modelo importado com uma forma de unidade recomendada.
- Crie um ponto final.
- Chame o modelo por meio da API do OCI Generative AI, SDK ou use o modelo no playground.
Gerenciando os Modelos Importados
Depois de executar os pré-requisitos e importar um modelo, você poderá executar as seguintes tarefas nos modelos importados: