Gerenciando Modelos Importados (Novo)

Além de usar os modelos pré-treinados hospedados na OCI Generative AI, você pode importar modelos de código aberto e de terceiros suportados (por exemplo, do Hugging Face) para a OCI Generative AI, hospedá-los, criar pontos finais e usá-los como qualquer outro modelo.

Abraçando Pré-requisitos de Rosto

Antes de importar um modelo diretamente do Hugging Face:

  • Decida qual modelo suportado do Hugging Face importar e anote seu tamanho de unidade de cluster de IA dedicado recomendado.
  • Para acessar e usar alguns modelos, você precisa de um token do Hugging Face, especialmente as versões mais recentes e fechadas, como Llama 3 e Llama 3.1 Para esses modelos, gere um token de acesso nas configurações da sua conta do Hugging Face em Tokens de Acesso. Certifique-se de que ele tenha as permissões necessárias (pelo menos acesso "read").

Pré-requisitos do Serviço Object Storage

Antes de importar um modelo de um bucket do serviço Object Storage:

  • Se você não for um administrador do OCI, peça a um para conceder a você permissão do IAM para gerenciar o Object Storage em seu compartimento:
    allow group <your-group-name> to manage object-family in compartment <compartment-with-bucket>
                                
  • Decida um modelo que funcione com o ponto final /v1/chat/completions — somente esses modelos são suportados.
  • Certifique-se de que o modelo suporte apenas um destes recursos:
    • TEXT_TO_TEXT: entrada de texto, saída de texto
    • IMAGE_TEXT_TO_TEXT: imagem, texto interno ou ambos, texto externo
    • EMBOLSO: entrada de texto, incorporações de vetor
    • RERANK: consulta e documentos do candidato, pontuações de relevância e uma lista reordenada
  • Salve artefatos de modelo em um bucket do Object Storage.
  • Importante: O arquivo de configuração deve ser chamado config.json para uma importação bem-sucedida, semelhante à maioria dos modelos Hugging Face.

Solicitação de recursos e preços

Para acessar um modelo importado, crie um ponto final para esse modelo em um cluster de IA dedicado. Use a tabela a seguir para solicitar recursos de cluster de IA dedicados antes de importar um modelo.

Tamanhos de Unidade de Cluster de IA Dedicados para Modelos Importados
Tamanho da Unidade do Cluster de IA Dedicado Nome do Limite Unidades Necessárias de Solicitação Contagem de Unidades de IA
A10_X1 dedicated-unit-a10-count 1 1,77
A10_X2 dedicated-unit-a10-count 2 3,54
A10_X4 dedicated-unit-a10-count 4 7,08
A100_40G_X1 dedicated-unit-a100-40g-count 1 2,7
A100_40G_X2 dedicated-unit-a100-40g-count 2 5,4
A100_40G_X4 dedicated-unit-a100-40g-count 4 10,8
A100_40G_X8 dedicated-unit-a100-40g-count 8 21,6
A100_80G_X1 dedicated-unit-a100-80g-count 1 3,24
A100_80G_X2 dedicated-unit-a100-80g-count 2 6,48
A100_80G_X4 dedicated-unit-a100-80g-count 4 12,96
A100_80G_X8 dedicated-unit-a100-80g-count 8 25,92
H100_X1 dedicated-unit-h100-count 1 6,01
H100_X2 dedicated-unit-h100-count 2 12,02
H100_X4 dedicated-unit-h100-count 4 24,04
H100_X8 dedicated-unit-h100-count 8 48,08
H200_X1 dedicated-unit-h200-count 1 6,22
H200_X2 dedicated-unit-h200-count 2 12,44
H200_X4 dedicated-unit-h200-count 4 24,88
H200_X8 dedicated-unit-h200-count 8 49,76
Dica

Para solicitar os recursos para o tamanho de unidade de cluster de IA dedicado recomendado, consulte solicitando um limite de recursos.

Para calcular o preço, multiplique o preço de Unidade de IA por hora para Oracle Cloud Infrastructure Generative AI - Importação de Modelo na página Informações da Página de Preços para a contagem de unidades de IA nesta página.