Modelos suportados do Google
Você pode importar grandes modelos de linguagem de buckets do Hugging Face e do OCI Object Storage para o OCI Generative AI, criar pontos finais para esses modelos e usá-los no serviço Generative AI.
As séries Gemma do Google, incluindo os modelos de código aberto Gemma2 e Gemma3, foram criadas para atender às necessidades de processamento de linguagem e alta versatilidade. Para obter mais informações, consulte Gemma2 e Gemma3 na documentação do Hugging Face.
Gemma
| Abraçando o ID do modelo facial | Capacidade do Modelo | Forma Recomendada da Unidade de Cluster de IA Dedicada |
|---|---|---|
| google/gemma-2-2b-it | TEXT_TO_TEXT | A100_80G_X1 |
| google/gemma-2-9b-it | TEXT_TO_TEXT | A100_80G_X1 |
| google/gemma-2-27b-it | TEXT_TO_TEXT | A100_80G_X2 |
| google/gemma-3-1b-it | TEXT_TO_TEXT | A100_80G_X1 |
| google/gemma-3-4b-it | IMAGE_TEXT_TO_TEXT | A100_80G_X1 |
| google/gemma-3-12b-it | IMAGE_TEXT_TO_TEXT | A100_80G_X1 |
| google/gemma-3-27b-it | IMAGE_TEXT_TO_TEXT | A100_80G_X2 |
| google/gemma-3-270m-it | TEXT_TO_TEXT | A100_80G_X1 |
Observação
- Para importar uma versão ajustada de um modelo, apenas modelos ajustados que usam a mesma versão de transformadores que o modelo original e têm uma contagem de parâmetros dentro de ±10% do original são suportados.
- Se o tipo de instância da forma de unidade recomendada não estiver disponível na sua região, selecione uma instância de camada superior (por exemplo, selecione uma forma H100 em vez de uma forma A100-80G).
- Para obter pré-requisitos e como importar modelos, consulte Gerenciando Modelos Importados (Novo).