Modelos OpenAI compatíveis
Você pode importar modelos compatíveis de buckets do Hugging Face e do OCI Object Storage para o OCI Generative AI, criar pontos finais para esses modelos e usá-los no serviço Generative AI.
OpenAI Whisper
O modelo OpenAI Whisper Large V3 Turbo é otimizado para reconhecimento automático de fala e cargas de trabalho de transcrição de áudio. Este modelo de áudio para texto é uma versão afinada de um modelo Whisper Large V3 podado, com menos camadas de decodificador para uma transcrição mais rápida com um tradeoff de qualidade menor. O modelo suporta transcrição multilíngue, identificação de idioma e tradução de fala de idiomas suportados para texto em inglês e é adequado para casos de uso de processamento de áudio sensíveis à latência e de alto rendimento. Para mais detalhes, consulte OpenAI Whisper Large V3 Turbo na documentação Hugging Face.
| Abraçando o ID do modelo facial | Capacidade do Modelo | Formas Recomendadas de Unidade de Cluster de IA Dedicada |
|---|---|---|
| openai/sussurro-grande-v3-turbo | ÁUDIO_PARA_TEXTO |
|
-
Embora você possa importar qualquer modelo de chat, incorporação (e ajuste fino) validado por meio do Open Model Engine (com runtime vLLM ou SGLang), apenas os modelos listados explicitamente nesta página foram avaliados para essa família de modelos pela Oracle em relação aos tempos de execução do modelo de código-fonte aberto e testados nas configurações de GPU suportadas pela Oracle. Não obstante o precedente, a Oracle não é responsável por nenhum problema relacionado ao desempenho, disponibilidade, operação ou segurança dos Modelos Compatíveis. Modelos não listados podem ter problemas de compatibilidade e recomendamos que você teste qualquer modelo não listado antes do uso da produção. Saiba mais sobre a OCI Generative AI Imported Model Architecture.
- Para modelos importados, você pode usar o tamanho do contexto nativo especificado pelo provedor do modelo. No entanto, o tamanho máximo de contexto efetivo é limitado pela configuração de hardware subjacente que você seleciona para hospedar clusters de IA dedicados na OCI Generative AI. Para aproveitar ao máximo o tamanho do contexto nativo de um modelo, talvez seja necessário provisionar mais recursos de hardware.
- Use os modelos ajustados somente se eles corresponderem à versão do transformador do modelo base compatível e tiverem uma contagem de parâmetros dentro de ± 10% do original.
- Para obter o hardware disponível e as etapas sobre como implantar os modelos importados, consulte Gerenciando Modelos Importados.
- Se uma forma recomendada não estiver disponível em uma região, selecione a alternativa mais próxima disponível. Por exemplo, se
H100_X2não estiver disponível, masA100_80G_X2estiver, selecioneA100_80G_X2. Se ambas as formas H100 e A100 estiverem disponíveis, para melhor desempenho, selecione H100.