Modelos de IA empresarial na OCI Generative AI
Use Modelos de IA empresarial na OCI Generative AI para acessar modelos hospedados pré-treinados, importar modelos personalizados compatíveis e implementar modelos para cargas de trabalho de inferência empresarial.
Esta seção fornece links para os modelos disponíveis na OCI Generative AI e para os recursos usados para implementar, gerenciar e dimensionar esses modelos na OCI.
O que você pode fazer com modelos de IA corporativos
Use Modelos de IA Empresariais quando quiser:
- Executar inferência com modelos hospedados pré-treinados
- Importar e hospedar modelos personalizados suportados
- Selecione opções de implantação sob demanda e dedicadas
- Implemente modelos em clusters de IA dedicados para cargas de trabalho de produção
- Gerenciar pontos finais e acesso à rede privada
- Analise o modelo e a disponibilidade regional
- Compreender considerações sobre preço e desempenho
A OCI Generative AI oferece suporte a tarefas de modelo principais, como:
- Chat para geração de conversação
- Incorporações para pesquisa semântica, recomendação, classificação e clusterização
- Classificar novamente para pedidos de documentos por relevância para uma consulta
Opções de Uso do Modelo
A OCI Generative AI oferece suporte a várias maneiras de usar modelos:
- Modelos hospedados pré-treinados para inferência gerenciada por meio da OCI
- Modelos importados para implantação de modelo personalizado compatível
- Modo sob demanda para acesso gerenciado compartilhado
- Modo dedicado para modelo isolado que serve em clusters de IA dedicados
Essas opções permitem que você passe da experimentação para a produção enquanto seleciona o nível de controle, o isolamento de desempenho e o gerenciamento de infraestrutura adequados à sua carga de trabalho.
Infraestrutura de Modelo e Gerenciamento
Os Modelos de IA empresarial na OCI Generative AI são suportados por recursos de implementação e gerenciamento, como:
- Clusters de IA dedicados para hospedagem de modelo isolada
- Pontos Finais para atender ao tráfego do modelo
- Pontos Finais Privados para acesso seguro à rede
- Disponibilidade de modelo regional para planejamento de implantação
- Orientação de desempenho e custo para cargas de trabalho de produção
Tópicos nesta Seção
Use os seguintes tópicos para saber mais sobre Modelos de IA Empresarial na OCI Generative AI:
-
Modelos Básicos Pré-treinados Oferecidos no Serviço Generative AI
Saiba mais sobre os modelos hospedados pré-treinados disponíveis na OCI Generative AI.
-
Modelos Validados para Importação
Revise os modelos personalizados suportados que você pode importar para a OCI Generative AI.
-
Modos sob demanda e dedicados para modelos de IA generativa da OCI
Compreender as opções de implantação para executar modelos em ambientes compartilhados ou dedicados.
-
Gerenciando Clusters de IA Dedicados
Saiba como criar e gerenciar clusters de IA dedicados para hospedagem de modelos.
-
Benchmarks de Desempenho de Cluster de IA Dedicado
Revise a orientação de benchmark para desempenho de cluster de IA dedicado.
- Regiões de IA Generativa
Veja onde a OCI Generative AI está disponível.
- Modelos de IA Generativa por Região
Revise a disponibilidade do modelo por região do OCI.
-
Gerenciando Pontos Finais
Saiba como gerenciar pontos finais para acesso ao modelo.
-
Gerenciando Pontos Finais Privados
Saiba como configurar o acesso à rede privada para o OCI Generative AI.
-
Calculando o Custo no Serviço Generative AI
Revise as considerações de preços para uso da OCI Generative AI.