Escolhendo um Método de Ajuste fino na IA generativa
Quando você cria um modelo personalizado, o OCI Generative AI ajusta os modelos base pré-treinados usando um método que corresponda ao modelo base.
Importante
Alguns modelos básicos pré-treinados da OCI Generative AI suportados para o modo de serviço dedicado agora estão obsoletos e serão descontinuados no máximo 6 meses após o lançamento do 1º modelo de substituição. Você pode hospedar um modelo base ou ajustar um modelo base e hospedar o modelo ajustado em um cluster de IA dedicado (modo de serviço dedicado) até que o modelo base seja retirado. Para datas de desativação do modo de serviço dedicado, consulte Desativando os Modelos.
Alguns modelos básicos pré-treinados da OCI Generative AI suportados para o modo de serviço dedicado agora estão obsoletos e serão descontinuados no máximo 6 meses após o lançamento do 1º modelo de substituição. Você pode hospedar um modelo base ou ajustar um modelo base e hospedar o modelo ajustado em um cluster de IA dedicado (modo de serviço dedicado) até que o modelo base seja retirado. Para datas de desativação do modo de serviço dedicado, consulte Desativando os Modelos.
A tabela a seguir lista o método que o Generative AI usa para treinar cada tipo de modelo base:
Modelos Base Pré-treinados | Método de Treinamento |
---|---|
|
|
|
|
|
Observação
Para obter informações sobre os hiperparâmetros usados para cada método de treinamento, consulte Hiperparâmetros para Ajustar um Modelo no Serviço Generative AI.
Para obter informações sobre os hiperparâmetros usados para cada método de treinamento, consulte Hiperparâmetros para Ajustar um Modelo no Serviço Generative AI.
Escolhendo entre T-Few
e Vanilla
Para os modelos cohere.command
e cohere.command-light
, a OCI Generative AI tem dois métodos de treinamento: T-Few
e Vanilla
. Use as diretrizes a seguir para ajudá-lo a selecionar o melhor método de treinamento para seus casos de uso.
Recurso | Opções e Recomendações |
---|---|
Métodos de treinamento para cohere.command e cohere.command-light
|
|
Tamanho do Conjunto de Dados |
O uso de pequenos conjuntos de dados para o método |
Complexidade |
|
Hospedagem |
|