Desativando os Modelos

A IA Gerativa do OCI retira seus modelos de linguagem grande (LLMs) com base no tipo e no modo de serviço de cada modelo. Os LLMs atendem solicitações do usuário em um modo de serviço sob demanda ou em um modo de serviço dedicado. Revise as seções a seguir para saber mais sobre os tempos de depreciação e remoção e para decidir qual modo de serviço funciona melhor para você.

Terminologia

A aposentadoria
Quando um modelo é retirado, ele não está mais disponível para uso no serviço IA Gerativa.
Desativação
Quando um modelo é obsoleto, ele permanece disponível no serviço IA Gerativa, mas terá um período definido que poderá ser usado antes de ser desativado.

Sobre os modos de serviço

Modo de Serviço sob Demanda

O modo de serviço sob demanda está disponível apenas para modelos básicos pré-treinados e tem as seguintes características:

  • Quando a IA Gerativa do OCI libera uma nova versão ou família de modelos, você pode obter um período de sobreposição durante o qual ambas as versões ou duas famílias do mesmo modelo são suportadas até que a versão ou família de modelos mais antigas seja desativada.
  • Todas as versões e família de modelos não estão disponíveis em todas as regiões suportadas do OCI. Consulte os principais recursos em Modelos Fundamentais Pré-treinados em IA Generativa para obter os modelos disponíveis em cada região.
Modelos de Modo de Serviço Sob Demanda Suportados

A tabela a seguir mostra as datas de baixa do modelo para o modo de serviço sob demanda.

Modelo Data da Release Data da Baixa Modelo(s) de Substituição
cohere.command-r-plus v1.2 2024-06-18 Pelo menos um mês após o lançamento do 1o modelo de substituição. Provisório
cohere.command-r-16k v1.2 2024-06-04 Pelo menos um mês após o lançamento do 1o modelo de substituição. Provisório
meta.llama-3-70b-instruct v1.0 2024-06-04 Pelo menos um mês após o lançamento do 1o modelo de substituição. Provisório
cohere.command v15.6 2024-02-07 2024-07-18 cohere.command-r-plus v1.2
cohere.command-light v15.6 2024-02-07 2024-07-09 cohere.command-r-16k v1.2
cohere.embed-english-v3.0 2024-02-07 Pelo menos 6 meses após o lançamento do 1o modelo de substituição. Provisório
cohere.embed-multilingual-light-v3.0 2024-02-07 Pelo menos 6 meses após o lançamento do 1o modelo de substituição. Provisório
meta.llama-2-70b-chat 2024-01-22 2024-07-09 meta.llama-3-70b-instruct
Modo de Serviço Dedicado

O modo de serviço dedicado está disponível para modelos de base personalizados e pré-treinados e tem as seguintes características:

  • Como cada cluster de IA dedicado de hospedagem só pode hospedar a mesma versão de cada modelo, se você decidir continuar usando a versão do modelo que o cluster de IA dedicado já está hospedando e não migrar dentro do período de sobreposição, poderá solicitar suporte de longo prazo para essa versão.
  • Os pontos finais existentes continuarão a ser executados.
Importante

Se você precisar de um modelo de modo de serviço dedicado para permanecer ativo por mais tempo que a data de baixa, crie um ticket de suporte.
Modelos de Modo de Serviço Dedicado Suportados
Modelo Data da Release Data da Baixa Modelo(s) de Substituição
cohere.command-r-plus v1.2 2024-06-18 Pelo menos 6 meses após o lançamento do 1o modelo de substituição. Provisório
cohere.command-r-16k v1.2 2024-06-04 Pelo menos 6 meses após o lançamento do 1o modelo de substituição. Provisório
meta.llama-3-70b-instruct v1.0 2024-06-04 Pelo menos 6 meses após o lançamento do 1o modelo de substituição. Provisório
cohere.command v15.6 2024-02-07 2025-01-18 cohere.command-r-plus v1.2
cohere.command-light v15.6 2024-02-07 2025-01-04 cohere.command-r-16k v1.2
cohere.embed-english-v3.0 2024-02-07 Pelo menos 6 meses após o lançamento do 1o modelo de substituição. Provisório
cohere.embed-multilingual-light-v3.0 2024-02-07 Pelo menos 6 meses após o lançamento do 1o modelo de substituição. Provisório
meta.llama-2-70b-chat 2024-01-22 2025-01-04 meta.llama-3-70b-instruct
Observação

Os tempos de descontinuação podem mudar no futuro.
Vulnerabilidades de Segurança e Correções de Bugs para Modelos Base

O serviço Generative AI se esforça para reduzir rapidamente quaisquer problemas de segurança ou correções de bugs que estejam presentes em qualquer um dos modelos base suportados. Verifique as notas de versão do OCI para saber se você precisa migrar para outra versão.