Desativando os Modelos
A IA Gerativa do OCI retira seus modelos de linguagem grande (LLMs) com base no tipo e no modo de serviço de cada modelo. Os LLMs atendem solicitações do usuário em um modo de serviço sob demanda ou em um modo de serviço dedicado. Revise as seções a seguir para saber mais sobre os tempos de depreciação e remoção e para decidir qual modo de serviço funciona melhor para você.
Terminologia
- A aposentadoria
- Quando um modelo é retirado, ele não está mais disponível para uso no serviço IA Gerativa.
- Desativação
- Quando um modelo é obsoleto, ele permanece disponível no serviço IA Gerativa, mas terá um período definido que poderá ser usado antes de ser desativado.
Sobre os modos de serviço
- Modo de Serviço sob Demanda
-
O modo de serviço sob demanda está disponível apenas para modelos básicos pré-treinados e tem as seguintes características:
- Quando a IA Gerativa do OCI libera uma nova versão ou família de modelos, você pode obter um período de sobreposição durante o qual ambas as versões ou duas famílias do mesmo modelo são suportadas até que a versão ou família de modelos mais antigas seja desativada.
- Todas as versões e família de modelos não estão disponíveis em todas as regiões suportadas do OCI. Consulte os principais recursos em Modelos Fundamentais Pré-treinados em IA Generativa para obter os modelos disponíveis em cada região.
- Modelos de Modo de Serviço Sob Demanda Suportados
-
A tabela a seguir mostra as datas de baixa do modelo para o modo de serviço sob demanda.
Modelo Data da Release Data da Baixa Modelo(s) de Substituição cohere.command-r-plus v1.2
2024-06-18
Pelo menos um mês após o lançamento do 1o modelo de substituição. Provisório cohere.command-r-16k v1.2
2024-06-04
Pelo menos um mês após o lançamento do 1o modelo de substituição. Provisório meta.llama-3-70b-instruct v1.0
2024-06-04
Pelo menos um mês após o lançamento do 1o modelo de substituição. Provisório cohere.command v15.6
2024-02-07
2024-07-18
cohere.command-r-plus v1.2
cohere.command-light v15.6
2024-02-07
2024-07-09
cohere.command-r-16k v1.2
cohere.embed-english-v3.0
2024-02-07
Pelo menos 6 meses após o lançamento do 1o modelo de substituição. Provisório cohere.embed-multilingual-light-v3.0
2024-02-07
Pelo menos 6 meses após o lançamento do 1o modelo de substituição. Provisório meta.llama-2-70b-chat
2024-01-22
2024-07-09
meta.llama-3-70b-instruct
- Modo de Serviço Dedicado
-
O modo de serviço dedicado está disponível para modelos de base personalizados e pré-treinados e tem as seguintes características:
- Como cada cluster de IA dedicado de hospedagem só pode hospedar a mesma versão de cada modelo, se você decidir continuar usando a versão do modelo que o cluster de IA dedicado já está hospedando e não migrar dentro do período de sobreposição, poderá solicitar suporte de longo prazo para essa versão.
- Os pontos finais existentes continuarão a ser executados.
Importante
Se você precisar de um modelo de modo de serviço dedicado para permanecer ativo por mais tempo que a data de baixa, crie um ticket de suporte. - Modelos de Modo de Serviço Dedicado Suportados
-
Modelo Data da Release Data da Baixa Modelo(s) de Substituição cohere.command-r-plus v1.2
2024-06-18
Pelo menos 6 meses após o lançamento do 1o modelo de substituição. Provisório cohere.command-r-16k v1.2
2024-06-04
Pelo menos 6 meses após o lançamento do 1o modelo de substituição. Provisório meta.llama-3-70b-instruct v1.0
2024-06-04
Pelo menos 6 meses após o lançamento do 1o modelo de substituição. Provisório cohere.command v15.6
2024-02-07
2025-01-18
cohere.command-r-plus v1.2
cohere.command-light v15.6
2024-02-07
2025-01-04
cohere.command-r-16k v1.2
cohere.embed-english-v3.0
2024-02-07
Pelo menos 6 meses após o lançamento do 1o modelo de substituição. Provisório cohere.embed-multilingual-light-v3.0
2024-02-07
Pelo menos 6 meses após o lançamento do 1o modelo de substituição. Provisório meta.llama-2-70b-chat
2024-01-22
2025-01-04
meta.llama-3-70b-instruct
Os tempos de descontinuação podem mudar no futuro.
- Vulnerabilidades de Segurança e Correções de Bugs para Modelos Base
-
O serviço Generative AI se esforça para reduzir rapidamente quaisquer problemas de segurança ou correções de bugs que estejam presentes em qualquer um dos modelos base suportados. Verifique as notas de versão do OCI para saber se você precisa migrar para outra versão.