Modelos Fundamentais Pré-treinados no Serviço Generative AI

Você pode usar os seguintes modelos básicos pré-treinados no OCI Generative AI:

Observação

Para obter linhas de tempo de modelo suportadas, consulte Baixando os Modelos.
Modelos de Chat (Novos)

Faça perguntas e obtenha respostas de conversação por meio de um chatbot de IA.

Modelo Disponível nestas regiões Recursos Principais
cohere.command-r-plus v1.2
  • Centro-Oeste dos EUA (Chicago)
  • Centro da Alemanha (Frankfurt)
  • UK South (London)
  • O prompt do usuário pode ter até 128.000 tokens e a resposta pode ter até 4000 tokens para cada execução.
  • Otimizado para tarefas complexas, oferece compreensão avançada de linguagem, maior capacidade e respostas com mais nuances e pode manter o contexto de seu longo histórico de conversas de 128.000 tokens. Também é ideal para resposta a perguntas, análise de sentimento e recuperação de informações.
cohere.command-r-16k v1.2
  • Centro-Oeste dos EUA (Chicago)
  • Centro da Alemanha (Frankfurt)
  • UK South (London)
  • O prompt do usuário pode ter até 16.000 tokens e a resposta pode ter até 4000 tokens para cada execução.
  • Otimizado para interação conversacional e tarefas de contexto longo. Ideal para geração de texto, sumarização, tradução ou classificação baseada em texto.
meta.llama-3-70b-instruct v1.0
  • Centro-Oeste dos EUA (Chicago)
  • Centro da Alemanha (Frankfurt)
  • UK South (London)
  • O modelo tem 70 bilhões de parâmetros.
  • O prompt e a resposta do usuário podem ter até 8000 tokens para cada execução.
  • Você pode ajustar esse modelo com seu conjunto de dados.
Dica

Saiba sobre modelos de chat.

Modelos de Geração

Forneça instruções para gerar texto ou extrair informações do texto.

Importante

O recurso de geração de texto será removido do playground, da API e da CLI do OCI Generative AI quando os modelos cohere.command v15.6 e cohere.command-light v15.6 forem desativados. Em vez disso, você pode usar os modelos de bate-papo. Para datas de baixa, consulte Baixando os Modelos.
Modelo Disponível nestas regiões Recursos Principais
cohere.command v15.6
  • Centro-Oeste dos EUA (Chicago)
  • O modelo tem 52 bilhões de parâmetros.
  • O prompt e a resposta do usuário podem ter até 4.096 tokens para cada execução.
  • Você pode ajustar esse modelo com seu conjunto de dados.
cohere.command-light v15.6
  • Centro-Oeste dos EUA (Chicago)
  • O modelo tem 6 bilhões de parâmetros.
  • O prompt e a resposta do usuário podem ter até 4.096 tokens para cada execução.
  • Você pode ajustar esse modelo com seu conjunto de dados.
meta.llama-2-70b-chat
  • Centro-Oeste dos EUA (Chicago)
  • O modelo tem 70 bilhões de parâmetros.
  • O prompt e a resposta do usuário podem ter até 4.096 tokens para cada execução.
O Modelo de Sumarização

Resuma o texto com o formato, o tamanho e o tom instruídos.

Importante

O recurso de sumarização será removido do playground, da API e da CLI do OCI Generative AI quando o modelo cohere.command v15.6 for descontinuado. Em vez desse modelo, você pode resumir o texto usando os modelos de chat. Para datas de baixa, consulte Baixando os Modelos.
Modelo Disponível nestas regiões Recursos Principais
cohere.command v15.6
  • Centro-Oeste dos EUA (Chicago)
  • O modelo tem 52 bilhões de parâmetros.
  • O prompt e a resposta do usuário podem ter até 4.096 tokens para cada execução.
Incorporando Modelos

Converta texto em incorporações de vetor para usar em aplicativos para pesquisas semânticas, classificação de texto ou clusterização de texto.

Modelo Disponível nestas regiões Recursos Principais
cohere.embed-english-v3.0
  • Centro-Oeste dos EUA (Chicago)
  • Centro da Alemanha (Frankfurt)
  • UK South (London)
  • Inglês ou multilíngue.
  • O modelo cria um vetor de 1.024 dimensões para cada incorporação.
  • Máximo de 96 sentenças por execução.
  • Máximo de 512 tokens por incorporação.
cohere.embed-multilingual-v3.0
  • Centro-Oeste dos EUA (Chicago)
  • Central da Alemanha (Frankfurt)
  • UK South (London)
  • Inglês ou multilíngue.
  • O modelo cria um vetor de 1.024 dimensões para cada incorporação.
  • Máximo de 96 sentenças por execução.
  • Máximo de 512 tokens por incorporação.
cohere.embed-english-light-v3.0
  • Centro-Oeste dos EUA (Chicago)
  • Os modelos leves são menores e mais rápidos que os modelos originais.
  • Inglês ou multilíngue.
  • O modelo cria um vetor de 384 dimensões para cada incorporação.
  • Máximo de 96 sentenças por execução.
  • Máximo de 512 tokens por incorporação.
cohere.embed-multilingual-light-v3.0
  • US Midwest (Chicago)
  • Os modelos leves são menores e mais rápidos que os modelos originais.
  • Inglês ou multilíngue.
  • O modelo cria um vetor de 384 dimensões para cada incorporação.
  • Máximo de 96 sentenças por execução.
  • Máximo de 512 tokens por incorporação.