Cohere Embed 4 (New)
O cohere.embed-v4.0
é um modelo multimodal que pode criar incorporações de texto a partir de entradas de texto ou de uma imagem. A entrada da imagem não está disponível na Console e você deve usar a API. Para API, insira uma imagem codificada em base64 em cada execução. Por exemplo, uma imagem de 512 x 512 é convertida em cerca de 1.610 tokens.
Disponível nestas regiões
- Leste do Brasil (São Paulo) (somente cluster de IA dedicado)
- Centro da Alemanha (Frankfurt) (somente cluster de IA dedicado)
- Sul da Índia (Hyderabad) (somente cluster de IA dedicado)
- Centro do Japão (Osaka)
- Centro da Arábia Saudita (Riade)
- Leste dos EAU (Dubai) (somente cluster de IA dedicado)
- Sul do Reino Unido (Londres) (somente cluster de IA dedicado)
- Centro-Oeste dos EUA (Chicago)
Principais Recursos
- Modo
- Insira texto ou imagem, mas não ambos.
- Para obter incorporações de uma imagem, apenas uma imagem é permitida. Não é possível combinar texto e imagem para a mesma incorporação. Entrada de imagem somente por meio da API.
- Entrada e Saída
- Na Console, cada entrada de texto deve ter menos de 512 tokens e no máximo 96 entradas por execução.
- No SDK e na API, todas as entradas juntas podem adicionar até 128.000 tokens por incorporação por execução.
- O modelo gera um vetor de 1.536 dimensões para cada incorporação.
- Suporte a Idioma
- Texto: Inglês ou multilíngue.
- Imagem: somente em inglês.
Cluster de IA Dedicado para o Modelo
Para acessar um modelo por meio de um cluster de IA dedicado em qualquer região listada, você deve criar um ponto final para esse modelo em um cluster de IA dedicado. Para o tamanho da unidade de cluster que corresponde a este modelo, consulte a tabela a seguir.
Modelo Base | Cluster de Ajuste | Cluster de Hosts | Informações da Página de Preços | Aumento do Limite do Cluster de Solicitações |
---|---|---|---|---|
|
Não disponível para ajuste fino |
|
|
|
-
Se você não tiver limites de cluster suficientes em sua tenancy para hospedar um modelo Incorporado em um cluster de IA dedicado, solicite o limite
dedicated-unit-embed-cohere-count
para aumentar em 1. - Revise os benchmarks de desempenho do cluster do Cohere Embed 4 para diferentes casos de uso.
Datas de Liberação e Baixa
Modelo | Data de Liberação | Data de Aposentadoria Sob Demanda | Data de Baixa do Modo Dedicado |
---|---|---|---|
cohere.embed-v4.0
|
2,025-7-3 | Pelo menos 6 meses após o lançamento do 1o modelo de substituição. | Pelo menos 6 meses após o lançamento do 1o modelo de substituição. |
Para obter uma lista de todas as linhas de tempo do modelo e detalhes de baixa, consulte Desativando os Modelos.
Incorporando Parâmetro de Modelo
Ao usar os modelos de incorporação, você pode obter uma saída diferente alterando o parâmetro a seguir.
- Truncar
-
Se os tokens de início ou de fim em uma sentença serão truncados, quando essa sentença exceder o número máximo de tokens permitidos. Por exemplo, uma sentença tem 516 tokens, mas o tamanho máximo do token é 512. Se você optar por truncar o final, os últimos 4 tokens dessa instrução serão cortados.