Cohere Embed 4 (New)
cohere.embed-v4.0
es un modelo multimodal que puede crear incrustaciones de texto a partir de una entrada de modalidad mixta, que es una entrada de texto e imágenes en una sola carga útil.
Disponible en estas regiones
- Este de Brasil (São Paulo) (solo cluster de IA dedicado)
- Centro de Alemania (Fráncfort) (solo cluster de IA dedicado)
- Sur de India (Hyderabad) (solo clúster de IA dedicada)
- Centro de Japón (Osaka)
- Arabia Saudí Central (Riad)
- Este de Emiratos Árabes Unidos (Dubái) (solo cluster de IA dedicado)
- Sur de Reino Unido (Londres) (solo cluster de IA dedicado)
- Medio Oeste de EE. UU. (Chicago)
Características clave
- Modo
- Introduzca texto o imagen, pero no ambos.
- Para obtener incrustaciones para una imagen, solo se permite una imagen. No puede combinar texto e imagen para la misma incrustación. Entrada de imagen solo mediante API.
- Entrada y salida
- En la consola, cada entrada de texto debe tener menos de 512 tokens y un máximo de 96 entradas por ejecución.
- En el SDK y la API, todas las entradas juntas pueden agregar hasta 128 000 tokens por incrustación por ejecución.
- El modelo genera un vector de 1.536 dimensiones para cada incrustación.
- Soporte de Idioma
- Texto: inglés o multilingual.
- Imagen: solo en inglés.
Cluster de IA dedicado para el modelo
Para acceder a un modelo a través de un cluster de IA dedicado en cualquier región de la lista, debe crear un punto final para ese modelo en un cluster de IA dedicado. Para ver el tamaño de la unidad de cluster que coincide con este modelo, consulte la siguiente tabla.
Modelo base | Cluster de Ajuste | Cluster de alojamiento | Información de página de asignación de precios | Aumento de límite de cluster de solicitud |
---|---|---|---|---|
|
No disponible para ajuste |
|
|
|
-
Si no tiene suficientes límites de cluster en su arrendamiento para alojar un modelo Embed en un cluster de AI dedicado, solicite que el límite
dedicated-unit-embed-cohere-count
aumente en 1. - Revise las referencias de rendimiento del cluster de Cohere Embed 4 para diferentes casos de uso.
Fechas de liberación y baja
Modelo | Fecha de liberación | Fecha de baja bajo demanda | Fecha de baja en modo dedicado |
---|---|---|---|
cohere.embed-v4.0
|
2.025-7-3 | Al menos 6 meses después de la liberación del 1er modelo de reemplazo. | Al menos 6 meses después de la liberación del 1er modelo de reemplazo. |
Para obtener una lista de todas las líneas de tiempo de modelo y los detalles de baja, consulte Baja de los modelos.
Parámetro de Modelo embebido
Al utilizar los modelos de embebido, puede obtener una salida diferente cambiando el siguiente parámetro.
- Truncate
-
Si se truncan los tokens de inicio o finalización en una frase, cuando esa frase supera el número máximo de tokens permitidos. Por ejemplo, una frase tiene 516 tokens, pero el tamaño máximo de token es 512. Si selecciona truncar el final, los últimos 4 tokens de esa frase se cortan.