Cohere Rerank 3.5
El modelo cohere.rerank.v3-5 toma una consulta y una lista de textos y produce una matriz ordenada con cada texto asignado una puntuación de relevancia. La puntuación de relevancia es cómo el modelo clasifica los documentos, es decir, qué tan bien cada texto coincide con la consulta.
Regiones para este modelo
Para las regiones soportadas, los tipos de punto final (clusters de IA dedicados o bajo demanda) y el alojamiento (OCI Generative AI o llamadas externas) para este modelo, consulte la página Modelos por región. Para obtener más información sobre las regiones, consulte la página Regiones de IA generativa.
Acceder a este modelo
Las tintas de API muestran los puntos finales de todas las regiones comerciales, soberanas y gubernamentales compatibles.
Características clave
Cluster de IA dedicado para el modelo
- El modelo solo está disponible mediante el modo dedicado. (No disponible bajo demanda.)
- Para el modo dedicado, cree un punto final en un cluster de AI dedicado de alojamiento, aloje el modelo en el cluster y, a continuación, ejecute la API RerankText o su SDK relevante.
Para ver el tamaño de la unidad de cluster que coincide con este modelo, consulte la siguiente tabla.
| Modelo base | Cluster de Ajuste | Cluster de alojamiento | Información de página de asignación de precios | Aumento de límite de cluster de solicitud |
|---|---|---|---|---|
|
No disponible para ajuste |
|
|
|
Si no tiene suficientes límites de cluster en su arrendamiento para alojar el modelo Cohere Rerank 3.5 en un cluster de AI dedicado, solicite que el límite dedicated-unit-rerank-cohere-count aumente en 1.
Reglas de punto final para clusters
- Un cluster de AI dedicado puede contener hasta 50 puntos finales.
- Utilice estos puntos finales para crear alias que apunten al mismo modelo base o a la misma versión de un modelo personalizado, pero no a ambos tipos.
- Varios puntos finales para el mismo modelo facilitan su asignación a diferentes usuarios o propósitos.
| Tamaño de unidad de cluster de alojamiento | Reglas de punto final |
|---|---|
| RERANK_COHERE |
|
-
Para aumentar el volumen de llamadas soportado por un cluster de alojamiento, aumente el recuento de instancias editando el cluster de AI dedicado. Consulte Updating a Dedicated AI Cluster.
-
Para más de 50 puntos finales por cluster, solicite un aumento del límite,
endpoint-per-dedicated-unit-count. Consulte Creación de una solicitud de aumento del límite y Límites de servicio para la IA generativa.
Referencias de rendimiento de cluster
Revise las referencias de rendimiento del cluster de Cohere Rerank 3.5 para diferentes escenarios.
Fechas de lanzamiento y baja de OCI
Para conocer las fechas de lanzamiento y baja y las opciones del modelo de sustitución, consulte las siguientes páginas en función del modo (bajo demanda o dedicado):
Fechas de liberación y baja
Para conocer las fechas de liberación y baja y las opciones de modelo de sustitución, consulte la siguiente página:
Parámetro de modelo de nueva clasificación
Para conocer los parámetros del modelo Rerank, consulte la documentación de la API RerankText.