Cohere Rerank 3.5
El modelo cohere.rerank.v3-5 toma una consulta y una lista de textos y produce una matriz ordenada con cada texto asignado una puntuación de relevancia. La puntuación de relevancia es cómo el modelo clasifica los documentos, es decir, qué tan bien cada texto coincide con la consulta.
Regiones para este modelo
Para las regiones soportadas, los tipos de punto final (clusters de IA dedicados o bajo demanda) y el alojamiento (OCI Generative AI o llamadas externas) para este modelo, consulte la página Modelos por región. Para obtener más información sobre las regiones, consulte la página Regiones de IA generativa.
Acceder a este modelo
Los puntos finales de API para todas las regiones comerciales, soberanas y gubernamentales soportadas se muestran en los enlaces API de gestión y API de inferencia. Puede acceder a cada modelo solo a través de sus regiones soportadas.
Características clave
- Solo modo dedicado.
- No disponible bajo demanda o en el parque infantil.
- Acceda al modelo que se aloja en un cluster a través de API y SDK.
- Para el modo dedicado, cree un punto final en un cluster de AI dedicado de alojamiento, aloje el modelo en el cluster y, a continuación, ejecute la API RerankText o su SDK relevante.
Cluster de IA dedicado para el modelo
Para acceder a un modelo a través de un cluster de IA dedicado en cualquier región de la lista, debe crear un punto final para ese modelo en un cluster de IA dedicado. Para ver el tamaño de la unidad de cluster que coincide con este modelo, consulte la siguiente tabla.
| Modelo base | Cluster de Ajuste | Cluster de alojamiento | Información de página de asignación de precios | Aumento de límite de cluster de solicitud |
|---|---|---|---|---|
|
No disponible para ajuste |
|
|
|
Si no tiene suficientes límites de cluster en su arrendamiento para alojar el modelo Cohere Rerank 3.5 en un cluster de AI dedicado, solicite que el límite dedicated-unit-rerank-cohere-count aumente en 1.
Reglas de punto final para clusters
- Un cluster de AI dedicado puede contener hasta 50 puntos finales.
- Utilice estos puntos finales para crear alias que apunten al mismo modelo base o a la misma versión de un modelo personalizado, pero no a ambos tipos.
- Varios puntos finales para el mismo modelo facilitan su asignación a diferentes usuarios o propósitos.
| Tamaño de unidad de cluster de alojamiento | Reglas de punto final |
|---|---|
| RERANK_COHERE |
|
-
Para aumentar el volumen de llamadas soportado por un cluster de alojamiento, aumente el recuento de instancias editando el cluster de AI dedicado. Consulte Updating a Dedicated AI Cluster.
-
Para más de 50 puntos finales por cluster, solicite un aumento del límite,
endpoint-per-dedicated-unit-count. Consulte Solicitud de un aumento del límite de servicio y Límites de servicio para la IA generativa.
Referencias de rendimiento de cluster
Revise las referencias de rendimiento del cluster de Cohere Rerank 3.5 para diferentes escenarios.
Fechas de liberación y baja
| Modelo | Fecha de liberación | Fecha de baja bajo demanda | Fecha de baja en modo dedicado |
|---|---|---|---|
cohere.rerank.v3-5
|
2025-05-14 | El modo bajo demanda no está disponible para este modelo. | Al menos 6 meses después de la liberación del 1er modelo de reemplazo. |
Para obtener una lista de todas las líneas de tiempo de modelo y los detalles de baja, consulte Baja de los modelos.
Parámetro de modelo de nueva clasificación
Para conocer los parámetros del modelo Rerank, consulte la documentación de la API RerankText.