Cohere Rerank 3.5

El modelo cohere.rerank.v3-5 toma una consulta y una lista de textos y produce una matriz ordenada con cada texto asignado una puntuación de relevancia. La puntuación de relevancia es cómo el modelo clasifica los documentos, es decir, qué tan bien cada texto coincide con la consulta.

Disponible en estas regiones comerciales

  • Este de Brasil (São Paulo) (solo cluster de IA dedicado)
  • Centro de Alemania (Fráncfort) (solo cluster de IA dedicado)
  • Japan Central (Osaka) (solo cluster de IA dedicado)
  • Saudi Arabia Central (Riyadh) (solo cluster de IA dedicado)
  • Sur de Reino Unido (Londres) (solo cluster de IA dedicado)
  • Este de EE. UU. (Ashburn) (solo cluster de IA dedicado)
  • Medio oeste de EE. UU. (Chicago) (solo cluster de IA dedicado)

Disponible en esta región soberana

Este modelo está disponible en EU Sovereign Central (Fráncfort) (solo cluster de IA dedicado) mediante los siguientes puntos finales de API:

  • API de inferencia:

    https://inference.generativeai.eu-frankfurt-2.oci.oraclecloud.eu

  • API de gestión:

    https://generativeai.eu-frankfurt-2.oci.oraclecloud.eu

En la API, tanto para el nombre de modelo como para el OCID de modelo utilice cohere.rerank.v3-5.

Obtén más información sobre Oracle EU Sovereign Cloud.

Características clave

  • Solo modo dedicado.
  • No disponible bajo demanda o en el parque infantil.
  • Acceda al modelo que se aloja en un cluster a través de API y SDK.
  • Para el modo dedicado, cree un punto final en un cluster de AI dedicado de alojamiento, aloje el modelo en el cluster y, a continuación, ejecute la API RerankText o su SDK relevante.

Cluster de IA dedicado para el modelo

Para acceder a un modelo a través de un cluster de IA dedicado en cualquier región de la lista, debe crear un punto final para ese modelo en un cluster de IA dedicado. Para ver el tamaño de la unidad de cluster que coincide con este modelo, consulte la siguiente tabla.

Modelo base Cluster de Ajuste Cluster de alojamiento Información de página de asignación de precios Aumento de límite de cluster de solicitud
  • Nombre de modelo: Cohere Rerank 3.5
  • Nombre del modelo de OCI: cohere.rerank.v3-5
No disponible para ajuste
  • Tamaño de unidad: RERANK_COHERE
  • Unidades necesarias: 1
  • Nombre del Producto de la Página de Precios: Cohere Rerank - Dedicated
  • Nombre de límite: dedicated-unit-rerank-cohere-count
  • Para el alojamiento, solicite un aumento del límite en: 1
Consejo

Si no tiene suficientes límites de cluster en su arrendamiento para alojar el modelo Cohere Rerank 3.5 en un cluster de AI dedicado, solicite que el límite dedicated-unit-rerank-cohere-count aumente en 1.

Reglas de punto final para clusters

  • Un cluster de AI dedicado puede contener hasta 50 puntos finales.
  • Utilice estos puntos finales para crear alias que apunten al mismo modelo base o a la misma versión de un modelo personalizado, pero no a ambos tipos.
  • Varios puntos finales para el mismo modelo facilitan su asignación a diferentes usuarios o propósitos.
Tamaño de unidad de cluster de alojamiento Reglas de punto final
RERANK_COHERE
  • Modelo base: para ejecutar el ⁇ cohere.rerank.v3-5 ⁇ modelo en varios puntos finales, cree tantos puntos finales como necesite en un cluster RERANK_COHERE (tamaño de unidad).
  • Modelo personalizado: no puede ajustar cohere.rerank.v3-5, por lo que no puede crear ni alojar modelos personalizados creados a partir de esa base.
Consejo

Referencias de rendimiento de cluster

Revise las referencias de rendimiento del cluster de Cohere Rerank 3.5 para diferentes escenarios.

Fechas de liberación y baja

Modelo Fecha de liberación Fecha de baja bajo demanda Fecha de baja en modo dedicado
cohere.rerank.v3-5 2.025-5-14 El modo bajo demanda no está disponible para este modelo. Al menos 6 meses después de la liberación del 1er modelo de reemplazo.
Importante

Para obtener una lista de todas las líneas de tiempo de modelo y los detalles de baja, consulte Baja de los modelos.

Parámetro de modelo de nueva clasificación

Para conocer los parámetros del modelo Rerank, consulte la documentación de la API RerankText.