Cohere Rerank 4.0

Cohere Rerank 4.0 es un modelo de rerank disponible en dos variantes, Pro y Fast.

Cómo funciona Reranking

La modificación mejora la relevancia de la búsqueda al reordenar un juego inicial de resultados recuperados. Después de que un primer paso de recuperación devuelve documentos candidatos, el modelo de nueva ejecución compara la consulta con cada candidato y clasifica los resultados de más relevantes a menos relevantes. Esto ayuda a mostrar resultados que coincidan mejor con la intención del usuario.

Los modelos Rerank 4.0 de Cohere soportan el cambio multilingüe y también pueden volver a clasificar el contenido JSON semiestructurado.

Novedades de Rerank 4.0

En comparación con Cohere Rerank v3.5, Rerank 4.0 presenta una ventana de contexto más grande, mejor calidad de cambio, soporte para la adaptación de modelos y dos variantes optimizadas para diferentes requisitos de carga de trabajo.

Ventana de contexto aumentada

Rerank 4.0 admite una ventana de contexto de 32 000 tokens, en comparación con el límite de 4 000 tokens en Rerank v3.5. Esta ventana de contexto más amplia mejora el manejo de documentos largos y entradas de candidatos más grandes, lo que es útil para el contenido empresarial denso, como informes financieros, acuerdos legales y documentación técnica.

Mejora de la calidad del reranking

Rerank 4.0 mejora los pedidos de resultados para las cargas de trabajo de recuperación empresarial. En comparación con Rerank v3.5, proporciona una clasificación de mayor relevancia para los negocios, las finanzas y el contenido técnico, lo que puede mejorar la calidad de los flujos de trabajo de generación aumentados de recuperación posteriores al mostrar un contexto más relevante.

Soporte de autoaprendizaje

Rerank 4.0 presenta soporte de autoaprendizaje, que le permite adaptar el comportamiento de repetición a los datos, la terminología y las preferencias de relevancia sin necesidad de datos de entrenamiento anotados. Esto puede mejorar la calidad de recuperación para dominios empresariales especializados.

Variantes Pro y Fast

Rerank 4.0 está disponible en dos variantes:

  • Pro está optimizado para tareas de renovación de mayor precisión y recuperación más complejas.
  • Fast está optimizado para cargas de trabajo de menor latencia y mayor rendimiento.

Soporte de datos multilingüe y semiestructurado

Rerank 4.0 admite la reproducción de texto multilingüe y mejora el manejo del contenido semiestructurado, incluidos JSON, tablas y contenido similar a código. Esto lo hace más adecuado para conjuntos de datos empresariales que combinan el lenguaje natural con campos estructurados o parcialmente estructurados.

Regiones para este modelo

Importante

Para las regiones soportadas, los tipos de punto final (clusters de IA dedicados o bajo demanda) y el alojamiento (OCI Generative AI o llamadas externas) para este modelo, consulte la página Modelos por región. Para obtener más información sobre las regiones, consulte la página Regiones de IA generativa.

Variantes de modelo

Cohere Rerank 4 incluye las siguientes variantes de modelos:

Modelo Nombre de modelo de OCI Descripción
Cohere Rerank 4 Pro cohere.rerank-v4.0-pro Modelo de reproducción multilingüe para texto en inglés y no en inglés y datos JSON semiestructurados. Ideal para cargas de trabajo de cambio complejas y centradas en la calidad.
Cohere Rerank 4 Fast cohere.rerank-v4.0-fast Modelo de reproducción multilingüe ligero para texto en inglés y no en inglés y datos JSON semiestructurados. Ideal para cargas de trabajo de menor latencia y mayor rendimiento.

Cluster de IA dedicado para el modelo

  • El modelo solo está disponible mediante el modo dedicado. (No disponible bajo demanda.)
  • Para el modo dedicado, cree un punto final en un cluster de AI dedicado de alojamiento, aloje el modelo en el cluster y, a continuación, ejecute la API RerankText o su SDK relevante.

Para ver el tamaño de la unidad de cluster que coincide con cada modelo, consulte la siguiente tabla.

Modelo base Cluster de Ajuste Cluster de alojamiento Información de página de asignación de precios Aumento de límite de cluster de solicitud
  • Nombre de modelo: Cohere Rerank 4.0 Pro
  • Nombre del modelo de OCI: cohere.rerank-v4.0-pro
No disponible para ajuste
  • Tamaño de unidad: RERANK_COHERE
  • Unidades necesarias: 1
  • Nombre del Producto de la Página de Precios: Cohere Rerank - Dedicated
  • Nombre de límite: dedicated-unit-rerank-cohere-count
  • Para el alojamiento, solicite un aumento del límite en: 1
  • Nombre de modelo: Cohere Rerank 4.0 Fast
  • Nombre del modelo de OCI: cohere.rerank-v4.0-fast
No disponible para ajuste
  • Tamaño de unidad: RERANK_COHERE
  • Unidades necesarias: 1
  • Nombre del Producto de la Página de Precios: Cohere Rerank - Dedicated
  • Nombre de límite: dedicated-unit-rerank-cohere-count
  • Para el alojamiento, solicite un aumento del límite en: 1
Consejo

Si no tiene suficientes límites de cluster en su arrendamiento para alojar el modelo Cohere Rerank 4.0 en un cluster de AI dedicado, solicite que el límite dedicated-unit-rerank-cohere-count aumente en 1.

Reglas de punto final para clusters

  • Un cluster de AI dedicado puede contener hasta 50 puntos finales.
  • Utilice estos puntos finales para crear alias que apunten al mismo modelo base o a la misma versión de un modelo personalizado, pero no a ambos tipos.
  • Varios puntos finales para el mismo modelo facilitan su asignación a diferentes usuarios o propósitos.
Tamaño de unidad de cluster de alojamiento Reglas de punto final
RERANK_COHERE
  • Modelo base: para ejecutar el modelo ⁇ cohere.rerank-v4.0-pro o cohere.rerank-v4.0-fast ⁇ en varios puntos finales, cree tantos puntos finales como necesite en un cluster RERANK_COHERE (tamaño de unidad).
  • Modelo personalizado: no puede ajustar cohere.rerank-v4.0-pro ni cohere.rerank-v4.0-fast, por lo que no puede crear ni alojar modelos personalizados creados a partir de esa base.
Consejo

Parámetro de modelo de nueva clasificación

Para conocer los parámetros del modelo Rerank, consulte la documentación de la API RerankText.