Cohere Rerank 4.0
Cohere Rerank 4.0 es un modelo de rerank disponible en dos variantes, Pro y Fast.
Cómo funciona Reranking
La modificación mejora la relevancia de la búsqueda al reordenar un juego inicial de resultados recuperados. Después de que un primer paso de recuperación devuelve documentos candidatos, el modelo de nueva ejecución compara la consulta con cada candidato y clasifica los resultados de más relevantes a menos relevantes. Esto ayuda a mostrar resultados que coincidan mejor con la intención del usuario.
Los modelos Rerank 4.0 de Cohere soportan el cambio multilingüe y también pueden volver a clasificar el contenido JSON semiestructurado.
Novedades de Rerank 4.0
En comparación con Cohere Rerank v3.5, Rerank 4.0 presenta una ventana de contexto más grande, mejor calidad de cambio, soporte para la adaptación de modelos y dos variantes optimizadas para diferentes requisitos de carga de trabajo.
Ventana de contexto aumentada
Rerank 4.0 admite una ventana de contexto de 32 000 tokens, en comparación con el límite de 4 000 tokens en Rerank v3.5. Esta ventana de contexto más amplia mejora el manejo de documentos largos y entradas de candidatos más grandes, lo que es útil para el contenido empresarial denso, como informes financieros, acuerdos legales y documentación técnica.
Mejora de la calidad del reranking
Rerank 4.0 mejora los pedidos de resultados para las cargas de trabajo de recuperación empresarial. En comparación con Rerank v3.5, proporciona una clasificación de mayor relevancia para los negocios, las finanzas y el contenido técnico, lo que puede mejorar la calidad de los flujos de trabajo de generación aumentados de recuperación posteriores al mostrar un contexto más relevante.
Soporte de autoaprendizaje
Rerank 4.0 presenta soporte de autoaprendizaje, que le permite adaptar el comportamiento de repetición a los datos, la terminología y las preferencias de relevancia sin necesidad de datos de entrenamiento anotados. Esto puede mejorar la calidad de recuperación para dominios empresariales especializados.
Variantes Pro y Fast
Rerank 4.0 está disponible en dos variantes:
- Pro está optimizado para tareas de renovación de mayor precisión y recuperación más complejas.
- Fast está optimizado para cargas de trabajo de menor latencia y mayor rendimiento.
Soporte de datos multilingüe y semiestructurado
Rerank 4.0 admite la reproducción de texto multilingüe y mejora el manejo del contenido semiestructurado, incluidos JSON, tablas y contenido similar a código. Esto lo hace más adecuado para conjuntos de datos empresariales que combinan el lenguaje natural con campos estructurados o parcialmente estructurados.
Regiones para este modelo
Para las regiones soportadas, los tipos de punto final (clusters de IA dedicados o bajo demanda) y el alojamiento (OCI Generative AI o llamadas externas) para este modelo, consulte la página Modelos por región. Para obtener más información sobre las regiones, consulte la página Regiones de IA generativa.
Acceder a este modelo
Las tintas de API muestran los puntos finales de todas las regiones comerciales, soberanas y gubernamentales compatibles.
Variantes de modelo
Cohere Rerank 4 incluye las siguientes variantes de modelos:
| Modelo | Nombre de modelo de OCI | Descripción |
|---|---|---|
| Cohere Rerank 4 Pro | cohere.rerank-v4.0-pro |
Modelo de reproducción multilingüe para texto en inglés y no en inglés y datos JSON semiestructurados. Ideal para cargas de trabajo de cambio complejas y centradas en la calidad. |
| Cohere Rerank 4 Fast | cohere.rerank-v4.0-fast |
Modelo de reproducción multilingüe ligero para texto en inglés y no en inglés y datos JSON semiestructurados. Ideal para cargas de trabajo de menor latencia y mayor rendimiento. |
Cluster de IA dedicado para el modelo
- El modelo solo está disponible mediante el modo dedicado. (No disponible bajo demanda.)
- Para el modo dedicado, cree un punto final en un cluster de AI dedicado de alojamiento, aloje el modelo en el cluster y, a continuación, ejecute la API RerankText o su SDK relevante.
Para ver el tamaño de la unidad de cluster que coincide con cada modelo, consulte la siguiente tabla.
| Modelo base | Cluster de Ajuste | Cluster de alojamiento | Información de página de asignación de precios | Aumento de límite de cluster de solicitud |
|---|---|---|---|---|
|
No disponible para ajuste |
|
|
|
|
No disponible para ajuste |
|
|
|
Si no tiene suficientes límites de cluster en su arrendamiento para alojar el modelo Cohere Rerank 4.0 en un cluster de AI dedicado, solicite que el límite dedicated-unit-rerank-cohere-count aumente en 1.
Reglas de punto final para clusters
- Un cluster de AI dedicado puede contener hasta 50 puntos finales.
- Utilice estos puntos finales para crear alias que apunten al mismo modelo base o a la misma versión de un modelo personalizado, pero no a ambos tipos.
- Varios puntos finales para el mismo modelo facilitan su asignación a diferentes usuarios o propósitos.
| Tamaño de unidad de cluster de alojamiento | Reglas de punto final |
|---|---|
| RERANK_COHERE |
|
-
Para aumentar el volumen de llamadas soportado por un cluster de alojamiento, aumente el recuento de instancias editando el cluster de AI dedicado. Consulte Updating a Dedicated AI Cluster.
-
Para más de 50 puntos finales por cluster, solicite un aumento del límite,
endpoint-per-dedicated-unit-count. Consulte Creación de una solicitud de aumento del límite y Límites de servicio para la IA generativa.
Fechas de liberación y baja
Para conocer las fechas de liberación y baja y las opciones de modelo de sustitución, consulte la siguiente página:
Parámetro de modelo de nueva clasificación
Para conocer los parámetros del modelo Rerank, consulte la documentación de la API RerankText.