Cohere Rerank 4

Cohere Rerank 4 es un modelo de rerank disponible en dos variantes, Pro y Fast.

La modificación mejora la relevancia de la búsqueda al reordenar un juego inicial de resultados recuperados. Después de que un paso de recuperación devuelve documentos candidatos, el modelo de nueva clasificación compara la consulta con cada candidato y clasifica los resultados de los más relevantes a los menos relevantes.

Cohere Rerank 4 soporta el aprendizaje multilingüe y el contenido semiestructurado, incluidos JSON, tablas y contenido similar a código.

Novedades de Rerank 4

En comparación con Cohere Rerank 3.5, Rerank 4 agrega una ventana de contexto más grande, mejor calidad de reproducción, soporte de autoaprendizaje y dos variantes optimizadas para diferentes requisitos de carga de trabajo

Ventana de contexto aumentada

Rerank 4 admite una ventana de contexto de 32.000 tokens. La ventana de contexto más amplia mejora el manejo de documentos largos y entradas de candidatos más grandes, lo que es útil para el contenido empresarial denso, como informes, contratos, manuales y documentación técnica.

Mejora de la calidad del reranking

Rerank 4 mejora los pedidos de resultados para las cargas de trabajo de recuperación empresarial. Proporciona una clasificación de mayor relevancia para el negocio, las finanzas, el contenido técnico y otro contenido específico del dominio, lo que puede mejorar los flujos de trabajo de generación aumentados de recuperación posteriores al mostrar un contexto más relevante.

Soporte de autoaprendizaje

Rerank 4 presenta soporte de autoaprendizaje, que ayuda a adaptar el comportamiento de repetición a datos específicos del dominio, terminología y preferencias de relevancia sin necesidad de datos de entrenamiento anotados.

Variantes Pro y Fast

Rerank 4 está disponible en dos variantes:

Pro está optimizado para tareas de renovación de mayor precisión y recuperación más complejas.
Fast está optimizado para cargas de trabajo de menor latencia y mayor rendimiento.

Soporte de datos multilingüe y semiestructurado

Rerank 4 es compatible con el reranking para contenido en inglés y no en inglés en más de 100 idiomas. También soporta contenido semiestructurado, como JSON, tablas y contenido similar a código.

Regiones para este modelo

Importante

Para las regiones soportadas, los tipos de punto final (clusters de IA dedicados o bajo demanda) y el alojamiento (OCI Generative AI o llamadas externas) para este modelo, consulte la página Modelos por región. Para obtener más información sobre las regiones, consulte la página Regiones de IA generativa.

Variantes de modelo

Cohere Rerank 4 incluye las siguientes variantes de modelos:


Modelo	Nombre de modelo de OCI	Descripción
Cohere Rerank 4 Pro	`cohere.rerank-v4.0-pro`	Modelo de reproducción multilingüe para texto en inglés y no en inglés y datos JSON semiestructurados. Ideal para cargas de trabajo de cambio complejas y centradas en la calidad.
Cohere Rerank 4 Fast	`cohere.rerank-v4.0-fast`	Modelo de reproducción multilingüe ligero para texto en inglés y no en inglés y datos JSON semiestructurados. Ideal para cargas de trabajo de menor latencia y mayor rendimiento.

Modo bajo demanda

Algunas variantes de Cohere Rerank 4 están disponibles bajo demanda en las regiones soportadas. El modo bajo demanda no requiere un cluster de IA dedicado.

Consulte Modelos por región para comprobar qué variantes de modelo están disponibles bajo demanda y en qué regiones.


Nombre de modelo	Nombre de modelo de OCI	Nombre de producto de página de asignación de precios
Cohere Rerank 4 Pro	`cohere.rerank-v4.0-pro`	Rerank 4 Pro
Cohere Rerank 4 Fast	`cohere.rerank-v4.0-fast`	Rerank 4 Fast

La fijación de precios se basa en 1 000 unidades de búsqueda. Consulte la página de precios.

Obtenga más información sobre el modo bajo demanda.

Cluster de IA dedicado para el modelo

Para los modelos en modo bajo demanda, no se necesitan clusters. Accede a ellos a través de la consola y la API. Para los modelos disponibles en el modo dedicado, utilice puntos finales creados en clusters de IA dedicados. Obtenga información sobre el modo dedicado.

En la siguiente tabla, se muestran los tamaños de las unidades de hardware, las regiones disponibles y los límites de servicio para los clusters de IA dedicados disponibles para Cohere Rerank 4 Pro y Cohere Rerank 4 Fast. Estos modelos no están disponibles para el ajuste.

Cohere Rerank 4 Pro y rápido


Tamaño de unidad de hardware	Regiones disponibles	Nombre de límite
Cohere_A10_X1	Centro de Alemania (Fráncfort) Este de EE. UU. (Ashburn) Medio Oeste de EE. UU. (Chicago)	Nombre de límite: `dedicated-unit-a10-count` Solicitar aumento en: 1
Cohere_A100_80G_X1	Medio Oeste de EE. UU. (Chicago) Oeste de EE. UU. (Phoenix)	Nombre de límite: `dedicated-unit-a100-80g-count` Solicitar aumento en: 1
Cohere_B200_X1	Este de Brasil (São Paulo) Centro de Alemania (Fráncfort) Sur de India (Hyderabad) Centro de Japón (Osaka) Sur de Reino Unido (Londres) Este de EE. UU. (Ashburn) Medio Oeste de EE. UU. (Chicago) Oeste de EE. UU. (Phoenix)	Nombre de límite: `dedicated-unit-b200-count` Solicitar aumento en: 1
Cohere_H100_X1	Este de Brasil (São Paulo) Centro de Alemania (Fráncfort) Sur de India (Hyderabad) Centro de Japón (Osaka) Sur de Reino Unido (Londres) Este de EE. UU. (Ashburn) Medio Oeste de EE. UU. (Chicago)	Nombre de límite: `dedicated-unit-h100-count` Solicitar aumento en: 1
Cohere_H200_X1	Arabia Saudí Central (Riad)	Nombre de límite: `dedicated-unit-h200-count` Solicitar aumento en: 1

Importante

Para conocer los precios del hardware, consulte el estimador de costos.
Si los límites de arrendamiento no son suficientes para alojar este modelo en un cluster de AI dedicado, solicite un aumento para el límite de hardware correspondiente. Por ejemplo, solicite un aumento para el límite dedicated-unit-h100-count en 1. Consulte Creación de una solicitud de aumento de límite.

Acceder a este modelo

Para utilizar un modelo de Cohere Rerank 4, llame a la API de RerankText desde una región soportada.

Punto final: https://inference.generativeai.{region}.oci.oraclecloud.com
Operación de API: POST /20231130/actions/rerankText

En RerankTextDetails, para servingMode, defina el atributo servingType según cómo desee acceder al modelo:

Utilice ON_DEMAND para un modelo a demanda en una región soportada.
Utilice DEDICATED para un modelo alojado en un punto final de cluster de IA dedicado.

Para obtener información sobre la disponibilidad y la configuración, consulte las secciones anteriores Modo bajo demanda y Cluster de AI dedicado para el modelo.

Fechas de lanzamiento y baja de OCI

Para conocer las fechas de lanzamiento y baja y las opciones del modelo de sustitución, consulte las siguientes páginas en función del modo (bajo demanda o dedicado):

Parámetros de modelo de nueva clasificación

Para conocer los parámetros del modelo Rerank, consulte la documentación de la API RerankText.

Documentación de Oracle Cloud Infrastructure