Cohere Rerank 3.5

Das Modell cohere.rerank.v3-5 nimmt eine Abfrage und eine Liste von Texten auf und erstellt ein geordnetes Array mit jedem Text, dem eine Relevanzbewertung zugewiesen ist. Die Relevanzbewertung ist, wie das Modell die Dokumente einstuft, d.h. wie gut jeder Text mit der Abfrage übereinstimmt.

Regionen für dieses Modell

Wichtig

Für unterstützte Regionen, Endpunkttypen (On-Demand- oder dedizierte KI-Cluster) und Hosting (OCI Generative AI oder externe Aufrufe) für dieses Modell finden Sie auf der Seite Modelle nach Region. Details zu den Regionen finden Sie auf der Seite Regionen für generative KI.

Wichtige Features

Dediziertes KI-Cluster für das Modell

  • Das Modell ist nur im dedizierten Modus verfügbar. (Bei Bedarf nicht verfügbar.)
  • Erstellen Sie im dedizierten Modus einen Endpunkt in einem dedizierten KI-Hostcluster, hosten Sie das Modell im Cluster, und führen Sie dann die RerankText-API oder das zugehörige SDK aus.

Die Größe der Clustereinheit, die mit diesem Modell übereinstimmt, finden Sie in der folgenden Tabelle.

Basismodell Optimierungscluster Hostingcluster Preisfindungsseiteninformationen Erhöhung des Clusterlimits anfordern
  • Modellname: Cohere Rerank 3.5
  • OCI-Modellname: cohere.rerank.v3-5
Nicht für Feinabstimmung verfügbar
  • Einheit: RERANK_COHERE
  • Erforderliche Maßeinheiten: 1
  • Produktname der Preisseite: Cohere Rerank - Dedicated
  • Limitname: dedicated-unit-rerank-cohere-count
  • Für Hosting erhöhen Sie das Limit um: 1
Tipp

Wenn in Ihrem Mandanten nicht genügend Clusterlimits für das Hosting des Modells Cohere Rerank 3.5 in einem dedizierten KI-Cluster vorhanden sind, fordern Sie die Erhöhung des Limits dedicated-unit-rerank-cohere-count um 1 an.

Endpunktregeln für Cluster

  • Ein dediziertes KI-Cluster kann bis zu 50 Endpunkte enthalten.
  • Verwenden Sie diese Endpunkte, um Aliasnamen zu erstellen, die alle entweder auf das gleiche Basismodell oder auf die gleiche Version eines benutzerdefinierten Modells verweisen, nicht jedoch auf beide Typen.
  • Mehrere Endpunkte für dasselbe Modell erleichtern die Zuweisung zu verschiedenen Benutzern oder Zwecken.
Hostingclustereinheitsgröße Endpunktregeln
RERANK_COHERE
  • Basismodell: Um das Modell ⁇ cohere.rerank.v3-5 ⁇ auf mehreren Endpunkten auszuführen, erstellen Sie so viele Endpunkte, wie Sie für ein RERANK_COHERE-Cluster benötigen (Größe der Einheit).
  • Benutzerdefiniertes Modell: Sie können cohere.rerank.v3-5 nicht optimieren, sodass Sie keine benutzerdefinierten Modelle erstellen und hosten können, die auf dieser Basis erstellt wurden.
Tipp

Clusterperformancebenchmarks

Prüfen Sie die Cohere Rerank 3.5-Clusterperformancebenchmarks für verschiedene Szenarios.

Rerank-Modellparameter

Die Parameter des Rerank-Modells finden Sie in der API-Dokumentation RerankText.