Cohere Rerank 3.5 (New)
Das Modell cohere.rerank.3-5
nimmt eine Abfrage und eine Liste von Texten auf und erstellt ein geordnetes Array mit jedem Text, dem eine Relevanzbewertung zugewiesen ist. Die Relevanzbewertung ist, wie das Modell die Dokumente einstuft, d.h. wie gut jeder Text mit der Abfrage übereinstimmt.
In diesen Regionen verfügbar
- Brazil East (Sao Paulo) (nur dediziertes KI-Cluster)
- Germany Central (Frankfurt) (nur dediziertes KI-Cluster)
- Japan Central (Osaka) (nur dediziertes KI-Cluster)
- Saudi Arabia Central (Riyadh) (nur dediziertes KI-Cluster)
- UK South (London) (nur dediziertes KI-Cluster)
- US East (Ashburn) (nur dediziertes KI-Cluster)
- Mittlerer Westen der USA (Chicago) (nur dediziertes KI-Cluster)
Wichtige Features
- Nur dedizierter Modus.
- Nicht verfügbar auf Anfrage oder auf dem Spielplatz.
- Greifen Sie über API und SDK auf das Modell zu, das in einem Cluster gehostet wird.
- Erstellen Sie im dedizierten Modus einen Endpunkt in einem dedizierten KI-Hostcluster, hosten Sie das Modell im Cluster, und führen Sie dann die RerankText-API oder das zugehörige SDK aus.
Dediziertes KI-Cluster für das Modell
Um ein Modell über ein dediziertes KI-Cluster in einer beliebigen aufgelisteten Region zu erreichen, müssen Sie einen Endpunkt für dieses Modell in einem dedizierten KI-Cluster erstellen. Die Größe der Clustereinheit, die mit diesem Modell übereinstimmt, finden Sie in der folgenden Tabelle.
Basismodell | Optimierungscluster | Hostingcluster | Preisfindungsseiteninformationen | Erhöhung des Clusterlimits anfordern |
---|---|---|---|---|
|
Nicht für Feinabstimmung verfügbar |
|
|
|
-
Wenn in Ihrem Mandanten nicht genügend Clusterlimits für das Hosting des Modells Cohere Rerank 3.5 in einem dedizierten KI-Cluster vorhanden sind, fordern Sie die Erhöhung des Limits
dedicated-unit-rerank-cohere-count
um 1 an. - Prüfen Sie die Cohere Rerank 3.5-Clusterperformancebenchmarks für verschiedene Szenarios.
Abruf- und Abgangsdatum
Modell | Freigabedatum | Abgangsdatum bei Bedarf | Abgangsdatum im dedizierten Modus |
---|---|---|---|
cohere.rerank.3-5
|
2.025-5-14 | Die On-Demand-Option ist für dieses Modell nicht verfügbar. | Mindestens 6 Monate nach dem Release des 1. Ersatzmodells. |
Eine Liste aller Modellzeitpositionen und Abgangsdetails finden Sie unter Ablauf der Modelle.
Rerank-Modellparameter
Die Parameter des Rerank-Modells finden Sie in der API-Dokumentation RerankText.