Cohere Embed English 3
Das Modell cohere.embed-english-v3.0
transformiert jeden Satz, Satz oder Absatz, den Sie eingeben, in ein Array.
Sie können die Einbettungsmodelle verwenden, um Ähnlichkeit in Ausdrücken zu finden, die im Kontext oder in der Kategorie ähnlich sind. Einbettungen werden in der Regel in einer Vektordatenbank gespeichert. Einbettungen werden hauptsächlich für semantische Suchen verwendet, bei denen sich die Suchfunktion auf die Bedeutung des durchsuchten Textes konzentriert, anstatt Ergebnisse basierend auf Schlüsselwörtern zu finden.
In diesen Regionen verfügbar
- Brazil East (Sao Paulo)
- Germany Central (Frankfurt)
- Japan Central (Osaka)
- UAE East (Dubai) (nur dediziertes KI-Cluster)
- UK South (London)
- US Midwest (Chicago)
Wichtige Features
- Verwenden Sie die Cohere Embed English-Modelle, um Texteinbettungen aus englischen Dokumenten zu generieren.
- Englisch oder mehrsprachig.
- Das Modell erstellt für jede Einbettung einen Vektor mit 1,024 Dimensionen.
- Maximal 96 Sätze pro Ausführung.
- Maximal 512 Token für jede Eingabe.
Dediziertes KI-Cluster für das Modell
Um ein Modell über ein dediziertes KI-Cluster in einer beliebigen aufgelisteten Region zu erreichen, müssen Sie einen Endpunkt für dieses Modell in einem dedizierten KI-Cluster erstellen. Die Größe der Clustereinheit, die mit diesem Modell übereinstimmt, finden Sie in der folgenden Tabelle.
Basismodell | Optimierungscluster | Hostingcluster | Preisfindungsseiteninformationen | Erhöhung des Clusterlimits anfordern |
---|---|---|---|---|
|
Nicht für Feinabstimmung verfügbar |
|
|
|
-
Wenn in Ihrem Mandanten nicht genügend Clusterlimits für das Hosting eines Einbettungsmodells in einem dedizierten KI-Cluster vorhanden sind, fordern Sie die Erhöhung des Limits
dedicated-unit-embed-cohere-count
um 1 an. - Prüfen Sie die Performancebenchmarks für das Cluster Cohere Embed English 3 für verschiedene Anwendungsfälle.
Abruf- und Abgangsdatum
Modell | Freigabedatum | Abgangsdatum bei Bedarf | Abgangsdatum im dedizierten Modus |
---|---|---|---|
cohere.embed-english-v3.0
|
2.024-2-7 | 2.026-1-22 | cohere.embed-v4.0
|
Eine Liste aller Modellzeitpositionen und Abgangsdetails finden Sie unter Ablauf der Modelle.
Modellparameter für Einbettung
Wenn Sie die Einbettungsmodelle verwenden, können Sie eine andere Ausgabe erhalten, indem Sie den folgenden Parameter ändern.
- Truncate
-
Gibt an, ob die Start- oder Endtoken in einem Satz abgeschnitten werden sollen, wenn der Satz die maximale Anzahl zulässiger Token überschreitet. Beispiel: Ein Satz hat 516 Token, die maximale Tokengröße ist jedoch 512. Wenn Sie das Ende abschneiden, werden die letzten 4 Token dieses Satzes abgeschnitten.