Cohere Embed 4 (New)
cohere.embed-v4.0
ist ein multimodales Modell, das Texteinbettungen aus einer gemischten Modalitätseingabe erstellen kann. Dabei handelt es sich um eine Eingabe von Text und Bildern in einer einzelnen Payload.
In diesen Regionen verfügbar
- Brazil East (Sao Paulo) (nur dediziertes KI-Cluster)
- Germany Central (Frankfurt) (nur dediziertes KI-Cluster)
- India South (Hyderabad) (nur dediziertes KI-Cluster)
- Japan Central (Osaka)
- Saudi Arabia Central (Riad)
- UAE East (Dubai) (nur dediziertes KI-Cluster)
- UK South (London) (nur dediziertes KI-Cluster)
- US Midwest (Chicago)
Wichtige Features
- Modus
- Text oder Bild eingeben, aber nicht beides.
- Um Einbettungen für ein Bild zu erhalten, ist nur ein Bild zulässig. Sie können Text und Bild nicht für dieselbe Einbettung kombinieren. Bildeingabe nur über API.
- Ein- und Ausgaben
- In der Konsole muss jede Texteingabe kleiner als 512 Token und maximal 96 Eingaben pro Ausführung sein.
- Im SDK und in der API können alle Eingaben zusammen bis zu 128.000 Token pro Einbettung pro Ausführung hinzufügen.
- Das Modell gibt für jede Einbettung einen 1.536-dimensionalen Vektor aus.
- Unterstützung der Landessprache
- Text: Englisch oder Mehrsprachig.
- Bild: Nur Englisch.
Dediziertes KI-Cluster für das Modell
Um ein Modell über ein dediziertes KI-Cluster in einer beliebigen aufgelisteten Region zu erreichen, müssen Sie einen Endpunkt für dieses Modell in einem dedizierten KI-Cluster erstellen. Die Größe der Clustereinheit, die mit diesem Modell übereinstimmt, finden Sie in der folgenden Tabelle.
Basismodell | Optimierungscluster | Hostingcluster | Preisfindungsseiteninformationen | Erhöhung des Clusterlimits anfordern |
---|---|---|---|---|
|
Nicht für Feinabstimmung verfügbar |
|
|
|
-
Wenn in Ihrem Mandanten nicht genügend Clusterlimits für das Hosting eines Einbettungsmodells in einem dedizierten KI-Cluster vorhanden sind, fordern Sie die Erhöhung des Limits
dedicated-unit-embed-cohere-count
um 1 an. - Prüfen Sie die Performancebenchmarks für Cohere Embed 4-Cluster für verschiedene Anwendungsfälle.
Abruf- und Abgangsdatum
Modell | Freigabedatum | Abgangsdatum bei Bedarf | Abgangsdatum im dedizierten Modus |
---|---|---|---|
cohere.embed-v4.0
|
2.025-7-3 | Mindestens 6 Monate nach dem Release des 1. Ersatzmodells. | Mindestens 6 Monate nach dem Release des 1. Ersatzmodells. |
Eine Liste aller Modellzeitpositionen und Abgangsdetails finden Sie unter Ablauf der Modelle.
Modellparameter für Einbettung
Wenn Sie die Einbettungsmodelle verwenden, können Sie eine andere Ausgabe erhalten, indem Sie den folgenden Parameter ändern.
- Truncate
-
Gibt an, ob die Start- oder Endtoken in einem Satz abgeschnitten werden sollen, wenn der Satz die maximale Anzahl zulässiger Token überschreitet. Beispiel: Ein Satz hat 516 Token, die maximale Tokengröße ist jedoch 512. Wenn Sie das Ende abschneiden, werden die letzten 4 Token dieses Satzes abgeschnitten.