Cohere Embed Multilingual Light 3
Das Modell cohere.embed-multilingual-light-v3.0
transformiert jeden Satz, Satz oder Absatz, den Sie eingeben, in ein Array.
Sie können die Einbettungsmodelle verwenden, um Ähnlichkeit in Ausdrücken zu finden, die im Kontext oder in der Kategorie ähnlich sind. Einbettungen werden in der Regel in einer Vektordatenbank gespeichert. Einbettungen werden hauptsächlich für semantische Suchen verwendet, bei denen sich die Suchfunktion auf die Bedeutung des durchsuchten Textes konzentriert, anstatt Ergebnisse basierend auf Schlüsselwörtern zu finden.
In dieser Region verfügbar
- US Midwest (Chicago)
Wichtige Features
- Lichtmodelle sind kleiner und schneller als die Originalmodelle.
- Englisch oder mehrsprachig.
- Das Modell erstellt für jede Einbettung einen Vektor mit 384 Dimensionen.
- Maximal 96 Sätze pro Ausführung.
- Maximal 512 Token für jede Eingabe.
- Am besten für Anwendungsfälle, wenn:
- Anstelle von Englisch werden die Dokumente in einer der unterstützten Sprachen geschrieben.
- Die Dokumente sind in mehreren Sprachen geschrieben, und diese Sprachen sind eine der unterstützten Sprachen.
Dediziertes KI-Cluster für das Modell
Um ein Modell über ein dediziertes KI-Cluster in einer beliebigen aufgelisteten Region zu erreichen, müssen Sie einen Endpunkt für dieses Modell in einem dedizierten KI-Cluster erstellen. Die Größe der Clustereinheit, die mit diesem Modell übereinstimmt, finden Sie in der folgenden Tabelle.
Basismodell | Optimierungscluster | Hostingcluster | Preisfindungsseiteninformationen | Erhöhung des Clusterlimits anfordern |
---|---|---|---|---|
|
Nicht für Feinabstimmung verfügbar |
|
|
|
-
Das Cohere Embed Multilingual Light 3-Modell verfügt sowohl über On-Demand- als auch über dedizierte KI-Clusteroptionen. Für die On-Demand-Option benötigen Sie keine Cluster, und Sie können das Modell im Playground der Konsole oder über die API erreichen.
-
Wenn in Ihrem Mandanten nicht genügend Clusterlimits für das Hosting eines Einbettungsmodells in einem dedizierten KI-Cluster vorhanden sind, fordern Sie die Erhöhung des Limits
dedicated-unit-embed-cohere-count
um 1 an.
Abruf- und Abgangsdatum
Modell | Freigabedatum | Abgangsdatum bei Bedarf | Abgangsdatum im dedizierten Modus |
---|---|---|---|
cohere.embed-multilingual-light-v3.0
|
2.024-2-7 | 2.026-1-22 | cohere.embed-v4.0
|
Eine Liste aller Modellzeitpositionen und Abgangsdetails finden Sie unter Ablauf der Modelle.
Modellparameter für Einbettung
Wenn Sie die Einbettungsmodelle verwenden, können Sie eine andere Ausgabe erhalten, indem Sie den folgenden Parameter ändern.
- Truncate
-
Gibt an, ob die Start- oder Endtoken in einem Satz abgeschnitten werden sollen, wenn der Satz die maximale Anzahl zulässiger Token überschreitet. Beispiel: Ein Satz hat 516 Token, die maximale Tokengröße ist jedoch 512. Wenn Sie das Ende abschneiden, werden die letzten 4 Token dieses Satzes abgeschnitten.