Cohere Embed 4 (New)

cohere.embed-v4.0 ist ein multimodales Modell, das Texteinbettungen aus einer gemischten Modalitätseingabe erstellen kann. Dabei handelt es sich um eine Eingabe von Text und Bildern in einer einzelnen Payload.

In diesen Regionen verfügbar

  • Brazil East (Sao Paulo) (nur dediziertes KI-Cluster)
  • Germany Central (Frankfurt) (nur dediziertes KI-Cluster)
  • India South (Hyderabad) (nur dediziertes KI-Cluster)
  • Japan Central (Osaka)
  • Saudi Arabia Central (Riad)
  • UAE East (Dubai) (nur dediziertes KI-Cluster)
  • UK South (London) (nur dediziertes KI-Cluster)
  • US Midwest (Chicago)

Wichtige Features

  • Modus
    • Text oder Bild eingeben, aber nicht beides.
    • Um Einbettungen für ein Bild zu erhalten, ist nur ein Bild zulässig. Sie können Text und Bild nicht für dieselbe Einbettung kombinieren. Bildeingabe nur über API.
  • Ein- und Ausgaben
    • In der Konsole muss jede Texteingabe kleiner als 512 Token und maximal 96 Eingaben pro Ausführung sein.
    • Im SDK und in der API können alle Eingaben zusammen bis zu 128.000 Token pro Einbettung pro Ausführung hinzufügen.
    • Das Modell gibt für jede Einbettung einen 1.536-dimensionalen Vektor aus.
  • Unterstützung der Landessprache

Dediziertes KI-Cluster für das Modell

Um ein Modell über ein dediziertes KI-Cluster in einer beliebigen aufgelisteten Region zu erreichen, müssen Sie einen Endpunkt für dieses Modell in einem dedizierten KI-Cluster erstellen. Die Größe der Clustereinheit, die mit diesem Modell übereinstimmt, finden Sie in der folgenden Tabelle.

Basismodell Optimierungscluster Hostingcluster Preisfindungsseiteninformationen Erhöhung des Clusterlimits anfordern
  • Modellname: Cohere Embed 4
  • OCI-Modellname: cohere.embed-v4.0
Nicht für Feinabstimmung verfügbar
  • Einheit: Embed Cohere
  • Erforderliche Maßeinheiten: 1
  • Produktname der Preisseite: Embed Cohere - Dedicated
  • Für Hosting Multiply the Unit Price: x1
  • Limitname: dedicated-unit-embed-cohere-count
  • Für Hosting erhöhen Sie das Limit um: 1
Tipp

  • Wenn in Ihrem Mandanten nicht genügend Clusterlimits für das Hosting eines Einbettungsmodells in einem dedizierten KI-Cluster vorhanden sind, fordern Sie die Erhöhung des Limits dedicated-unit-embed-cohere-count um 1 an.

  • Prüfen Sie die Performancebenchmarks für Cohere Embed 4-Cluster für verschiedene Anwendungsfälle.

Abruf- und Abgangsdatum

Modell Freigabedatum Abgangsdatum bei Bedarf Abgangsdatum im dedizierten Modus
cohere.embed-v4.0 2.025-7-3 Mindestens 6 Monate nach dem Release des 1. Ersatzmodells. Mindestens 6 Monate nach dem Release des 1. Ersatzmodells.
Wichtig

Eine Liste aller Modellzeitpositionen und Abgangsdetails finden Sie unter Ablauf der Modelle.

Modellparameter für Einbettung

Wenn Sie die Einbettungsmodelle verwenden, können Sie eine andere Ausgabe erhalten, indem Sie den folgenden Parameter ändern.

Truncate

Gibt an, ob die Start- oder Endtoken in einem Satz abgeschnitten werden sollen, wenn der Satz die maximale Anzahl zulässiger Token überschreitet. Beispiel: Ein Satz hat 516 Token, die maximale Tokengröße ist jedoch 512. Wenn Sie das Ende abschneiden, werden die letzten 4 Token dieses Satzes abgeschnitten.