Cohere Embed Multilingual Light 3
Il modello cohere.embed-multilingual-light-v3.0
trasforma ogni frase, frase o paragrafo inserito in un array.
È possibile utilizzare i modelli di incorporamento per trovare la somiglianza nelle frasi simili nel contesto o nella categoria. Le integrazioni sono in genere memorizzate in un database vettoriale. Gli incorporamenti sono principalmente utilizzati per ricerche semantiche in cui la funzione di ricerca si concentra sul significato del testo che sta cercando piuttosto che trovare risultati basati su parole chiave.
Disponibile in quest'area
- Stati Uniti (Midwest) - Chicago
Caratteristiche principali
- I modelli leggeri sono più piccoli e più veloci dei modelli originali.
- Inglese o multilingue.
- Il modello crea un vettore 384-dimensionale per ogni incorporamento.
- Massimo 96 frasi per esecuzione.
- Massimo 512 token per ogni input.
- Ideale per i casi d'uso quando:
- Al posto dell'inglese, i documenti vengono scritti in una delle lingue supportate.
- I documenti sono scritti in più lingue e queste sono una delle lingue supportate.
Cluster AI dedicato per il modello
Per raggiungere un modello tramite un cluster AI dedicato in qualsiasi area elencata, devi creare un endpoint per tale modello su un cluster AI dedicato. Per le dimensioni dell'unità cluster corrispondenti a questo modello, vedere la tabella riportata di seguito.
Modello base | Cluster di ottimizzazione | Cluster di hosting | Informazioni pagina determinazione prezzi | Richiedi aumento limite cluster |
---|---|---|---|---|
|
Non disponibile per l'ottimizzazione |
|
|
|
-
Il modello Cohere Embed Multilingual Light 3 include opzioni di cluster AI sia on-demand che dedicate. Per l'opzione on-demand, non hai bisogno di cluster e puoi raggiungere il modello nell'area di gioco della console o tramite l'API.
-
Se non si dispone di limiti cluster sufficienti nella tenancy per l'hosting di un modello incorporato in un cluster AI dedicato, richiedere il limite
dedicated-unit-embed-cohere-count
da aumentare di 1.
Date rilascio e smobilizzo
Modello | Data di rilascio | Data smobilizzo su richiesta | Data smobilizzo modalità dedicata |
---|---|---|---|
cohere.embed-multilingual-light-v3.0
|
2.024-2-7 | Almeno un mese dopo il rilascio del 1° modello di sostituzione. | Almeno 6 mesi dopo il rilascio del 1o modello di sostituzione. |
Per un elenco di tutte le linee temporali del modello e dei relativi dettagli, vedere Ritiro dei modelli.
Incorporamento del parametro modello
Quando si utilizzano i modelli di incorporamento, è possibile ottenere un output diverso modificando il parametro seguente.
- Tronca
-
Indica se troncare i token iniziale o finale in una frase, quando tale frase supera il numero massimo di token consentiti. Ad esempio, una frase ha 516 token, ma la dimensione massima del token è 512. Se si sceglie di troncare la fine, gli ultimi 4 token di quella frase vengono tagliati.