Comando Cohere (52B)
Il modello cohere.command
non è più valido.
Il modello
cohere.command
supportato per la modalità di servizio su richiesta è ora ritirato e questo modello non è più valido per la modalità di servizio dedicata. Se si sta ospitando cohere.command
in un cluster AI dedicato, (modalità di servizio dedicata), è possibile continuare a utilizzare questa replica del modello hosted con l'API di generazione e riepilogo e nell'area di gioco fino a quando il modello cohere.command
non ritira per la modalità di servizio dedicata. Questo modello, se ospitato in un cluster AI dedicato, è disponibile solo nel Midwest degli Stati Uniti (Chicago). Vedere Ritiro dei modelli per le date e le definizioni di smobilizzo. Si consiglia di utilizzare i modelli di chat che offrono le stesse funzionalità di generazione del testo e di riepilogo, incluso il controllo della lunghezza e dello stile del riepilogo.Disponibile in queste aree
- Stati Uniti (Midwest) - Chicago
Caratteristiche principali
- Il modello ha 52 miliardi di parametri.
- Il prompt utente e la risposta possono essere fino a 4.096 token per ogni esecuzione.
- È possibile ottimizzare questo modello con il data set.
Cluster AI dedicato per il modello
Nella lista di aree precedente, i modelli nelle aree che non sono contrassegnate con (solo cluster AI dedicato) dispongono di opzioni cluster AI sia on-demand che dedicate. Per l'opzione on-demand, non hai bisogno di cluster e puoi raggiungere il modello nell'area di gioco della console o tramite l'API.
Per raggiungere un modello tramite un cluster AI dedicato in qualsiasi area elencata, devi creare un endpoint per tale modello su un cluster AI dedicato. Per le dimensioni dell'unità cluster corrispondenti a questo modello, vedere la tabella riportata di seguito.
Modello base | Cluster di ottimizzazione | Cluster di hosting | Informazioni pagina determinazione prezzi | Richiedi aumento limite cluster |
---|---|---|---|---|
|
|
|
|
|
Date rilascio e smobilizzo
Modello | Data di rilascio | Data smobilizzo su richiesta | Data smobilizzo modalità dedicata |
---|---|---|---|
cohere.command
|
2.024-2-7 | 2.024-10-2 | 2.025-8-7 |
Per un elenco di tutte le linee temporali del modello e dei relativi dettagli, vedere Ritiro dei modelli.
Parametri del modello di generazione
Quando si utilizzano i modelli di generazione, è possibile variare l'output modificando i seguenti parametri.
- Numero massimo di token di output
-
Numero massimo di token che si desidera vengano generati dal modello per ogni risposta. Stima quattro caratteri per token.
- Temperatura
-
Livello di casualità utilizzato per generare il testo di output.
Suggerimento
Iniziare con la temperatura impostata su 0 o meno e aumentare la temperatura quando si rigenerano i prompt per ottenere un output più creativo. Le alte temperature possono introdurre allucinazioni e informazioni di fatto errate. - Top k
-
Metodo di campionamento in cui il modello sceglie il token successivo in modo casuale dai token
top k
con maggiore probabilità. Un valore più alto perk
genera un output più casuale, che rende il testo di output più naturale. Il valore predefinito per k è 0 per i modellicommand
e -1 per i modelliLlama
, il che significa che i modelli devono considerare tutti i token e non utilizzare questo metodo. - Top p
-
Metodo di campionamento che controlla la probabilità cumulativa dei primi token da considerare per il token successivo. Assegnare a
p
un numero decimale compreso tra 0 e 1 per la probabilità. Ad esempio, immettere 0,75 per il primo 75% da considerare. Impostarep
su 1 per considerare tutti i token. - Sequenze di interruzione
-
Sequenza di caratteri, ad esempio una parola, una frase, una nuova riga
(\n)
o un punto, che indica al modello quando interrompere l'output generato. Se si dispone di più sequenze di arresto, il modello si arresta quando raggiunge una qualsiasi di tali sequenze. - Penalità di frequenza
-
Penale assegnata a un token quando tale token appare frequentemente. Le sanzioni elevate incoraggiano un minor numero di token ripetuti e producono un output più casuale.
- Penalità di presenza
-
Penalità assegnata a ciascun token quando viene visualizzato nell'output per incoraggiare la generazione di output con token non utilizzati.
- Mostra probabilità
-
Ogni volta Che deve essere generato un nuovo token, un numero intero compreso tra -15 e 0 viene assegnato a tutti i token, dove i token con numeri pi alti hanno maggiori probabilità di seguire il token corrente. Ad esempio, è più probabile che la parola preferito sia seguita dalla parola alimento o libro piuttosto che dalla parola zebra. Questo parametro è disponibile solo per i modelli
cohere
.
Parametri modello di generazione sintetico
Quando si utilizza un modello di riepilogo ospitato nell'area di gioco, è possibile ottenere un output diverso modificando i seguenti parametri.
- Length
-
Lunghezza approssimativa del riepilogo. È possibile selezionare corto, medio o lungo. Brevi riassunti sono circa fino a due frasi lunghe, brevi riassunti sono tra tre e cinque frasi, e lunghi riassunti potrebbero avere sei o più frasi. Per il valore Automatico, il modello sceglie una lunghezza in base alla dimensione di input.
- Formato
-
Indica se visualizzare il riepilogo in un paragrafo in formato libero o in punti elenco. Per il valore Auto, il modello sceglie il formato migliore in base al testo di input.
- Estrattività
-
Quanto riutilizzare l'input nel riepilogo. I riepiloghi con elevata estrattività tendono a utilizzare le frasi parola per parola e i riepiloghi con bassa estrattività tendono a parafrasare.
- Temperatura
-
Livello di casualità utilizzato per generare il testo di output.
Suggerimento
Per riepilogare un testo, iniziare con la temperatura impostata su 0. Se non si richiedono risultati casuali, si consiglia un valore di temperatura di 0,2. Utilizzare un valore più alto se, ad esempio, si prevede di selezionare vari riepiloghi in seguito. Tuttavia, non utilizzare una temperatura elevata per la sintesi perché un'alta temperatura incoraggia il modello a produrre testo creativo, che potrebbe anche includere allucinazioni e informazioni di fatto errate. - Comando aggiuntivo
-
Altre opzioni riassuntive quali lo stile o l'elemento attivo. Scrivere uno o più comandi aggiuntivi in un linguaggio naturale come istruzioni per il modello, ad esempio "focus on date", o "write in a conversational style", o "END the curriculum with END SUMMARY".