Commande Cohere (52B)
Le modèle cohere.command
est obsolète.
Le modèle
cohere.command
pris en charge pour le mode de service sur demande est maintenant mis hors service et ce modèle est obsolète pour le mode de service dédié. Si vous hébergez cohere.command
sur une grappe dédiée à l'IA (mode de service dédié), vous pouvez continuer à utiliser cette réplique de modèle hébergée avec l'API de récapitulation et de génération et dans le terrain de jeu jusqu'à ce que le modèle cohere.command
abandonne le mode de service dédié. Ce modèle, lorsqu'il est hébergé sur une grappe dédiée à l'IA, n'est disponible qu'au Midwest américain (Chicago). Voir Mise hors service des modèles pour les dates et les définitions de mise hors service. Nous vous recommandons d'utiliser les modèles de clavardage qui offrent les mêmes capacités de récapitulation et de génération de texte, y compris le contrôle de la longueur et du style du sommaire.Disponible dans ces régions
- États-Unis - Midwest (Chicago)
Principales fonctions
- Le modèle a 52 milliards de paramètres.
- L'invite et la réponse de l'utilisateur peuvent atteindre 4 096 jetons pour chaque exécution.
- Vous pouvez ajuster ce modèle avec votre jeu de données.
Grappe d'IA dédiée pour le modèle
Dans la liste de régions précédente, les modèles des régions qui ne sont pas marquées avec (grappe dédiée à l'IA uniquement) ont des options de grappe dédiée à l'IA et à la demande. Pour l'option sur demande, vous n'avez pas besoin de grappes et vous pouvez accéder au modèle dans le terrain de jeu de la console ou au moyen de l'API.
Pour atteindre un modèle au moyen d'une grappe dédiée à l'IA dans n'importe quelle région répertoriée, vous devez créer un point d'extrémité pour ce modèle sur une grappe dédiée à l'IA. Pour connaître la taille d'unité de grappe correspondant à ce modèle, voir le tableau suivant.
Modèle de base | Cluster de réglage fin | Grappe d'hébergement | Informations sur la page de tarification | Demander une augmentation de limite de grappe |
---|---|---|---|---|
|
|
|
|
|
Dates de lancement et de mise hors service
Modèle | Date de version | Date de mise hors service sur demande | Date de mise hors service en mode dédié |
---|---|---|---|
cohere.command
|
2,024-2-7 | 2,024-10-2 | 2,025-8-7 |
Pour obtenir la liste de toutes les lignes de temps du modèle et les détails de mise hors service, voir Mise hors service des modèles.
Paramètres de modèle de génération
Lorsque vous utilisez les modèles de génération, vous pouvez modifier la sortie en modifiant les paramètres suivants.
- Nombre maximal de jetons de sortie
-
Nombre maximal de jetons que le modèle doit générer pour chaque réponse. Estimer quatre caractères par jeton.
- Température
-
Niveau de caractère aléatoire utilisé pour générer le texte de sortie.
Conseil
Commencez avec la température réglée à 0 ou moins d'un, puis augmentez la température au fur et à mesure que vous régénérez les invites pour une sortie plus créative. Les températures élevées peuvent introduire des hallucinations et des informations factuellement incorrectes. - k premiers
-
Méthode d'échantillonnage dans laquelle le modèle choisit le jeton suivant de manière aléatoire à partir des jetons
top k
les plus probables. Une valeur supérieure pourk
génère une sortie plus aléatoire, ce qui rend le texte de sortie plus naturel. La valeur par défaut pour k est 0 pour les modèlescommand
et -1 pour les modèlesLlama
, ce qui signifie que les modèles doivent prendre en compte tous les jetons et ne pas utiliser cette méthode. - p premiers
-
Méthode d'échantillonnage qui contrôle la probabilité cumulative des jetons supérieurs à prendre en compte pour le jeton suivant. Affectez à
p
un nombre décimal compris entre 0 et 1 pour la probabilité. Par exemple, entrez 0,75 pour les 75 % principaux à prendre en compte. Réglezp
à 1 pour prendre en compte tous les jetons. - Séquences d'arrêt
-
Séquence de caractères, telle qu'un mot, une expression, une nouvelle ligne
(\n)
ou un point, qui indique au modèle à quel moment arrêter la sortie générée. S'il existe plusieurs séquences d'arrêt, le modèle s'arrête lorsqu'il atteint l'une d'entre elles. - Pénalité de fréquence
-
Pénalité affectée à un jeton lorsque ce jeton apparaît fréquemment. Les pénalités élevées encouragent moins de jetons répétés et produisent un résultat plus aléatoire.
- Pénalité de présence
-
Pénalité affectée à chaque jeton lorsqu'il apparaît dans la sortie pour favoriser la génération de sorties contenant des jetons qui n'ont pas été utilisés.
- Afficher les probabilités
-
Chaque fois qu'un nouveau jeton doit être généré, un nombre compris entre -15 et 0 lui est affecté à tous les jetons. Les jetons associés aux valeurs les plus élevées sont les plus susceptibles de suivre le jeton courant. Par exemple, il est plus probable que le mot favori soit suivi du mot aliment ou livre plutôt que du mot zebra. Ce paramètre est disponible uniquement pour les modèles
cohere
.
Paramètres de modèle de résumé
Lorsque vous utilisez un modèle de résumé hébergé dans le terrain de jeu, vous pouvez obtenir une sortie différente en modifiant les paramètres suivants.
- Longueur
-
La longueur approximative du résumé. Vous pouvez sélectionner court, moyen ou long. Les résumés courts sont d'environ deux phrases de long, les résumés moyens sont entre trois et cinq phrases, et les résumés longs peuvent avoir six phrases ou plus. Avec la valeur Auto, le modèle choisit une longueur en fonction de la taille de l'entrée.
- Formater
-
Indique si le résumé doit être affiché comme un paragraphe à structure libre ou sous forme de liste à puces. Avec la valeur Auto, le modèle choisit le meilleur format en fonction du texte d'entrée.
- Extractivité
-
Degré de réutilisation de l'entrée dans le résumé. Les résumés à forte extractivité ont tendance à utiliser des phrases verbatim, et les résumés à faible extractivité ont tendance à paraphraser.
- Température
-
Niveau de caractère aléatoire utilisé pour générer le texte de sortie.
Conseil
Pour résumer un texte, commencez par régler la température à 0. Si vous n'avez pas besoin de résultats aléatoires, nous vous recommandons une valeur de température de 0,2. Utilisez une valeur plus élevée si, par exemple, vous prévoyez de sélectionner divers sommaires par la suite. Cependant, n'utilisez pas de température élevée pour un résumé car cela incite le modèle à produire du texte créatif, qui peut également inclure des hallucinations et des informations factuellement incorrectes. - Commande supplémentaire
-
Autres options de résumé telles que le style ou le ciblage. Écrivez une ou plusieurs commandes supplémentaires dans un langage naturel en tant qu'instructions au modèle, par exemple, "focus on dates", ou "write in a conversation style", ou "END the CV with END SUMMARY".