xAI Grok 4.20
Le xAI Grok 4.20 offre des variantes de raisonnement et de non-raisonnement avec une vitesse de pointe et un support d'appel d'outils agénétique. Il est conçu pour réduire les hallucinations et suivre de près les invites, produisant des réponses plus fiables et précises.
En savoir plus sur Grok 4.20
Régions pour ce modèle
Pour les régions prises en charge, les types d'adresse (clusters d'IA dédiés ou à la demande) et l'hébergement (appels externes ou OCI Generative AI) pour ce modèle, reportez-vous à la page Modèles par région. Pour plus de détails sur les régions, reportez-vous à la page Régions d'IA générative.
Accéder à ce modèle
Généralités
Le modèle xAI Grok 4.20 est disponible dans deux modes proposés dans deux modèles distincts. Un modèle de raisonnement et un modèle de non-raisonnement. Reportez-vous au tableau suivant pour déterminer le modèle à sélectionner.
| Mode | Nom du modèle | Utilisation |
|---|---|---|
| Raisonnement | xai.grok-4.20-0309-reasoning |
Logique et mathématiques complexes, analyse scientifique/technique, enquêtes en plusieurs étapes ou tâches à enjeux plus élevés où la précision compte plus que la latence la plus faible. |
| Non-raisonnement | xai.grok-4.20-0309-non-reasoning |
Questions et réponses de routine, récupération d'informations générales et scénarios à haut débit où la vitesse de réponse est la priorité. |
Principales fonctionnalités
- Noms de modèle dans OCI Generative AI :
- Raisonnement
-
xai.grok-4.20-0309-reasoningxai.grok-4.20-reasoning(alias qui pointe versxai.grok-4.20-0309-reasoning)
- Non-raisonnement
-
xai.grok-4.20-0309-non-reasoningxai.grok-4.20-non-reasoning(alias qui pointe versxai.grok-4.20-0309-non-reasoning)
- Disponible à la demande : accédez à ce modèle à la demande, via le playground de test de la console ou l'API.
- Prise en charge multimodale : saisissez du texte et des images et obtenez une sortie texte.
- Longueur de contexte : 2 millions de jetons (la longueur maximale de l'invite + de la réponse est de 2 millions de jetons pour conserver le contexte). Dans le terrain de jeu, la longueur de la réponse est plafonnée à 131 000 jetons pour chaque course, mais le contexte reste de 2 millions.
- Modes : fonctionne selon deux modes : "raisonnement" pour les tâches complexes et "non-raisonnement" pour les demandes simples et critiques en termes de vitesse.
- Appel de fonction : Oui, via l'API.
- Sorties structurées : Oui.
-
Jetons d'entrée en cache : Oui
- Nombre de jetons : reportez-vous à l'attribut
cachedTokensdans l'API de référence PromptTokensDetails. - Tarification : Voir la page Tarification.
Remarque importante : La fonctionnalité d'entrée en cache est disponible à la fois dans le playground de test et dans l'API. Cependant, ces informations ne peuvent être extraites que via l'API.
- Nombre de jetons : reportez-vous à l'attribut
- Limite de connaissance : Non disponible
Limites
- Jetons par minute (TPM)
- Pour l'augmentation de limite TPM, utilisez les noms de limite suivants :
- Pour le modèle de raisonnement :
grok-4-2-reasoning-tokens-per-minute-count(pour 200 000 jetons) - Pour le modèle sans raisonnement :
grok-4-2-non-reasoning-tokens-per-minute-count(pour 200 000 jetons)
Reportez-vous à Création d'une demande d'augmentation de limite.
- Pour le modèle de raisonnement :
- Entrées d'image
-
- Console : téléchargez des images
.pngou.jpg, de 5 Mo ou moins. - API : seuls les formats de fichier JPG/JPEG et PNG sont pris en charge. Soumettez une version codée
base64d'une image, en veillant à ce que chaque image convertie soit supérieure à 256 et inférieure à 1 792 jetons. Par exemple, une image 512 x 512 convertit généralement en environ 1 610 jetons. Il n'y a pas de nombre maximum d'images pouvant être téléchargées. Le nombre combiné de jetons pour le texte et les images doit se trouver dans la fenêtre de contexte globale du modèle de 2 millions de jetons.
- Console : téléchargez des images
Mode à la demande
Les modèles Grok sont disponibles uniquement en mode à la demande.
| Nom du modèle | Nom du modèle OCI |
|---|---|
| xAI Grok 4.20 |
|
Dates de publication et de retrait OCI
Pour les dates de déblocage et de sortie et les options de modèle de remplacement, voir Dates de sortie du modèle (mode à la demande).
Paramètres de modèle
Pour modifier les réponses du modèle, vous pouvez modifier les valeurs des paramètres suivants dans le playground de test ou l'API.
- Nombre maximal de sèmes de sortie
-
Nombre maximal de sèmes que le modèle doit générer pour chaque réponse. Estimez quatre caractères par jeton. Comme vous demandez un modèle de discussion, la réponse dépend de l'invite et chaque réponse n'utilise pas nécessairement le nombre maximal de jetons alloués.
Conseil
Pour les entrées volumineuses présentant des problèmes difficiles, définissez une valeur élevée pour le paramètre de jetons de sortie maximum. Reportez-vous à Dépannage. - Température
-
Niveau de randomité utilisé pour générer le texte de sortie. Min : 0, Max : 2
- Valeur Top p
-
Méthode d'échantillonnage qui contrôle la probabilité cumulée des jetons supérieurs à prendre en compte pour le jeton suivant. Affectez à
pun nombre décimal compris entre 0,05 et 1 pour la probabilité. Par exemple, entrez 0,75 pour les 75 % les plus importants à prendre en compte. Définissezpsur 1 pour prendre en compte tous les jetons.
Dépannage
Problème : le modèle Grok 4.20 ne répond pas.
Cause : le paramètre Nombre maximal de jetons de sortie dans la zone de lecture ou le paramètre max_tokens dans l'API est probablement trop faible. Par exemple, par défaut, ce paramètre est défini sur 600 jetons dans le terrain de jeu, qui peuvent être faibles pour les tâches complexes.
Action : augmentez le paramètre de jetons de sortie maximum.