xAI Grok 4.20

Le xAI Grok 4.20 offre des variantes de raisonnement et de non-raisonnement avec une vitesse de pointe et un support d'appel d'outils agénétique. Il est conçu pour réduire les hallucinations et suivre de près les invites, produisant des réponses plus fiables et précises.

En savoir plus sur Grok 4.20

Régions pour ce modèle

Important

Pour les régions prises en charge, les types d'adresse (clusters d'IA dédiés ou à la demande) et l'hébergement (appels externes ou OCI Generative AI) pour ce modèle, reportez-vous à la page Modèles par région. Pour plus de détails sur les régions, reportez-vous à la page Régions d'IA générative.

Généralités

Le modèle xAI Grok 4.20 est disponible dans deux modes proposés dans deux modèles distincts. Un modèle de raisonnement et un modèle de non-raisonnement. Reportez-vous au tableau suivant pour déterminer le modèle à sélectionner.

Mode Nom du modèle Utilisation
Raisonnement xai.grok-4.20-0309-reasoning Logique et mathématiques complexes, analyse scientifique/technique, enquêtes en plusieurs étapes ou tâches à enjeux plus élevés où la précision compte plus que la latence la plus faible.
Non-raisonnement xai.grok-4.20-0309-non-reasoning Questions et réponses de routine, récupération d'informations générales et scénarios à haut débit où la vitesse de réponse est la priorité.

Principales fonctionnalités

  • Noms de modèle dans OCI Generative AI :
    Raisonnement
    • xai.grok-4.20-0309-reasoning
    • xai.grok-4.20-reasoning (alias qui pointe vers xai.grok-4.20-0309-reasoning)
    Non-raisonnement
    • xai.grok-4.20-0309-non-reasoning
    • xai.grok-4.20-non-reasoning (alias qui pointe vers xai.grok-4.20-0309-non-reasoning)
  • Disponible à la demande : accédez à ce modèle à la demande, via le playground de test de la console ou l'API.
  • Prise en charge multimodale : saisissez du texte et des images et obtenez une sortie texte.
  • Longueur de contexte : 2 millions de jetons (la longueur maximale de l'invite + de la réponse est de 2 millions de jetons pour conserver le contexte). Dans le terrain de jeu, la longueur de la réponse est plafonnée à 131 000 jetons pour chaque course, mais le contexte reste de 2 millions.
  • Modes : fonctionne selon deux modes : "raisonnement" pour les tâches complexes et "non-raisonnement" pour les demandes simples et critiques en termes de vitesse.
  • Appel de fonction : Oui, via l'API.
  • Sorties structurées : Oui.
  • Jetons d'entrée en cache : Oui

    Remarque importante : La fonctionnalité d'entrée en cache est disponible à la fois dans le playground de test et dans l'API. Cependant, ces informations ne peuvent être extraites que via l'API.

  • Limite de connaissance : Non disponible

Limites

Jetons par minute (TPM)
Pour l'augmentation de limite TPM, utilisez les noms de limite suivants :
  • Pour le modèle de raisonnement : grok-4-2-reasoning-tokens-per-minute-count (pour 200 000 jetons)
  • Pour le modèle sans raisonnement : grok-4-2-non-reasoning-tokens-per-minute-count (pour 200 000 jetons)

Reportez-vous à Création d'une demande d'augmentation de limite.

Entrées d'image
  • Console : téléchargez des images .png ou .jpg, de 5 Mo ou moins.
  • API : seuls les formats de fichier JPG/JPEG et PNG sont pris en charge. Soumettez une version codée base64 d'une image, en veillant à ce que chaque image convertie soit supérieure à 256 et inférieure à 1 792 jetons. Par exemple, une image 512 x 512 convertit généralement en environ 1 610 jetons. Il n'y a pas de nombre maximum d'images pouvant être téléchargées. Le nombre combiné de jetons pour le texte et les images doit se trouver dans la fenêtre de contexte globale du modèle de 2 millions de jetons.

Mode à la demande

Remarque

Les modèles Grok sont disponibles uniquement en mode à la demande.
Nom du modèle Nom du modèle OCI
xAI Grok 4.20
  • xai.grok-4.20-0309-reasoning
  • xai.grok-4.20-0309-non-reasoning

Paramètres de modèle

Pour modifier les réponses du modèle, vous pouvez modifier les valeurs des paramètres suivants dans le playground de test ou l'API.

Nombre maximal de sèmes de sortie

Nombre maximal de sèmes que le modèle doit générer pour chaque réponse. Estimez quatre caractères par jeton. Comme vous demandez un modèle de discussion, la réponse dépend de l'invite et chaque réponse n'utilise pas nécessairement le nombre maximal de jetons alloués.

Conseil

Pour les entrées volumineuses présentant des problèmes difficiles, définissez une valeur élevée pour le paramètre de jetons de sortie maximum. Reportez-vous à Dépannage.
Température

Niveau de randomité utilisé pour générer le texte de sortie. Min : 0, Max : 2

Valeur Top p

Méthode d'échantillonnage qui contrôle la probabilité cumulée des jetons supérieurs à prendre en compte pour le jeton suivant. Affectez à p un nombre décimal compris entre 0,05 et 1 pour la probabilité. Par exemple, entrez 0,75 pour les 75 % les plus importants à prendre en compte. Définissez p sur 1 pour prendre en compte tous les jetons.

Dépannage

Problème : le modèle Grok 4.20 ne répond pas.

Cause : le paramètre Nombre maximal de jetons de sortie dans la zone de lecture ou le paramètre max_tokens dans l'API est probablement trop faible. Par exemple, par défaut, ce paramètre est défini sur 600 jetons dans le terrain de jeu, qui peuvent être faibles pour les tâches complexes.

Action : augmentez le paramètre de jetons de sortie maximum.