xAI Grok 4.20 Multi-Agent

Le modèle xAI Grok 4.20 Multi-Agent permet à Realtime Multi-Agent Research d'orchestrer plusieurs agents d'IA qui travaillent ensemble en temps réel pour effectuer des tâches de recherche approfondies en plusieurs étapes. Chaque agent se spécialise dans un aspect particulier de la recherche (recherche sur le Web, analyse des données, synthèse des résultats) et collabore pour fournir des réponses complètes et bien fournies.

Références de documentation xAI

Régions pour ce modèle

Important

Pour les régions prises en charge, les types d'adresse (clusters d'IA dédiés ou à la demande) et l'hébergement (appels externes ou OCI Generative AI) pour ce modèle, reportez-vous à la page Modèles par région. Pour plus de détails sur les régions, reportez-vous à la page Régions d'IA générative.

Accéder à ce modèle

Accédez à ce modèle dans les régions prises en charge via l'API avec les adresses suivantes :
https://inference.generativeai.us-ashburn-1.oci.oraclecloud.com/v1/responses
https://inference.generativeai.us-chicago-1.oci.oraclecloud.com/v1/responses
https://inference.generativeai.us-phoenix-1.oci.oraclecloud.com/v1/responses
Remarque

Ce modèle n'est pas disponible dans la console.

Principales fonctionnalités

  • Noms de modèle dans OCI Generative AI :
    • xai.grok-4.20-multi-agent-0309
    • xai.grok-4.20-multi-agent (alias qui pointe vers xai.grok-4.20-multi-agent-0309)
  • Disponible à la demande : Oui, uniquement via l'API.
  • Prise en charge multimodale : saisissez du texte et des images et obtenez une sortie texte.
  • Longueur de contexte : 2 millions de jetons.
  • Appel de fonction : Oui, via l'API.
  • Sorties structurées : Oui.
  • Jetons d'entrée en cache : Oui

    Remarque importante : La fonctionnalité d'entrée en cache est disponible à la fois dans le playground de test et dans l'API. Cependant, ces informations ne peuvent être extraites que via l'API.

  • Limite de connaissance : non disponible.

Limites

Jetons par minute (TPM)
Pour l'augmentation de limite TPM, utilisez le nom de limite suivant : grok-4-2-multi-agent-tokens-per-minute-count (pour 200 000 jetons). Reportez-vous à Création d'une demande d'augmentation de limite.
Entrées d'image
  • API : seuls les formats de fichier JPG/JPEG et PNG sont pris en charge. Soumettez une version codée base64 d'une image, en veillant à ce que chaque image convertie soit supérieure à 256 et inférieure à 1 792 jetons. Par exemple, une image 512 x 512 convertit généralement en environ 1 610 jetons. Il n'y a pas de nombre maximum d'images pouvant être téléchargées. Le nombre combiné de jetons pour le texte et les images doit se trouver dans la fenêtre de contexte globale du modèle de 2 millions de jetons.

Mode à la demande

Remarque

Les modèles Grok sont disponibles uniquement en mode à la demande.
Nom du modèle Nom du modèle OCI
xAI Grok 4.20 Multi-Agent
  • xai.grok-4.20-multi-agent-0309
  • xai.grok-4.20-multi-agent