xAI Grok 4.20 Multi-Agent

El modelo xAI Grok 4.20 Multi-Agent permite a Realtime Multi-Agent Research orquestar múltiples agentes de IA que trabajan juntos en tiempo real para realizar tareas de investigación profundas y de varios pasos. Cada agente se especializa en un aspecto particular de la investigación (buscar la web, analizar datos, sintetizar hallazgos) y colabora para ofrecer respuestas completas y bien fundamentadas.

Referencias de documentación de xAI

Regiones para este modelo

Importante

Para las regiones soportadas, los tipos de punto final (clusters de IA dedicados o bajo demanda) y el alojamiento (OCI Generative AI o llamadas externas) para este modelo, consulte la página Modelos por región. Para obtener más información sobre las regiones, consulte la página Regiones de IA generativa.

Acceder a este modelo

Acceda a este modelo en las regiones soportadas a través de la API con los siguientes puntos finales:

https://inference.generativeai.us-ashburn-1.oci.oraclecloud.com/v1/responses

https://inference.generativeai.us-chicago-1.oci.oraclecloud.com/v1/responses

https://inference.generativeai.us-phoenix-1.oci.oraclecloud.com/v1/responses

Nota

Este modelo no está disponible en la consola.

Características clave

Nombres de modelos en OCI Generative AI:
- xai.grok-4.20-multi-agent-0309
- xai.grok-4.20-multi-agent (un alias que apunta a xai.grok-4.20-multi-agent-0309)
Disponible bajo demanda: sí, solo a través de la API.
Soporte multimodal: introduzca texto e imágenes y obtenga una salida de texto.
Longitud de contexto: 1 millón de tokens.
Llamadas a funciones: sí, a través de la API.
Salidas estructuradas: sí.
Tokens de entrada almacenados en caché: sí
- Recuento de tokens: consulte el atributo cachedTokens en la API de referencia de PromptTokensDetails.
- Precios: consulte la página de precios.
Nota importante: La función de entrada en caché está disponible tanto en el patio de juegos como en la API. Sin embargo, esa información solo se puede recuperar a través de la API.
Cierre de conocimiento: no disponible.

Límites

Tokens por minuto (TPM)

Para el aumento del límite de TPM, utilice el siguiente nombre de límite: grok-4-2-multi-agent-tokens-per-minute-count (para 200 000 tokens). Consulte Creación de una solicitud de aumento de límite.

Entradas de imagen

API: solo se admiten los formatos de archivo JPG/JPEG y PNG. Envíe una versión codificada base64 de una imagen, asegurándose de que cada imagen convertida tenga más de 256 tokens y menos de 1.792 tokens. Por ejemplo, una imagen de 512 x 512 normalmente se convierte en alrededor de 1.610 tokens. No hay un número máximo de imágenes que se puedan cargar. El recuento combinado de tokens para texto e imágenes debe estar dentro de la ventana de contexto general del modelo de 1 millón de tokens.

Modo bajo demanda

Nota

Los modelos Grok solo están disponibles en el modo bajo demanda.


Nombre de modelo	Nombre de modelo de OCI
xAI Grok 4.20 Multi-Agent	`xai.grok-4.20-multi-agent-0309` `xai.grok-4.20-multi-agent`

Fechas de lanzamiento y baja de OCI

Para conocer las fechas de lanzamiento y baja y las opciones del modelo de sustitución, consulte Model Retirement Dates (On-Demand Mode).