xAI Grok 4.20 Multi-Agent
El modelo xAI Grok 4.20 Multi-Agent permite a Realtime Multi-Agent Research orquestar múltiples agentes de IA que trabajan juntos en tiempo real para realizar tareas de investigación profundas y de varios pasos. Cada agente se especializa en un aspecto particular de la investigación (buscar la web, analizar datos, sintetizar hallazgos) y colabora para ofrecer respuestas completas y bien fundamentadas.
- Referencias de documentación de xAI
Regiones para este modelo
Para las regiones soportadas, los tipos de punto final (clusters de IA dedicados o bajo demanda) y el alojamiento (OCI Generative AI o llamadas externas) para este modelo, consulte la página Modelos por región. Para obtener más información sobre las regiones, consulte la página Regiones de IA generativa.
Acceder a este modelo
https://inference.generativeai.us-ashburn-1.oci.oraclecloud.com/v1/responseshttps://inference.generativeai.us-chicago-1.oci.oraclecloud.com/v1/responseshttps://inference.generativeai.us-phoenix-1.oci.oraclecloud.com/v1/responsesEste modelo no está disponible en la consola.
Características clave
- Nombres de modelos en OCI Generative AI:
xai.grok-4.20-multi-agent-0309xai.grok-4.20-multi-agent(un alias que apunta axai.grok-4.20-multi-agent-0309)
- Disponible bajo demanda: sí, solo a través de la API.
- Soporte multimodal: introduzca texto e imágenes y obtenga una salida de texto.
- Longitud de contexto: 2 millones de tokens.
- Llamadas a funciones: sí, a través de la API.
- Salidas estructuradas: sí.
-
Tokens de entrada almacenados en caché: sí
- Recuento de tokens: consulte el atributo
cachedTokensen la API de referencia de PromptTokensDetails. - Precios: consulte la página de precios.
Nota importante: La función de entrada en caché está disponible tanto en el patio de juegos como en la API. Sin embargo, esa información solo se puede recuperar a través de la API.
- Recuento de tokens: consulte el atributo
- Cierre de conocimiento: no disponible.
Límites
- Tokens por minuto (TPM)
- Para el aumento del límite de TPM, utilice el siguiente nombre de límite:
grok-4-2-multi-agent-tokens-per-minute-count(para 200 000 tokens). Consulte Creación de una solicitud de aumento de límite. - Entradas de imagen
-
- API: solo se admiten los formatos de archivo JPG/JPEG y PNG. Envíe una versión codificada
base64de una imagen, asegurándose de que cada imagen convertida tenga más de 256 tokens y menos de 1.792 tokens. Por ejemplo, una imagen de 512 x 512 normalmente se convierte en alrededor de 1.610 tokens. No hay un número máximo de imágenes que se puedan cargar. El recuento combinado de tokens para texto e imágenes debe estar dentro de la ventana de contexto general del modelo de 2 millones de tokens.
- API: solo se admiten los formatos de archivo JPG/JPEG y PNG. Envíe una versión codificada
Modo bajo demanda
Los modelos Grok solo están disponibles en el modo bajo demanda.
| Nombre de modelo | Nombre de modelo de OCI |
|---|---|
| xAI Grok 4.20 Multi-Agent |
|
Fechas de lanzamiento y baja de OCI
Para conocer las fechas de lanzamiento y baja y las opciones del modelo de sustitución, consulte Model Retirement Dates (On-Demand Mode).