Selección de modelos en agentes de IA generativa
El servicio OCI Generative AI Agents soporta la selección de modelos, donde puede seleccionar un modelo de lenguaje grande (LLM) como el LLM de enrutamiento para su agente durante la creación o edición. Puede seleccionar entre los modelos a demanda alojados en el servicio OCI Generative AI o crear y utilizar puntos finales de cluster de IA dedicados para los modelos soportados.
La selección de modelos proporciona flexibilidad para optimizar el rendimiento de su agente en función de su carga de trabajo (por ejemplo, para las herramientas RAG y SQL).
Cómo Seleccionar un Modelo
Al crear o editar un agente en la consola de OCI, vaya a la sección Selección de modelo en la configuración del agente.
-
Seleccione el tipo de LLM de enrutamiento:
- Seleccione una de las opciones siguientes:
- Valor predeterminado: utiliza el modelo estándar proporcionado por el servicio de agentes de IA generativa (Llama 3.3 70B). Esto es adecuado para agentes de uso general sin necesidad de modelos personalizados.
- Modelo de IA generativa: seleccione uno de los modelos a demanda alojados directamente en el servicio OCI Generative AI.
- Punto final de IA generativa: seleccione uno de los modelos alojados en puntos finales de cluster de IA dedicados en el servicio OCI Generative AI.
- Seleccione una de las opciones siguientes:
-
Seleccione un modelo o punto final específico:
- Si ha seleccionado Modelo de IA generativa o Punto final de IA generativa en la lista, la consola muestra una lista de opciones disponibles. Examine y seleccione el modelo o punto final preferible.
- La lista se rellena en función de los modelos/puntos finales disponibles del arrendamiento y los permisos de IAM
-
Actualizar hiperparámetros predeterminados:
- Revise los valores por defecto para los hiperparámetros de modelo.
- Opcionalmente, actualice cualquiera de esos hiperparámetros.
- Puede utilizar estos modelos al agregar herramientas RAG, SQL y Agent.
- Para obtener más información sobre estos modelos, active el rastreo al crear un punto final para este agente.
- Si la lista no se está rellenando, consulte qué política debe agregar de los ejemplos de la página Acceso de usuario a la selección de modelos en agentes.
Modelos soportados
| Modelos que puede seleccionar | Hiperparámetros que puede actualizar |
|---|---|
|
|
|
|
|
Regiones soportadas
Se admiten las siguientes regiones:
- Este de Brasil (São Paulo)
- Centro de Alemania (Fráncfort)
- Centro de Japón (Osaka)
- Sur de Reino Unido (Londres)
- Este de EE. UU. (Ashburn)
- Medio Oeste de EE. UU. (Chicago)
- Oeste de EE. UU. (Phoenix)
Para confirmar las regiones utilizables de un modelo para la función de selección de modelos de agentes, realice las siguientes tareas.
Temas relacionados
Si un modelo no está disponible en su región o modo, considere alternativas de la lista soportada.
Temas relacionados