Descripción general de OCI Generative AI
OCI Generative AI es un servicio de Oracle Cloud Infrastructure totalmente gestionado para crear, desplegar y operar aplicaciones de IA generativa a escala empresarial.
Utiliza OCI Generative AI para trabajar con modelos preentrenados y personalizados, crear agentes de producción y aplicar controles de gobernanza empresarial en el acceso, las redes y el comportamiento de la IA. El servicio admite tareas básicas de IA generativa, como chat, incrustaciones, rerank y API compatibles con OpenAI, al tiempo que proporciona capacidades empresariales para herramientas, memoria, recuperación y aplicaciones ágentes alojadas.
Esta documentación se organiza en torno a tres áreas principales:
- Modelos de IA empresarial
- Agentes de IA empresariales
- Gobernanza de la IA empresarial
Modelos de IA empresarial
Utilice modelos de IA empresarial cuando desee acceder a modelos para tareas de inferencia como la generación conversacional, la búsqueda semántica, las recomendaciones, la clasificación, la agrupación en clusters y la clasificación de relevancia.
OCI Generative AI admite:
- Chatea para conocer experiencias conversacionales como la respuesta a preguntas y los asistentes virtuales
- Incrustaciones para búsqueda semántica, recomendación, clasificación y agrupación en clusters
- Volver a clasificar los documentos por relevancia para una consulta
- API compatibles con OpenAI para la integración con herramientas y SDK existentes
Puedes utilizar modelos de OCI Generative AI de varias formas. Puede llamar a modelos alojados previamente entrenados a través de la consola, la API o la CLI. También puede importar, ajustar y alojar modelos personalizados en clusters de IA dedicados. Esto le ofrece una ruta que va desde la experimentación hasta la producción con controles empresariales y flexibilidad de despliegue.
Agentes de IA empresariales
Utilice agentes de IA empresarial cuando desee crear aplicaciones de producción que combinen modelos con herramientas, memoria, recuperación y orquestación.
OCI Generative AI proporciona dos enfoques principales para los agentes de creación:
- Creación de agentes con la API de respuestas de OCI
- Despliega aplicaciones ágiles alojadas en OCI Generative AI
También puede combinar estos enfoques en una arquitectura híbrida.
La API de respuestas de OCI es la API principal para flujos de trabajo de Agentic. Es compatible con OpenAI y admite la interacción de modelos, la orquestación, el razonamiento, el estado de la conversación y el uso de herramientas. Las herramientas admitidas incluyen File Search, Code Interpreter, Function Calling y MCP Calling. Los agentes también pueden utilizar recursos compatibles, como Archivos, Almacenes de vector, Contenedores, Conversaciones, Proyectos y funciones de memoria, como memoria a largo plazo y compactación de memoria a corto plazo.
OCI Generative AI también admite SQL Search (NL2SQL) para flujos de trabajo de agentes que necesitan acceso a datos empresariales estructurados. NL2SQL convierte las solicitudes en lenguaje natural en SQL validado mediante el enriquecimiento semántico y los metadatos de datos estructurados.
Para los equipos que desean un alojamiento gestionado por OCI para entornos de ejecución personalizados, OCI Generative AI proporciona aplicaciones y despliegues para aplicaciones ágentes alojadas. Este modelo admite el despliegue basado en contenedores, la infraestructura gestionada, las redes, la integración de almacenamiento y la configuración de identidad.
Gobernanza de la IA empresarial
Utiliza Enterprise AI Governance cuando necesites proteger y controlar cómo se accede, implementa y utiliza a los recursos de IA generativa.
La gobernanza de la IA empresarial en OCI Generative AI combina controles de infraestructura, identidad, seguridad de red y tiempo de ejecución para ayudar a mantener los sistemas de IA seguros, compatibles y alineados con la política organizativa.
Las capacidades clave de gobernanza incluyen:
- Políticas de IAM para controlar quién puede acceder, utilizar y gestionar recursos de OCI Generative AI
- Puntos finales privados para mantener el acceso al modelo dentro de un límite de red seguro
- Claves de API para acceder a los servicios de IA generativa de OCI
- OAuth para tareas ágentes que requieren la integración de la aplicación de dominio de identidad de OCI IAM
- Enrutamiento de paquetes de confianza cero (ZPR) para la aplicación de la red basada en identidad
- Guardrails para aplicar controles de conformidad y seguridad de tiempo de ejecución a entradas y salidas de modelos
Juntas, estas capacidades proporcionan una gobernanza integral en el control de acceso, la seguridad de la red, la configuración de aplicaciones alojadas y el comportamiento de la IA.
Cómo funcionan conjuntamente estas áreas
Estas tres áreas trabajan juntas como parte de una plataforma:
- Los modelos de IA empresarial proporcionan la base del modelo para la inferencia y la generación
- Los agentes de IA empresarial agregan orquestación, herramientas, memoria, recuperación y ejecución alojada
- Enterprise AI Governance aplica los controles de seguridad, acceso y conformidad necesarios para el uso empresarial
Esta combinación le permite pasar del acceso al modelo, al desarrollo de aplicaciones ágiles, al despliegue de producción con gobernanza incorporada.