Modelos de IA empresarial en OCI Generative AI
Utiliza modelos de IA empresarial en OCI Generative AI para acceder a modelos alojados previamente entrenados, importar modelos personalizados compatibles y desplegar modelos para cargas de trabajo de inferencia empresarial.
En esta sección se proporcionan enlaces a los modelos disponibles en OCI Generative AI y a los recursos utilizados para desplegar, gestionar y escalar esos modelos en OCI.
Qué puedes hacer con los modelos de IA empresarial
Utilice modelos de IA empresarial cuando desee:
- Ejecutar inferencia con modelos alojados previamente entrenados
- Importar y alojar modelos personalizados soportados
- Seleccionar opciones de despliegue bajo demanda y dedicadas
- Despliegue modelos en clusters de IA dedicados para cargas de trabajo de producción
- Gestionar puntos finales y acceso a la red privada
- Revisar modelo y disponibilidad regional
- Comprender las consideraciones de precio y rendimiento
OCI Generative AI soporta tareas de modelo principales como:
- Chat para la generación conversacional
- Incrustaciones para búsqueda semántica, recomendación, clasificación y agrupación en clusters
- Volver a clasificar los documentos por relevancia para una consulta
Opciones de uso de modelo
OCI Generative AI admite varias formas de utilizar modelos:
- Modelos alojados previamente entrenados para inferencia gestionada a través de OCI
- Modelos importados para el despliegue de modelos personalizados soportados
- Modo bajo demanda para el acceso gestionado compartido
- Modo dedicado para modelos aislados que sirven en clusters de IA dedicados
Estas opciones le permiten pasar de la experimentación a la producción al seleccionar el nivel de control, el aislamiento de rendimiento y la gestión de la infraestructura que se adapte a su carga de trabajo.
Infraestructura y gestión de modelos
Los modelos de IA empresarial en OCI Generative AI están soportados por recursos de despliegue y gestión como:
- Clusters de IA dedicados para alojamiento de modelos aislados
- Puntos finales para servir tráfico de modelo
- Puntos finales privados para un acceso de red seguro
- Disponibilidad del modelo regional para la planificación del despliegue
- Orientación de rendimiento y costos para cargas de trabajo de producción
Temas en esta sección
Use los siguientes temas para obtener información sobre los modelos de IA empresarial en OCI Generative AI:
-
Se ofrecieron modelos básicos preentrenados en IA generativa
Obtén más información sobre los modelos alojados preentrenados disponibles en OCI Generative AI.
-
Modelos validados para importación
Revise los modelos personalizados soportados que puede importar a OCI Generative AI.
-
Modos a demanda y dedicados para modelos de IA generativa de OCI
Comprender las opciones de despliegue para ejecutar modelos en entornos compartidos o dedicados.
-
Gestión de clusteres de AI dedicados
Descubre cómo crear y gestionar clusters de IA dedicados para el alojamiento de modelos.
-
Referencias de rendimiento de cluster de IA dedicado
Revise la orientación de referencia para el rendimiento del cluster de IA dedicado.
- Regiones de IA generativa
Descubre dónde está disponible OCI Generative AI.
- Modelos de IA generativa por región
Revisar la disponibilidad del modelo por región de OCI.
-
Gestión de puntos finales
Descubra cómo gestionar puntos finales para el acceso al modelo.
-
Gestión de puntos finales privadas
Descubre cómo configurar el acceso de red privada para OCI Generative AI.
-
Cálculo de costo en IA generativa
Revise las consideraciones de precios para el uso de OCI Generative AI.