Modelos de IA empresarial en OCI Generative AI

Utiliza modelos de IA empresarial en OCI Generative AI para acceder a modelos alojados previamente entrenados, importar modelos personalizados compatibles y desplegar modelos para cargas de trabajo de inferencia empresarial.

En esta sección se proporcionan enlaces a los modelos disponibles en OCI Generative AI y a los recursos utilizados para desplegar, gestionar y escalar esos modelos en OCI.

Qué puedes hacer con los modelos de IA empresarial

Utilice modelos de IA empresarial cuando desee:

  • Ejecutar inferencia con modelos alojados previamente entrenados
  • Importar y alojar modelos personalizados soportados
  • Seleccionar opciones de despliegue bajo demanda y dedicadas
  • Despliegue modelos en clusters de IA dedicados para cargas de trabajo de producción
  • Gestionar puntos finales y acceso a la red privada
  • Revisar modelo y disponibilidad regional
  • Comprender las consideraciones de precio y rendimiento

OCI Generative AI soporta tareas de modelo principales como:

  • Chat para la generación conversacional
  • Incrustaciones para búsqueda semántica, recomendación, clasificación y agrupación en clusters
  • Volver a clasificar los documentos por relevancia para una consulta

Opciones de uso de modelo

OCI Generative AI admite varias formas de utilizar modelos:

  • Modelos alojados previamente entrenados para inferencia gestionada a través de OCI
  • Modelos importados para el despliegue de modelos personalizados soportados
  • Modo bajo demanda para el acceso gestionado compartido
  • Modo dedicado para modelos aislados que sirven en clusters de IA dedicados

Estas opciones le permiten pasar de la experimentación a la producción al seleccionar el nivel de control, el aislamiento de rendimiento y la gestión de la infraestructura que se adapte a su carga de trabajo.

Infraestructura y gestión de modelos

Los modelos de IA empresarial en OCI Generative AI están soportados por recursos de despliegue y gestión como:

  • Clusters de IA dedicados para alojamiento de modelos aislados
  • Puntos finales para servir tráfico de modelo
  • Puntos finales privados para un acceso de red seguro
  • Disponibilidad del modelo regional para la planificación del despliegue
  • Orientación de rendimiento y costos para cargas de trabajo de producción

Temas en esta sección

Use los siguientes temas para obtener información sobre los modelos de IA empresarial en OCI Generative AI: