Implementación de Oracle Cloud Infrastructure Generative AI basada en el modelo de lenguaje de Cohere Large

Oracle Cloud Infrastructure Generative AI (OCI Generative AI) es un servicio totalmente gestionado que proporciona un juego de modelos de lenguaje grandes (LLM) personalizables y de última generación que abarcan una amplia gama de casos de uso para la generación de texto. Puede utilizar el patio de recreo, una interfaz en la consola para explorar los modelos personalizados y previamente entrenados alojados sin escribir una sola línea de código ni crear y alojar sus propios modelos personalizados ajustados según sus propios datos en clusters de IA dedicados.

El servicio OCI Generative AI incluye los siguientes modelos fundamentales:
  • Generación: proporcione instrucciones para generar texto o extraer información de este.
  • Resumen: Resuma texto con el formato, la longitud y el tono indicados.
  • Embebido: convierta texto en elementos embebidos de vectores para su uso en aplicaciones de búsquedas semánticas, clasificación de textos o agrupación de textos.

Arquitectura

Puede utilizar el patio de recreo de OCI Generative AI para probar modelos previamente entrenados, ejecutar las peticiones de datos, ajustar los parámetros, actualizar las peticiones de datos y volver a ejecutar los modelos hasta que esté satisfecho con los resultados. Después de esto, puede copiar el código de la consola en sus aplicaciones.

También puede crear una copia de un modelo entrenado previamente, agregar su propio juego de datos de entrenamiento y permitir que el servicio OCI Generative AI ajuste el modelo. OCI Generative AI utiliza potentes clusters de IA dedicados especialmente diseñados para ajustar. Estos clusters pertenecen solo a su arrendamiento. Después de ajustar el modelo, creamos un punto final para el modelo personalizado y el host de ese modelo en un cluster de AI dedicado diseñado para el alojamiento.

Ventajas de crear un LLM en OCI

Servicio de IA generativa: Oracle ofrece servicios de IA generativa nativos en colaboración con Cohere, una plataforma de IA empresarial líder equipada con comprensión de lenguaje avanzada para crear la próxima generación de aplicaciones empresariales. OCI Generative AI es un servicio totalmente gestionado disponible a través de una API para integrar sin problemas estos modelos de lenguaje versátiles en una amplia gama de casos de uso, incluida la asistencia de escritura, el resumen y el chat.

Clusters de AI dedicados: los clusters de AI dedicados son recursos informáticos que puede utilizar para ajustar modelos personalizados o para alojar puntos finales para modelos personalizados. Los clusters están dedicados a sus modelos y no se comparten con usuarios de otros arrendamientos. La IA generativa de OCI del modelo personalizado le permite acotar los modelos con sus propios datos.

Modelo personalizado: la IA generativa de OCI le permite acotar los modelos utilizando sus propios datos.

Note:

La nueva función de búsqueda de similitud de vectores de IA está disponible en Oracle Database 23ai.
En esta configuración de arquitectura de referencia, se aprovisionan los siguientes servicios de OCI:
  • OCI Object Storage para el almacenamiento de datos.
  • Espacio de trabajo de Oracle Cloud Infrastructure Data Science para la creación de modelos.
  • IA generativa de OCI con GPU para recursos informáticos.
  • Herramienta Oracle APEX Application Development para la interfaz de usuario.

El siguiente diagrama ilustra esta arquitectura de referencia.



oci-generative-ai-llm-arch-oracle.zip

La arquitectura tiene los siguientes componentes:

  • Región

    Una región de Oracle Cloud Infrastructure es un área geográfica localizada que contiene uno o más centros de datos, denominados dominios de disponibilidad. Las regiones son independientes entre sí y pueden separarse a grandes distancias (entre países e incluso continentes).

  • Red virtual en la nube (VCN) y subredes

    Una VCN es una red personalizable y definida por software que se configura en una región de Oracle Cloud Infrastructure. Al igual que las redes de los centros de datos tradicionales, las redes virtuales le proporcionan el control de su entorno de red. Una VCN puede tener varios bloques de CIDR no superpuestos que puede cambiar después de crear la VCN. Puede segmentar una VCN en subredes, las cuales se pueden acotar a una región o a un dominio de disponibilidad. Cada subred está formada por un rango contiguo de direcciones que no se solapan con las demás subredes de la VCN. Puede cambiar el tamaño de una subred después de la creación. Una subred puede ser pública o privada.

  • Object Storage

    El almacenamiento de objetos proporciona acceso rápido a grandes cantidades de datos estructurados y no estructurados de cualquier tipo de contenido, incluidas copias de seguridad de base de datos, datos analíticos y contenido rico, como imágenes y vídeos. Puede almacenar datos de forma segura y, a continuación, recuperarlos directamente desde Internet o desde la plataforma en la nube. Puede escalar el almacenamiento sin experimentar ninguna degradación en el rendimiento ni en la confiabilidad del servicio. Utilice el almacenamiento estándar para el almacenamiento de acceso frecuente al que debe acceder de forma rápida, inmediata y frecuente. Utilice el almacenamiento de archivo para el almacenamiento "frío" que conserva durante largos períodos de tiempo y a los que rara vez accede.

  • Data Science

    Oracle Cloud Infrastructure Data Science es una plataforma totalmente gestionada y sin servidor que los equipos de ciencia de datos pueden utilizar para crear, entrenar y gestionar modelos de aprendizaje automático (ML) en Oracle Cloud Infrastructure (OCI). Se puede integrar fácilmente con otros servicios de OCI, como Oracle Autonomous Data Warehouse, Oracle Cloud Infrastructure Object Storage, etc. Puede crear y evaluar modelos de aprendizaje automático de alta calidad que aumenten la flexibilidad del negocio al poner los datos de confianza de la empresa a trabajar rápidamente, y puede respaldar objetivos empresariales basados en datos con un despliegue más fácil de modelos de aprendizaje automático.

  • Oracle Database 23ai (búsqueda de vectores de IA)

    Oracle Database 23ai ofrece la base de datos convergente más completa y sencilla para los desarrolladores que buscan crear nuevos microservicios, gráficos, documentos y aplicaciones relacionales.

    Oracle ha agregado capacidades de búsqueda semántica mediante vectores de IA a Oracle Database 23ai. La recopilación de funciones, denominada búsqueda vectorial de IA, incluye un nuevo tipo de datos vectoriales, índices vectoriales y operadores SQL de búsqueda vectorial que permiten a Oracle Database almacenar el contenido semántico de documentos, imágenes y otros datos no estructurados como vectores, y utilizarlos para ejecutar consultas de similitud rápidas. Para obtener más información, consulte el enlace Blog en la sección Explorar más.

Explorar más

Revise estos recursos adicionales para obtener más información sobre las funciones de esta arquitectura de referencia.

IA generativa de OCI

Agradecimientos

Author: Pavan Kumar Manuguri