19 Aprendizaje automático (vista previa)

Oracle AI Data Platform Workbench proporciona gestión del ciclo de vida del aprendizaje automático (ML) mediante conceptos y API de MLflow, específicamente experimentos, ejecuciones y un registro de modelos.

Estas capacidades están profundamente integradas en AI Data Platform Workbench en varias superficies, incluidos los espacios de trabajo, los experimentos y el catálogo, para que los equipos puedan realizar un seguimiento del trabajo donde ocurre y promover los resultados en activos compartidos y controlados.

Ciclo de vida de aprendizaje automático

Los ciclos de vida completos de aprendizaje automático suelen seguir estos pasos:
  1. Preparación de datos: limpieza y formato de entradas raw
  2. Análisis de datos exploratorios (EDA): explora los datos para encontrar patrones
  3. Ingeniería de funciones: crear variables para los modelos
  4. Experimento: entrenar de forma iterativa utilizando múltiples enfoques (cada iteración es a ⁇ run)
  5. Validar y almacenar: identifique la mejor ejecución y registre el modelo para reutilizarlo.
  6. Ejecutar inferencias: utilice una versión de modelo registrada para la inferencia por lotes desde blocs de notas
  7. Supervisión: realiza un seguimiento del rendimiento y la disponibilidad básicos de producción para los modelos desplegados

Capacidades básicas

Seguimiento de experimentos por espacio de trabajo de equipo

  • Los experimentos se limitan a un espacio de trabajo para separar equipos y organizar el trabajo.
  • El registro automático compatible con MLflow captura parámetros, métricas y artefactos para cada ejecución, creando un registro reproducible que admite ejecuciones con cambios controlados.

Ejecutar comparación y registro

  • Las ejecuciones se pueden filtrar y comparar para identificar un modelo candidato.
  • Una ejecución se puede registrar en el registro de modelos respaldado por el catálogo maestro, con control de versiones, etiquetas y campos personalizados. La plataforma gestiona la gestión de versiones cuando se registran los modelos actualizados.

De registro a inferencia de bloc de notas

  • Los modelos se pueden cargar en blocs de notas por versión más reciente o explícita, lo que permite una reutilización consistente.
  • Los flujos de trabajo de inferencia por lotes pueden hacer referencia a las versiones del registro directamente, lo que reduce el manejo manual entre la experimentación y la inferencia.

Linaje para auditabilidad

  • Los modelos registrados vuelven a enlazar a la ejecución del experimento de origen, incluidas las condiciones de ejecución, como hiperparámetros, variables de entorno, métricas y artefactos.
  • Esto apoya la revisión y auditoría haciendo explícita la procedencia de cada modelo.

¿Por qué utilizar MLflow?

AI Data Platform Workbench utiliza MLflow como base para su marco MLOps, ya que proporciona un enfoque abierto, ampliable y independiente del marco para gestionar el ciclo de vida completo del aprendizaje automático.

El flujo de aprendizaje automático admite las capacidades básicas necesarias para poner en funcionamiento el aprendizaje automático a escala, incluido el seguimiento de experimentos, el empaquetado de modelos, la gestión de artefactos, el control de versiones de modelos, el registro y la gobernanza. Su capacidad para capturar parámetros, métricas, artefactos y ejecutar metadatos de forma coherente lo hace muy adecuado para mejorar la reproducibilidad, la auditabilidad y la colaboración entre los equipos de ingeniería y ciencia de datos.

Una razón clave para seleccionar MLflow es su amplia compatibilidad con los populares marcos de aprendizaje automático, como TensorFlow, PyTorch y scikit-learn. Esto permite que AI Data Platform Workbench admita diversos patrones de desarrollo de modelos sin forzar a los equipos a un único marco o cadena de herramientas. La arquitectura de plugins y la flexibilidad de despliegue de MLflow también facilitan la ampliación de la plataforma y la integración con la infraestructura empresarial existente.

Al estandarizar en MLflow, AI Data Platform Workbench puede proporcionar una experiencia MLOps consistente en la experimentación, el registro de modelos y la gestión del ciclo de vida, al tiempo que conserva la flexibilidad necesaria para evolucionar con diferentes casos de uso de IA/ML.