19 Apprentissage automatique (Aperçu)

L'atelier de plate-forme de données d'Oracle AI Data Platform Workbench fournit une gestion du cycle de vie de l'apprentissage automatique à l'aide des concepts et des API de flux ML, plus précisément des expériences, des exécutions et un registre de modèles.

Ces capacités sont profondément intégrées dans AI Data Platform Workbench à travers de multiples surfaces, y compris les espaces de travail, les expériences et le catalogue, afin que les équipes puissent suivre le travail où il se produit et promouvoir les résultats dans des ressources partagées et gérées.

Cycle de vie de l'apprentissage automatique

Les cycles de vie d'apprentissage automatique de bout en bout suivent généralement les étapes suivantes :
  1. Préparation des données : Nettoyer et formater les entrées brutes
  2. Analyse exploratoire des données (EDA) : Explorez les données pour trouver des modèles
  3. Ingénierie de fonctions : Créez des variables pour les modèles
  4. Experiment : Entraînement itératif à l'aide de plusieurs approches (chaque itération est a run)
  5. Valider et stocker : Identifiez la meilleure exécution et enregistrez le modèle pour réutilisation
  6. Exécuter les inférences : Utilisez une version de modèle enregistrée pour l'inférence par lots à partir des carnets
  7. Surveiller : Effectuer le suivi des performances de production de base et de la disponibilité des modèles déployés

Fonctions de base

Suivi des expériences par espace de travail d'équipe

  • Les expériences sont portées à a workspace pour séparer les équipes et organiser le travail.
  • La journalisation automatique compatible MLflow capture les paramètres, les mesures et les artefacts pour chaque exécution, créant ainsi un enregistrement reproductible qui prend en charge les réexécutions avec des modifications contrôlées.

Exécuter la comparaison et l'enregistrement

  • Les exécutions peuvent être filtrées et comparées pour identifier un modèle candidat.
  • Une exécution peut être enregistrée dans le registre de modèles soutenu par le catalogue principal, avec contrôle des versions, balises et champs personnalisés. La gestion des versions est gérée par la plate-forme lorsque des modèles mis à jour sont enregistrés.

De registre à inférence de carnet

  • Les modèles peuvent être chargés dans les carnets par la dernière version ou par version explicite, ce qui permet une réutilisation cohérente.
  • Les flux de travail d'inférence par lots peuvent référencer directement les versions du registre, ce qui réduit le traitement manuel entre l'expérimentation et l'inférence.

Lignage pour vérification

  • Les modèles enregistrés sont liés à l'exécution de l'expérience d'origine, y compris les conditions d'exécution telles que les hyperparamètres, les variables d'environnement, les mesures et les artefacts.
  • Cela permet l'examen et la vérification en rendant la provenance de chaque modèle explicite.

Pourquoi utiliser MLflow?

AI Data Platform Workbench utilise MLflow comme base de son cadre MLOps, car il fournit une approche ouverte, extensible et indépendante du cadre de gestion du cycle d'apprentissage automatique de bout en bout.

MLflow prend en charge les fonctionnalités de base requises pour l'opérationnalisation de l'apprentissage automatique à grande échelle, notamment le suivi des expériences, l'emballage des modèles, la gestion des artefacts, le contrôle des versions des modèles, la gouvernance et la base de registres. Sa capacité à saisir des paramètres, des mesures, des artefacts et à exécuter des métadonnées de manière cohérente le rend bien adapté à l'amélioration de la reproductibilité, de la vérifiabilité et de la collaboration entre les équipes de science des données et d'ingénierie.

Une raison clé de la sélection de MLflow est sa large compatibilité avec les cadres d'apprentissage automatique populaires tels que TensorFlow, PyTorch et scikit-learn. Cela permet à AI Data Platform Workbench de prendre en charge divers modèles de développement sans forcer les équipes dans un seul cadre ou une seule chaîne d'outils. L'architecture de plug-in et la flexibilité de déploiement de MLflow facilitent également l'extension de la plate-forme et l'intégration à l'infrastructure d'entreprise existante.

En normalisant sur MLflow, AI Data Platform Workbench peut fournir une expérience MLOps cohérente dans l'expérimentation, l'enregistrement des modèles et la gestion du cycle de vie, tout en conservant la flexibilité nécessaire pour évoluer avec différents cas d'utilisation d'intelligence artificielle et d'apprentissage automatique.