19 Machine Learning (aperçu)
Oracle AI Data Platform Workbench fournit une gestion du cycle de vie du machine learning (ML) à l'aide de concepts et d'API de MLflow, en particulier des expériences, des exécutions et d'un registre de modèles.
Ces fonctionnalités sont profondément intégrées à AI Data Platform Workbench sur plusieurs surfaces, y compris les espaces de travail, les expériences et le catalogue, afin que les équipes puissent suivre le travail là où il se produit et promouvoir les résultats dans des ressources partagées et gérées.
Cycle d'apprentissage automatique
- Préparation des données : Nettoyer et formater les entrées brutes
- Analyse exploratoire des données (EDA) : explorer les données pour trouver des modèles
- Ingénierie des fonctionnalités : créer des variables pour les modèles
- Expérience : entraînement itératif à l'aide de plusieurs approches (chaque itération est une ⁇ run)
- Valider et stocker : identifiez la meilleure exécution et inscrivez le modèle pour réutilisation
- Exécuter les inférences : utilisez une version de modèle enregistrée pour l'inférence de batch à partir des blocs-notes
- Surveillance : suivre les performances et la disponibilité de base de la production pour les modèles déployés
Fonctionnalités principales
Suivi des expériences par espace de travail d'équipe
- Les expériences sont ciblées sur un espace de travail pour séparer les équipes et organiser le travail.
- L'autologging compatible MLflow capture les paramètres, les mesures et les artefacts de chaque exécution, créant ainsi un enregistrement reproductible qui prend en charge les réexécutions avec des modifications contrôlées.
Exécuter la comparaison et l'enregistrement
- Les exécutions peuvent être filtrées et comparées pour identifier un modèle candidat.
- Une exécution peut être enregistrée dans le registre des modèles soutenu par le catalogue maître, avec la gestion des versions, les balises et les champs personnalisés. La gestion des versions est gérée par la plate-forme lorsque les modèles mis à jour sont enregistrés.
Du registre à l'inférence du bloc-notes
- Les modèles peuvent être chargés dans les blocs-notes par version la plus récente ou explicite, ce qui permet une réutilisation cohérente.
- Les workflows d'inférence par lot peuvent référencer directement les versions du registre, ce qui réduit la gestion manuelle entre l'expérimentation et l'inférence.
Lignage pour auditabilité
- Les modèles inscrits renvoient à l'exécution de l'expérience d'origine, y compris les conditions d'exécution telles que les hyperparamètres, les variables d'environnement, les mesures et les artefacts.
- Cela prend en charge la révision et l'audit en rendant la provenance de chaque modèle explicite.
Pourquoi utiliser le MLflow ?
AI Data Platform Workbench utilise le MLflow comme base de sa structure MLOps car il fournit une approche ouverte, extensible et indépendante de la structure pour gérer le cycle de vie du machine learning de bout en bout.
MLflow prend en charge les fonctionnalités de base nécessaires à la mise en œuvre du machine learning à grande échelle, notamment le suivi des expériences, le packaging des modèles, la gestion des artefacts, la gestion des versions de modèles, la gouvernance et la base de registres. Sa capacité à capturer des paramètres, des mesures, des artefacts et à exécuter des métadonnées de manière cohérente la rend bien adaptée pour améliorer la reproductibilité, l'auditabilité et la collaboration entre les équipes de science des données et d'ingénierie.
L'une des principales raisons de la sélection de MLflow est sa large compatibilité avec les structures d'apprentissage automatique populaires telles que TensorFlow, PyTorch et scikit-learn. Cela permet à AI Data Platform Workbench de prendre en charge divers modèles de développement de modèles sans forcer les équipes dans un cadre ou une chaîne d'outils unique. L'architecture des modules d'extension et la flexibilité de déploiement de MLflow facilitent également l'extension de la plate-forme et l'intégration à l'infrastructure d'entreprise existante.
En standardisant MLflow, AI Data Platform Workbench peut fournir une expérience MLOps cohérente à travers l'expérimentation, l'enregistrement des modèles, la gestion du cycle de vie, tout en conservant la flexibilité nécessaire pour évoluer avec différents cas d'utilisation de l'IA/ML.