Utiliser des modèles d'apprentissage automatique
Les transformations de données prennent en charge l'utilisation du modèle d'apprentissage automatique dans un flux de données. Voyez comment créer et utiliser des modèles d'apprentissage automatique dans des flux de données.
Rubriques
- Créer une entité de données de modèle d'apprentissage automatique dans l'éditeur de flux de données
Pour utiliser des modèles d'apprentissage automatique dans les transformations de données, vous devez créer deux flux de données. Vous devez d'abord créer l'entité de données du modèle d'apprentissage automatique à l'aide de l'éditeur de flux de données, puis vous pouvez utiliser l'entité de données dans un flux de données pour extraire les données d'une connexion source et les charger dans un serveur cible. - Propriétés de l'entité de données de modèle ML
L'onglet Propriétés de l'assistant Ajouter une entité de données fournit des options d'exploration de données que vous pouvez utiliser pour définir l'entité de données du modèle ML. - Utiliser le modèle d'apprentissage automatique dans un flux de données
Vous pouvez utiliser la fonction de base de données Modèle de prédiction pour exécuter des algorithmes de modèle d'apprentissage automatique sur les données sources et charger la sortie dans une base de données cible.
Rubrique parent : La page Data Transforms
Créer une entité de données de modèle d'apprentissage automatique dans l'éditeur de flux de données
Pour utiliser des modèles d'apprentissage automatique dans les transformations de données, vous devez créer deux flux de données. Vous devez d'abord créer l'entité de données du modèle d'apprentissage automatique à l'aide de l'éditeur de flux de données, puis vous pouvez utiliser l'entité de données dans un flux de données pour extraire les données d'une connexion source et les charger dans un serveur cible.
Pour créer une entité de données de modèle d'apprentissage automatique dans l'éditeur de flux de données,
- Faites glisser l'entité de données sur laquelle vous souhaitez créer le modèle d'apprentissage automatique vers le canevas de conception.
- Sélectionnez le composant et cliquez sur l'icône Ajouter une entité de données
située dans le coin supérieur droit du composant cible.
- La page Ajouter une entité de données s'affiche et vous permet de configurer les détails suivants du composant cible :
Onglet Général
- Dans la zone de texte Nom, entrez le nom de l'entité de données nouvellement créée.
- Dans la liste déroulante Type d'entité, sélectionnez Modèle ML comme type d'entité de données.
Lorsque vous sélectionnez ce type d'entité, l'interface utilisateur change comme suit :
- La liste déroulante Connexion répertorie uniquement les connexions Oracle que vous avez créées.
- L'assistant Ajouter une entité de données affiche l'onglet Propriétés dans lequel vous pouvez sélectionner le type d'apprentissage, la fonction, l'algorithme et configurer les paramètres pour définir le modèle d'apprentissage automatique. Pour plus d'informations, voir Propriétés d'entité de données de modèle ML.
- Dans la liste déroulante Type de connexion, sélectionnez la connexion requise à partir de laquelle vous souhaitez ajouter l'entité de données nouvellement créée. Pour les entités de données de modèle d'apprentissage automatique, la liste déroulante Type de connexion ne répertorie que Oracle comme option.
- La liste déroulante Connection est alimentée avec les connexions que vous avez créées avec le type de connexion associé. Dans la liste déroulante Connexion, sélectionnez le nom du serveur où vous souhaitez conserver l'entité de données du modèle d'apprentissage automatique.
- Dans la liste déroulante Schéma, tous les schémas correspondant à la connexion sélectionnée sont répertoriés dans deux groupes.
- Nouveau schéma de base de données (celui que vous n'avez pas importé auparavant) et
- Schéma de base de données existant (personnes que vous avez importées d'avant et qui remplacent potentiellement des entités de données).
- Dans la zone de texte Marqueurs, entrez un marqueur de votre choix. Vous pouvez utiliser des marqueurs pour filtrer les entités de données affichées dans la page Entité de données.
- Pour marquer cette entité de données comme groupe de fonctions, développez Options avancées et cochez la case Traiter comme groupe de fonctions.
- Cliquez sur Suivant.
Onglet Propriétés
- Sélectionnez le type d'apprentissage, la fonction et l'algorithme à utiliser pour créer cette entité de données. Pour plus d'informations sur les options, voir Propriétés d'entité de données de modèle ML.
- Selon les options sélectionnées, la section Paramètres est alimentée avec la liste des paramètres marqués "Importance" et "Élevée". Vous pouvez ajouter d'autres paramètres requis à l'aide de l'icône
.
Vous devez spécifier une valeur pour chaque paramètre afin que le flux de données puisse s'exécuter avec succès.
Onglet Colonnes
- Cliquez sur l'icône
Ajouter des colonnes pour ajouter de nouvelles colonnes à la nouvelle entité de données créée.
Une nouvelle colonne est ajoutée à la table affichée.
- Le tableau présente les colonnes suivantes :
- Le nom
- Type de données - Cliquez sur la cellule pour configurer le type de données requis.
- Ajuster
- Longueur
- Actions - Cliquez sur l'icône croisée pour supprimer la colonne créée.
- Pour supprimer les colonnes en masse, sélectionnez-les et cliquez sur l'icône de suppression
.
- Pour rechercher les détails de colonne requis, dans la zone de texte Rechercher, entrez le nom de colonne requis et cliquez sur Entrer. Les détails de la colonne requise s'affichent.
- Cliquez sur Suivant.
Onglet Prévisualiser l'entité de données
Il affiche un aperçu de toutes les colonnes créées et de leurs détails configurés. Si l'entité de données appartient à une base de données Oracle, vous pouvez également afficher les statistiques de la table. Pour plus d'informations, voir Voir les statistiques des entités de données.
- Cliquez sur Enregistrer pour enregistrer la configuration et quitter l'assistant.
- Enregistrer et exécuter le flux de données.
La nouvelle entité de données est créée. Elle s'affiche dans la page Entités de données.
Rubrique parent : Utiliser des modèles d'apprentissage automatique
Propriétés d'entité de données de modèle d'apprentissage automatique
L'onglet Propriétés de l'assistant Ajouter une entité de données fournit des options d'exploration de données que vous pouvez utiliser pour définir l'entité de données du modèle d'apprentissage automatique.
Cette rubrique suppose une connaissance préalable des concepts d'Oracle Machine Learning, tels que les fonctions et les algorithmes d'exploration de données. Pour plus d'informations, voir Guide de l'API Oracle Machine Learning for SQL.
Vous pouvez utiliser l'une des options suivantes pour configurer les propriétés de l'entité de données ML Model :
- Type d'apprentissage : supervisé
- Fonction : Classification
- Arbre de décision
- Analyse sémantique explicite
- Modèles linéaires généralisés
- Bayésien naïf
- Forêt aléatoire
- Réseau neuronal
- Machines à vecteurs de support
- Fonction : Régression
- Modèles linéaires généralisés
- Réseau neuronal
- Machines à vecteurs de support
- Fonction : Série chronologique
- lissage exponentiel
- Fonction : Importance d'attribut
- Longueur minimale de la description
- Fonction : Classification
- Type d'apprentissage : non supervisé
- Fonction : Association
- Apriori
- Fonction : Importance d'attribut
- Décomposition de la matrice CUR
- Fonction : Détection d'anomalies
- Machines à vecteurs de soutien d'une classe
- Fonction : Mise en grappe
- Espérance-maximisation
- K moyennes
- Clusterisation de partitionnement orthogonal
- Fonction : Extraction de fonction
- Analyse sémantique explicite
- Factorisation de matrice non négative
- Décomposition en valeurs singulières
- Fonction : Association
Rubrique parent : Utiliser des modèles d'apprentissage automatique
Utiliser le modèle d'apprentissage automatique dans un flux de données
Vous pouvez utiliser la fonction de base de données Modèle de prédiction pour exécuter des algorithmes de modèle d'apprentissage automatique sur les données sources et charger la sortie dans une base de données cible.
Avant d'utiliser un modèle d'apprentissage automatique dans un flux de données, vous devez créer le modèle d'apprentissage automatique. Pour obtenir des instructions sur la création d'un modèle d'apprentissage automatique, voir Créer une entité de données de modèle d'apprentissage automatique dans l'éditeur de flux de données.
Pour utiliser un modèle d'apprentissage automatique dans un flux de données :
- Suivez les instructions sous Créer un flux de données pour créer un nouveau flux de données.
- Dans l'éditeur de flux de données, faites glisser les tables que vous souhaitez utiliser comme source dans le flux de données et déposez-les sur le canevas de conception.
- Dans la barre d'outils Fonctions de base de données, cliquez sur Apprentissage automatique et faites glisser le composant de transformation Modèle de prévision vers le canevas de conception.
- Cliquez sur le composant de transformation Prediction Model (Modèle de prévision) pour voir ses propriétés.
- Dans l'onglet Général, spécifiez les informations suivantes :
- Connexion - La liste déroulante répertorie toutes les connexions Oracle disponibles. Sélectionnez la connexion Oracle à utiliser.
- Schéma - Sélectionnez le schéma.
- Modèle d'apprentissage automatique - La liste déroulante répertorie tous les modèles d'apprentissage automatique disponibles. Voir Créer une entité de données de modèle d'apprentissage automatique dans l'éditeur de flux de données pour obtenir des instructions sur la création d'un modèle d'apprentissage automatique.
- Dans l'onglet Mappage de colonnes, mappez la colonne source à intégrer à l'attribut INPUT de l'opérateur. La seule colonne disponible dans les mappages de colonne est
prediction parameters. Faites glisser une colonne de texte des colonnes disponibles vers la colonne Expression. - Faites glisser la table à utiliser comme cible dans le flux de données et déposez-la sur le canevas de conception.
- Enregistrer et exécuter le flux de données.
Les transformations de données exécutent le modèle de prédiction sur les données sources et écrivent la sortie dans la table cible.
Rubrique parent : Utiliser des modèles d'apprentissage automatique