Créer et utiliser des modèles prédictifs Oracle Analytics

Les modèles prédictifs d'Oracle Analytics utilisent plusieurs algorithmes Oracle Machine Learning intégrés pour explorer vos jeux de données, prédire une valeur cible ou identifier des classes d'enregistrements. Utilisez l'éditeur de flux de données pour créer, entraîner et appliquer des modèles prédictifs à vos données.

Que sont les modèles prédictifs d'Oracle Analytics?

Un modèle prédictif Oracle Analytics applique un algorithme spécifique à un jeu de données afin de prédire des valeurs ou des classes, ou d'identifier des groupes dans les données.

Vous pouvez également utiliser des modèles d'apprentissage automatique Oracle pour prédire des données.

Oracle Analytics inclut des algorithmes pour vous aider à entraîner des modèles prédictifs à différentes fins. Parmi des exemples d'algorithmes figurent des arbres de classification et de régression (CART), la régression logique et les k moyennes.

L'éditeur de flux de données vous permet d'entraîner un modèle sur un jeu de données d'entraînement en premier lieu. Une fois le modèle prédictif entraîné, vous l'appliquez aux jeux de données à prédire.

Vous pouvez mettre le modèle entraîné à la disposition d'autres utilisateurs qui peuvent l'appliquer sur leurs données pour prédire des valeurs. Dans certains cas, des utilisateurs entraînent les modèles, d'autres les appliquent.

Note :

En cas de doute sur ce que vous pouvez rechercher dans vos données, vous pouvez utiliser Expliquer qui utilise l'apprentissage automatique pour identifier des tendances et schémas. Vous utilisez ensuite l'éditeur de flux de données pour créer et entraîner des modèles prédictifs pour forer dans les tendances et schémas trouvés par Expliquer.
L'éditeur de flux de données vous sert à entraîner un modèle :
  • Vous créez d'abord un flux de données et ajoutez le jeu de données à utiliser pour entraîner le modèle. Ce jeu de données d'entraînement contient les données à prédire (par exemple, une valeur ventes ou âge, ou une variable seau de risque de crédit).
  • Le cas échéant, vous pouvez utiliser l'éditeur de flux de données pour modifier le jeu de données en ajoutant, sélectionnant et joignant des colonnes, etc.
  • Après avoir confirmé qu'il s'agit bien des données sur lesquelles vous voulez entraîner le modèle, vous ajoutez une étape d'entraînement au flux de données et choisissez un algorithme de classification (binaire ou multi), de régression ou de regroupement pour entraîner le modèle. Nommez ensuite le modèle obtenu, enregistrez le flux de données et exécutez-le pour entraîner et créer le modèle.
  • Examinez les propriétés des objets d'apprentissage automatique pour déterminer la qualité du modèle. Le cas échéant, répétez le processus d'entraînement jusqu'à ce que le modèle atteigne la qualité voulue.

Utilisez le modèle terminé pour noter des données inconnues ou sans étiquette, et générer un jeu de données dans le flux de données ou ajouter une visualisation de prédiction à un classeur.

Exemple

Vous voulez, par exemple, créer et entraîner un modèle multiclasse afin de prédire les patients présentant un risque élevé de contracter une cardiopathie.

  1. Indiquez un jeu de données d'entraînement contenant des attributs sur des patients individuels, comme l'âge, le sexe et s'ils ont déjà eu des douleurs thoraciques, et des mesures, telles que la tension artérielle, la glycémie à jeun, le taux de cholestérol et la fréquence cardiaque maximale. Le jeu de données d'entraînement contient également une colonne appelée "Probabilité" à laquelle l'une des valeurs suivantes est affectée : absent, moins probable, probable, très probable ou présent.
  2. Choisissez l'algorithme CART (Arbre de décision) car il ignore les colonnes redondantes qui n'ajoutent aucune valeur à la prédiction, et identifie et utilise uniquement les colonnes servant à prédire la cible. Lorsque vous ajoutez l'algorithme au flux de données, vous choisissez la colonne Probabilité pour entraîner le modèle. L'algorithme utilise l'apprentissage automatique pour choisir les colonnes d'inducteurs nécessaires à l'exécution et à la sortie de prédictions et des jeux de données connexes.
  3. Inspectez les résultats et affinez le modèle d'entraînement. Appliquez ensuite le modèle à un jeu de données plus volumineux afin de prédire les patients présentant une probabilité élevée d'être atteints ou de contracter une cardiopathie.

Comment choisir un algorithme de modèle prédictif?

Oracle Analytics fournit des algorithmes pour tous vos besoins en modélisation d'apprentissage automatique : prédiction numérique, multi-classificateur, classificateur binaire et regroupement.

La fonctionnalité d'apprentissage automatique d'Oracle est destinée aux analystes de données expérimentés qui ont une idée de ce qu'ils recherchent dans leurs données, sont familiarisés avec la pratique des analyses prédictives et comprennent les différences entre les algorithmes.

Note :

Si vous utilisez des données provenant d'Oracle Autonomous Data Warehouse, vous pouvez utiliser la fonction AutoML pour entraîner rapidement et facilement un modèle prédictif pour vous-même, sans avoir aucune connaissance en apprentissage automatique. Voir Entraîner un modèle prédictif à l'aide de la fonction AutoML d'Autonomous Data Warehouse.

En général, les utilisateurs veulent créer plusieurs modèles de prédiction, les comparer et choisir le plus susceptible de donner des résultats répondant à leurs critères et à leurs exigences. Ces critères peuvent varier. Par exemple, les utilisateurs choisissent parfois des modèles présentant une meilleure exactitude générale, ou le moins d'erreurs de type I (faux positif) et de type II (faux négatif), et parfois des modèles retournant rapidement des résultats de niveau d'exactitude acceptable même s'ils ne sont pas idéaux.

Oracle Analytics contient plusieurs algorithmes d'apprentissage automatique pour chaque type de prédiction ou de classification. Ils permettent aux utilisateurs de créer plusieurs modèles, d'ajuster différents paramètres ou de sélectionner différents jeux de données d'entraînement d'entrée, puis de choisir le meilleur modèle. Pour choisir le meilleur, l'utilisateur compare et pondère des modèles par rapport à ses critères propres. Pour déterminer le meilleur, les utilisateurs peuvent appliquer le modèle et visualiser les résultats des calculs pour évaluer l'exactitude. Ils peuvent également ouvrir et explorer les jeux de données connexes produits par Oracle Analytics à l'aide du modèle.

Consultez ce tableau pour en savoir plus sur les algorithmes fournis :

Nom Type Catégorie Fonction Description
CART

Classification

Régression

Classificateur binaire

Multi-classificateur

Numérique

- Utilise des arbres de décision pour prédire des valeurs discrètes et continues.

À utiliser avec des jeux de données volumineux.

Régression linéaire élastique nette Régression Numérique ElasticNet Modèle de régression avancé. Fournit des informations supplémentaires (régularisation), effectue la sélection de variable et des combinaisons linéaires. Pénalités des méthodes de régression Lasso et Arête.

À utiliser avec un nombre important d'attributs pour éviter la colinéarité (quand plusieurs attributs sont parfaitement corrélés) et le surapprentissage.

Hiérarchique Regroupement Regroupement AgglomerativeClustering Établit une hiérarchie de regroupements ascendante (chaque observation constitue un regroupement, puis est fusionné) ou descendante (toutes les observations constituent un regroupement au départ), et à l'aide de mesures de distance.

À utiliser lorsque le jeu de données n'est pas important et que le nombre de regroupements est inconnu au départ.

K moyennes Regroupement Regroupement K moyennes Partitionne des enregistrements de manière itérative en k regroupements, où chaque observation appartient au regroupement avec la moyenne la plus proche.

À utiliser pour les colonnes de mesures de regroupement et avec un nombre déterminé de regroupements nécessaires. Fonctionne bien avec les jeux de données volumineux. Les résultats sont différents à chaque exécution.

Régression linéaire Régression Numérique Moindres carrés ordinaires

Arête

Lasso

Approche linéaire pour une relation de modélisation entre une variable cible et d'autres attributs du jeu de données.

À utiliser pour prédire des valeurs numériques lorsque les attributs ne sont pas parfaitement corrélés.

Régression logistique Régression Classificateur binaire LogisticRegressionCV À utiliser pour prédire la valeur d'une variable catégoriquement dépendante. La variable dépendante est une variable binaire qui contient des données codées 1 ou 0.
Bayésien naïf Classification

Classificateur binaire

Multi-classificateur

GaussianNB Classification probabiliste basée sur le théorème de Bayes qui ne suppose aucune dépendance entre les fonctions.

À utiliser s'il existe un grand nombre de dimensions d'entrée.

Réseau neuronal Classification

Classificateur binaire

Multi-classificateur

MLPClassifier Algorithme de classification itératif qui apprend en comparant le résultat de sa classification à la valeur réelle et la retourne au réseau pour modifier l'algorithme pour des itérations supplémentaires.

À utiliser pour l'analyse de texte.

Forêt aléatoire Classification

Classificateur binaire

Multi-classificateur

Numérique

- Une méthode d'apprentissage d'ensemble qui construit plusieurs arbres de décision et produit la valeur qui les représente tous collectivement.

À utiliser pour prédire des variables numériques et catégoriques.

SVM Classification

Classificateur binaire

Multi-classificateur

LinearSVC, SVC Classe les enregistrements en les mappant dans l'espace et en construisant des hyperplans utilisables pour la classification. Les nouveaux enregistrements (données de notation) sont mappés dans l'espace et leur appartenance à une catégorie est prédite, selon le côté de l'hyperplan où ils se situent.

Entraîner un modèle prédictif à l'aide de la fonction AutoML d'Oracle Autonomous Data Warehouse

Lorsque vous utilisez des données provenant d'Oracle Autonomous Data Warehouse, la fonction AutoML de ce service vous permet de recommander et d'entraîner un modèle prédictif. Cette fonction analyse vos données, calcule le meilleur algorithme à utiliser et enregistre un modèle de prédiction dans Oracle Analytics pour vous permettre d'effectuer des prédictions relatives à vos données.

Lorsque vous utilisez la fonction AutoML, Oracle Autonomous Data Warehouse fait tout le travail à votre place, de sorte que vous pouvez déployer un modèle de prédiction sans avoir aucune connaissance en apprentissage automatique ou en intelligence artificielle. Le modèle de prédiction généré est enregistré dans la zone Modèles de la page Apprentissage automatique. Pour prédire des données en fonction du nouveau modèle, créez un flux de données et utilisez l'étape Appliquer le modèle.
Avant de commencer :
  • Créez un jeu de données à partir des données provenant d'Oracle Autonomous Data Warehouse pour lesquelles vous souhaitez effectuer des prédictions. Imaginons par exemple que vous avez des données sur l'attrition, avec un champ nommé ATTRITION réglé à 'Oui' ou 'Non'.
  • Assurez-vous que l'utilisateur de base de données spécifié pour la connexion d'Oracle Analytics à Oracle Autonomous Data Warehouse dispose du rôle OML_Developer et qu'il n'est pas un superutilisateur 'admin'. Sinon, le flux de données échouera lorsque vous essaierez de l'enregistrer ou de l'exécuter.
  1. Dans la page d'accueil, cliquez sur Créer, puis cliquez sur Flux de données.
  2. Dans Ajouter un jeu de données, sélectionnez le jeu de données basé sur Oracle Autonomous Data Warehouse contenant les données à analyser.
  3. Cliquez sur Ajouter une étape, puis sur AutoML.
  4. Pour Cible, cliquez sur Sélectionner une colonne et sélectionnez la colonne de données contenant la valeur à prédire.
    Par exemple, pour prédire l'attrition, vous pouvez sélectionner un champ nommé ATTRITION indiquant 'TRUE' ou 'FALSE' selon que des employés ont quitté ou non l'organisation.

  5. Acceptez les valeurs recommandées par Oracle Analytics indiquées dans les champs Type de tâche et Mesure de classement de modèle ou sélectionnez un autre algorithme.
  6. Cliquez sur Enregistrer le modèle et spécifiez le nom du modèle de prédiction généré.
  7. Cliquez sur Enregistrer et indiquez un nom pour le flux de données.
  8. Cliquez sur Exécuter pour analyser les données et générer un modèle prédictif.
  9. Dans la page d'accueil, cliquez sur Naviguer, cliquez sur Apprentissage automatique, puis cliquez avec le bouton droit de la souris sur le modèle généré et sélectionnez Inspecter.
Vous pouvez localiser le modèle généré par Oracle Analytics dans la page Apprentissage automatique de l'onglet Modèles. Inspectez le modèle pour en évaluer la qualité. Voir Évaluer la qualité d'un modèle prédictif. Vous pouvez également faire référence aux jeux de données connexes qui sont générés pour les modèles générés par AutoML. Voir Que sont les jeux de données connexes d'un modèle prédictif?.

Créer et entraîner un modèle prédictif

Les analystes de données avancés créent et entraînent des modèles prédictifs afin de pouvoir les utiliser pour déployer des algorithmes Oracle Machine Learning, analyser des jeux de données, prédire une valeur cible ou identifier des classes d'enregistrement. Utilisez l'éditeur de flux de données pour créer et entraîner des modèles prédictifs et les appliquer à vos données.

Icône de tutoriel Sprint LiveLabs

Parvenir à un modèle exact est un processus itératif et un analyste expérimenté peut tester différents modèles, comparer leurs résultats et affiner les paramètres en procédant par essai et erreur. Un analyste de données peut utiliser le modèle prédictif exact finalisé pour prédire des tendances dans d'autres jeux de données, ou ajouter le modèle à des classeurs.

Note :

Si vous utilisez des données provenant d'Oracle Autonomous Data Warehouse, vous pouvez utiliser la fonction AutoML pour entraîner rapidement et facilement un modèle prédictif pour vous-même, sans avoir aucune connaissance en apprentissage automatique. Voir Entraîner un modèle prédictif à l'aide de la fonction AutoML d'Autonomous Data Warehouse.

Oracle Analytics fournit des algorithmes de prédiction numérique, de classification multiclasse, de classification binaire et de regroupement.

  1. Dans la page d'accueil, cliquez sur Créer, puis sélectionnez Flux de données.
  2. Sélectionnez le jeu de données à utiliser pour entrainer le modèle. Cliquez sur Ajouter.
  3. Dans l'éditeur de flux de données, cliquez sur Ajouter une étape (+).
    Après avoir ajouté un jeu de données, vous pouvez utiliser toutes ses colonnes pour créer un modèle ou ne sélectionner que les colonnes pertinentes. Le choix de colonnes pertinentes exige de bien connaître le jeu de données. Ignorez les colonnes dont vous savez qu'elles n'influenceront pas le comportement résultant ou qui contiennent des informations redondantes. Vous pouvez choisir les colonnes pertinentes uniquement en ajoutant l'étape Sélectionner des colonnes. En cas de doute sur les colonnes pertinentes, utilisez-les toutes.
  4. Sélectionnez une des étapes d'entraînement de modèle (par exemple Entraîner la prédiction numérique ou Entraîner le regroupement).
  5. Sélectionnez un algorithme et cliquez sur OK.
  6. Si vous utilisez un modèle supervisé, de prédiction ou de classification par exemple, cliquez sur Cible et sélectionnez la colonne à prédire. Par exemple, si vous créez un modèle destiné à prédire le revenu d'une personne, sélectionnez la colonne Revenu.
    Si vous utilisez un modèle non supervisé, de regroupement par exemple, aucune colonne cible n'est nécessaire.
  7. Modifiez les paramètres par défaut du modèle pour affiner et améliorer l'exactitude du résultat prédit. Le modèle que vous utilisez déterminer ces paramètres.
  8. Cliquez sur l'étape Enregistrer le modèle et entrez un nom et une description.
  9. Cliquez sur Enregistrer, entrez un nom et une description du flux de données, et cliquez sur OK pour enregistrer le flux de données.
  10. Cliquez sur Exécuter le flux de données pour créer le modèle prédictif selon le jeu de données d'entrée et les paramètres de modèle fournis.

Étapes du flux de données pour l'entraînement des modèles d'apprentissage automatique

Oracle Analytics vous permet d'entraîner des modèles d'apprentissage automatique à l'aide d'étapes de flux de données. Après avoir entraîné un modèle d'apprentissage automatique, appliquez-le à vos données à l'aide de l'étape Appliquer le modèle.

Nom de l'étape Description
AutoML (Oracle Autonomous Data Warehouse est requis) La fonction AutoML d'Oracle Autonomous Data Warehouse vous permet de recommander et d'entraîner un modèle prédictif pour vous-même. L'étape AutoML analyse vos données, calcule le meilleur algorithme à utiliser et enregistre un modèle de prédiction dans Oracle Analytics.
Entraîner le classificateur binaire

Entraîner un modèle d'apprentissage automatique pour classer vos données dans l'une des deux catégories prédéfinies.

Entraîner le regroupement Entraîner un modèle d'apprentissage automatique pour séparer des groupes ayant des traits similaires et les affecter à des regroupements.
Entraîner le multi-classificateur Entraîner un modèle d'apprentissage automatique pour classer vos données dans l'une des trois catégories prédéfinies ou plus.
Entraîner la prédiction numérique Entraîner un modèle d'apprentissage automatique pour prédire une valeur numérique en fonction de valeurs de données connues.

Inspecter un modèle prédictif

Après avoir créé le modèle prédictif et exécuté le flux de données, vous pouvez vérifier les informations concernant le modèle pour déterminer son exactitude. À l'aide de ces informations, adaptez les paramètres du modèle de manière itérative pour améliorer son exactitude et prédire de meilleurs résultats.

Voir les détails d'un modèle prédictif

Les informations détaillées d'un modèle prédictif vous aident à comprendre le modèle et à déterminer s'il convient pour prédire les données. Les détails du modèle comprennent la classe, l'algorithme, les colonnes d'entrée et de sortie du modèle.

  1. Dans la page d'accueil, cliquez sur Navigateur Icône du navigateur utilisée pour afficher le navigateur, puis sur Apprentissage automatique.
  2. Cliquez sur l'icône du menu d'un modèle d'entraînement et sélectionnez Inspecter.
  3. Cliquez sur Détails pour voir les informations sur le modèle.

Évaluer la qualité d'un modèle prédictif

Voyez des informations qui vous aident à comprendre la qualité d'un modèle prédictif. Par exemple, vous pouvez vérifier des mesures d'exactitude comme l'exactitude du modèle, la précision, le rappel, la valeur F1 et le taux de faux positifs.

Oracle Analytics fournit des mesures similaires indépendamment de l'algorithme utilisé pour créer le modèle, ce qui facilite la comparaison de différents modèles. Lors de la création du modèle, le jeu de données d'entrée est divisé en deux afin d'entraîner et de tester le modèle selon le paramètre de pourcentage de partition pour l'entraînement. Le modèle utilise la partie test du jeu de données pour évaluer l'exactitude du modèle créé.
En fonction des résultats de l'onglet Qualité, vous aurez peut-être besoin d'ajuster les paramètres du modèle et de l'entraîner à nouveau.
  1. Dans la page d'accueil, cliquez sur Navigateur Icône du navigateur utilisée pour afficher le navigateur, puis sur Apprentissage automatique.
  2. Cliquez sur l'icône du menu d'un modèle d'entraînement et sélectionnez Inspecter.
  3. Cliquez sur l'onglet Qualité pour vérifier les mesures de qualité du modèle et évaluer le modèle. Par exemple, vérifiez la note de précision du modèle.

Conseil : Cliquez sur Plus pour vérifier les détails des vues générées pour le modèle.

Que sont les jeux de données connexes d'un modèle prédictif?

Lorsque vous exécutez le flux de données pour créer le modèle d'entraînement du modèle prédictif Oracle Analytics, Oracle Analytics crée un ensemble de jeux de données connexes. Vous pouvez ouvrir et créer des classeurs sur ces jeux de données pour en savoir plus sur l'exactitude du modèle.

Selon l'algorithme choisi pour le modèle, les jeux de données connexes contiennent des détails sur celui-ci : règles de prédiction, mesures d'exactitude, matrice de confusion, inducteurs clés de prédiction, etc. Vous pouvez utiliser ces informations pour affiner le modèle afin d'obtenir de meilleurs résultats, et vous servir des jeux de données connexes pour comparer des modèles et décider lequel est plus précis.

Par exemple, vous pouvez ouvrir un jeu de données Inducteurs pour découvrir les colonnes qui ont une forte influence positive ou négative sur le modèle. En examinant ces colonnes, vous constatez que certaines colonnes ne sont pas traitées en tant que variables de modèle car elles sont trop granulaires pour la prévision ou leurs entrées ne sont pas réalistes. Dans l'éditeur de flux de données, ouvrez le modèle et, en fonction des informations obtenues, supprimez les colonnes non pertinentes ou trop granulaires, et régénérez le modèle. Consultez les onglets Qualité et Résultats et vérifiez si l'exactitude du modèle s'est améliorée. Poursuivez ce processus jusqu'à ce que l'exactitude du modèle soit satisfaisante et qu'il soit prêt à évaluer un nouveau jeu de données.

Différents algorithmes génèrent des jeux de données connexes similaires. En fonction du type d'algorithme, les paramètres individuels et les noms de colonne peuvent changer dans le jeu de données, mais la fonctionnalité de ce dernier reste la même. Par exemple, la colonne Régression Linéaire d'un jeu de données de statistiques peut être remplacée par Régression logistique, mais celui-ci contient des mesures d'exactitude du modèle.

Jeux de données connexes pour les modèles AutoML

Lorsque vous entraînez un modèle prédictif à l'aide de la fonction AutoML, Oracle Analytics crée des jeux de données supplémentaires qui contiennent des informations utiles sur le modèle. Le nombre de jeux de données créés dépend de l'algorithme du modèle. Par exemple, pour les modèles bayésiens naïfs, Oracle Analytics crée un jeu de données qui fournit des informations sur les probabilités conditionnelles. Pour un modèle d'arbre de décision, le jeu de données fournit des informations sur les statistiques de l'arbre de décision. Lorsque vous inspectez un modèle généré par la fonction AutoML à l'aide de l'algorithme de modèle linéaire généralisé (GLM), vous voyez des entrées dotées du préfixe GLM* pour les jeux de données propres au modèle qui contiennent des informations de métadonnées sur le modèle.
Description de GUID-1A190D76-82D5-4BEC-82C4-D881CFECA14D-default.png ci-après
.png

Jeux de données connexes

Note :

Oracle Analytics ajoute le nom de la sortie du flux de données au type de jeu de données connexe. Par exemple, pour un modèle CART, si la sortie du flux de données est nommée cart_model2, le jeu de données est nommé cart_model2_CART.

CART

Oracle Analytics crée une table pour le jeu de données connexe CART (arbre de classification et de régression). Elle contient des colonnes représentant les conditions et leurs critères dans l'arbre de décision, une prédiction pour chaque groupe et le niveau de confiance de la prédiction. Utilisez la visualisation d'arbre pour visualiser cet arbre de décision.

Le jeu de données CART est créé lorsque vous sélectionnez ces combinaisons de modèle et d'algorithme.

Modèle Algorithme
Numérique CART pour prédiction numérique
Classification binaire CART
Multiclasse CART

Rapport de classification

Oracle Analytics crée une table pour le jeu de données connexe Rapport de classification. Par exemple, si la colonne cible peut contenir deux valeurs distinctes, Oui et Non, ce jeu de donnés présente des mesures d'exactitude, telles que la valeur F1, la précision, le rappel et le soutien (nombre de rangées du jeu de données d'entraînement contenant cette valeur), pour chaque valeur distincte de la colonne cible.

Le jeu de données Classification est créé lorsque vous sélectionnez ces combinaisons de modèle et d'algorithme.

Modèle Algorithmes
Classification binaire

Bayésien naïf

Réseau neuronal

Machine à vecteurs de support

Multiclasse

Bayésien naïf

Réseau neuronal

Machine à vecteurs de support

Matrice de confusion

Oracle Analytics crée un tableau croisé dynamique pour le jeu de données connexe Matrice de confusion, également appelé matrice des covariances. Chaque rangée représente une instance d'une classe prédite, et chaque colonne, une instance dans une classe réelle. Ce tableau signale le nombre de faux positifs, de faux négatifs, de vrais positifs et de vrais négatifs. Ces valeurs sont utilisés pour calculer les mesures d'exactitude Précision, Rappel et F1.

Le jeu de données Matrice de confusion est créé lorsque vous sélectionnez ces combinaisons de modèle et d'algorithme.

Modèle Algorithmes
Classification binaire

Régression logistique

CART (Arbre de décision)

Bayésien naïf

Réseau neuronal

Forêt aléatoire

Machine à vecteurs de support

Multiclasse

CART (Arbre de décision)

Bayésien naïf

Réseau neuronal

Forêt aléatoire

Machine à vecteurs de support

Inducteurs

Oracle Analytics crée une table pour le jeu de données connexe Inducteurs, qui contient des informations sur les colonnes qui déterminent les valeurs de la colonne cible. Les régressions linéaires servent à identifier ces colonnes. À chaque colonne sont affectées des valeurs de coefficient et de corrélation. La valeur de coefficient décrit le poids-âge de la colonne utilisé pour déterminer la valeur de la colonne cible. La valeur de corrélation indique le sens de la relation entre la colonne cible et la colonne dépendante; par exemple, si la valeur de la colonne cible augmente ou diminue selon la colonne dépendante.

Le jeu de données Inducteurs est créé lorsque vous sélectionnez ces combinaisons de modèle et d'algorithme.

Modèle Algorithmes
Numérique

Régression linéaire

Régression linéaire élastique nette

Classification binaire

Régression logistique

Machine à vecteurs de support

Multiclasse Machine à vecteurs de support

Hitmap

Oracle Analytics crée une table pour le jeu de données connexe Hitmap, qui contient des informations sur les noeuds feuilles de l'arbre de décision. Chaque rangée du tableau figure un noeud feuille et contient des informations décrivant ce qu'il représente; par exemple, taille de segment, niveau de confiance et nombre attendu de rangées. Par exemple, nombre attendu de prédictions correctes = Taille de segment * Confiance.

Le jeu de données Hitmap est créé lorsque vous sélectionnez ces combinaisons de modèle et d'algorithme.

Modèle Algorithme
Numérique CART pour prédiction numérique

Valeurs résiduelles

Oracle Analytics crée une table pour le jeu de données connexe Valeurs résiduelles, qui contient des informations sur la qualité des prédictions résiduelles. Une valeur résiduelle est la différence entre la valeur mesurée et la valeur prédite par un modèle de régression. Ce jeu de données contient une valeur de somme agrégée de différence absolue entre les valeurs réelles et prédites pour toutes les colonnes qu'il contient.

Le jeu de données Valeurs résiduelles est créé lorsque vous sélectionnez ces combinaisons de modèle et d'algorithme.

Modèle Algorithmes
Valeurs numériques

Régression linéaire

Régression linéaire élastique nette

CART pour prédiction numérique

Classification binaire CART (Arbre de décision)
Multiclasse CART (Arbre de décision)

Statistiques

Oracle Analytics crée une table pour le jeu de données connexe Statistiques. Les mesures de ce jeu de données dépendent de l'algorithme utilisé pour le générer. Notez cette liste de mesures basées sur l'algorithme :

  • Régression linéaire, CART pour prédiction numérique, Régression linéaire nette élastique - Ces algorithmes contiennent R au carré, R au carré ajusté, Erreur absolue moyenne (EAM), Erreur quadratique moyenne (EQM), Erreur absolue relative (EAR), Erreur quadratique relative (EQR), Erreur quadratique moyenne (racine).
  • CART (Arbres de classification et de régression), Classification bayésienne naïve, Réseau neuronal, Machine à vecteurs de support, Forêt aléatoire, Régression logistique - Ces algorithmes contiennent les mesures Exactitude, Total F1.

Ce jeu de données est créé lorsque vous sélectionnez ces combinaisons de modèle et d'algorithme.

Modèle Algorithme
Numérique

Régression linéaire

Régression linéaire élastique nette

CART pour prédiction numérique

Classification binaire

Régression logistique

CART (Arbre de décision)

Bayésien naïf

Réseau neuronal

Forêt aléatoire

Machine à vecteurs de support

Multiclasse

Bayésien naïf

Réseau neuronal

Forêt aléatoire

Machine à vecteurs de support

Sommaire

Oracle Analytics crée une table pour le jeu de données connexe Sommaire, qui contient des informations, telles que Nom de cible et Nom de modèle.

Le jeu de données Sommaire est créé lorsque vous sélectionnez ces combinaisons de modèle et d'algorithme.

Modèle Algorithmes
Classification binaire

Bayésien naïf

Réseau neuronal

Machine à vecteurs de support

Multiclasse

Bayésien naïf

Réseau neuronal

Machine à vecteurs de support

Rechercher les jeux de données connexes d'un modèle prédictif

Des jeux de données connexes sont générés lorsque vous entraînez un modèle prédictif.

Selon l'algorithme, ces jeux de données connexes contiennent les détails du modèle : règles de prédiction, mesures d'exactitude, matrice de confusion, inducteurs clés de prédiction, etc. Ces paramètres vous aident à comprendre les règles utilisées par le modèle pour déterminer les prédictions et les classifications.
  1. Dans la page d'accueil, cliquez sur Navigateur Icône du navigateur utilisée pour afficher le navigateur, puis sur Apprentissage automatique.
  2. Cliquez sur l'icône du menu d'un modèle d'entraînement et sélectionnez Inspecter.
  3. Cliquez sur l'onglet Connexe pour accéder aux jeux de données connexes du modèle.
  4. Cliquez deux fois sur un jeu de données connexe pour le consulter ou l'utiliser dans un classeur.

Ajouter un modèle prédictif à un classeur

Lorsque vous créez un scénario dans un classeur, vous appliquez un modèle prédictif au jeu de données de ce dernier pour révéler les tendances et les schémas que la conception du modèle permet de trouver.

Note :

Vous ne pouvez pas appliquer un modèle d'apprentissage automatique Oracle aux données d'un classeur.
Après que vous ajoutez le modèle au classeur et mappez les entrées du premier aux colonnes du jeu de données, le volet Données contient les objets du modèle que vous pouvez glisser-déposer sur le canevas. L'apprentissage automatique génère les valeurs du modèle en fonction des colonnes de données correspondantes de la visualisation.
  1. Dans la page d'accueil, cliquez sur Créer, puis sur Classeur.
  2. Sélectionnez le jeu de données que vous voulez utiliser pour créer le classeur et cliquez sur Ajouter au classeur.
  3. Dans le volet Données, cliquez sur Ajouter et sélectionnez Créer un scénario.
  4. Dans la boîte de dialogue Créer un scénario - Sélectionner le modèle, sélectionnez un modèle et cliquez sur OK.
    Vous pouvez uniquement appliquer un modèle prédictif. Vous ne pouvez pas appliquer un modèle d'apprentissage automatique Oracle.
    Si l'entrée de chaque modèle ne peut pas être mise en correspondance avec un élément de données, la boîte de dialogue Mapper vos données avec le modèle s'affiche.
  5. Si la boîte de dialogue Mapper vos données avec le modèle apparaît, dans le champ Jeu de données, sélectionnez le jeu de données à utiliser avec le modèle.
  6. Mettez en correspondance les entrées du modèle et les éléments de données selon les besoins. Cliquez sur Terminé.
    Le scénario est affiché en tant que jeu de données dans le volet Éléments de données.
  7. Glissez-déposez les éléments du jeu de données et le modèle sur le canevas Visualiser.
  8. Pour ajuster le scénario, cliquez dessus avec le bouton droit de la souris dans le volet Éléments de données et sélectionnez Modifier le scénario.
  9. Modifiez le jeu de données et mettez à jour le mappage des entrées du modèle et des éléments de données selon les besoins.
  10. Cliquez sur Enregistrer pour enregistrer le classeur.