Analyse des données avec la fonctionnalité Expliquer

La fonctionnalité Expliquer utilise l'apprentissage automatique pour repérer des infos clés utiles des données.

Présentation de la fonctionnalité Expliquer

La fonctionnalité Expliquer analyse la colonne sélectionnée dans le contexte de son ensemble de données et génère des descriptions textuelles concernant les infos clés trouvées. Par exemple, pour chaque colonne, vous pourrez trouver les faits de base, les facteurs clés, les segments expliquant la colonne et les anomalies.

La fonctionnalité Expliquer utilise l'apprentissage automatique d'Oracle pour générer des informations précises, rapides et performantes sur vos données, et crée les visualisations correspondantes que vous pouvez ajouter au canevas du classeur.

La fonctionnalité Expliquer est destinée aux analystes de données qui ne savent pas quelles tendances de données ils recherchent et ne veulent pas perdre de temps à expérimenter en effectuant un glisser-déplacer des colonnes vers le canevas ou en utilisant des flux de données pour entraîner et appliquer des modèles prédictifs.

La fonctionnalité Expliquer constitue également un bon point de départ pour les analystes de données souhaitant confirmer une tendance recherchée dans les données. Ils peuvent ensuite utiliser les informations pour créer et affiner des modèles prédictifs applicables à d'autres ensembles de données.

Que sont les informations clés ?

Les informations clés sont des catégories qui décrivent la colonne sélectionnée dans le contexte de son ensemble de données.

Icône de tutoriel Sprint LiveLabs

Les informations clés fournies par la fonctionnalité Expliquer reposent sur l'agrégation ou le type de colonne choisi. Elles varient en fonction de la règle d'agrégation définie pour la mesure choisie. La fonctionnalité Expliquer génère uniquement les infos clés pertinentes pour le type de colonne choisi.

Type d'infos clés Description
Faits de base Ce type d'analyse affiche la distribution de base des valeurs de la colonne. Les données de colonne sont réparties en fonction de chacun des indicateurs de l'ensemble de données.
Ces informations clés sont disponibles pour tous les types de colonne.
  • Pour une mesure sélectionnée, elle montre la distribution de la valeur de mesure agrégée pour les différents membres de chaque colonne d'attribut.
  • Pour un attribut sélectionné, elle montre la valeur de chaque mesure de l'ensemble de données pour toutes les valeurs de membre de l'attribut.
Facteurs clés Ce type d'analyse affiche les colonnes de l'ensemble de données qui présentent le plus fort degré de corrélation avec le résultat de la colonne sélectionnée. Des graphiques affichent la distribution de la valeur sélectionnée sur chaque valeur d'attribut corrélée.

Cet onglet ne s'affiche qu'en cas d'explication de colonnes d'attribut ou d'une colonne de mesure comportant une règle d'agrégation moyenne.

Segments Ce type d'analyse affiche les segments (ou groupes) de clé à partir des valeurs de colonne. La fonctionnalité Expliquer exécute un algorithme de classification sur les données pour déterminer les croisements de valeurs de données. Elle identifie dans toutes les dimensions les plages de valeurs qui génèrent la plus forte probabilité d'un résultat donné de l'attribut.

Par exemple, un groupe d'individus appartenant à une tranche d'âge, à un ensemble d'emplacements et à une plage d'années d'études donnés constitue un segment présentant une très forte probabilité d'acheter un certain produit.

Cet onglet ne s'affiche qu'en cas d'explication de colonnes d'attribut.

Anomalies Ce type d'analyse identifie une série de valeurs où l'une des valeurs (agrégées) dévie sensiblement de ce que les algorithmes de régression attendent.

Utilisation de la fonctionnalité Expliquer pour repérer des informations clés de données

Lorsque vous sélectionnez une colonne et que vous choisissez la fonctionnalité Expliquer, Oracle Analytics utilise l'apprentissage automatique pour analyser la colonne dans le contexte de l'ensemble de données. La fonctionnalité Expliquer recherche par exemple des facteurs clés et des anomalies dans les données sélectionnées.

Les résultats sont affichés sous forme de visualisations et de descriptions de texte, que vous pouvez ajouter au canevas du classeur.
Si vous exécutez la fonctionnalité Expliquer sur une colonne et que les résultats contiennent trop de colonnes corrélées et de rang élevé (par exemple, le code postal avec la ville et l'Etat/la province), l'exclusion de certaines colonnes de l'ensemble de données permet à la fonctionnalité d'identifier des facteurs plus explicites. Reportez-vous à Masquage ou suppression d'une colonne.
  1. Sur la page d'accueil, cliquez sur Créer, puis sur Classeur afin de créer un classeur.
  2. Cliquez sur Visualiser pour ouvrir la page Visualiser.
  3. Dans le panneau de données, cliquez avec le bouton droit de la souris sur une colonne et sélectionnez Expliquer <élément de données>.

    Vous devez disposer de l'accès en écriture à l'ensemble de données pour que l'option Expliquer <élément de données> apparaisse.
    Pour que la fonctionnalité Expliquer puisse analyser un attribut, ce dernier doit comporter entre 3 et 99 valeurs distinctes.
    La boîte de dialogue Expliquer affiche des faits de base, des anomalies et d'autres informations concernant la colonne sélectionnée.
  4. Examinez les informations clés suggérées dans les autres catégories en cliquant sur les onglets. Par exemple, des faits de base à propos de <attribut> ou des anomalies de <attribut>.
  5. Placez le curseur de la souris sur chaque information clé à inclure dans le canevas du classeur et cliquez sur Sélection pour le canevas.
    Une coche verte (Coche verte) apparaît en regard des éléments sélectionnés.

    Vous pouvez sélectionner plusieurs informations clés dans les différents onglets.
  6. Cliquez sur Ajouter la sélection pour ajouter des informations clés accompagnées d'une coche verte dans les différents onglets.
    Vous pouvez gérer les informations clés de la fonctionnalité Expliquer comme n'importe quelle autre visualisation créée manuellement dans le canevas.
Pour affiner les informations clés, cliquez sur Paramètres afin de modifier les colonnes à analyser et de configurer les options de cette catégorie. Sélectionnez par exemple la taille minimale des segments.