Utilisez ces étapes dans des flux de données pour organiser, intégrer et transformer vos données. Par exemple, vous pouvez fusionner des sources de données, agréger des données ou effectuer une analyse géospatiale.
Les étapes vous permettent de transformer visuellement vos données sans nécessiter de compétences de codage.
Utilisez l'éditeur de flux de données pour ajouter des étapes aux flux de données.
.png
Ajouter des colonnes
Ajoutez des colonnes personnalisées à votre ensemble de données cible. Par exemple, vous pouvez calculer la valeur de votre stock en multipliant le nombre d'unités dans une colonne UNITS
par le prix de vente dans une colonne RETAIL_PRICE
, (c'est-à-dire, UNITS
* RETAIL_PRICE
).
Ajouter des données
Ajoutez des sources de données à votre flux de données. Par exemple, si vous fusionnez deux ensembles de données, vous ajoutez ces deux ensembles à votre flux de données. Reportez-vous à Prise en charge des bases de données pour les flux de données.
Agréger
Créez des totaux de groupe en appliquant des fonctions d'agrégation. Par exemple, le dénombrement, la somme ou la moyenne.
Analyser le sentiment
Détectez le sentiment pour une colonne donnée. Par exemple, vous pouvez analyser les commentaires des clients pour déterminer s'ils sont positifs ou négatifs. L'analyse de sentiment évalue le texte selon les mots et les expressions caractéristiques d'une émotion positive, neutre ou négative. Selon le résultat de l'analyse, une nouvelle colonne contient un sentiment positif, neutre ou négatif.
Appliquer un modèle d'IA
Analysez des données à l'aide d'un modèle d'intelligence artificielle. Par exemple, vous pouvez effectuer une détection d'objets, une classification d'images ou une détection de texte à l'aide d'un modèle créé dans le service OCI Vision. Reportez-vous à Utilisation de modèles OCI Vision dans Oracle Analytics. Vous pouvez également effectuer une analyse de langue telle qu'une analyse de sentiment ou une détection de la langue à l'aide de modèles créés dans OCI Language Service.
Appliquer un modèle
Analysez des données en appliquant un modèle d'apprentissage automatique à partir d'Oracle Machine Learning ou d'OCI Data Science. Par exemple, vous avez peut-être créé un modèle de classification permettant de prédire si les courriels sont des messages indésirables ou non. Reportez-vous à Application d'un modèle d'apprentissage automatique Oracle inscrit ou prédictif à un ensemble de données.
Appliquer un script personnalisé
Transformez les données à l'aide d'une fonction, comme une fonction définie dans Oracle Cloud Infrastructure (OCI). Vous pouvez par exemple utiliser une fonction pour remplacer un texte en anglais par de l'espagnol ou de l'allemand. L'administrateur Oracle Analytics inscrit ces fonctions pour les mettre à votre disposition.
AutoML
Utilisez la fonction AutoML d'Oracle Autonomous Data Warehouse pour la recommandation et l'entraînement d'un modèle prédictif. L'étape AutoML analyse les données, calcule le meilleur algorithme à utiliser et inscrit un modèle de prévision dans Oracle Analytics. Les analyses sont calculées dans la base de données, et non dans Oracle Analytics. Cette étape est disponible dans le sélecteur d'étape lorsque vous êtes connecté à un ensemble de données basé sur Oracle Autonomous Data Warehouse.
Reportez-vous à Entraînement d'un modèle prédictif à l'aide d'AutoML dans Oracle Autonomous Data Warehouse.
Discrétiser
Affectez les valeurs de données à des catégories (par exemple, haut, bas ou moyen). Par exemple, vous pouvez catégoriser les valeurs de RISK
en trois plages : basse, moyenne et élevée.
Branche
Créez plusieurs sorties à partir d'un flux de données. Par exemple, si vous disposez de données de transactions de vente basées sur le pays, vous pouvez enregistrer les données pour les Etats-Unis dans la première branche et pour le Canada dans la seconde.
Créer un cube Essbase
Créez un cube Essbase à partir d'une feuille de calcul ou d'une base de données.
Valeur cumulée
Calculez des totaux cumulés comme des agrégations mobiles ou courantes.
Analyses de base de données
Effectuez des analyses avancées et des analyses d'exploration de données. Par exemple, vous pouvez détecter les anomalies, créer des clusters de données, échantillonner les données et effectuer des analyses d'affinité. Cette étape est disponible dans le sélecteur d'étape lorsque vous êtes connecté à un ensemble de données basé sur une base de données Oracle ou sur Oracle Autonomous Data Warehouse. Les analyses sont calculées dans la base de données, et non dans Oracle Analytics. Reportez-vous à Fonctions d'analyse de base de données.
Filtre
Sélectionnez uniquement les données qui vous intéressent. Par exemple, vous pouvez créer un filtre afin de limiter les données de produits des ventes aux années 2020 à 2022.
Analyses de graphique
Effectuer une analyse géo-spatiale, telle que le calcul de la distance ou le nombre de sauts entre deux sommets. Cette étape est disponible dans le sélecteur d'étape lorsque vous êtes connecté à un ensemble de données basé sur une base de données Oracle ou sur Oracle Autonomous Data Warehouse. Les analyses sont calculées dans la base de données, et non dans Oracle Analytics. Reportez-vous à Fonctions d'analyse de graphique.
Groupe
Catégorisez les données non numériques dans des groupes que vous définissez. Par exemple, vous pouvez placer les commandes relatives aux secteurs d'activité Communication
et Digital
dans un groupe nommé Technology
et celles de Games
et de Stream
dans un groupe nommé Entertainment
.
Jointure
Combinez des données provenant de plusieurs sources de données à l'aide d'une jointure de base de données reposant sur une colonne commune. Par exemple, vous pouvez joindre un ensemble de données Orders
à un ensemble de données Customer_orders
à l'aide d'un champ d'ID de client.
Fusionner
Combinez plusieurs colonnes en une seule et même colonne. Par exemple, vous pouvez fusionner les colonnes de numéro de rue, de nom de rue, d'Etat/de province et de code postal en une seule colonne.
Renommer les colonnes
Remplacez le nom d'une colonne par un nom plus explicite. Par exemple, vous pouvez remplacer PORTABLE par Numéro de portable à contacter.
Réorganiser les colonnes
Modifiez l'ordre des colonnes dans l'ensemble de données de sortie. Par exemple, vous voudrez peut-être tirer les colonnes par ordre alphabétique selon leur nom, ou par type de données (caractère, entier, etc.).
Enregistrer les données
Indiquez où enregistrer les données générées par le flux de données. Vous pouvez enregistrer les données dans un ensemble de données dans Oracle Analytics ou dans une base de données. Vous pouvez également spécifier des paramètres d'exécution ou modifier le nom par défaut de l'ensemble de données. Reportez-vous à Prise en charge des bases de données pour les flux de données.
Sélectionner des colonnes
Indiquez les colonnes à inclure dans votre flux de données, ou à exclure (par défaut, toutes les colonnes de données sont incluses).
Fractionner les colonnes
Extrayez des données des colonnes de données. Par exemple, si une colonne contient les données 001011Black
, vous pouvez les fractionner en deux colonnes distinctes, 001011
et Black
.
Prévision de série chronologique
Calculez des valeurs prévues reposant sur des données historiques. Une prévision utilise une colonne de temps et une colonne cible d'un ensemble de données et calcule les valeurs prévues pour la colonne cible.
Entraîner <type de modèle>
Entraînez des modèles d'apprentissage automatique à l'aide d'algorithmes pour la prévision numérique, la multi-classification, la classification binaire et la création de cluster. Reportez-vous à Etapes de flux de données pour l'entraînement des modèles d'apprentissage automatique.
Lorsque vous avez entraîné un modèle d'apprentissage automatique, appliquez-le à vos données à l'aide de l'étape Appliquer un modèle.
Transformer la colonne
Modifiez le format, la structure ou la valeur des données. Par exemple, vous pouvez convertir du texte en majuscules, supprimer les espaces de début et de fin des données, ou calculer une augmentation de valeur en pourcentage.
Unifier les lignes
Fusionnez les lignes de deux sources de données (commande UNION en terminologie SQL). Vous pouvez mettre en correspondance les colonnes selon leur ordre ou leur nom.