À propos des flux de données

Les flux de données vous permettent d'organiser et d'intégrer les données de manière à produire des jeux organisés de données que vous pouvez visualiser.

Utilisez les flux de données pour manipuler vos données visuellement sans avoir aucune connaissance en codage manuel.

Par exemple, vous pouvez utiliser un flux de données pour :

  • Créer un jeu de données.
  • Combiner des données issues de différentes sources.
  • Agréger des données.
  • Entraîner des modèles d'apprentissage automatique ou appliquer un modèle d'apprentissage automatique prédictif à vos données.
  • Exécutez la détection d'objets, la classification d'images ou la détection de texte à l'aide de l'intelligence artificielle au moyen du service de visualisation OCI.

L'éditeur de flux de données vous permet de créer des flux de données.
Éditeur de flux de données

Ajoutez des étapes pour créer un flux de données. Chaque étape exécute une fonction spécifique, par exemple : ajouter des données, joindre des tables, fusionner des colonnes, transformer des données, enregistrer les données. Utilisez l'éditeur de flux de données pour ajouter et configurer les étapes. Chaque étape est validée lorsque vous l'ajoutez ou la modifiez. Lorsque vous avez configuré le flux de données, vous l'exécutez pour générer ou mettre à jour un jeu de données.

Lorsque vous ajoutez vos propres colonnes ou transformez des données, vous pouvez utiliser un grand nombre d'opérateurs (par exemple, BETWEEN, LIKE, IN), d'expressions conditionnelles (par exemple, CASE) et de fonctions (par exemple, Moyenne, Médiane, Centile) SQL.

Prise en charge des bases de données pour les flux de données

Vous pouvez organiser les données à partir de jeux de données, de domaines ou de connexions à une base de données à l'aide des flux de données.

Vous pouvez exécuter les flux de données individuellement ou dans une séquence. Vous pouvez inclure plusieurs sources de données dans un flux de données et spécifier comment les joindre.

Utilisez l'étape Ajouter des données pour ajouter des données à un flux de données, et utilisez l'étape Enregistrer les données pour enregistrer les données de sortie d'un flux de données.

Vous pouvez enregistrer les données de sortie d'un flux de données dans un jeu de données ou dans une base de données d'un des types pris en charge. Si vous enregistrez les données dans une base de données, vous pouvez transformer la source de données en la remplaçant par les données du flux de données. Les tables de la source de données et du flux de données doivent être dans la même base de données et avoir le même nom. Avant de commencer, créez une connexion à un des types de base de données pris en charge.

Note :

Vous pouvez ajouter des données de bases de données distantes connectées avec Data Gateway. Toutefois, vous ne pouvez pas enregistrer des données dans des bases de données distantes connectées avec Data Gateway.

Sortie de données

Vous pouvez enregistrer les données de sortie de flux de données dans les types de base de données suivants :
  • Base de données Oracle Autonomous Data Warehouse
  • Oracle Autonomous Transaction Processing
  • Oracle Database
  • Apache Hive
  • Hortonworks Hive
  • MapR Hive
  • Spark

Pour obtenir des informations sur les versions de base de données, voir Sources de données prises en charge.

Entrée de données

Vous pouvez entrer des données dans des flux de données à partir de la plupart des types de base de données (sauf Oracle Essbase et EPM Cloud).

Utilisation de l'éditeur de flux de données

Vous préparez vos données pour analyse en créant des flux de données dans l'éditeur de flux de données. Par exemple, vous pouvez transformer ou fusionner des colonnes, ou catégoriser des données dans des sections. Voyez comment utiliser l'éditeur de flux de données pour commencer rapidement à préparer vos données.

Utilisation de l'éditeur de flux de données :

Nom Icône Fonction
Données

Icône du panneau de données

Affichez le volet de données, où vous pouvez glisser-déposer des colonnes de données dans l'éditeur de flux de données.

Étapes du flux de données Icône du volet Étape du flux de données

Affichez le volet des étapes, où vous pouvez glisser-déposer des étapes dans l'éditeur de flux de données.

Prévisualisation des données

Icône de prévisualisation des données

Masquez ou affichez le volet des colonnes de prévisualisation des données en cliquant sur Activer/désactiver la prévisualisation de données dans l'angle inférieur droit de l'éditeur de flux de données. La mise à jour de ce volet se fait automatiquement lorsque vous apportez des modifications au flux de données. Vous pouvez spécifier si les modifications d'étape doivent être actualisées automatiquement dans le volet de prévisualisation des données en cliquant sur Appliquer automatiquement.

Exécuter le flux de données Exécuter le flux de données Exécutez le flux de données.
Afficher les fonctions disponibles/Masquer les fonctions

Icône Afficher les fonctions disponibles/Masquer les fonctions

Afficher ou masquez la liste de sélection des expressions. Cette icône est seulement affichée pour les étapes qui vous permettent de créer vos propres expressions, par exemple, l'étape "Ajouter des colonnes" ou "Transformer la colonne".

Éditeur d'étape

Icône de l'éditeur d'étape

Masquez ou affichez le volet de l'éditeur d'étape en cliquant sur l'icône Activer/désactiver l'éditeur d'étape dans l'angle inférieur droit de l'éditeur de flux de données.

Activer/désactiver l'actualisation automatique Activer/désactiver l'actualisation automatique pour les données des flux de données Activez l'actualisation de la prévisualisation de données dès que vous apportez des modifications à votre flux de données. Par exemple, si vous avez une étape de transformation de colonne qui remplace des minuscules par des majuscules, le texte en majuscule s'affiche dans la zone de prévisualisation de données. Si vous désactivez l'actualisation, la prévisualisation de données n'est actualisée que si vous cliquez sur Actualiser la prévisualisation de données.

(Prévisualisation) Utilisation du concepteur de flux de données amélioré

Utilisez le concepteur de flux de données le plus récent pour créer plus facilement des flux de données à l'aide de fonctions améliorées. Cette interface utilisateur fournit de nouvelles icônes, améliore la création de jointure et d'union, et propose une disposition optimisée pour une navigation transparente.

Utilisation du concepteur de flux de données amélioré :

Si vous souhaitez utiliser le nouveau concepteur, demandez à l'administrateur de l'activer.

Le nouveau concepteur présente de nouvelles icônes et améliorations.


Description de GUID-2B831D4B-0478-4EAC-917D-EA910D9FFFE3-default.png ci-après
.png

Fonction Icône Description
Disposition compacte Icône de disposition compacte Regroupe les étapes dans une zone de visualisation plus petite pour réduire le défilement.
Disposition développée Icône de disposition développée Aligne les étapes de la source de données d'entrée à gauche pour améliorer la lisibilité.
Jointure ou union incomplète

Icône de jointure ou d'union complète

Indique une source de données à laquelle aucune jointure ou union n'a été appliquée. Passez le pointeur de la souris sur l'icône de lien bleue pour voir une cible de jointure suggérée (ligne pointillée), puis cliquez de nouveau pour terminer la jointure ou l'union (ligne continue).

Améliorations apportées au zoom Icône de zoom Effectue un zoom avant et un zoom arrière.