A propos des flux de données

Les flux de données vous permettent d'organiser et d'intégrer vos données pour générer des ensembles de données organisés que les utilisateurs peuvent visualiser.

Utilisez les flux de données pour manipuler visuellement vos données sans nécessiter de compétences de codage manuel.

Par exemple, vous pouvez utiliser un flux de données pour :

  • créer un ensemble de données,
  • associer les données de différentes sources,
  • agréger des données,
  • entraîner des modèles d'apprentissage automatique ou appliquer un modèle d'apprentissage automatique prédictif à vos données,
  • détecter des objets, classer des images ou détecter du texte à l'aide de l'intelligence artificielle via le service OCI Vision.

Le volet de conception de flux de données vous permet de créer des flux de données.
La description de GUID-2B831D4B-0478-4EAC-917D-EA910D9FFFE3-default.png est la suivante
.png

Pour créer un flux de données, ajoutez des étapes. Chaque étape exécute une fonction spécifique, comme ajouter des données, joindre des tables, fusionner des colonnes ou transformer des données. Ajoutez et configurez vos étapes à l'aide de l'éditeur de flux de données. Chaque étape est validée lorsque vous l'ajoutez ou la modifiez. Lorsque vous avez configuré votre flux de données, exécutez-le pour créer ou mettre à jour un ensemble de données.

Lorsque vous ajoutez vos propres colonnes ou transformez des données, vous pouvez utiliser un large éventail d'opérateurs SQL (par exemple, BETWEEN, LIKE, IN), d'expressions conditionnelles (par exemple, CASE) et de fonctions (par exemple, Avg, Median, Percentile).

Mise à jour des ensembles de données générés par des flux de données

Vous pouvez réexécuter des flux de données pour que les ensembles de données restent à jour.

Remarque :

Lorsque vous réexécutez un flux de données, toutes les transformations appliquées directement à l'ensemble de données de sortie en dehors du flux de données sont perdues. L'ensemble de données est recréé à partir de zéro.

Prise en charge des bases de données pour les flux de données

Avec les flux de données, vous pouvez traiter les données à partir des ensembles de données, des domaines ou des connexions de base de données.

Vous pouvez exécuter les flux de données individuellement ou dans une séquence. Vous pouvez inclure plusieurs sources de données dans un flux de données et indiquer comment les joindre.

Utilisez l'étape Ajouter des données pour ajouter des données à un flux de données, puis utilisez l'étape Enregistrer les données pour enregistrer les données de sortie d'un flux de données.

Vous pouvez enregistrer les données de sortie d'un flux de données dans un ensemble de données ou dans l'un des types de base de données pris en charge. Si vous les enregistrez dans une base de données, vous pouvez transformer la source de données en la remplaçant par des données du flux de données. Les tables de source de données et de flux de données doivent être dans la même base de données et porter le même nom. Avant de commencer, créez une connexion à l'un des types de base de données pris en charge.

Remarque :

Vous pouvez ajouter des données à partir de bases de données distantes connectées à Data Gateway. Cependant, vous ne pouvez pas réenregistrer de données dans les bases de données distantes connectées à Data Gateway.

Sortie de données

Vous pouvez enregistrer les données de sortie des flux de données vers ces types de base de données :
  • Oracle Autonomous Data Warehouse
  • Oracle Autonomous Transaction Processing
  • Oracle Database
  • Apache Hive
  • Hortonworks Hive
  • MapR Hive
  • Spark

Pour les informations de version de base de données, reportez-vous à Sources de données prises en charge.

Entrée de données

Vous pouvez saisir des données dans des flux de données à partir de la plupart des types de base de données (sauf Oracle Essbase et EPM Cloud).