Transformer les données grâce aux transformations de données dans une base de données autonome basée sur l'IA

Utilisez les transformations de données dans Data Studio pour concevoir des processus graphiques d'intégration et de transformation de données pour Oracle Autonomous AI Database. Les transformations de données vous permettent de créer des charges de données, des flux de données et des flux de travail sans écrire de code.

Les chargements de données déplacent les données des connexions sources vers les connexions cibles, les flux de données définissent la façon dont les données sont déplacées et transformées entre les systèmes, et les flux de travail définissent la séquence dans laquelle les flux de données, les chargements de données et d'autres étapes sont exécutés.

Lorsque vous exécutez ces objets, l'agent d'exécution Oracle Data Transforms orchestre les travaux et génère le code pour vous.

Cette rubrique fournit un point d'entrée pour comprendre quand et comment utiliser les transformations de données avec une base de données d'IA autonome. Pour des informations de référence complètes, consultez la documentation de Data Studio.

Quand utiliser les transformations de données

Utiliser la transformation des données lorsque vous avez besoin d'un moyen visuel à faible code pour déplacer, transformer, programmer et surveiller le travail d'intégration de données pour Autonomous AI Database.

Par exemple, utilisez-le pour :

  • Créez des chargements de données pour charger plusieurs entités de données à partir d'une connexion source vers une connexion cible.
  • Créez des flux de données pour déplacer et transformer des données entre des systèmes à l'aide de composants tels que des jointures, des filtres, des mappages, des contraintes, des agrégats, des expressions, des consultations, des jeux, des tris et d'autres fonctions de base de données.
  • Créez des flux de travail pour organiser plusieurs flux de données, chargements de données, variables et flux de travail dans une séquence d'exécution contrôlée.
  • Programmer des flux de données ou des flux de travail à exécuter à une heure ou à un intervalle spécifiés.
  • Surveillez le statut d'exécution des chargements de données, des flux de données et des flux de travail à partir du panneau de statut ou des pages Tâches.
  • Utilisez des variables pour paramétrer les flux de données et les flux de travail.
  • Utilisez des modèles d'apprentissage automatique dans les flux de données, notamment des étapes de modèle de prédiction qui écrivent la sortie dans une table cible.
  • Exporter et importer des objets de transformation de données, tels que des projets, des connexions, des chargements de données, des flux de données, des flux de travail et des programmes, entre les environnements.

Utilisez d'autres options de chargement ou de transformation de base de données Autonomous AI Database, telles que SQL, PL/SQL, DBMS_CLOUD, Oracle Data Pump ou des outils d'orchestration externes, lorsque vous avez besoin d'un flux de travail entièrement codé, administratif ou basé sur une application au lieu d'un flux de travail Data Studio visuel. Voir Charger des données dans une base de données d'IA autonome pour en savoir plus sur ces options de chargement de données.

Fonctionnement de la transformation des données avec Autonomous AI Database

Les transformations de données sont disponibles à partir de Database Actions dans Data Studio pour Autonomous AI Database. Vous pouvez l'ouvrir à partir de la carte Transformations de données dans la page Actions de base de données ou à partir du menu Data Studio du sélecteur Actions de base de données. Pour utiliser l'outil Transformations de données, connectez-vous en tant qu'utilisateur ADMIN ou en tant qu'utilisateur doté du rôle DATA_TRANSFORM_USER.

Data Transforms est également disponible dans une fiche descriptive Marketplace pour OCI appelée Data Integrator : Web Edition. Si une instance de Data Transforms du marché des applications OCI est enregistrée dans une base de données d'intelligence artificielle autonome, la carte Data Transforms de Database Actions continue d'ouvrir cette instance de marché des applications enregistrée. Pour utiliser l'instance Data Transforms intégrée à la place, annulez l'enregistrement de l'instance Marketplace.

Lorsque vous ouvrez Data Transforms pour la première fois, vous devez fournir les données d'identification de l'utilisateur de base de données. Une fois le service démarré, la page d'accueil des transformations de données s'ouvre et vous pouvez voir la connexion à la base de données d'intelligence artificielle autonome à partir de l'onglet Connexions.

Voir Accéder aux transformations de données Oracle à partir de Data Studio pour connaître les étapes d'accès, le rôle requis, le comportement de première connexion et le comportement d'enregistrement sur le marché des applications.

Avant de commencer

Avant de créer des transformations, vérifiez que :

  • Votre utilisateur a accès à Database Actions et dispose du rôle DATA_TRANSFORM_USER, sauf si vous utilisez l'utilisateur ADMIN.
  • Les systèmes source et cible requis sont accessibles à partir du réseau OCI utilisé par Autonomous AI Database. Les connexions Data Transforms sont utilisées pour se connecter à des technologies prises en charge accessibles à partir de votre réseau OCI. Pour plus de détails, voir Utiliser des connexions.
  • Si Autonomous AI Database utilise un point d'extrémité privé, les sources de données privées doivent être accessibles à partir des clients du même VCN. Voir Notes sur la transformation de données pour obtenir des notes sur les sources de données privées et les tâches de longue durée.
  • Vous comprenez l'environnement Data Transforms que vous utilisez : transformation de données intégrée dans Autonomous AI Database, instance Data Transforms enregistrée ou liste Marketplace Data Integrator : Web Edition. Certaines fonctionnalités documentées sont marquées d'insignes indiquant où elles s'appliquent.

Transformations de données ouvertes

Pour ouvrir des transformations de données :

  1. Ouvrez Database Actions pour votre base de données autonome avec intelligence artificielle.
  2. Sélectionnez Data Studio.
  3. Sélectionnez Transformations de données.
  4. Connectez-vous en tant qu'ADMIN ou en tant qu'utilisateur de base de données avec le rôle DATA_TRANSFORM_USER.
  5. Si vous y êtes invité, fournissez les données d'identification de l'utilisateur de base de données requises pour utiliser la connexion Data Transforms.
  6. Utilisez la page d'accueil Transformation de données pour créer ou gérer des connexions, des projets, des chargements de données, des flux de données, des flux de travail, des tâches, des variables et des opérations d'importation ou d'exportation.

Pour effectuer les étapes de la tâche, utilisez les liens de documentation Data Studio dans la section suivante.

Ce que vous pouvez faire dans les transformations de données

  • Connexions : Créez et gérez des connexions aux systèmes source et cible, notamment la base de données, l'application, le service, le stockage d'objets, REST et les connexions personnalisées basées sur JDBC.

    Voir Utiliser des connexions pour la création de connexions, les types de connexion pris en charge, les connecteurs personnalisés, les connexions au service de stockage d'objets, les connexions REST et les tâches de connexion connexes.

  • Projets : Organisez les flux de données, les flux de travail, les variables, les chargements de données et les tâches dans des groupes logiques.

    Voir Utiliser les projets pour obtenir des conseils sur l'organisation du travail Transformations de données en conteneurs de projet.

  • Chargements de données : Déplacez plusieurs entités de données d'une connexion source vers une connexion cible et sélectionnez des actions de chargement telles que recréer, tronquer, ajouter, ajouter ou fusion incrémentielle lorsque cela est pris en charge.

    Voir Créer et exécuter des chargements de données pour savoir comment créer des chargements de données, sélectionner des connexions source et cible, sélectionner des options de traitement de chargement et exécuter des chargements de données.

  • Entités de données : Représente des structures source ou cible tabulaires qui peuvent être importées, créées, utilisées dans des flux de données et inspectées.

    Voir Utiliser les entités de données pour plus d'informations sur l'importation, la création et l'inspection des entités de données utilisées par les chargements de données et les flux de données.

  • Flux de données : Créez une logique de transformation visuelle en connectant des sources, des cibles et des composants de transformation sur un canevas de conception.

    Voir À propos des flux de données pour en savoir plus sur la création et la modification de flux de données visuels, l'ajout de composants, le mappage de colonnes, la validation et l'exécution de flux de données.

  • Flux de travail : Orchestrez plusieurs flux de données, chargements de données, variables et flux de travail dans une séquence définie.

    Voir Introduction aux flux de travail pour plus d'informations sur la création et l'exécution de flux de travail qui séquencent les flux de données, les chargements de données, les variables et d'autres étapes de flux de travail.

  • Programmations : Programmez des flux de données ou des flux de travail pour une exécution ultérieure ou récurrente.

    Voir Programmer des flux de données ou des flux de travail pour savoir comment programmer le travail de transformation pour une exécution programmée.

  • Tâches et surveillance : Suivre les exécutions en cours et terminées, vérifier les détails de la tâche, réexécuter les tâches, supprimer les tâches et inspecter les détails des erreurs.

    Voir Surveiller le statut des chargements de données, des flux de données et des flux de travail pour plus d'informations sur l'utilisation du panneau de statut et des liens de tâche pour surveiller l'exécution.

  • Variables : Stockez les valeurs qui peuvent être remplacées dans des flux de données et des flux de travail au moment de l'exécution.

    Voir Créer et utiliser des variables pour apprendre à créer des variables et à les utiliser dans les flux de données et les flux de travail.

  • Modèles d'apprentissage automatique : Créez des entités de données de modèle d'apprentissage automatique et utilisez des étapes de modèle d'apprentissage automatique dans les flux de données.

    Voir Utiliser des modèles d'apprentissage automatique pour obtenir des conseils sur la création d'entités de données de modèle d'apprentissage automatique et l'utilisation de modèles d'apprentissage automatique dans les flux de données.

  • Exporter et importer : Le déplacement des données transforme les métadonnées entre les environnements en exportant et en important des objets au moyen du stockage d'objets.

    Voir Exporter et importer des objets pour plus d'informations sur le déplacement des objets de transformation de données entre des environnements.