Charger les données dans une base Autonomous Data Warehouse à l'aide d'une tâche de chargement de données

Une tâche de chargement de données vous aide à transformer et à charger des données dans des lacs de données ou d'autres cibles telles qu'Oracle Autonomous Data Warehouse.

Les données sources pour le chargement peuvent provenir d'une ou de plusieurs entités de données d'un schéma.

Dans ce tutoriel, vous allez :

  1. Créer une tâche de chargement de données pour transformer et charger des données à partir d'une entité de données de stockage d'objets dans une base de données Autonomous Data Warehouse.
  2. Publier la tâche de chargement de données dans une application.
  3. Exécuter la tâche de chargement de données.

Avant de commencer

Pour suivre ce tutoriel, vous devez disposer des éléments suivants :

1. Création d'une tâche de chargement de données

  1. Dans la barre d'onglets, sélectionnez l'onglet Ouvrir (icône plus), puis Projets.
  2. Dans la page Projets, sélectionnez DI_Lab.
  3. Dans la page de détails du projet DI_Lab, sélectionnez Tâches dans le sous-menu de gauche.
  4. Dans la page Tâches, sélectionnez Créer une tâche, puis Chargeur de données.

    La page Créer une tâche de chargement de données s'ouvre dans un nouvel onglet. Les étapes numérotées et nommées en haut vous guident tout au long de la configuration. Une coche s'affiche sur une icône d'étape une fois que vous avez configuré l'étape. Pour passer d'une étape à une autre, sélectionnez Suivant ou Précédent. Vous pouvez également naviguer directement jusqu'à une étape configurée en sélectionnant l'icône correspondante.

  5. Dans la page Create data loader task (Créer une tâche de chargement de données), étape Basic information (Informations de base), sélectionnez les éléments suivants :
    Pour cet élémentSélectionnez
    Type de source Stockage de fichiers
    Type de cible Base de données
    Type de chargement Entité de données unique
  6. Pour le nom de la tâche, entrez Load Revenue Data into Data Warehouse. Sélectionnez ensuite Suivant pour naviguer jusqu'à l'étape suivante.

    Une case à cocher s'affiche sur l'icône de l'étape informations de base une fois que vous avez configuré l'étape.

  7. À l'étape Source, sélectionnez les éléments suivants :
    Pour cet élémentSélectionnez
    Ressource de données Lac de données
    Connexion Connexion par défaut
    Compartiment Compartiment contenant le seau dans lequel vous avez chargé le fichier de données-échantillons, REVENUE.CSV
    Seau Seau de stockage d'objets qui contient l'exemple de fichier CSV
  8. Sous Paramètres de fichier, sélectionnez les éléments suivants :
    Pour cet élémentSélectionnez
    Type de fichier CSV
    Type de compression Auto (Valeur par défaut)
    Les données ont un en-tête la case à cocher
    Délimiteur COMMA

    Vous pouvez laisser les paramètres par défaut tels quels dans les autres champs.

  9. Sous Entités de données disponibles, sélectionnez la case à cocher REVENUE.CSV, puis Définir comme source.

    Le nom REVENUE.CSV s'affiche à côté de Entités de données sélectionnées.

  10. Sélectionnez Créer pour enregistrer la tâche et continuer d'apporter des modifications.
  11. Sélectionnez Suivant pour avancer à l'étape Cible, puis sélectionnez les éléments suivants :
    Pour cet élémentSélectionnez
    Ressource de données Entrepôt de données
    Connexion Connexion par défaut
    Schéma Bêta
  12. Sous Emplacement temporaire, vous pouvez utiliser l'emplacement temporaire par défaut configuré lors de la création de la ressource de données cible.

    Vous pouvez également désélectionner la case pour sélectionner un autre seau de stockage d'objets.

  13. Sous Target data entity load settings (Paramètres de chargement des entités de données cibles), sélectionnez Create new data entity (Créer de nouvelles entités de données).

    Insert est la stratégie d'intégration par défaut.

  14. Sous Options de nom de l'entité de données cible, sélectionnez Indiquer le nom de l'entité. Dans le champ Nom d'entité, entrez REVENUE_TARGET.
  15. Sélectionnez Enregistrer pour enregistrer la tâche et continuer de modifier.
  16. Sélectionnez Suivant pour naviguer vers l'étape Transformation.

    L'explorateur de données interactif s'affiche. Dans l'onglet Attributs, les attributs de l'entité de données REVENUE.CSV sont affichés.

  17. Sous Attributs, recherchez SRC_ORDER_NUMBER. Puis, dans le menu des transformations (Menu Transformations) pour SRC_ORDER_NUMBER, sélectionnez Remplissage nul.

    Menu Transformation

  18. Dans la boîte de dialogue Null Fill Up (Remplir toutes les valeurs nulles), procédez de la façon suivante :
    • Entrez Not Available dans le champ Remplacer par.
    • Ne sélectionnez pas Conserver les attributs sources.
    • Laissez Nom et les autres champs tels quels.
  19. Sélectionnez Appliquer.
  20. Cliquez sur l'icône Transformations à côté du nom de l'entité de données.

    Bouton d'extension du panneau de transformation

    Le panneau Transformations s'ouvre, vous permettant de consulter la liste des transformations appliquées au jeu de données source. Pour supprimer une transformation, sélectionnez l'icône de suppression à côté du nom d'attribut transformé.

    Panneau de transformations développé

  21. Pour fermer le panneau Transformations, sélectionnez l'icône X.
  22. À côté d'Attributs, sélectionnez Données pour naviguer jusqu'à l'onglet Données et recherchez SRC_ORDER_NUMBER.

    Les valeurs nules dans SRC_ORDER_NUMBER ont été remplacées par la chaîne Non disponible.

  23. Sélectionnez Suivant pour naviguer jusqu'à l'étape Vérifier et valider.

    La validation de la tâche commence automatiquement.

    Un sommaire des détails de configuration de chaque étape est présenté dans un bloc. Si vous modifiez la configuration d'une étape, naviguez jusqu'à l'étape Vérifier et valider pour valider de nouveau la tâche.

    Le résultat de la validation de la tâche est affiché dans le dernier bloc, Validation.

  24. Si la validation a réussi, sélectionnez enregistrer et fermer.

2. Publication d'une tâche de chargement de données

  1. Dans la page de détails du projet DI Lab, sélectionnez Tâches dans le sous-menu.
  2. Dans la liste Tâches, recherchez Load Revenue Data into Data Warehouse.
  3. Sélectionnez le menu Actions (trois points), puis sélectionnez Publier dans l'application.
  4. Dans la boîte de dialogue Publier dans l'application, sélectionnez Application de laboratoire.
  5. Sélectionnez Publier.

    Un message d'avis s'affiche, avec un lien vers l'application pour voir la tâche publiée.

  6. Dans l'avis, sélectionnez Voir l'application. Cliquez ensuite sur X pour fermer l'avis.

    La liste Correctifs de la page Détails de l'application s'affiche. Lorsque vous publiez une tâche, une entrée de correctif est créée dans l'application.

  7. Dans la liste Correctifs, vous pouvez surveiller le statut des correctifs. Sélectionnez Actualiser pour obtenir les dernières mises à jour du statut.

    Un correctif est une mise à jour apportée à l'application. Lorsque vous publiez une tâche, un correctif Publier est créé. Lorsque vous annulez la publication d'une tâche, un correctif Annuler la publication est créé.

    Lorsque le statut du correctif passe à Réussite, une entrée de tâche publiée est créée dans la liste Tâches de la page Détails de l'application.

3. Exécution d'une tâche de chargement de données

  1. Dans la barre d'onglets, sélectionnez l'onglet Ouvrir (icône plus), puis Applications.
  2. Sélectionnez Application de laboratoire pour ouvrir la page de détails.
  3. Dans la page Détails de l'application, sélectionnez Tâches.
  4. Dans la liste Tâches, dans le menu Actions (trois points) pour Load Revenue Data into Data Warehouse, sélectionnez Run (Exécuter).

    Un message d'avis s'affiche et la liste Exécutions s'affiche. Une exécution de tâche de chargement de données est créée dans la liste Exécutions. Utilisez la liste Exécutions pour voir toutes les exécutions de tâche et leur statut.

  5. Dans la liste Exécutions, sélectionnez Actualiser pour obtenir les dernières mises à jour de statut d'exécution de tâche.

    En savoir plus sur les exécutions de tâche

    Lorsque le statut d'exécution passe à Réussite, vous pouvez voir les valeurs des champs Lecture des données et Rangées écrites.