Utilisation des entités de données

Une entité de données est une représentation tabulaire d'une structure de données.

Il inclut des tables ou des vues de base de données qui peuvent être utilisées dans un mapping en tant que source ou cible. Ce sont simplement des métadonnées pour les sources et les cibles. Ils sont utilisés pour créer des flux de données.

Vous pouvez ajouter des entités de données au projet que vous venez de créer de deux manières :

Toutes les entités de données nouvellement créées ou importées ainsi que leurs détails sont affichés sur la page Entités de données. Les détails sont les suivants :

  • Nom de l'entité de données
  • Connexion pour laquelle l'entité de données a été créée
  • Schéma auquel l'entité de données est associée
  • Cliquez sur l'icône Actions (Icône Actions) en regard de l'entité de données sélectionnée pour effectuer les opérations suivantes :
    • Sélectionnez Modifier, pour modifier les détails existants.
    • Sélectionnez Aperçu pour prévisualiser l'entité de données sélectionnée. Si l'entité de données appartient à une base de données Oracle, vous pouvez également visualiser les statistiques de la table. Pour plus d'informations, reportez-vous à Visualisation des statistiques des entités de données.
    • Sélectionnez Supprimer pour supprimer l'entité de données sélectionnée.
  • Pour supprimer les entités de données en masse, dans la page Entités de données, cochez les cases des entités de données respectives et cliquez sur Supprimer.
  • Vous pouvez également rechercher l'entité de données requise pour connaître ses détails en fonction des filtres suivants :
    • Nom de l'entité de données
    • Connexion pour laquelle l'entité de données a été créée
    • Schéma auquel l'entité de données est associée
    • Balise associée à l'entité de données

Sujets

Importer des entités de données

La méthode la plus simple et la plus courante pour créer une entité de données consiste à importer sa structure à partir du type de connexion (par exemple, base de données Oracle).

Pour importer des entités de données existantes, procédez comme suit :

  1. Dans le panneau de gauche de la page d'accueil, cliquez sur l'onglet Entités de données.

    La page Entités de données apparaît.

  2. Cliquez sur Importer des entités de données pour importer les entités de données existantes.

    Diapositives de la page Importer des entités de données. Si vous prévoyez d'utiliser une connexion au serveur Oracle ERP Cloud pour l'import, reportez-vous à Import de définitions d'entité de données à partir d'un serveur Oracle Analytics Publisher.

  3. Sélectionnez la connexion, suivie du schéma, puis enfin le type d'objets à importer.

    Pour les connexions Oracle Object Storage, la liste déroulante Schéma répertorie le nom du bucket indiqué dans l'URL lors de la création de la connexion.

  4. [Pour les connexions Oracle Business Intelligence Cloud Connector (BICC) uniquement] Dans Offres à importer pour collecte, choisissez les offres dont vous souhaitez importer les banques de données. Vous devez sélectionner au moins une offre pour importer les objets vue publique BICC (PVO).
    Remarque

    L'import des objets vue PVO BICC peut prendre beaucoup de temps en fonction du nombre d'objets sélectionnés. Pour améliorer les performances, Oracle recommande d'utiliser un masque pour filtrer et limiter le nombre d'objets PVO à importer.
  5. Choisissez un masque/filtre si vous ne voulez pas importer tous les objets du schéma.

    Selon le type de connexion, d'autres options d'import s'affichent.

    Remarque

    Pour les connexions Oracle Object Storage, cette valeur est sensible à la casse. Si Fichiers similaires par lots est défini sur True, tous les fichiers qui correspondent au masque et ont la même structure sont regroupés en une seule entité de données.
  6. [Pour les connexions Oracle Financials Cloud uniquement] Dans la liste de la section Ressources, sélectionnez les éléments à importer. Une fois le processus d'importation terminé, une table est créée pour chaque ressource sélectionnée.
  7. [Pour les connexions au serveur REST uniquement] Dans la section Ressources, procédez comme suit :
    • Dans le champ URI de ressource, entrez l'URL du service REST à partir duquel importer des ressources.
    • Cliquez sur l'icône +.
    • Dans la colonne Nom, entrez l'identificateur de la ressource.
    • Dans la colonne URI d'opération, entrez l'URI de la ressource.
    • Cliquez sur Tester la ressource pour vérifier si les entrées sont valides.
  8. Cliquez sur Démarrer.

    Un travail est créé et l'ID de travail correspondant s'affiche pour vous permettre de suivre la session. Cliquez sur l'ID de travail pour afficher les détails du travail.

    Une fois le travail exécuté, toutes les entités de données sélectionnées sont importées. Cliquez sur l'icône Actualiser Icône Actualiser située dans le coin droit de la page Entités de données pour afficher les nouvelles entités de données importées.

Créer des entités de données

Vous pouvez créer ou mettre à jour manuellement les entités de données via l'interface Oracle Data Transforms.

Les entités de données doivent posséder les objets correspondants dans la connexion source à utiliser comme source dans un flux de données. En général, le processus d'importation s'assure que ces objets sont en coordination. Cependant, chaque fois que vous créez ou mettez à jour manuellement des entités de données, veillez toujours à vérifier si les deux définitions sont en coordination les unes avec les autres.

Lorsque vous utilisez une entité de données comme cible, elle n'a pas besoin d'exister précédemment dans la connexion cible et peut être créée dans le cadre de l'exécution de Data Flow.

Pour créer une entité de données :
  1. Dans le panneau de gauche de la page d'accueil, cliquez sur l'onglet Entités de données.

    La page Entités de données apparaît.

  2. Cliquez sur Créer une entité de données pour créer une entité de données.

    La page Créer une entité de données apparaît.

  3. Dans la zone de texte Name, entrez le nom de la nouvelle entité de données que vous créez.
  4. Dans la liste déroulante Connexion, sélectionnez la connexion requise à partir de laquelle vous souhaitez ajouter la nouvelle entité de données créée.
    Remarque

    Les connexions Oracle Financials Cloud ne sont pas répertoriées ici car vous ne pouvez pas créer manuellement d'entités de données pour ces connexions. Vous pouvez uniquement importer des entités de données à partir d'adresses REST Oracle Financials Cloud à l'aide de la page Importer des entités de données. Reportez-vous à Import d'entités de données.
  5. Dans la liste déroulante Schéma, tous les schémas correspondant à la connexion sélectionnée sont répertoriés dans deux groupes.
    • Nouveau schéma de base de données (ceux dont vous n'avez pas importé auparavant) et
    • Schéma de base de données existant (ceux dont vous avez importé précédemment et qui remplacent potentiellement des entités de données).

    Dans la liste déroulante Schéma, sélectionnez le schéma requis.

    Remarque

    Pour les connexions Oracle Object Storage, la liste déroulante Schéma répertorie le nom du bucket indiqué dans l'URL lorsque vous avez créé la connexion.
  6. Dans la liste déroulante Type, sélectionnez le type d'entité de données.
    • Table : pour définir la structure de la table de l'entité de données nouvellement créée, cliquez sur l'icône + pour ajouter des colonnes. Pour chaque colonne, vous pouvez indiquer des paramètres tels que Nom, Type de données, Longueur, Echelle, Non NULL. Double-cliquez sur la cellule pour configurer la valeur.

      Pour supprimer une ligne, cliquez sur l'icône "x". Cliquez sur les boutons Flèche Haut et Flèche Bas pour trier les lignes du tableau.

    • Vue en ligne : pour créer l'entité de données à l'aide du code en ligne, entrez l'instruction Select dans l'onglet Requête. Par exemple, SELECT * FROM CUSTOMER. Cliquez sur Valider.

      L'onglet Colonnes affiche la liste des colonnes renvoyées par la requête en lecture seule. Cliquez sur l'onglet Aperçu pour afficher les données de colonne.

  7. Dans la zone de texte Balises, entrez la balise de votre choix. Vous pouvez utiliser des balises pour filtrer les entités de données affichées sur la page Entité de données.
  8. Pour les connexions Oracle Object Storage, cette page affiche les options suivantes :
    • Sommaire – Sélectionnez le fichier CSV qui contient les données à importer. Les métadonnées affichées dans la table d'aperçu, telles que le type de données et la longueur des colonnes, sont basées sur la première ligne du fichier CSV. Assurez-vous que le fichier CSV comporte une ligne d'en-tête. L'en-tête ne doit contenir que des caractères alphanumériques et aucun caractère spécial.
    • Fichiers de groupe : cochez cette case si vous souhaitez regrouper les données de plusieurs fichiers CSV en une seule entité de données. Par exemple, supposons que vous voulez fusionner les données de Employee_Data1.csv, Employee_Data2.csv et Employee_Data3.csv en une seule entité de données.

      Si vous souhaitez charger les fichiers CSV à l'aide de Windows, veillez à convertir d'abord les fichiers au format Unix pour éviter les problèmes d'encodage de caractères lors du regroupement.

    • Nom de ressource – Utilisez cette option avec Fichiers de groupe. Saisissez la valeur à utiliser pour identifier les fichiers. Le nom de la ressource doit être une expression régulière. Vous ne pouvez utiliser qu'un astérisque (*) comme caractère générique dans le nom de la ressource. Par exemple, Employee_Data*.csv.
  9. Pour les connexions de base de données Oracle, vous pouvez marquer les entités de données comme un groupe de fonctionnalités. Développez Options avancées et cochez la case Traiter en tant que groupe de fonctionnalités.
  10. Cliquez sur Enregistrer.

    La nouvelle entité de données est créée.

Créer des entités de données dans l'éditeur Data Flow

Si vous avez déjà créé ou importé l'entité de données cible, vous devez la faire glisser vers le canevas de conception et terminer les mises en correspondance et les options de colonne.

Pour créer la définition d'une entité dans l'éditeur Data Flow, procédez comme suit :

  1. Faites glisser l'entité de données vers le canevas de conception.
  2. Sélectionnez le composant et cliquez sur l'icône Ajouter une entité de données Icône Ajouter une entité de données présente dans l'angle supérieur droit du composant cible.
  3. La page Ajouter une entité de données apparaît et vous permet de configurer les détails suivants du composant cible :

    Onglet Général

    • Dans la zone de texte Nom, entrez le nom de la nouvelle entité de données créée.
    • Dans la liste déroulante Type d'entité, sélectionnez le type d'entité de données.
      • Table
      • Modèle de machine learning
        Lorsque vous sélectionnez ce type d'entité, l'interface utilisateur change comme suit :
        • La liste déroulante Type de connexion répertorie uniquement Oracle comme option. Par conséquent, la liste déroulante Connexion répertorie uniquement les connexions Oracle que vous avez créées.
        • L'assistant Ajouter une entité de données affiche l'onglet Propriétés, dans lequel vous pouvez sélectionner le type d'apprentissage, la fonction, l'algorithme et configurer les paramètres pour définir le modèle d'apprentissage automatique. Pour plus d'informations sur la création et l'utilisation d'une entité de données de modèle d'apprentissage automatique, reportez-vous à Utilisation de modèles d'apprentissage automatique.
    • Dans la liste déroulante Type de connexion, sélectionnez la connexion requise à partir de laquelle vous souhaitez ajouter la nouvelle entité de données créée. La liste déroulante Connexion contient les connexions que vous avez créées avec le type de connexion associé.
    • Dans la liste déroulante Connexion, sélectionnez le nom du serveur à partir duquel vous souhaitez ajouter la nouvelle entité de données créée.
    • Dans la liste déroulante Schéma, tous les schémas correspondant à la connexion sélectionnée sont répertoriés dans deux groupes.
      • Nouveau schéma de base de données (ceux dont vous n'avez pas importé auparavant) et
      • Schéma de base de données existant (ceux dont vous avez importé précédemment et qui remplacent potentiellement des entités de données).
      Dans la liste déroulante Schéma, sélectionnez le schéma requis.
      Remarque

      Pour les connexions Oracle Object Storage, la liste déroulante Schéma répertorie le nom du bucket indiqué dans l'URL lorsque vous avez créé la connexion.
    • Dans la zone de texte Balises, entrez la balise de votre choix. Vous pouvez utiliser des balises pour filtrer les entités de données affichées sur la page Entité de données.
    • Pour les connexions de base de données Oracle, vous pouvez marquer les entités de données comme un groupe de fonctionnalités. Développez Options avancées et cochez la case Traiter en tant que groupe de fonctionnalités.
    • Cliquez sur Suivant.

    Onglet Colonnes

    • Cliquez sur l'icône Icône Ajouter des colonnes Add Columns (Ajouter des colonnes) pour ajouter des colonnes à la nouvelle entité de données.

      Une nouvelle colonne est ajoutée au tableau affiché.

    • La table comporte les colonnes suivantes :
      • Nom
      • Type de données : cliquez sur la cellule pour configurer le type de données requis.
      • Redimensionner
      • Longueur
      • Actions : cliquez sur l'icône en forme de croix pour supprimer la colonne créée.
    • Pour supprimer les colonnes en masse, sélectionnez-les et cliquez sur l'icône Icône Supprimer Supprimer.
    • Pour rechercher les détails de colonne requis, saisissez le nom de la colonne requise dans la zone de texte Rechercher et cliquez sur Entrée. Les détails de la colonne requise s'affichent.
    • Cliquez sur Suivant.

    Onglet Aperçu de l'entité de données

    Il affiche un aperçu de toutes les colonnes créées et de leurs détails configurés. Si l'entité de données appartient à une base de données Oracle, vous pouvez également visualiser les statistiques de la table. Pour plus d'informations, reportez-vous à Visualiser les statistiques des entités de données.

  4. Cliquez sur Enregistrer.

    La nouvelle entité de données cible est créée.

  5. Développez le panneau Propriétés dans le panneau de droite pour afficher les paramètres suivants des composants créés :
    • Général : affiche le nom du composant ainsi que les détails de connexion et de schéma associés.
    • Attributs : affiche les détails de tous les attributs associés au composant.
    • Column Mapping - Cliquez sur Auto Map pour mapper automatiquement toutes les colonnes.
    • Aperçu - Cliquez sur ce bouton pour avoir un aperçu du composant.
    • Options : modifiez les options selon vos besoins.

Afficher les statistiques des entités de données

L'onglet Aperçu affiche les statistiques détaillées de chaque entité de données.

Remarque

Cette fonctionnalité est disponible pour les tables de base de données Oracle uniquement.
Vous pouvez afficher les statistiques d'une entité de données sélectionnée de l'une des manières suivantes :
  • Dans la liste Entités de données, cliquez sur l'icône Actions (Icône Actions) en regard de l'entité de données et cliquez sur Aperçu. Sélectionnez l'onglet Statistiques pour afficher les statistiques de l'entité de données sélectionnée.
  • Dans n'importe quel flux de données, cliquez sur n'importe quelle entité de données source ou cible, puis développez le panneau des propriétés dans le volet de droite. Cliquez sur Aperçu.

Les données statistiques sont présentées comme suit :

  • Le nombre total de lignes et de colonnes dans l'entité de données est affiché en haut.
  • Le panneau des statistiques affiche les miniatures de chaque colonne avec des informations sur les valeurs Min, Max, Distinct et Null.
  • Deux types de représentation miniature sont affichés en fonction de l'histogramme :
    • Un graphique à barres représente les données des histogrammes de fréquence et de fréquence supérieure. Le graphique à barres affiche les 10 premières valeurs du nombre de lignes du tableau.
    • Un tableau répertorie les données des histogrammes hybride et équilibré en hauteur. La table affiche l'ensemble des données et peut faire défiler les données. La table affiche la fourchette des valeurs et le pourcentage de lignes de chaque fourchette.
  • Vous pouvez cliquer sur chaque miniature pour afficher les statistiques de la colonne dans un nouvel onglet du navigateur.
  • La vue détaillée de chaque graphique indique également le type d'histogramme.