Utiliser des entités de données
Une entité de données est une représentation tabulaire d'une structure de données.
Il inclut des tables ou des vues de base de données qui peuvent être utilisées dans un mappage en tant que source ou cible. Il s'agit simplement de métadonnées pour les sources et les cibles. Ils sont utilisés pour créer des flux de données.
Vous pouvez ajouter des entités de données à votre projet nouvellement créé de l'une des deux façons suivantes :
Toutes les entités de données nouvellement créées ou importées ainsi que leurs détails sont affichés dans la page Entités de données. Voir Voir et gérer les entités de données.
Sujets
- Importer des entités de données
La façon la plus simple et la plus courante de créer une entité de données consiste à importer sa structure à partir du type de connexion (par exemple, base de données Oracle). - Créer des entités de données
Vous pouvez créer ou mettre à jour manuellement les entités de données au moyen de l'interface Oracle Data Transforms. - Créer des entités de données dans l'éditeur de flux de données
Si vous avez déjà créé ou importé votre entité de données cible, vous pouvez faire glisser l'entité de données dans le canevas de conception et terminer les mappages et options de colonne. - Voir et gérer les entités de données
Toutes les entités de données créées et importées, ainsi que leurs détails, sont affichés dans la page Entités de données. - Voir les statistiques des entités de données
L'onglet Aperçu affiche des statistiques détaillées sur chaque entité de données.
Rubrique parent : La page Data Transforms
Importer les entités de données
La façon la plus simple et la plus courante de créer une entité de données consiste à importer sa structure à partir du type de connexion (par exemple, base de données Oracle).
Pour importer des entités de données existantes :
- Dans le volet de gauche de la page d'accueil, cliquez sur l'onglet Entités de données.
La page Entités de données s'affiche.
- Cliquez sur Importer les entités de données pour importer les entités de données existantes.
Diapositives de la page Importer des entités de données. Si vous prévoyez d'utiliser une connexion au serveur Oracle ERP Cloud pour l'importation, voir Importation de définitions d'entité de données à partir d'un serveur Oracle Analytics Publisher.
- Sélectionnez la connexion suivie de schéma, puis sélectionnez enfin le type d'objet à importer.
Pour les connexions au service Oracle Object Storage, la liste déroulante Schéma répertorie le nom du seau que vous avez spécifié dans l'URL lors de la création de la connexion.
- [Pour les connexions au connecteur Oracle Business Intelligence Cloud (BICC) uniquement] Dans Offres à importer pour la collecte, sélectionnez les offres dont vous voulez importer les magasins de données. Vous devez sélectionner au moins une offre pour importer les objets de vue publique BICC.
Note
L'importation des objets de vue PVO BICC peut prendre beaucoup de temps en fonction du nombre d'objets sélectionnés. Pour améliorer les performances, Oracle recommande d'utiliser un masque pour filtrer et limiter le nombre d'objets de vue publics à importer. - Sélectionnez un masque/filtre si vous ne voulez pas importer tous les objets du schéma.
Selon le type de connexion, d'autres options d'importation vous seront proposées.
Note
Pour les connexions au service Oracle Object Storage, cette valeur est sensible à la casse. Si Lot de fichiers similaires est réglé àTrue, tous les fichiers qui correspondent au masque et ont la même structure sont regroupés en une seule entité de données. - [Pour les connexions à Oracle Financials Cloud uniquement] Dans la liste de la section Ressources, sélectionnez les éléments à importer. Une fois le processus d'importation terminé, une table est créée pour chaque ressource sélectionnée.
- [Pour les connexions au serveur REST uniquement] Dans la section Ressources, procédez de la façon suivante :
- Dans le champ URI de ressource, entrez l'URL du service REST à partir duquel vous voulez importer des ressources.
- Cliquez sur l'icône +.
- Dans la colonne Nom, entrez un identificateur pour la ressource.
- Dans la colonne URI de l'opération, entrez l'URI de la ressource.
- Cliquez sur Tester la ressource pour vérifier si les entrées sont valides.
- Cliquez sur Démarrer.
Un travail est créé et l'ID travail correspondant s'affiche pour vous permettre de suivre la session. Cliquez sur l'ID tâche pour afficher les détails de la tâche.
Une fois la tâche exécutée, toutes les entités de données sélectionnées sont importées. Cliquez sur l'icône Actualiser
située dans le coin droit de la page Entités de données pour voir les nouvelles entités de données importées.
Rubrique parent : Utiliser des entités de données
Créer des entités de données
Vous pouvez créer ou mettre à jour manuellement les entités de données au moyen de l'interface Oracle Data Transforms.
Les entités de données doivent posséder les objets correspondants dans la connexion source à utiliser en tant que source dans un flux de données. Habituellement, le processus d'importation s'assure que ces objets sont en coordination. Toutefois, chaque fois que vous créez ou mettez à jour manuellement des entités de données, assurez-vous toujours de vérifier si les deux définitions sont en coordination les unes avec les autres.
Lorsque vous utilisez une entité de données comme cible, elle n'a pas besoin d'exister précédemment dans la connexion cible et peut être créée dans le cadre de l'exécution du service de flux de données.
- Dans le volet de gauche de la page d'accueil, cliquez sur l'onglet Entités de données.
La page Entités de données s'affiche.
- Cliquez sur Créer une entité de données pour créer une nouvelle entité de données.
La page Créer une entité de données s'affiche.
- Dans la zone de texte Name, entrez le nom de la nouvelle entité de données que vous créez.
- Dans la liste déroulante Connexion, sélectionnez la connexion requise à partir de laquelle vous souhaitez ajouter l'entité de données nouvellement créée.
Note
Les connexions à Oracle Financials Cloud ne sont pas répertoriées ici car vous ne pouvez pas créer manuellement des entités de données pour ces connexions. Vous pouvez uniquement importer des entités de données à partir de points d'extrémité REST Oracle Financials Cloud à l'aide de la page Importer des entités de données. Voir Importer des entités de données. - Dans la liste déroulante Schéma, tous les schémas correspondant à la connexion sélectionnée sont répertoriés dans deux groupes.
- Nouveau schéma de base de données (celui que vous n'avez pas importé auparavant) et
- Schéma de base de données existant (personnes que vous avez importées d'avant et qui remplacent potentiellement des entités de données).
Dans la liste déroulante Schéma, sélectionnez le schéma requis.
Note
Pour les connexions au service Oracle Object Storage, la liste déroulante Schéma répertorie le nom du seau que vous avez spécifié dans l'URL lors de la création de la connexion. - Dans la liste déroulante Type, sélectionnez le type d'entité de données.
- Table : Pour définir la structure de la table pour la nouvelle entité de données créée, cliquez sur l'icône + pour ajouter des colonnes. Pour chaque colonne, vous pouvez spécifier des paramètres tels que Nom, Type de données, Longueur, Échelle, Non nul. Cliquez deux fois sur la cellule pour configurer la valeur.
Cliquez sur l'icône 'x' pour supprimer une rangée. Cliquez sur les flèches vers le haut et vers le bas pour trier les lignes de la table.
- Vue en ligne : Pour créer l'entité de données à l'aide du code en ligne, entrez l'énoncé Sélectionner dans l'onglet Interrogation. Par exemple,
SELECT * FROM CUSTOMER. Cliquez sur Valider.L'onglet Colonnes affiche une liste en lecture seule des colonnes retournées par l'interrogation. Cliquez sur l'onglet Prévisualiser pour voir les données de colonne.
- Table : Pour définir la structure de la table pour la nouvelle entité de données créée, cliquez sur l'icône + pour ajouter des colonnes. Pour chaque colonne, vous pouvez spécifier des paramètres tels que Nom, Type de données, Longueur, Échelle, Non nul. Cliquez deux fois sur la cellule pour configurer la valeur.
- Dans la zone de texte Marqueurs, entrez un marqueur de votre choix. Vous pouvez utiliser des marqueurs pour filtrer les entités de données affichées dans la page Entité de données.
- Pour les connexions au service Oracle Object Storage, cette page affiche les options suivantes :
- Contenu – Sélectionnez le fichier CSV qui contient les données à importer. Les métadonnées affichées dans la table de prévisualisation, telles que le type de données et la longueur des colonnes, sont basées sur la première rangée du fichier CSV. Assurez-vous que le fichier CSV comporte une ligne d'en-tête. L'en-tête ne doit contenir que des caractères alphanumériques et aucun caractère spécial.
- Regrouper des fichiers – Cochez cette case pour regrouper les données de plusieurs fichiers CSV en une seule entité de données. Par exemple, supposons que vous vouliez fusionner les données de Employee_Data1.csv, Employee_Data2.csv et Employee_Data3.csv en une seule entité de données.
Si vous souhaitez charger les fichiers CSV à l'aide de Windows, assurez-vous d'abord de convertir les fichiers au format Unix pour éviter les problèmes d'encodage de caractères lors du regroupement.
- Nom de la ressource – Utilisez cette option avec Fichiers de groupe. Entrez la valeur à utiliser pour identifier les fichiers. Le nom de la ressource doit être une expression rationnelle. Vous ne pouvez utiliser qu'un astérisque (*) comme caractère générique dans le nom de la ressource. Par exemple,
Employee_Data*.csv.
- Pour les connexions à une base de données Oracle, vous pouvez marquer les entités de données en tant que groupe de fonctions. Développez Options avancées et cochez la case Traiter comme groupe de fonctions.
- Cliquez sur Enregistrer.
La nouvelle entité de données est créée.
Rubrique parent : Utiliser des entités de données
Créer des entités de données dans l'éditeur de flux de données
Si vous avez déjà créé ou importé votre entité de données cible, faites glisser l'entité de données vers le canevas de conception et terminez les mappages et les options de colonne.
Pour créer la définition d'une entité dans l'éditeur de flux de données,
- Faites glisser l'entité de données vers le canevas de conception.
- Sélectionnez le composant et cliquez sur l'icône Ajouter une entité de données
située dans le coin supérieur droit du composant cible.
- La page Ajouter une entité de données s'affiche et vous permet de configurer les détails suivants du composant cible :
Onglet Général
- Dans la zone de texte Nom, entrez le nom de l'entité de données nouvellement créée.
- Dans la liste déroulante Type d'entité, sélectionnez le type d'entité de données.
- Table
- Modèle d'apprentissage automatique
Lorsque vous sélectionnez ce type d'entité, l'interface utilisateur change comme suit :
- La liste déroulante Type de connexion ne répertorie que Oracle comme option. Par conséquent, la liste déroulante Connexion répertorie uniquement les connexions Oracle que vous avez créées.
- L'assistant Ajouter une entité de données affiche l'onglet Propriétés dans lequel vous pouvez sélectionner le type d'apprentissage, la fonction, l'algorithme et configurer les paramètres pour définir le modèle d'apprentissage automatique. Voir Utiliser des modèles d'apprentissage automatique pour des informations détaillées sur la création et l'utilisation d'une entité de données de modèle d'apprentissage automatique.
- Vue matérialisée
Lorsque vous sélectionnez ce type d'entité, la liste déroulante Type de connexion ne répertorie que Oracle comme option, et la liste déroulante Connexion est alimentée avec la même connexion que l'entité de données source. Les deux options sont grisées. Voir Créer et utiliser une vue matérialisée dans un flux de données pour des informations détaillées sur la création et l'utilisation d'une entité de données de vue matérialisée.
- Dans la liste déroulante Type de connexion, sélectionnez la connexion requise à partir de laquelle vous souhaitez ajouter l'entité de données nouvellement créée. La liste déroulante Connection est alimentée avec les connexions que vous avez créées avec le type de connexion associé.
- Dans la liste déroulante Connexion, sélectionnez le nom du serveur à partir duquel vous souhaitez ajouter l'entité de données nouvellement créée.
- Dans la liste déroulante Schéma, tous les schémas correspondant à la connexion sélectionnée sont répertoriés dans deux groupes.
- Nouveau schéma de base de données (celui que vous n'avez pas importé auparavant) et
- Schéma de base de données existant (personnes que vous avez importées d'avant et qui remplacent potentiellement des entités de données).
Note
Pour les connexions au service Oracle Object Storage, la liste déroulante Schéma répertorie le nom du seau que vous avez spécifié dans l'URL lors de la création de la connexion. - Dans la zone de texte Marqueurs, entrez un marqueur de votre choix. Vous pouvez utiliser des marqueurs pour filtrer les entités de données affichées dans la page Entité de données.
- Pour les connexions à une base de données Oracle, vous pouvez marquer les entités de données en tant que groupe de fonctions. Développez Advanced Options (Options avancées) et cochez la case Treat as Feature Group (Traiter comme groupe de fonctions).
- Cliquez sur Suivant.
Onglet Colonnes
- Cliquez sur l'icône
Ajouter des colonnes pour ajouter de nouvelles colonnes à la nouvelle entité de données créée.
Une nouvelle colonne est ajoutée à la table affichée.
- Le tableau présente les colonnes suivantes :
- Le nom
- Type de données - Cliquez sur la cellule pour configurer le type de données requis.
- Ajuster
- Longueur
- Actions - Cliquez sur l'icône croisée pour supprimer la colonne créée.
- Pour supprimer les colonnes en masse, sélectionnez-les et cliquez sur l'icône de suppression
.
- Pour rechercher les détails de colonne requis, dans la zone de texte Rechercher, entrez le nom de colonne requis et cliquez sur Entrer. Les détails de la colonne requise s'affichent.
- Cliquez sur Suivant.
Onglet Prévisualiser l'entité de données
Il affiche un aperçu de toutes les colonnes créées et de leurs détails configurés. Si l'entité de données appartient à une base de données Oracle, vous pouvez également afficher les statistiques de la table. Pour plus d'informations, voir Voir les statistiques des entités de données.
- Cliquez sur Enregistrer.
La nouvelle entité de données cible est créée.
- Développez le panneau des propriétés dans le volet de droite pour voir les paramètres suivants des composants créés :
- Général - Affiche le nom du composant ainsi que ses détails de connexion et de schéma.
- Attributs - Affiche les détails de tous les attributs associés au composant.
- Column Mapping - Cliquez sur Auto Map pour mapper automatiquement toutes les colonnes.
- Aperçu - Cliquez sur ce bouton pour obtenir un aperçu du groupe de pages.
- Options - Modifiez les options le cas échéant.
Rubrique parent : Utiliser des entités de données
Voir et gérer les entités de données
Toutes les entités de données créées et importées, ainsi que leurs détails, sont affichées dans la page Entités de données.
Vous pouvez rechercher l'entité de données requise pour connaître ses détails en fonction des filtres suivants :
- Nom de l'entité de données.
- Connexion pour laquelle l'entité de données a été créée.
- Schéma auquel l'entité de données est associée.
- Type d'entité de l'entité de données.
- Marqueurs associés à l'entité de données.
Cliquez sur l'icône Actions (
) à côté de l'entité de données sélectionnée pour effectuer les opérations suivantes :
- Sélectionnez Modifier pour modifier les détails existants.
- Sélectionnez Prévisualiser pour prévisualiser l'entité de données sélectionnée. Si l'entité de données appartient à une base de données Oracle, vous pouvez également afficher les statistiques de la table. Voir Voir les statistiques des entités de données pour plus de détails.
- Sélectionnez Voir les dépendances pour vérifier les flux de données dépendants et les chargements de données, le cas échéant, associés à l'entité de données sélectionnée. Les dépendances sont regroupées par nom de projet sous l'objet Entité de données et chaque noeud de projet répertorie les chargements de données et le flux de données associés.
- Vous pouvez supprimer une ou plusieurs entités de données. Pour supprimer des entités de données :
- Sélectionnez les entités de données.
- Cliquez sur le bouton Supprimer. Le premier écran de confirmation s'affiche et répertorie les entités de données sélectionnées.
- Cliquez sur Supprimer. Un autre écran de confirmation apparaît répertoriant les flux de données et les chargements de données qui seront affectés lors de la suppression. Pour les entités de données qui n'ont aucune dépendance, l'écran de confirmation affiche le statut "Supprimé".
- Cochez une ou plusieurs cases, si nécessaire, et cliquez sur Supprimer. Un écran de confirmation apparaît et affiche le statut des entités de données "Supprimé".
Tout flux de données qui référence les entités de données supprimées devient non valide. Les tâches de chargement de données pour le chargement des entités de données supprimées échoueront. Aucun objet supplémentaire n'est supprimé.
Rubriques
Rubrique parent : Utiliser des entités de données
Voir les statistiques des entités de données
L'onglet Preview affiche des statistiques détaillées sur chaque entité de données.
Cette fonction n'est disponible que pour les tables de base de données Oracle.
- Dans la liste Entités de données, cliquez sur l'icône Actions (
) à côté de l'entité de données et cliquez sur Prévisualiser. Sélectionnez l'onglet Statistiques pour voir les statistiques de l'entité de données sélectionnée.
- Dans n'importe quel flux de données, cliquez sur n'importe quelle entité de données source ou cible, puis développez le panneau des propriétés dans le volet de droite. Cliquez sur Aperçu.
Les données statistiques sont présentées comme suit :
- Le nombre total de rangées et de colonnes dans l'entité de données est affiché en haut.
- Le panneau de statistiques affiche les graphiques miniatures de chaque colonne avec des informations sur les valeurs Min, Max, Distinct et Null.
- Deux types de représentation miniature sont affichés en fonction de l'histogramme :
- Un graphique à barres représente les données des histogrammes de fréquence et de fréquence supérieure. Le graphique à barres affiche les 10 premières valeurs du nombre de rangées du tableau.
- Un tableau répertorie les données des histogrammes hybrides et équilibrés en hauteur. La table affiche toutes les données et peut faire défiler l'affichage. Le tableau affiche l'intervalle pour les valeurs et le pourcentage de rangées dans chaque intervalle.
- Vous pouvez cliquer sur chaque miniature pour afficher les statistiques de la colonne dans un nouvel onglet du navigateur.
- La vue détaillée de chaque graphique indique également le type d'histogramme.
Rubrique parent : Utiliser des entités de données