Utilisation des entités de données
Une entité de données est une représentation tableau d'une structure de données.
Elle inclut les vues ou les tables de base de données qui peuvent être utilisées dans une mise en correspondance en tant que source ou cible. Il s'agit simplement des métadonnées des sources et des cibles. Elles sont utilisées lors de la création de flux de données.
Vous pouvez ajouter des entités de données au projet nouvellement créé de l'une des deux manières suivantes :
Toutes les entités de données nouvellement créées ou importées ainsi que leurs détails sont affichés sur la page Entités de données. Les détails indiqués sont les suivants :
- Nom de l'entité de données
- Connexion pour laquelle l'entité de données a été créée
- Schéma associé à l'entité de données
- Cliquez sur l'icône Actions (
) en regard de l'entité de données sélectionnée pour effectuer les opérations suivantes :
- Sélectionnez Modifier pour modifier les détails existants.
- Sélectionnez Prévisualiser pour prévisualiser l'entité de données sélectionnée. Si l'entité de données appartient à une base de données Oracle, vous pouvez également visualiser les statistiques de la table. Pour plus d'informations, reportez-vous à Affichage des statistiques des entités de données.
- Sélectionnez Supprimer pour supprimer l'entité de données sélectionnée.
- Pour supprimer les entités de données en masse, sur la page Entités de données, cochez les cases des entités de données correspondantes et cliquez sur Supprimer.
- Vous pouvez également rechercher l'entité de données requise pour connaître ses détails en fonction des filtres suivants :
- Nom de l'entité de données
- Connexion pour laquelle l'entité de données a été créée
- Schéma associé à l'entité de données
- Balise associée à l'entité de données
Sujets
- Import d'entités de données
La méthode la plus simple et la plus courante pour créer une entité de données consiste à importer sa structure à partir du type de connexion (par exemple, une base de données Oracle). - Création d'entités de données
Vous pouvez créer ou mettre à jour manuellement les entités de données via l'interface Oracle Data Transforms. - Création d'entités de données dans l'éditeur de flux de données
Si vous avez déjà créé ou importé l'entité de données cible, faites glisser l'entité de données sur le canevas de conception et exécutez les options et les mises en correspondance de colonne. - Affichage des statistiques des entités de données
L'onglet Aperçu affiche les statistiques détaillées de chaque entité de données.
Rubrique parent : Page Data Transforms
Importer des entités de données
La méthode la plus simple et la plus courante pour créer une entité de données consiste à importer sa structure à partir du type de connexion (par exemple, une base de données Oracle).
Pour importer des entités de données existantes, procédez comme suit :
- Dans le panneau de gauche de la page d'accueil, cliquez sur l'onglet Entités de données.
La page Entités de données apparaît.
- Cliquez sur Import d'entités de données pour importer les entités de données existantes.
Diapositives de la page Importer des entités de données. Si vous prévoyez d'utiliser une connexion au serveur Oracle ERP Cloud pour l'import, reportez-vous à Import de définitions d'entité de données à partir d'un serveur Oracle ERP Cloud.
- Sélectionnez la connexion, suivie du schéma, puis enfin le type d'objets à importer.
Pour les connexions Oracle Object Storage, la liste déroulante Schéma répertorie le nom du bucket indiqué dans l'URL lors de la création de la connexion.
- [Pour les connexions Oracle Business Intelligence Cloud Connector (BICC) uniquement] Dans Offres à importer pour la collecte, choisissez les offres dont vous souhaitez importer les banques de données. Vous devez sélectionner au moins une offre pour importer les objets vue publique (PVO) BICC.
Remarque
L'importation des objets PVO BICC peut prendre beaucoup de temps en fonction du nombre d'objets sélectionnés. Pour améliorer les performances, Oracle recommande d'utiliser un masque pour filtrer et limiter le nombre d'objets PVO à importer. - Choisissez un masque/filtre si vous ne voulez pas importer tous les objets du schéma.
Selon le type de connexion, d'autres options d'import s'affichent.
Remarque
Pour les connexions Oracle Object Storage, cette valeur est sensible à la casse. Si l'option Regrouper les fichiers similaires est définie surTrue
, tous les fichiers qui correspondent au masque et qui ont la même structure sont regroupés en une seule entité de données. - [Pour les connexions Oracle Financials Cloud uniquement] Dans la liste de la section Ressources, sélectionnez les éléments à importer. Une fois le processus d'import terminé, une table est créée pour chaque ressource sélectionnée.
- [Pour les connexions au serveur REST uniquement] Dans la section Ressources, procédez comme suit :
- Dans le champ URI de ressource, entrez l'URL du service REST à partir duquel importer des ressources.
- Cliquez sur l'icône +.
- Dans la colonne Nom, entrez l'identificateur de la ressource.
- Dans la colonne URI d'opération, entrez l'URI de la ressource.
- Cliquez sur Tester la ressource pour vérifier si les entrées sont valides.
- Cliquez sur Démarrer.
Un travail est créé et l'ID de travail correspondant apparaît pour vous permettre de suivre la session. Cliquez sur l'ID du travail pour afficher les détails de ce dernier.
Une fois le travail exécuté, toutes les entités de données sélectionnées sont importées. Cliquez sur l'icône Actualiser
présente dans l'angle droit de la page Entités de données pour voir les nouvelles entités de données importées.
Rubrique parent : Utilisation des entités de données
Créer des entités de données
Vous pouvez créer ou mettre à jour manuellement les entités de données via l'interface Oracle Data Transforms.
Les entités de données doivent posséder les objets correspondants dans la connexion source pour être utilisées en tant que sources dans un flux de données. Généralement, le processus d'import vérifie que ces objets sont mis en correspondance. Toutefois, chaque fois que vous créez ou mettez à jour manuellement des entités de données, veillez toujours à vérifier que les deux définitions sont en coordination l'une avec l'autre.
Lorsque vous utilisez une entité de données comme cible, il n'est pas nécessaire qu'elle se trouve déjà dans la connexion cible. Elle peut être créée dans le cadre de l'exécution d'un flux de données.
- Dans le panneau de gauche de la page d'accueil, cliquez sur l'onglet Entités de données.
La page Entités de données apparaît.
- Cliquez sur Créer une entité de données pour créer une entité de données.
La page Créer une entité de données apparaît.
- Dans la zone de texte Nom, saisissez le nom de l'entité de données que vous créez.
- Dans la liste déroulante Connexion, sélectionnez la connexion requise à partir de laquelle ajouter l'entité de données nouvellement créée.
Remarque
Les connexions Oracle Financials Cloud ne sont pas répertoriées ici car vous ne pouvez pas créer manuellement d'entités de données pour ces connexions. Vous pouvez uniquement importer des entités de données à partir des adresses REST Oracle Financials Cloud à l'aide de la page Importer des entités de données. Reportez-vous à Import d'entités de données. - Dans la liste déroulante Schéma, tous les schémas correspondant à la connexion sélectionnée sont répertoriés en deux groupes.
- Nouveau schéma de base de données (ce que vous n'avez pas importé précédemment)
- Schéma de base de données existant (ceux que vous avez importés précédemment et qui remplacent potentiellement des entités de données).
Dans la liste déroulante Schéma, sélectionnez le schéma requis.
Remarque
Pour les connexions Oracle Object Storage, la liste déroulante Schéma répertorie le nom du bucket indiqué dans l'URL lors de la création de la connexion. - Dans la liste déroulante Type, sélectionnez le type d'entité de données.
- Table : afin de définir la structure de table de l'entité de données nouvellement créée, cliquez sur l'icône + pour ajouter des colonnes. Pour chaque colonne, vous pouvez indiquer des paramètres tels que Nom, Type de données, Longueur, Echelle, Non NULL. Cliquez deux fois sur la cellule pour configurer la valeur.
Cliquez sur l'icône x pour supprimer une ligne. Cliquez sur les boutons Flèche Haut et Flèche Bas pour trier les lignes de la table.
- Vue en ligne : pour créer l'entité de données à l'aide du code en ligne, entrez l'instruction Select dans l'onglet Requête. Par exemple,
SELECT * FROM CUSTOMER
. Cliquez sur Valider.L'onglet Colonnes affiche une liste en lecture seule des colonnes renvoyées par la requête. Cliquez sur l'onglet Aperçu pour afficher les données de colonne.
- Table : afin de définir la structure de table de l'entité de données nouvellement créée, cliquez sur l'icône + pour ajouter des colonnes. Pour chaque colonne, vous pouvez indiquer des paramètres tels que Nom, Type de données, Longueur, Echelle, Non NULL. Cliquez deux fois sur la cellule pour configurer la valeur.
- Dans la zone de texte Balises, saisissez la balise de votre choix. Vous pouvez utiliser des balises pour filtrer les entités de données affichées sur la page Entité de données.
- Pour les connexions Oracle Object Storage, cette page affiche les options suivantes :
- Contenu : sélectionnez le fichier CSV qui contient les données à importer. Les métadonnées affichées dans la table d'aperçu, telles que le type de données et la longueur des colonnes, sont basées sur la première ligne du fichier CSV. Assurez-vous que le fichier CSV comporte une ligne d'en-tête. L'en-tête ne doit contenir que des caractères alphanumériques et aucun caractère spécial.
- Grouper les fichiers : cochez cette case pour regrouper les données de plusieurs fichiers CSV dans une entité de données. Par exemple, supposons que vous voulez fusionner les données des fichiers Employee_Data1.csv, Employee_Data2.csv et Employee_Data3.csv en une seule entité de données.
Si vous voulez télécharger les fichiers CSV à l'aide de Windows, assurez-vous d'abord de les convertir au format Unix pour éviter les problèmes d'encodage de caractères lors du regroupement.
- Nom de la ressource : utilisez cette option avec Regrouper les fichiers. Entrez la valeur à utiliser pour identifier les fichiers. Le nom de la ressource doit être une expression régulière. Vous ne pouvez utiliser qu'un astérisque (*) comme caractère générique dans le nom de la ressource. Par exemple,
Employee_Data*.csv
.
- Pour les connexions de base de données Oracle, vous pouvez marquer les entités de données comme étant un groupe de fonctionnalités. Développez Options avancées et cochez la case Traiter comme groupe de fonctionnalités.
- Cliquez sur Enregistrer.
L'entité de données est créée.
Rubrique parent : Utilisation des entités de données
Création d'entités de données dans l'éditeur de flux de données
Si vous avez déjà créé ou importé l'entité de données cible, faites glisser l'entité de données sur le canevas de conception et exécutez les options.
Pour créer la définition d'une entité dans l'éditeur Data Flow, procédez comme suit :
- Faites glisser l'entité de données vers le canevas de conception.
- Sélectionnez le composant et cliquez sur l'icône Ajouter une entité de données
présente dans l'angle supérieur droit du composant cible.
- La page Ajouter une entité de données : permet de configurer les détails suivants du composant cible :
Onglet Général
- Dans la zone de texte Nom, saisissez le nom de l'entité de données nouvellement créée.
- Dans la liste déroulante Type d'entité, sélectionnez le type d'entité de données.
- Table
- Modèle de machine learning
Lorsque vous sélectionnez ce type d'entité, l'interface utilisateur change comme suit :
- La liste déroulante Type de connexion répertorie uniquement Oracle comme option. Par conséquent, la liste déroulante Connexion répertorie uniquement les connexions Oracle que vous avez créées.
- L'assistant Ajouter une entité de données affiche l'onglet Propriétés, dans lequel vous pouvez sélectionner le type d'apprentissage, la fonction, l'algorithme et configurer les paramètres pour définir le modèle d'apprentissage automatique. Pour plus d'informations sur la création et l'utilisation d'une entité de données de modèle d'apprentissage automatique, reportez-vous à Utilisation de modèles d'apprentissage automatique.
- Dans la liste déroulante Type de connexion, sélectionnez la connexion requise à partir de laquelle vous souhaitez ajouter la nouvelle entité de données créée. La liste déroulante Connexion contient les connexions que vous avez créées avec le type de connexion associé.
- Dans la liste déroulante Connexion, sélectionnez le nom du serveur à partir duquel vous souhaitez ajouter la nouvelle entité de données créée.
- Dans la liste déroulante Schéma, tous les schémas correspondant à la connexion sélectionnée sont répertoriés dans deux groupes.
- Nouveau schéma de base de données (ceux dont vous n'avez pas importé auparavant) et
- Schéma de base de données existant (ceux dont vous avez importé précédemment et qui remplacent potentiellement des entités de données).
Remarque
Pour les connexions Oracle Object Storage, la liste déroulante Schéma répertorie le nom du bucket indiqué dans l'URL lorsque vous avez créé la connexion. - Dans la zone de texte Balises, entrez la balise de votre choix. Vous pouvez utiliser des balises pour filtrer les entités de données affichées sur la page Entité de données.
- Pour les connexions de base de données Oracle, vous pouvez marquer les entités de données comme un groupe de fonctionnalités. Développez Options avancées et cochez la case Traiter en tant que groupe de fonctionnalités.
- Cliquez sur Suivant.
Onglet Colonnes
- Cliquez sur l'icône
Ajouter des colonnes pour ajouter de nouvelles colonnes à l'entité de données nouvellement créée.
Une nouvelle colonne est ajoutée à la table affichée.
- La table comporte les colonnes suivantes :
- Nom
- Type de données : cliquez sur la cellule pour configurer le type de données requis.
- Redimensionner
- Longueur
- Actions : cliquez sur l'icône en forme de croix pour supprimer la colonne créée.
- Pour supprimer les colonnes en masse, sélectionnez-les et cliquez sur l'icône
Supprimer.
- Pour rechercher les détails de la colonne requise, saisissez son nom dans la zone de texte Rechercher et cliquez sur Entrée. Les détails de la colonne requise sont affichés.
- Cliquez sur Suivant.
Onglet Entité de données d'aperçu
Il affiche un aperçu de toutes les colonnes créées et de leurs détails configurés. Si l'entité de données appartient à une base de données Oracle, vous pouvez également visualiser les statistiques de la table. Pour plus d'informations, reportez-vous à Affichage des statistiques des entités de données.
- Cliquez sur Enregistrer.
L'entité de données cible est créée.
- Développez le panneau des propriétés dans le volet de droite pour visualiser les paramètres suivants des composants créés :
- Général : affiche le nom du composant, ainsi que ses détails de connexion et de schéma.
- Attributs - Affiche les détails de tous les attributs associés au composant.
- Mapping de colonnes : cliquez sur Mapping automatique pour mettre en correspondance toutes les colonnes automatiquement.
- Aperçu : cliquez sur cette option pour afficher un aperçu du composant.
- Options : modifiez les options selon vos besoins.
Rubrique parent : Utilisation des entités de données
Visualiser les statistiques des entités de données
L'onglet Aperçu affiche des statistiques détaillées de chaque entité de données.
Cette fonctionnalité est disponible uniquement pour les tables de base de données Oracle.
- Dans la liste des entités de données, cliquez sur l'icône Actions (
) en regard de l'entité de données, puis sur Aperçu. Sélectionnez l'onglet Statistiques pour visualiser les statistiques de l'entité de données sélectionnée.
- Sur un flux de données, cliquez sur une entité de données source ou cible, puis développez le panneau des propriétés dans le volet de droite. Cliquez sur Aperçu.
Les données statistiques sont présentées comme suit :
- Le nombre total de lignes et de colonnes dans l'entité de données est affiché en haut.
- Le panneau de statistiques affiche les graphiques miniatures de chaque colonne avec des informations sur les valeurs minimales, maximales, distinctes et NULL.
- Deux types de représentation miniature sont affichés en fonction de l'histogramme :
- Un graphique à barres représente les données des histogrammes de fréquence et de fréquence principale. Le graphique à barres affiche les 10 premières valeurs du nombre de lignes dans le tableau.
- Une table répertorie les données des histogrammes hybrides et avec équilibrage de hauteur. La table affiche l'intégralité des données et est déroulante. La table affiche la plage pour les valeurs et le pourcentage de lignes dans chaque plage.
- Vous pouvez cliquer sur chaque miniature pour visualiser les statistiques de la colonne dans un nouvel onglet du navigateur.
- La vue détaillée de chaque graphique affiche également le type d'histogramme.
Rubrique parent : Utilisation des entités de données