Collecte d'une ressource de données

Collectez une ressource de données pour extraire les informations sur la structure de données dans le catalogue de données, et visualiser ses attributs et entités de données.

Pour collecter une ressource de données, vous devez avoir créé au moins une connexion à la ressource de données.

    1. Dans l'onglet Accueil de l'instance pour laquelle collecter une ressource de données, cliquez sur Ressources de données.
    2. Sur la page Ressources de données, cliquez sur la ressource de données à collecter.
    3. Sur la page de détails de la ressource de données, cliquez sur Rechercher.
    4. Dans la section Sélectionner une connexion, sélectionnez la connexion à utiliser et cliquez sur Suivant.
      Remarque

      Pour une ressource de données Object Storage, vous pouvez utiliser le bouton Affecter des modèles de nom de fichier pour affecter des modèles de nom de fichier à la ressource de données sélectionnée. Pour plus d'informations, reportez-vous à Affectation de modèles de nom de fichier à des ressources de données.
    5. Dans la section Sélectionner des entités de données, affichez et ajoutez toutes les entités de données à collecter dans la table des entités de données. Cliquez sur l'icône d'ajout pour chaque entité de données à inclure dans le travail de collecte. Développez les dossiers d'entité de données pour consulter les entités de données imbriquées et les inclure. Cliquez sur Ajouter tout afin de sélectionner toutes les entités pour la collecte. Pour rechercher une entité de données parmi celles disponibles, utilisez la zone Filtrer les dossiers/entités de données.
      Remarque

      Seuls les dossiers et les entités de données pour lesquels vous disposez d'un accès en sélection ou en lecture sont répertoriés. Si vous ne trouvez pas les entités de données que vous recherchez, assurez-vous que vous disposez des privilèges d'accès à ces entités de données dans la source de données.
    6. Vérifiez les entités de données à collecter dans la table des entités de données.
    7. (Facultatif) Cliquez sur l'icône de suppression de toute entité de données sélectionnée à enlever du travail de collecte. Si vous devez recommencer, cliquez sur Enlever tout.
      Remarque

      Dans les ressources de données de type base de données Oracle ou base de données autonome présentant la version de base de données Oracle Database 12c ou une version supérieure, le collecteur Data Catalog ne collecte pas les schémas gérés par Oracle ni les autres schémas d'utilisateur commun .
    8. Cliquez sur Suivant.
    9. Dans l'onglet Créer un travail, dans le champ Nom de travail, entrez un nom unique permettant d'identifier le travail de collecte.
    10. (Facultatif) Entrez une description.
    11. Cochez la case Collecte incrémentielle pour que les exécutions suivantes de ce travail collectent uniquement les entités de données modifiées depuis la première exécution du travail de collecte.
      Remarque

      La collecte incrémentielle ne s'applique pas aux ressources de données MySQL, PostgreSQL, Hive et Kafka.
    12. Cochez la case Inclure les fichiers non reconnus pour que Data Catalog collecte également les fichiers qui ne sont pas pris en charge. Par exemple, .log, .txt, .sh, .jar et .pdf.
      Remarque

      Sélectionnez l'option Inclure les fichiers non reconnus pour collecter une entité de données logique uniquement composée de fichiers archivés.
    13. Si vous collectez une ressource de données Oracle Object Storage, cochez la case Inclure les fichiers avec correspondance uniquement afin de collecter uniquement les fichiers qui correspondent aux modèles de nom de fichier affectés. Les autres modèles de nom de fichier sont ignorés et ajoutés au nombre de fichiers ignorés.
    14. Sélectionnez l'une des options suivantes pour indiquer l'heure d'exécution du travail de collecte :
      • Exécuter le travail maintenant : crée un travail de collecte, l'exécute immédiatement.
      • Programmer le traitement du travail : affiche des champs supplémentaires pour programmer le travail de collecte. Saisissez le nom et la description de la programmation. Indiquez la fréquence d'exécution du travail. Les choix possibles sont horaire, quotidien, hebdomadaire et mensuel. Sélectionnez les heures de début et de fin du travail.
      • Enregistrer les configurations de travail pour plus tard : crée un travail pour collecter la ressource de données, mais le travail ne s'exécute pas.
    15. Cliquez sur Créer un travail.

    Dans l'onglet Travaux, vous pouvez suivre le statut du travail et visualiser ses détails.

  • Utilisez la commande create et les paramètres requis pour collecter des entités de données à partir d'une ressource de données :

    oci data-catalog job-definition create [OPTIONS]

    Afin d'obtenir la liste complète des indicateurs et des options de variable pour les commandes d'interface de ligne de commande, reportez-vous à Référence de commande d'interface de ligne de commande.

  • Exécutez l'opération CreateJobDefinition pour collecter la ressource de données.