À propos de la performance d'actualisation des données

Oracle s'efforce constamment d'améliorer la performance du chargement des données dans les pipelines.

Les performances de chargement des données pour votre instance varient. Le temps nécessaire pour terminer le traitement des données, qu'il s'agisse des chargements complets de l'entrepôt ou des chargements de données incrémentiels, dépend de divers facteurs. Un chargement de pipeline de données comprend les éléments suivants :

  • Extraction de données à partir des applications Oracle Fusion Cloud.
  • Chargement des données dans Oracle Autonomous Data Warehouse.
  • Transformation des données en schéma prédéfini.
Le temps nécessaire pour effectuer chacune de ces étapes est déterminé par divers facteurs, notamment :
  • Disponibilité du système source.
  • Taille et complexité des données sources.
  • Les secteurs fonctionnels activés.
  • Interrogations SQL personnalisées qui ont une incidence sur Oracle Autonomous Data Warehouse.
  • Vos interrogations s'exécutent simultanément.
  • Personnalisations effectuées sur les objets du système source (qui nécessitent un chargement complet pour ces objets).
  • Application de correctifs aux systèmes source et cible.
Pour l'actualisation quotidienne des données et l'exécution du pipeline afin de mettre à jour toutes les mesures clés et tous les tableaux de bord qui en résultent, le temps d'exécution dépend de nombreux facteurs tels que la quantité de données actualisées de manière incrémentielle. Afin de planifier vos besoins de flux de travail en aval, assurez-vous d'effectuer les actions suivantes :
  • Activez l'estimation de l'exécution du pipeline à l'aide de la fonction de prévisualisation de l'estimation de l'actualisation des données dans la page Activer les fonctions. Les détails de l'achèvement estimatif de l'actualisation sont visibles dans la page Paramètres de pipeline.
  • Déclenchez toutes les opérations suivantes en fonction de l'heure d'achèvement estimative de l'actualisation.
  • Communiquez avec Oracle Support si l'actualisation n'est pas terminée avant l'heure d'achèvement estimative.
  • Abonnez-vous aux avis d'événement pour recevoir un avis par courriel dès qu'il y a un problème avec l'exécution du pipeline. Voir Activer les avis d'événement (Aperçu).

L'actualisation des données est généralement terminée tous les jours, sauf si les tâches de pipeline de données sont désactivées ou bloquées. Vous pouvez observer les temps de chargement des données pour votre configuration de source et d'entrepôt spécifique afin d'estimer le temps nécessaire pour une actualisation quotidienne incrémentielle et pour un chargement complet de l'entrepôt. Ces informations peuvent vous aider à planifier l'heure optimale dans la journée pour commencer l'actualisation quotidienne des données. Vous pouvez programmer le chargement de données pour qu'il s'exécute pendant les heures creuses, par exemple, exécuter les chargements d'entrepôt complets initiaux lors des week-ends et les chargements incrémentiels pendant la nuit afin de ne pas gêner les utilisateurs.

Vous pouvez afficher l'heure d'achèvement estimative de l'actualisation pour les pipelines quotidiens dans la page Paramètres de pipeline du champ Achèvement estimatif de l'actualisation en tant que fonction de prévisualisation. Cela vous permet de planifier vos tâches dans l'application.
Détails de l'achèvement estimatif de l'actualisation dans la page Paramètres de pipeline

Le traitement d'actualisation incrémentielle des données actualise les objets en tant que jeux de données de base et dérivés. Les jeux de données de base sont des objets qui font partie du pipeline de base et proviennent directement des applications Oracle Fusion Cloud et nécessaires pour le contenu de base (par exemple, les transactions et les dimensions). Les jeux de données dérivés sont basés sur des données qui nécessitent un traitement supplémentaire (par exemple, les jeux de données utilisés dans les cas d'utilisation prédéfinis de l'apprentissage automatique). Le processus d'actualisation incrémentielle actualise d'abord les jeux de données de base pour s'assurer que les données essentielles sont disponibles rapidement. Le système prédit et affiche l'heure d'achèvement du chargement incrémentiel, mais ne fait pas de même pour les jeux de données dérivés. Si vous n'avez pas activé de contenu comportant des jeux de données dérivés, vous ne verrez pas ces informations dans la page Paramètres de pipeline de la section Pipeline de données.