Datenaktualisierungsperformance

Oracle ist bestrebt, die Performance für das Laden von Daten in Pipelines ständig zu verbessern.

Die Performance beim Laden von Daten für Ihre Instanz variiert. Die Zeit bis zum Abschluss der Datenverarbeitung, sowohl vollständige Warehouse-Ladevorgänge als auch inkrementelle Dataloads, hängt von verschiedenen Faktoren ab. Ein Laden der Datenpipeline umfasst Folgendes:

  • Daten aus Oracle Fusion Cloud-Anwendungen extrahieren
  • Daten in Oracle Autonomous Data Warehouse laden
  • Transformation der Daten in das vordefinierte Schema.
Die Zeit für die Durchführung dieser Schritte wird durch verschiedene Faktoren bestimmt, darunter:
  • Die Verfügbarkeit des Quellsystems.
  • Die Größe und Komplexität der Quelldaten.
  • Die aktivierten Funktionsbereiche.
  • Benutzerdefinierte SQL-Abfragen, die sich auf Oracle Autonomous Data Warehouse auswirken.
  • Ihre Abfragen werden gleichzeitig ausgeführt.
  • Anpassungen an den Quellsystemobjekten (die eine vollständige Last für diese Objekte erfordern).
  • Das Patching von Quell- und Zielsystemen.
Für die tägliche Aktualisierung von Daten und die Pipelineausführung, um alle resultierenden Schlüsselmetriken und Dashboards zu aktualisieren, hängt die Ausführungszeit von vielen Faktoren ab, wie der Datenmenge, die inkrementell aktualisiert wird. Um Ihre nachgelagerten Workflowanforderungen zu planen, müssen Sie folgende Aktionen ausführen:
  • Aktivieren Sie die Pipelineausführungsschätzung mit dem Vorschaurefeature "Datenaktualisierung - Schätzung" auf der Seite "Features aktivieren". Die geschätzten Details zum Abschluss der Aktualisierung werden auf der Seite "Pipelineeinstellungen" angezeigt.
  • Lösen Sie alle nachfolgenden Vorgänge basierend auf der geschätzten Aktualisierungsabschlusszeit aus.
  • Wenden Sie sich an Oracle Support, wenn die Aktualisierung nicht bis zur geschätzten Abschlusszeit abgeschlossen ist.
  • Abonnieren Sie Eventbenachrichtigungen, damit Sie eine E-Mail-Benachrichtigung erhalten, sobald ein Problem mit der Pipelineausführung aufgetreten ist. Siehe Ereignisbenachrichtigungen aktivieren (Vorschau).

Die Datenaktualisierung wird in der Regel täglich abgeschlossen, es sei denn, die Datenpipelinejobs sind deaktiviert oder hängen geblieben. Sie können die Ladezeiten von Daten für Ihre spezifische Quell- und Warehouse-Konfiguration beobachten, um die Zeit für eine inkrementelle tägliche Aktualisierung und eine vollständige Warehouse-Last zu schätzen. Anhand dieser Informationen können Sie die optimale Tageszeit für die tägliche Datenaktualisierung planen. Sie können planen, dass der Dataload außerhalb der Spitzenzeiten ausgeführt wird. Beispiel: Sie führen erstmalige vollständige Warehouse-Ladevorgänge an Wochenenden und inkrementelle Ladevorgänge an Werktagen nachts aus, um sicherzustellen, dass die Arbeit der Benutzer nicht beeinträchtigt wird.

Sie können die geschätzte Abschlusszeit der Aktualisierung für tägliche Pipelines auf der Seite "Pipelineeinstellungen" im Feld "Geschätzter Abschluss der Aktualisierung" als Vorschaufunktion anzeigen. So können Sie Ihre Aufgaben in der Anwendung planen.
Details zum geschätzten Abschluss der Aktualisierung auf der Seite "Pipelineparameter"

Der inkrementelle Datenaktualisierungsprozess aktualisiert Objekte in mehreren Phasen, um sicherzustellen, dass wichtige Daten schnell verfügbar gemacht werden. Der Aktualisierungsprozess für mehrere Phasen umfasst:
  • Eine Prioritätsaktualisierung bestimmter Tabellen, die Sie für betriebliche Anwendungsfälle konfiguriert haben.
  • Als Nächstes aktualisiert der Prozess gegebenenfalls die vordefinierten Module und benutzerdefinierten Datenkonfigurationen. Die in dieser Phase aktualisierten Objekte sind Teil der Core-Pipeline und werden direkt aus Oracle Fusion Cloud Applications bezogen und für Core-Inhalte (z.B. Transaktionen und Dimensionen) benötigt.
  • Schließlich aktualisiert der Prozess die Datenerweiterungen des Typs "Dataset", Datenerweiterungen, die als versionierte Datasets konfiguriert sind, Datenerweiterungen ohne letztes Änderungsdatum oder letztes Aktualisierungsdatum sowie die Prognosemodule, wie z.B. die Vorhersage pünktlicher Lieferantenzahlungen. Die in dieser Phase aktualisierten Objekte erfordern eine zusätzliche Verarbeitung. Beispiel: Datasets, die in vordefinierten Anwendungsfällen für maschinelles Lernen verwendet werden).

Das System prognostiziert und zeigt die Abschlusszeit des inkrementellen Ladevorgangs an. Wenn Sie Inhalt, der im mehrstufigen Aktualisierungsprozess zuletzt verarbeitet wurde, nicht aktiviert haben, werden diese Informationen nicht auf der Seite "Pipelineeinstellungen" im Abschnitt "Datenpipeline" angezeigt.