Informationen zur Verwendung von Oracle Modern Data Platform für Geschäftsberichte und Prognosen

Bei diesem Design wird die Verwendung von Oracle Modern Data Platform für Geschäftsberichte und Prognosen untersucht.

Berücksichtigen Sie den Anwendungsfall, bei dem ein Unternehmen über eine große Menge an Produktvertriebsdaten aus internen und externen Quellen verfügt. Während sowohl historische als auch aktuelle Verkaufsdaten einen Wert für das Unternehmen haben, werden im Tagesgeschäft meist nur Daten aus den letzten Monaten oder Jahren verwendet. Verbraucher dieser Daten sind Geschäftsanwender, die diese Daten für Berichte, Analysen und Prognosen verwenden. Sie möchten, dass ihre Berichte und Dashboards schnell Ergebnisse liefern, um die Mitarbeiterproduktivität zu maximieren.

Traditionell vertrauen Unternehmen auf Data Warehouses, die auf relationalen Datenbanken basieren, um Anwendungsfälle wie die oben genannten zu melden. Diese Implementierungen hatten jedoch mehrere Einschränkungen - Skalierbarkeit und Performance sind die wichtigsten dieser Einschränkungen.

Architektur

Ein modernerer Ansatz ist die Verwendung einer Data Lakehouse-Architektur, die aus OCI Object Storage, Big Data-Technologien wie Hadoop, Spark und Columnar oder einer traditionellen Datenbank für das Reporting besteht.

Oracle Cloud Infrastructure (OCI) verfügt über eine breite Palette von Tools und Services, die alle Aspekte einer modernen Datenplattform abdecken. In dieser Lösung betrachten wir eine kleine Teilmenge von OCI-Services, die den architektonischen Anforderungen entsprechen.

  1. OCI Object Storage: Eine internetbasierte, leistungsstarke Speicherplattform, die zuverlässige und kostengünstige Dauerhaftigkeit von Daten bietet. Es kann eine unbegrenzte Menge unstrukturierter Daten eines beliebigen Inhaltstyps speichern, einschließlich Analysedaten und umfangreicher Inhalte, wie Bilder und Videos.
  2. Oracle Big Data Service: Ein verwalteter Hadoop-Service, der für eine Vielzahl von Big Data-Anwendungsfälle und Workloads entwickelt wurde. Von kurzlebigen Clustern zur Bewältigung spezifischer Aufgaben bis hin zu langlebigen Clustern, die horizontal skaliert werden können, um die Anforderungen eines Unternehmens kostengünstig und mit höchster Sicherheit zu erfüllen.
  3. Oracle Autonomous Database: Eine benutzerfreundliche, vollständig autonome Datenbank, die elastisch skalierbar ist und schnelle Abfrageperformance liefert. Da Autonomous Database als Service bereitgestellt wird, ist keine Datenbankadministration erforderlich.
  4. Oracle Analytics Cloud: Ein skalierbarer und sicherer Public Cloud-Service, mit dem Business Analysts und Consumer moderne, KI-gesteuerte Selfservice-Analysefunktionen für Datenvorbereitung, Visualisierung, Unternehmensberichte, erweiterte Analysen und Natural Language Processing nutzen können.

Die folgende Abbildung veranschaulicht die Architektur.
Beschreibung von oci-modern-data-reporting-arch.png folgt
Beschreibung der Abbildung oci-modern-data-reporting-arch.png

oci-modern-data-reporting-arch-oracle.zip

Jede der oben aufgeführten Architekturkomponenten funktioniert wie folgt zusammen:
  • Die OCI Object Storage-Schicht bietet eine zuverlässige und kostengünstige Möglichkeit, große Datenmengen zu speichern. Mit Object Storage verfügen Sie über einen gemeinsamen Persistence-Datenspeicher, der von mehreren Tools und Services verwendet werden kann. Dadurch wird auch sichergestellt, dass die Datenverarbeitungsschicht unabhängig vom Speicher vertikal oder horizontal skaliert werden kann.
  • Die Verarbeitungsschicht von Oracle Big Data Service bietet eine Plattform für die Aufnahme, Transformation und Aggregation von Massenmengen von Daten.
  • Die Datenbankschicht dient als schnelle und effiziente Methode zur Bereitstellung von Client-Reporting-Tools mit kuratierten Daten. Aktuelle und/oder nur relevante Daten werden in dieser Schicht beibehalten.
  • Oracle Analytics Cloud bietet die Möglichkeit, Daten zu visualisieren und Prognosen zu erstellen.

Diese Architektur unterstützt die folgenden Komponenten:

  • OCI-Datenintegration

    Oracle Cloud Infrastructure Data Integration ist ein vollständig verwalteter, serverloser, cloud-nativer Service, der Daten aus einer Vielzahl von Datenquellen in Oracle Cloud Infrastructure-Zielservices extrahiert, lädt, transformiert, bereinigt und umformt, wie Autonomous Data Warehouse und Oracle Cloud Infrastructure Object Storage. ETL (Extract Transform Load) nutzt die vollständig verwaltete Scale-Out-Verarbeitung in Spark, und ELT (Extract Load Transform) nutzt vollständige SQL-Push-Down-Funktionen von Autonomous Data Warehouse, um die Datenverschiebung zu minimieren und die Amortisierungszeit für neu aufgenommene Daten zu verbessern. Benutzer entwerfen Datenintegrationsprozesse mit einer intuitiven, kodlosen Benutzeroberfläche, die Integrationsabläufe optimiert, um die effizienteste Engine und Orchestrierung zu generieren und die Ausführungsumgebung automatisch zuzuweisen und zu skalieren. Oracle Cloud Infrastructure Data Integration bietet interaktive Exploration und Datenvorbereitung. Data Engineers können sich vor Schemaabweichungen schützen, indem sie Regeln zur Verarbeitung von Schemaänderungen definieren.

  • Streaming

    Oracle Cloud Infrastructure Streaming bietet eine vollständig verwaltete, skalierbare und langlebige Speicherlösung zur Aufnahme kontinuierlicher Datenstreams mit hohem Volumen, die Sie in Echtzeit konsumieren und verarbeiten können. Sie können Streaming verwenden, um hochvolumige Daten wie Anwendungslogs, betriebliche Telemetrie, Clickstream-Webdaten oder für andere Anwendungsfälle zu erfassen, bei denen kontinuierlich und sequentiell Daten in einem Publish-Subscribe-Nachrichtenmodell erzeugt und verarbeitet werden.