Datenplattform - Data Warehouse mit E-Business-Integration

Analysten benötigen eine effiziente Möglichkeit, Daten aus mehreren Finanzsystemen, Tabellen und anderen Datenquellen in einer vertrauenswürdigen, verwaltbaren und abfragenoptimierten Quelle zu konsolidieren.

Mit Oracle Autonomous Data Warehouse (ADW) und Oracle Analytics Cloud können Sie Daten aus Oracle E-Business Suite und anderen Quellen in einen zentralen Data Warehouse-Standort für Analysen laden und optimieren, damit Abteilungen verwertbare Erkenntnisse gewinnen können.

Diese Referenzarchitektur positioniert die Technologielösung im gesamten Geschäftskontext:



Geschäftsbereiche haben in der Regel keinen zeitnahen oder effizienten Zugriff auf Daten und Informationen. Analysten sammeln die Daten manuell, arbeiten mit ihnen auf individueller Basis und teilen dann Kopien von Dateien über E-Mail- oder Dateiserver. Die Daten werden nicht zentralisiert, so dass die Genauigkeit und Sicherheit der Daten schwierig ist. Die Analyse kann sehr lange dauern, und die Ergebnisse lassen sich nicht einfach wiederholen.

Ein Data Mart ist eine einfache Form eines Data Warehouse, das sich auf ein einzelnes Thema oder einen einzelnen Funktionsbereich konzentriert, z.B. Vertrieb, Marketing oder Finanzen. Sie werden häufig von einer einzelnen Abteilung innerhalb einer Organisation erstellt und kontrolliert. Aufgrund ihres Single-Subject-Fokus beziehen Data Marts in der Regel nur aus wenigen Quellen Daten. Zu den Quellen zählen interne Systeme, ein zentrales Data Warehouse oder externe Daten.

Gesteuerte Data Warehouses und Data Marts können Business-Anwendern umfangreiche Informationen bereitstellen und die KPIs der Organisation effektiver bereitstellen, ohne sich auf IT-Ressourcen und -Verfügbarkeit verlassen zu müssen.

Architektur

Diese Architektur verwendet Data Transforms, eine enthaltene Funktion in Oracle Autonomous Data Warehouse, zum Laden und Optimieren von Daten aus mehreren Quellen in ein zentralisiertes Autonomous Data Warehouse und verwendet Oracle Analytics Cloud, um die Daten zu analysieren und um verwertbare Erkenntnisse bereitzustellen.


Beschreibung von data-platform-ebs.png folgt
Beschreibung der Abbildung data-platform-ebs.png

Datenplattform-ebs-oracle.zip

Die Architektur konzentriert sich auf die folgenden logischen Bereiche:

  • Aufnahme, Transformation

    Erfasst und verfeinert die Daten für die Verwendung in den einzelnen Datenebenen in der Architektur.

  • Beibehalten, Kuratieren, Erstellen

    Vereinfacht den Zugriff und die Navigation der Daten, um die aktuelle Geschäftsansicht anzuzeigen. Bei relationalen Technologien können Daten in einfachen relationalen, Längs-, Dimensions- oder OLAP-Formularen logisch oder physisch strukturiert sein. Bei nicht relationalen Daten enthält diese Schicht einen oder mehrere Datenpools, entweder die Ausgabe eines Analyseprozesses oder die für eine bestimmte analytische Aufgabe optimierten Daten.

  • Analysieren, lernen, vorhersagen

    abstrahiert die logische Geschäftsansicht der Daten für die Consumer. Diese Abstraktion vereinfacht agile Ansätze für Entwicklung, Migration zur Zielarchitektur und das Provisioning einer einzelnen Berichtsebene aus mehreren föderierten Quellen.

Das folgende Diagramm zeigt eine Zuordnung der obigen Architektur zu Services, die auf Oracle Cloud Infrastructure mit Best Practices zur Sicherheit bereitgestellt werden.



OCI-adb-oac-arch-oracle.zip

Die Architektur umfasst die folgenden Komponenten:

  • Autonomous Data Warehouse

    Oracle Autonomous Data Warehouse ist ein selbststeuernder, selbstsichernder, selbstreparierender Datenbankservice, der für Data Warehousing-Workloads optimiert ist. Sie müssen keine Hardware konfigurieren oder verwalten und keine Software installieren. Oracle Cloud Infrastructure verarbeitet das Erstellen der Datenbank sowie das Backup, Patching, Upgrade und Tuning der Datenbank.

  • Data Integration

    Oracle Data Transforms ist ein Oracle Data Integrator-(ODI-)Integrationstool, das über Autonomous Database-Datenbankaktionen (DB-Tools) bereitgestellt werden kann. Der Service bietet eine vollständig einheitliche Lösung für das Erstellen, Bereitstellen und Verwalten komplexer Data Warehouses oder als Teil datenzentrierter Architekturen in einer SOA- oder Business Intelligence-Umgebung. Außerdem werden alle Elemente der Datenintegration, der Datenverschiebung, der Datensynchronisierung, der Datenqualität und des Datenmanagements kombiniert, um sicherzustellen, dass Informationen zeitnah, korrekt und konsistent auf komplexen Systemen sind.

  • Analysen

    Oracle Analytics Cloud ist ein skalierbarer und sicherer Public-Cloud-Service, mit dem Business Analysts moderne, KI-gesteuerte Selfservice-Analysefunktionen für Datenvorbereitung, Visualisierung, Unternehmensberichte, erweiterte Analysen und Natural Language Processing und -Generierung erhalten. Mit Oracle Analytics Cloud erhalten Sie außerdem flexible Servicemanagementfunktionen, darunter schnelles Setup, einfache Skalierung und Patching sowie automatisiertes Lifecycle Management.

Die Architektur umfasst auch die folgenden Komponenten:

  • Region

    Eine Oracle Cloud Infrastructure-Region ist ein lokalisierter geografischer Bereich, der ein oder mehrere Data Center, so genannte Availability-Domains, enthält. Regionen sind von anderen Regionen unabhängig, und große Distanzen können diese voneinander trennen (über Länder oder sogar Kontinente).

  • Compartment

    Compartments sind regionsübergreifende logische Partitionen in einem Oracle Cloud Infrastructure-Mandanten. Organisieren Sie Ihre Ressourcen in Oracle Cloud mit Compartments, kontrollieren Sie den Zugriff auf die Ressourcen, und legen Sie Nutzungsquoten fest. Um den Zugriff auf die Ressourcen in einem bestimmten Compartment zu kontrollieren, definieren Sie Policys, mit denen angegeben wird, wer auf die Ressourcen zugreifen kann und welche Aktionen sie ausführen können.

  • Identity and Access Management (IAM)

    Oracle Cloud Infrastructure Identity and Access Management (IAM) ist die Zugriffskontrollebene für Oracle Cloud Infrastructure-(OCI-) und Oracle Cloud-Anwendungen. Mit der IAM-API und der Benutzeroberfläche können Sie Identitätsdomains und die Ressourcen innerhalb der Identitätsdomain verwalten. Jede OCI-IAM-Identitätsdomain stellt eine eigenständige Identity and Access Management-Lösung oder eine andere Benutzerpopulation dar.

  • Policy

    Eine Oracle Cloud Infrastructure Identity and Access Management-Policy gibt an, wer auf welche Ressourcen zugreifen kann und wie. Der Zugriff wird auf Gruppen- und Compartment-Ebene erteilt. Das bedeutet, dass Sie eine Policy schreiben können, die einer Gruppe einen bestimmten Zugriffstyp in einem bestimmten Compartment oder dem Mandanten erteilt.

  • Availability-Domain

    Availability-Domains sind eigenständige, unabhängige Data Center innerhalb einer Region. Die physischen Ressourcen in jeder Availability-Domain sind von den Ressourcen in den anderen Availability-Domains isoliert, was Fehlertoleranz bietet. Availability-Domains haben keine gemeinsame Infrastruktur wie Stromversorgung, Kühlung oder das interne Availability-Domainnetzwerk. Es ist also unwahrscheinlich, dass der Ausfall einer Availability-Domain sich auf die anderen Availability-Domains in der Region auswirkt.

  • Virtuelles Cloud-Netzwerk (VCN) und Subnetz

    Ein VCN ist ein anpassbares, softwaredefiniertes Netzwerk, das Sie in einer Oracle Cloud Infrastructure-Region einrichten. Wie bei herkömmlichen Data-Center-Netzwerken haben VCNs vollständige Kontrolle über Ihre Netzwerkumgebung. Ein VCN kann mehrere sich nicht überschneidende CIDR-Blöcke aufweisen, die Sie nach dem Erstellen des VCN ändern können. Sie können ein VCN in Subnetze segmentieren, die für eine Region oder eine Availability-Domain gelten können. Jedes Subnetz besteht aus einem zusammenhängenden Adressbereich, der sich nicht mit den anderen Subnetzen im VCN überschneidet. Sie können die Größe eines Subnetzes nach der Erstellung ändern. Ein Subnetz kann öffentlich oder privat sein.

  • Internetgateway

    Das Internetgateway ermöglicht Traffic zwischen den öffentlichen Subnetzen in einem VCN und dem öffentlichen Internet.

  • Site-to-Site-VPN

    Site-to-Site-VPN stellt IPSec-VPN-Konnektivität zwischen Ihrem On-Premise-Netzwerk und VCNs in Oracle Cloud Infrastructure bereit. Die Protokollsuite IPSec verschlüsselt IP-Datenverkehr, bevor die Pakete von der Quelle an das Ziel übertragen werden, und entschlüsselt den Datenverkehr, wenn er eintrifft.

  • Dynamisches Routinggateway (DRG)

    Das DRG ist ein virtueller Router, der einen Pfad für privaten Netzwerkverkehr zwischen VCNs in derselben Region zwischen einem VCN und einem Netzwerk außerhalb der Region bereitstellt, wie ein VCN in einer anderen Oracle Cloud Infrastructure-Region, ein On-Premise-Netzwerk oder ein Netzwerk in einem anderen Cloud-Provider.

  • Network Address Translation-(NAT-)Gateway

    Ein NAT-Gateway ermöglicht privaten Ressourcen in einem VCN den Zugriff auf Hosts im Internet, ohne dass diese Ressourcen für eingehende Internetverbindungen freigegeben werden.

  • Servicegateway

    Das Servicegateway ermöglicht den Zugriff von einem VCN auf andere Services, wie Oracle Cloud Infrastructure Object Storage. Der Traffic vom VCN zum Oracle-Service durchläuft die Oracle-Netzwerk-Fabric und nie das Internet.

  • Routentabelle

    Virtuelle Routentabellen enthalten Regeln, um Traffic von Subnetzen an Ziele außerhalb eines VCN weiterzuleiten, in der Regel über Gateways.

  • Sicherheitsliste

    Für jedes Subnetz können Sie Sicherheitsregeln erstellen, die Quelle, Ziel und Traffictyp angeben, die in das Subnetz ein- und ausgehen dürfen.

  • Netzwerksicherheitsgruppe (NSG)

    Netzwerksicherheitsgruppe (NSG) fungiert als virtuelle Firewall für Ihre Cloud-Ressourcen. Mit dem Sicherheitsmodell ohne Vertrauen in Oracle Cloud Infrastructure wird der gesamte Traffic abgelehnt, und Sie können den Netzwerkverkehr innerhalb eines VCN kontrollieren. Eine NSG besteht aus einem Set von Ingress- und Egress-Sicherheitsregeln, die nur für ein bestimmtes Set von VNICs in einem einzelnen VCN gelten.

  • Bastionhost

    Der Bastionhost ist eine Compute-Instanz, die als sicherer, kontrollierter Einstiegspunkt für die Topologie von außerhalb der Cloud dient. Der Bastionhost wird in der Regel in einer demilitarisierten Zone (DMZ) bereitgestellt. Damit können Sie sensible Ressourcen schützen, indem Sie sie in privaten Netzwerken platzieren, auf die nicht direkt von außerhalb der Cloud zugegriffen werden kann. Die Topologie verfügt über einen einzelnen, bekannten Einstiegspunkt, mit dem Sie regelmäßig überwachen und auditieren können. So können Sie vermeiden, die sensibleren Komponenten der Topologie freizugeben, ohne den Zugriff darauf zu beeinträchtigen.

  • Objektspeicher

    Object Storage ermöglicht einen schnellen Zugriff auf große Mengen strukturierter und unstrukturierter Daten aller Inhaltstypen, darunter Datenbankbackups, Analysedaten und umfangreiche Inhalte wie Bilder und Videos. Sie können Daten sicher und geschützt speichern und dann direkt aus dem Internet oder aus der Cloud-Plattform abrufen. Sie können den Speicher nahtlos skalieren, ohne dass dies zu einer Beeinträchtigung der Performance oder Servicezuverlässigkeit führt. Verwenden Sie Standardspeicher für "Hot"-Speicher, auf den Sie schnell, sofort und häufig zugreifen müssen. Verwenden Sie den Archivspeicher zum "kalten" Speicher, den Sie über lange Zeiträume beibehalten und selten oder nur selten aufrufen.

Empfehlungen

Verwenden Sie die folgenden Empfehlungen als Ausgangspunkt, um Daten aus der Oracle E-Business Suite und anderen Quellen zur Analyse in einen zentralen Data Warehouse-Standort zu laden und zu optimieren.

Ihre Anforderungen können von der hier beschriebenen Architektur abweichen.

  • Datenrefinery

    Mit Data Transforms, einem integrierten Service von Oracle Autonomous Data Warehouse, können Sie Mappings zwischen Datenquellen und Zielen erstellen, um die Daten mit ETL- und E-LT-Methoden zu verfeinern und zu bereinigen.

  • Datenintegration zur Unterstützung von EBS

    Knowledge-Module in Oracle E-Business Suite helfen Ihnen, Daten aus Geschäftsanwendungen zu extrahieren und in das Data Warehouse mit regulären Zuordnungen aus einer Oracle Database zu integrieren.

  • Oracle Analytics Cloud

    Bevor Sie Oracle Analytics Cloud mit Oracle Autonomous Data Warehouse verbinden, muss ein Datenbankadministrator die IP-Adresse (oder den Adressbereich) für die Oracle Analytics Cloud-Instanz zur Liste der genehmigten Adressen hinzufügen. Der Datenbankadministrator muss eine Sicherheitsregel hinzufügen, die TCP/IP-Traffic von Oracle Analytics Cloud an die Datenbank zulässt.

Hinweise

Berücksichtigen Sie beim Laden und Optimieren von Daten aus der Oracle E-Business Suite und anderen Quellen in einen zentralen Data Warehouse-Speicherort für Analysen die folgenden Implementierungsoptionen.

Richtlinien Datenrefinery Datenpersistenzplattform Zugriff und Interpretation
Empfohlen Oracle Autonomous Data Warehouse-Tools Oracle Autonomous Data Warehouse Oracle Analytics Cloud
Andere Optionen Oracle Data Integrator Oracle Exadata Database Service  
Begründung Oracle Autonomous Data Warehouse umfasst eine benutzerfreundliche, integrierte Gruppe von Funktionen für die Datenaufnahme und -feinerung. Diese Tools finden Sie im Menü "DB-Aktionen". Oracle Autonomous Data Warehouse ist eine benutzerfreundliche, vollständig autonome Datenbank, die elastisch skalierbar ist, schnelle Abfrageperformance bereitstellt und keine Datenbankadministration erfordert. Außerdem bietet sie direkten Zugriff auf die Daten aus dem Objektspeicher über externe Tabellen. Oracle Analytics Cloud ist eine vollständig verwaltete und eng in die kuratierte Datenschicht (Oracle Autonomous Data Warehouse) integrierte Lösung.

Bereitstellen

Der Terraform-Code für diese Referenzarchitektur ist in GitHub verfügbar. Sie können den Code mit nur einem Mausklick in Oracle Cloud Infrastructure Resource Manager abrufen, den Stack erstellen und bereitstellen. Alternativ können Sie den Code von GitHub auf Ihren Computer herunterladen, den Code anpassen und die Architektur mit der Terraform-CLI bereitstellen.

  • Mit Oracle Cloud Infrastructure Resource Manager bereitstellen:
    1. Klicken Sie auf In Oracle Cloud bereitstellen

      Wenn Sie noch nicht angemeldet sind, geben Sie den Mandanten und die Benutzerzugangsdaten ein.

    2. Prüfen und akzeptieren Sie die Bedingungen.
    3. Wählen Sie die Region aus, in der Sie den Stack bereitstellen möchten.
    4. Befolgen Sie die Prompts und Anweisungen zum Erstellen des Stacks auf dem Bildschirm.
    5. Klicken Sie nach dem Erstellen des Stacks auf Terraform-Aktionen, und wählen Sie Planen aus.
    6. Warten Sie auf den Abschluss des Jobs, und prüfen Sie dann den Plan.

      Um Änderungen vorzunehmen, kehren Sie zur Seite "Stackdetails" zurück, klicken Sie auf Stack bearbeiten, und nehmen Sie die erforderlichen Änderungen vor. Führen Sie anschließend die Aktion Plan erneut aus.

    7. Wenn keine weiteren Änderungen erforderlich sind, kehren Sie zur Seite "Stackdetails" zurück, klicken Sie auf Terraform-Aktionen, und wählen Sie Anwenden aus.
  • Mit der Terraform-CLI bereitstellen:
    1. Gehen Sie zu GitHub.
    2. Befolgen Sie die Anweisungen im Dokument README.

Änderungslog

In diesem Log werden nur die wesentlichen Änderungen aufgeführt: