Führen Sie Multicloud-Datenanalysen mit der modernen Datenplattform von Oracle durch

Organisationen können ein Unternehmens-Data Warehouse erstellen, um sowohl Live- als auch archivierte Daten an einem Standort zu speichern.

Daten werden generiert, wenn Geschäftsprozesse abgeschlossen, ausgeführte Vorgänge oder verkaufte Produkte ausgeführt werden. Aufgrund heterogener Datenquellen möchten Unternehmen einen vereinfachten Ansatz für die Erstellung eines zentralen Datenspeichers implementieren - eine zentrale Anlaufstelle für all ihre Datenanalyseanforderungen. Aufgrund der Vielzahl von Quellen, wie von Benutzern, Herstellern, Distributoren, Partnern und Drittanbietern gemeldete Daten, sowie alltägliche Einzelhandelsaufträge und Kundenfeedback, Ziel ist es, ein zentrales Data Warehouse-Repository für Unternehmen zu erstellen, das von Geschäftsfunktionen extrahiert und analysiert wurde, um End-to-End-Geschäftsvisibilität zu schaffen und mit datengesteuerten Informationen zu reagieren.

Unternehmen möchten die Informationen nutzen und datengesteuerte Entscheidungen treffen, um ihr Unternehmen effizienter zu führen. Mit dieser Multi-Cloud-Datenanalyselösung können Unternehmen Analysen über ein zentrales Data Warehouse auf der modernen Oracle-Datenplattform mit Integrationen in mehrere Datenquellen wie Oracle Fusion Cloud Enterprise Resource Planning, Microsoft Azure SQL Server (SQL Server), Salesforce, eBay und Google Analytics effektiv ausführen.

Zu den Vorteilen zählen:

  • Eine einheitliche Datenanalyse-Pipeline

    Vereinfachter Zugriff auf alle Daten in Clouds und On-Premise-Installationen, einschließlich in Datenbanken und Objektspeichern gespeicherter Daten.

  • Einfache Integration

    Integrieren Sie Daten aus verschiedenen Systemen: Daten föderieren, orchestrieren, synchronisieren und mischen. Integrieren Sie Daten, beliebige Formate, APIs, beliebig schnell, mit beliebigen Anwendungen oder Geräten. All dies, während Sie eine sichere Zusammenarbeit ermöglichen, Sicherheitsregeln einhalten und keinen Code schreiben.

  • Hochleistungsanalysen

    Schneller Datenzugriff mit Abfragetools ermöglicht schnelle Entscheidungen und einen besseren Kundenservice.

  • Erweiterte Analysefunktionen

    Ermöglichen Sie erweiterte Analysetechniken wie Daten- und Text-Mining, maschinelles Lernen, Prognosen, Sentimentanalysen, Netzwerk- und Clusteranalysen, Diagrammanalysen, komplexe Ereignisverarbeitung und neuronale Netzwerke.

  • Zentrale Plattform

    Eine einzige, cloudbasierte Plattform, mit der Sie die Zusammenarbeit innerhalb von Teams erhöhen, die Ausführung und Markteinführungszeit verbessern und Innovationen beschleunigen können.

  • Kosten, Sicherheit und Verfügbarkeit

    Unternehmen möchten die Kosten für Investitionsausgaben (CapEx) und Gemeinkosten (OpEx) senken, aber auch eine gute Mischung aus Kosten und Performance mit Sicherheit und Verfügbarkeit verwenden.

Architektur

Diese Referenzarchitektur zeigt eine Multi-Cloud-Datenanalyse-Pipeline für Unternehmen, die Daten aus verschiedenen Quellen annimmt und formatiert, in das Unternehmens-Data Warehouse in Oracle Cloud Infrastructure (OCI) verschiebt und mit Oracle Analytics Cloud (OAC) analysiert.

Die Daten werden aus verschiedenen Quellen mit Oracle Integration- und OCI-Integrationsservices integriert. Die angezeigten Datenquellen sind Salesforce, eBay, SQL Server, Oracle Fusion Cloud Service und Google Analytics. Die Lösung gilt jedoch für jede Datenquelle, die API-Aufrufe oder Datenbankverbindungen akzeptiert. OCI-Integrationsservices verbinden jede Anwendung und Datenquelle, um End-to-End-Prozesse zu automatisieren und das Management zu zentralisieren. Das breite Spektrum an Integrationen mit vordefinierten Adaptern und Low-Code-Anpassung vereinfacht die Migration in die Cloud und optimiert gleichzeitig Multicloud-Vorgänge.

Oracle Integration (OIC) verbindet alle Anwendungen, Daten und Services, einschließlich Salesforce und eBay, Oracle Fusion Cloud Service sowie Partnerökosysteme für die Kommunikation zwischen Unternehmen (B2B). Die Daten werden mit Oracle Integration-Services aus variou-Quellen integriert. Sobald Daten aus allen verschiedenen Quellen in der Staging-Schicht verfügbar sind, werden die Daten dann mit Data Integration bereinigt, standardisiert, zusammengeführt und transformiert. ADW speichert die Staging-Schicht, Referenzdaten und die Analyseschicht. OAC wird als Analysetool verwendet, um Dashboards, Berichte, KPIs zu generieren und Selfserviceanalysen im gesamten Unternehmen zu optimieren. Vordefinierte Connectors aus OAC können verwendet werden, um Daten aus Google Analytics zu replizieren und zusammenzuführen.



oci-multicloud-data-analytics-diagram-oracle.zip

Datenquellenintegration:

  • Google Analytics-Integration

    Der Benutzer verwendet den in OAC integrierten Google Analytics-Daten-Connector, der eine Verbindung zu Google Drive oder Google Analytics herstellt. Die Verbindung muss die von Google autorisierten Umleitungs-URIs zusammen mit dem Client Secret und dem Ansichtsnamen Google Analytics verwenden. Nach der Autorisierung können Sie die Transformation lesen und Dashboards in OAC erstellen.

  • Salesforce-Integration

    Mit dem Salesforce-Adapter können Benutzer eine vereinfachte bidirektionale Integration mit Salesforce.com erstellen. Sie ermöglicht die Erkennung von Geschäftsobjekten und Vorgängen und ermöglicht eine einfache Zuordnung zu und von Salesforce.com-Geschäftsobjekten. OIC erstellt einen Workflow, der eine Verbindung mit dem Salesforce-Adapter erstellt und die Daten dann in ADW abruft.

  • Microsoft Azure SQL Server-Integration

    Die SQL Server-Datenintegration mit ADW wird mit Data Integration erreicht. Er erstellt eine Datenpipeline von SQL Server zu ADW, gibt das Quelldatenasset an und konfiguriert dann Transformationen, um die Daten zu bereinigen und zu verarbeiten, während sie in das Zieldatenasset geladen werden. Um ein bestimmtes Set von Prozessen in einer Sequenz auszuführen, erstellen Sie eine Pipeline. Das Entwerfen einer Pipeline ähnelt dem Erstellen eines Datenflusses, in dem Sie Operatoren zum Hinzufügen der gewünschten Aufgaben und Aktivitäten verwenden. Nachdem Sie eine Pipeline erstellt haben, erstellen Sie eine Pipelineaufgabe, die die Pipeline verwendet. Veröffentlichen Sie sie nach dem Erstellen von Aufgaben in der Standardanwendung oder in Ihrer eigenen Anwendung. Anwendungen führen Aufgaben aus und überwachen ihren Fortschritt und Status. Sie können auch Aufgaben für automatisierte Ausführungen planen.

  • Manueller Daten-Feed (Flat-Dateien)

    Oracle Cloud Infrastructure Object Storage wird als Geschäftsdateispeicher verwendet, in den Geschäfts- und Betriebsbenutzer die manuellen Datenfeeddateien wie Ziele, Prognosen, monatliche Kundenmarker und Kennzahlen zur vorläufigen Personalausrichtung hochladen. Sobald Datendateien in Oracle Cloud Infrastructure Object Storage-Buckets verfügbar sind, werden sie automatisch für die Verarbeitung mit Data Integration abgerufen.

  • Oracle Fusion Service-Integration

    OCI Data Integration verwendet Oracle Business Intelligence Cloud Connector (BICC), um Verbindungen zu Fusion-Anwendungen als Datenquellen zu ermöglichen. Sie verwenden ein Fusion Applications-Datenasset als Quelle, um Daten aus Fusion Applications, wie einer ERP- oder HCM-Cloud, zu extrahieren. OCI Data Integration lädt die extrahierten Daten in einen vordefinierten externen Speicherort, der in BICC konfiguriert ist. Wir laden die Daten aus Fusion-Anwendungen in Oracle Cloud Infrastructure Object Storage im Parquet-Format und dann in die Staging-Schicht von ADW.

Die Architektur umfasst die folgenden Komponenten:

  • Mandant

    Ein Mandant ist eine sichere und isolierte Partition, die Oracle bei der Registrierung für Oracle Cloud Infrastructure in Oracle Cloud einrichtet. Sie können Ihre Ressourcen in Oracle Cloud in Ihrem Mandanten erstellen, organisieren und verwalten. Ein Mandant ist synonym zu einem Unternehmen oder einer Organisation. In der Regel verfügt ein Unternehmen über einen einzelnen Mandanten und spiegelt dessen Organisationsstruktur in diesem Mandanten wider. Ein einzelner Mandant ist in der Regel mit einem einzelnen Abonnement verknüpft, und ein einzelnes Abonnement hat in der Regel nur einen Mandanten.

  • Region

    Eine Oracle Cloud Infrastructure-Region ist ein lokalisierter geografischer Bereich, der mindestens ein Data Center enthält, das als Availability-Domains bezeichnet wird. Regionen sind unabhängig von anderen Regionen, und große Entfernungen können sie voneinander trennen (innerhalb von Ländern oder sogar Kontinenten).

  • Compartment

    Compartments sind regionsübergreifende logische Partitionen in einem Oracle Cloud Infrastructure-Mandanten. In Compartments können Sie Ihre Ressourcen in Oracle Cloud organisieren, den Zugriff auf die Ressourcen kontrollieren und Nutzungs-Quotas festlegen. Um den Zugriff auf die Ressourcen in einem bestimmten Compartment zu kontrollieren, definieren Sie Policys, mit denen angegeben wird, wer auf die Ressourcen zugreifen kann und welche Aktionen sie ausführen können.

  • Autonomous Database

    Oracle Autonomous Database ist eine vollständig verwaltete, vorkonfigurierte Datenbankumgebung, die Sie für Transaktionsverarbeitungs- und Data Warehousing-Workloads verwenden können. Sie müssen keine Hardware konfigurieren oder verwalten und keine Software installieren. Oracle Cloud Infrastructure verwaltet das Erstellen der Datenbank sowie Backup, Patching, Upgrade und Optimierung der Datenbank.

  • Analysen

    Oracle Analytics Cloud ist ein skalierbarer und sicherer Public Cloud-Service, mit dem Geschäftsanalysten moderne, KI-gesteuerte Selfserviceanalysefunktionen für Datenvorbereitung, Visualisierung, Unternehmensberichte, erweiterte Analysen sowie Natural Language Processing und -generierung erhalten. Mit Oracle Analytics Cloud erhalten Sie außerdem flexible Service-Management-Funktionen, darunter schnelles Setup, einfache Skalierung und Patching sowie automatisiertes Lifecycle Management.

  • Object Storage

    Mit Object Storage erhalten Sie schnellen Zugriff auf große Mengen an strukturierten und unstrukturierten Daten eines beliebigen Inhaltstyps, darunter Datenbankbackups, Analysendaten und umfangreiche Inhalte, wie Bilder und Videos. Sie können Daten sicher und geschützt speichern und dann direkt aus dem Internet oder aus der Cloud-Plattform abrufen. Sie können den Speicher nahtlos skalieren, ohne dass die Performance oder Servicezuverlässigkeit beeinträchtigt wird. Verwenden Sie Standardspeicher für "Hot Storage", auf den Sie schnell, sofort und häufig zugreifen müssen. Verwenden Sie Archivspeicher für "Cold Storage", den Sie über lange Zeiträume beibehalten möchten und auf den Sie nur selten zugreifen.

  • Availability-Domains

    Availability-Domains sind eigenständige, unabhängige Data Center innerhalb einer Region. Die physischen Ressourcen in jeder Availability-Domain sind von den Ressourcen in den anderen Availability-Domains isoliert, was eine Fehlertoleranz sicherstellt. Availability-Domains haben keine gemeinsame Infrastruktur wie Stromversorgung oder Kühlung oder das interne Availability-Domainnetzwerk. Aus diesem Grund ist es wahrscheinlich, dass ein Fehler in einer Availability-Domain sich auf die anderen Availability-Domains in der Region auswirkt.

  • Virtual Cloud Network (VCN) und Subnetze

    Ein VCN ist ein anpassbares, Software-definiertes Netzwerk, das Sie in einer Oracle Cloud Infrastructure-Region einrichten können. Wie herkömmliche Data Center-Netzwerke erhalten Sie mit VCNs vollständige Kontrolle über Ihre Netzwerkumgebung. Ein VCN kann mehrere sich nicht überschneidende CIDR-Blöcke aufweisen, die Sie nach dem Erstellen des VCN ändern können. Sie können ein VCN in Subnetze segmentieren, die sich auf eine Region oder eine Availability-Domain beschränken. Jedes Subnetz besteht aus einem Bereich zusammenhängender Adressen, die sich nicht mit anderen Subnetzen im VCN überschneiden. Sie können die Größe eines Subnetzes nach der Erstellung ändern. Ein Subnetz kann öffentlich oder privat sein.

  • OCI-Integrationsservices

    OCI-Integrationsservices verbinden jede Anwendung und Datenquelle, um End-to-End-Prozesse zu automatisieren und das Management zu zentralisieren. Das breite Spektrum an Integrationen mit vordefinierten Adaptern und Low-Code-Anpassung vereinfacht die Migration in die Cloud und optimiert gleichzeitig Multicloud-Vorgänge.

  • OCI-Anwendungsintegration

    OCI Application Integration bietet eine vordefinierte Verbindung zu SaaS- und On-Premise-Anwendungen, einsatzbereiten Prozessautomatisierungsvorlagen und einen Low-Code-Visual Builder für die Entwicklung von Webanwendungen und Apps. Sie erhalten nativen Zugriff auf Ereignisse in Oracle Cloud ERP, HCM und CX. Verbinden Sie app-spezifische Analysesilos, um Anforderungen, Rekrutierung, Zahlungsabwicklung, Lead-to-Rechnung und andere wichtige Prozesse zu vereinfachen und Ihren IT- und Geschäftsführern End-to-End-Transparenz zu bieten.

  • Data Integration

    Oracle Cloud Infrastructure Data Integration ist ein vollständig verwalteter, serverloser, cloud-nativer Service, der Daten aus einer Vielzahl von Datenquellen in Oracle Cloud Infrastructure-Zielservices, wie Autonomous Data Warehouse und Oracle Cloud Infrastructure Object Storage, extrahiert, lädt, transformiert, bereinigt und neu ausbildet. ETL (Extract Transform Load) nutzt die vollständig verwaltete Scale-out-Verarbeitung in Spark. ELT (Extract Load Transform) nutzt vollständige SQL-Push-Down-Funktionen von Autonomous Data Warehouse, um die Datenverschiebung zu minimieren und die Time-to-Value für neu aufgenommene Daten zu verbessern. Benutzer entwerfen Datenintegrationsprozesse mit einer intuitiven, kodlosen Benutzeroberfläche, die Integrationsabläufe optimiert. So werden die effizienteste Engine und Orchestrierung generiert und die Ausführungsumgebung automatisch zugewiesen und skaliert. Oracle Cloud Infrastructure Data Integration bietet interaktive Exploration und Datenvorbereitung. Außerdem können Data Engineers sich vor Schemaabweichungen schützen, indem sie Regeln zur Verarbeitung von Schemaänderungen definieren.

Bestätigungen

Authors: Parag Pardhi

Contributors: Wei Han, Daryl Eicher, John Sulyok