A propos de l'utilisation d'Oracle Modern Data Platform pour le reporting et les prévisions métier

Cette conception explore l'utilisation d'Oracle Modern Data Platform pour le reporting et les prévisions métier.

Prenons le cas où une entreprise dispose d'une grande quantité de données sur les ventes de produits provenant de sources internes et externes. Bien que les données historiques et récentes sur les ventes aient une valeur pour l'entreprise, seules les données des derniers mois ou années sont utilisées dans les activités quotidiennes. Les consommateurs de ces données sont des utilisateurs professionnels qui utilisent ces données à des fins de reporting, d'analyse et de prévision. Ils souhaitent que leurs rapports et tableaux de bord génèrent rapidement des résultats pour optimiser la productivité du personnel.

Traditionnellement, les entreprises s'appuyaient sur des entrepôts de données basés sur des bases de données relationnelles pour signaler des cas d'utilisation tels que celui mentionné ci-dessus. Cependant, ces implémentations présentaient plusieurs limitations - l'évolutivité et les performances étant les plus importantes de ces limitations.

Architecture

Une approche plus moderne consiste à utiliser une architecture de data lakehouse composée d'OCI Object Storage, de technologies Big Data telles que Hadoop, Spark et d'une base de données en colonne ou traditionnelle pour le reporting.

Oracle Cloud Infrastructure (OCI) dispose d'un large éventail d'outils et de services qui s'adaptent à tous les aspects d'une plate-forme de données moderne. Dans cette solution, nous examinons un petit sous-ensemble de services OCI qui répondent aux exigences architecturales.

  1. OCI Object Storage : plateforme de stockage hautes performances, à l'échelle d'Internet, qui offre une durabilité fiable et rentable en matière de données. Il peut stocker une quantité illimitée de données non structurées de tout type de contenu, y compris des données analytiques et du contenu riche, comme des images et des vidéos.
  2. Oracle Big Data Service : service Hadoop géré conçu pour un ensemble divers de cas d'emploi et de charges globales Big Data. Des grappes de courte durée utilisées pour traiter des tâches spécifiques aux grappes de longue durée pouvant évoluer horizontalement pour répondre aux besoins d'une organisation à faible coût et avec les plus hauts niveaux de sécurité.
  3. Oracle Autonomous Database : base de données facile à utiliser et entièrement autonome, d'une capacité élastique et sur laquelle les performances des requêtes sont excellentes. En tant que service, Autonomous Database ne nécessite pas d'administration de base de données.
  4. Oracle Analytics Cloud : service cloud public évolutif et sécurisé qui permet aux analystes d'entreprise et aux clients de bénéficier de fonctions d'analyse modernes en libre-service basées sur l'intelligence artificielle, à des fins de préparation des données, de visualisation, de reporting d'entreprise, d'analyse augmentée et de traitement du langage naturel.

L'image suivante illustre l'architecture.
La description de oci-modern-data-reporting-arch.png suit
Description de l'illustration oci-modern-data-reporting-arch.png

oci-modern-data-reporting-arch-oracle.zip

Chacun des composants d'architecture répertoriés ci-dessus fonctionne de la manière suivante :
  • La couche OCI Object Storage offre un moyen fiable et rentable de stocker d'énormes quantités de données. Avec Object Storage, vous disposez d'une banque de données de persistance commune qui peut être utilisée par plusieurs outils et services. Cela garantit également que la couche de traitement des données peut être mise à l'échelle indépendamment du stockage.
  • La couche de traitement Oracle Big Data Service fournit une plate-forme pour l'inclusion, la transformation et l'agrégation de quantités de données en masse.
  • La couche de base de données sert de méthode rapide et efficace au service des outils de reporting client avec des données organisées. Les données récentes ou pertinentes sont conservées dans cette couche.
  • Oracle Analytics Cloud permet de visualiser les données et de faire des prévisions.

Cette architecture prend en charge les composants suivants :

  • OCI Data Integration

    Oracle Cloud Infrastructure Data Integration est un service cloud natif, sans serveur et entièrement géré qui extrait, charge, transforme, nettoie et remodèle les données de diverses sources de données en services Oracle Cloud Infrastructure cible, tels qu'Autonomous Data Warehouse et Oracle Cloud Infrastructure Object Storage. ETL (extract transform load) tire parti du traitement évolutif entièrement géré sur Spark, et ELT (extract load transform) tire parti des fonctionnalités de propagation SQL complètes d'Autonomous Data Warehouse afin de minimiser le déplacement des données et d'améliorer le délai de rentabilisation des données nouvellement ingérées. Les utilisateurs conçoivent des processus d'intégration de données à l'aide d'une interface utilisateur intuitive et sans code qui optimise les flux d'intégration pour générer le moteur et l'orchestration les plus efficaces, en allouant et en redimensionnant automatiquement l'environnement d'exécution. Oracle Cloud Infrastructure Data Integration fournit une exploration interactive et une préparation des données, et aide les ingénieurs de données à se protéger contre la dérive de schéma en définissant des règles pour gérer les modifications de schéma.

  • Streaming

    Oracle Cloud Infrastructure Streaming offre une solution de stockage entièrement gérée, évolutive et durable adaptée aux flux de données importants transmis en continu, que vous pouvez utiliser et traiter en temps réel. Vous pouvez utiliser Streaming pour l'inclusion de grands volumes de données telles que les journaux d'application, la télémétrie opérationnelle et les données de flux de clics sur le Web. Vous pouvez également pour d'autres cas d'emploi dans lesquels des données sont produites et traitées de manière continue et séquentielle suivant un modèle d'échange de messages de publication/abonnement.