Plate-forme de données - Data Warehouse avec intégration E-Business
Les analystes ont besoin d'un moyen efficace pour consolider les données de plusieurs systèmes financiers, feuilles de calcul et autres sources de données dans une source fiable, gérable et optimisée pour les requêtes.
Avec Oracle Autonomous Data Warehouse (ADW) et Oracle Analytics Cloud, vous pouvez charger et optimiser les données d'Oracle E-Business Suite et d'autres sources dans un entrepôt de données centralisé pour analyse afin que les services puissent obtenir des informations exploitables.
Cette architecture de référence positionne la solution technologique dans le contexte métier global :
Les secteurs d'activité n'ont généralement pas d'accès rapide ou efficace aux données et aux informations. Les analystes collectent les données manuellement, les utilisent individuellement, puis partagent des copies des fichiers via des serveurs de messagerie ou de fichiers. Les données ne sont pas centralisées, il est donc difficile de garantir leur précision et leur sécurité. L'analyse peut prendre beaucoup de temps et les résultats ne peuvent pas facilement être répétés.
Un datamart est une forme simple d'entrepôt de données qui se concentre sur un seul sujet ou domaine fonctionnel, comme les ventes, le marketing ou la finance, et qui sont souvent construits et contrôlés par un seul service au sein d'une organisation. Compte tenu de leur objectif à un seul sujet, les datamarts ne tirent généralement que de quelques sources de données. Les sources peuvent inclure des systèmes internes, un entrepôt de données central ou des données externes.
Les entrepôts de données et les datamarts régis peuvent fournir des informations riches aux utilisateurs professionnels et fournir plus efficacement les indicateurs clés de performance de l'entreprise sans dépendre fortement des ressources et de la disponibilité informatiques.
Architecture
Cette architecture utilise les transformations de données, une fonctionnalité incluse dans Oracle Autonomous Data Warehouse, pour charger et optimiser les données de plusieurs sources dans une instance Autonomous Data Warehouse centralisée, puis utilise Oracle Analytics Cloud pour analyser les données afin de fournir des informations exploitables.

Description de l'illustration data-platform-ebs.png
L'architecture se concentre sur les divisions logiques suivantes :
- Assimilation, transformation
Ingère et affine les données à utiliser dans chacune des couches de données de l'architecture.
- Persister, créer, créer
Facilite l'accès et la navigation aux données pour afficher la vue métier actuelle. Pour les technologies relationnelles, les données peuvent être logiques ou physiquement structurées sous des formes relationnelles, longitudinales, dimensionnelles ou OLAP simples. Pour les données non relationnelles, cette couche contient un ou plusieurs pools de données, provenant soit d'un processus analytique, soit de données optimisées pour une tâche analytique spécifique.
- Analyser, apprendre, prévoir
Abstrait la vue logique des données pour les consommateurs. Cette abstraction facilite les approches agiles en matière de développement, de migration vers l'architecture cible et la fourniture d'une couche de reporting unique à partir de plusieurs sources fédérées.
Le schéma suivant présente une mise en correspondance de l'architecture ci-dessus avec les services fournis sur Oracle Cloud Infrastructure à l'aide des meilleures pratiques de sécurité.
L'architecture comprend les composants suivants :
- Autonomous Data Warehouse
Oracle Autonomous Data Warehouse est un service de base de données à pilotage, sécurité et réparation automatiques, optimisé pour les charges de travail d'entreposage de données. Il n'est pas nécessaire de configurer ou de gérer du matériel, ni d'installer un logiciel. Oracle Cloud Infrastructure gère la création de la base de données, ainsi que la sauvegarde, l'application de patches, la mise à niveau et le réglage de la base de données.
- Data Integration
Oracle Data Transforms est un outil d'intégration Oracle Data Integrator (ODI) qui peut être déployé à partir d'actions de base de données Autonomous Database (outils de base de données). Elle fournit une solution entièrement unifiée pour la création, le déploiement et la gestion d'entrepôts de données complexes ou dans le cadre d'architectures orientées données dans un environnement SOA ou Business Intelligence. En outre, il combine tous les éléments de l'intégration des données, du déplacement des données, de la synchronisation des données, de la qualité des données et de la gestion des données, afin de garantir que les informations sont à jour, précises et cohérentes dans les systèmes complexes.
- Analyses
Oracle Analytics Cloud est un service cloud public évolutif et sécurisé qui offre aux analystes d'entreprise des fonctions d'analyse modernes en libre-service basées sur l'IA pour la préparation, la visualisation, le reporting d'entreprise, l'analyse augmentée, ainsi que le traitement et la génération de langage naturel. Grâce à Oracle Analytics Cloud, vous bénéficiez également de fonctionnalités de gestion des services flexibles, telles que la configuration rapide, la mise à l'échelle et l'application de patches, ainsi que la gestion automatisée du cycle de vie.
L'architecture comprend également les composants suivants :
- Région
Une région Oracle Cloud Infrastructure est une zone géographique localisée qui contient des centres de données, appelés domaines de disponibilité. Les régions sont indépendantes des autres régions, et de grandes distances peuvent les séparer (entre les pays ou même les continents).
- Compartiment
Les compartiments sont des partitions logiques inter-région au sein d'une location Oracle Cloud Infrastructure. Utilisez des compartiments pour organiser vos ressources dans Oracle Cloud, contrôler l'accès aux ressources et définir des quotas d'utilisation. Pour contrôler l'accès aux ressources d'un compartiment donné, vous définissez des stratégies qui indiquent qui peut accéder aux ressources et les actions réalisables.
- Identity and Access Management (IAM)
Oracle Cloud Infrastructure Identity and Access Management (IAM) est le plan de contrôle d'accès pour Oracle Cloud Infrastructure (OCI) et les applications Oracle Cloud. L'API IAM et l'interface utilisateur vous permettent de gérer les domaines d'identité et les ressources au sein du domaine d'identité. Chaque domaine d'identité OCI IAM représente une solution autonome de gestion des identités et des accès ou une population d'utilisateurs différente.
- Stratégie
Une stratégie Oracle Cloud Infrastructure Identity and Access Management indique qui peut accéder à quelles ressources et comment. L'accès est accordé au niveau du groupe et du compartiment, ce qui signifie que vous pouvez écrire une stratégie qui donne à un groupe un type d'accès spécifique au sein d'un compartiment spécifique ou à la location.
- Domaine de disponibilité
Les domaines de disponibilité sont des centres de données autonomes et indépendants au sein d'une région. Les ressources physiques de chaque domaine de disponibilité sont isolées des ressources des autres domaines de disponibilité, ce qui garantit la tolérance aux pannes. Les domaines de disponibilité ne partagent pas les mêmes infrastructures : alimentation, refroidissement ou réseau de domaine de disponibilité interne. Ainsi, il est peu probable qu'un problème survenant dans un domaine de disponibilité affecte les autres domaines de disponibilité de la région.
- Réseau cloud virtuel (VCN) et sous-réseau
Un VCN est un réseau personnalisable défini par logiciel que vous configurez dans une région Oracle Cloud Infrastructure. Tout comme les réseaux de centres de données traditionnels, les réseaux cloud virtuels vous donnent un contrôle total sur votre environnement réseau. Un VCN peut comporter plusieurs blocs CIDR qui ne se chevauchent pas et que vous pouvez modifier après avoir créé le VCN. Vous pouvez segmenter un VCN en sous-réseaux, qui peuvent être ciblés vers une région ou vers un domaine de disponibilité. Chaque sous-réseau se compose d'une plage contiguë d'adresses qui ne chevauchent pas les autres sous-réseaux du VCN. Vous pouvez modifier la taille d'un sous-réseau après sa création. Un sous-réseau peut être public ou privé.
- Passerelle Internet
La passerelle Internet autorise le trafic entre les sous-réseaux publics d'un réseau VCN et le réseau Internet public.
- VPN site à site
Le VPN site à site fournit une connectivité VPN IPSec entre votre réseau on-premise et vos réseaux cloud virtuels dans Oracle Cloud Infrastructure. La suite de protocoles IPSec chiffre le trafic IP avant que les paquets ne soient transférés de la source vers la destination et déchiffre le trafic à son arrivée.
- Passerelle de routage dynamique (DRG)
Le DRG est un routeur virtuel qui fournit un chemin pour le trafic réseau privé entre les réseaux cloud virtuels de la même région, entre un VCN et un réseau en dehors de la région, tel qu'un VCN dans une autre région Oracle Cloud Infrastructure, un réseau sur site ou un réseau dans un autre fournisseur cloud.
- Passerelle NAT (Network Address Translation)
Une passerelle NAT permet aux ressources privées d'un VCN d'accéder à des hôtes sur Internet, sans les exposer aux connexions Internet entrantes.
- Passerelle de service
La passerelle de service fournit l'accès d'un VCN à d'autres services, tels qu'Oracle Cloud Infrastructure Object Storage. Le trafic du VCN vers le service Oracle transite par la structure réseau Oracle et ne traverse jamais Internet.
- Table de routage
Les tables de routage virtuelles contiennent des règles permettant d'acheminer le trafic de sous-réseaux vers des destinations en dehors d'un VCN, généralement via des passerelles.
- Liste de sécurité
Pour chaque sous-réseau, vous pouvez créer des règles de sécurité qui spécifient la source, la destination et le type de trafic à autoriser à l'entrée et à la sortie du sous-réseau.
- Groupe de sécurité réseau
Le groupe de sécurité réseau agit comme un pare-feu virtuel pour vos ressources cloud. Avec le modèle de sécurité zéro confiance d'Oracle Cloud Infrastructure, tout le trafic est refusé et vous pouvez contrôler le trafic réseau à l'intérieur d'un VCN. Un groupe de sécurité réseau se compose d'un ensemble de règles de sécurité entrantes et sortantes qui s'appliquent uniquement à un ensemble spécifié de cartes d'interface réseau virtuelles dans un seul VCN.
- Hôte bastion
Le bastion est une instance de calcul qui sert de point d'entrée sécurisé et contrôlé vers la topologie à partir de l'extérieur du cloud. Le bastion est généralement provisionné dans une zone démilitarisée (DMZ). Il vous permet de protéger les ressources sensibles en les plaçant dans des réseaux privés inaccessibles directement à partir de l'extérieur du cloud. La topologie comporte un seul point d'entrée connu que vous pouvez surveiller et auditer régulièrement. Vous pouvez donc éviter d'exposer les composants les plus sensibles de la topologie sans compromettre leur accès.
- Object Storage
Object Storage offre un accès rapide à de grandes quantités de données structurées et non structurées de tout type de contenu, notamment des sauvegardes de base de données, des données analytiques et des contenus enrichis tels que des images et des vidéos. Vous pouvez stocker les données, puis les extraire directement à partir d'Internet ou de la plate-forme cloud, et ce, en toute sécurité. Vous pouvez faire évoluer le stockage de manière transparente sans subir de dégradation des performances ou de la fiabilité du service. Utilisez le stockage standard pour le stockage "à chaud" auquel vous devez accéder rapidement, immédiatement et fréquemment. Utilisez le stockage d'archives pour le stockage "à froid" que vous conservez pendant de longues périodes et auquel vous accédez rarement.
Recommandations
Utilisez les recommandations suivantes comme point de départ pour charger et optimiser les données d'Oracle E-Business Suite et d'autres sources dans un entrepôt de données centralisé à des fins d'analyse.
Vos exigences peuvent différer de l'architecture décrite ici.
- Raffinerie de données
Avec Data Transforms, service intégré d'Oracle Autonomous Data Warehouse, vous pouvez créer des mappings entre vos sources de données et vos cibles pour affiner et nettoyer les données à l'aide des méthodes ETL et E-LT.
- Intégration des données pour prendre en charge EBS
Les modules de connaissances d'Oracle E-Business Suite vous aident à extraire des données des applications métier et à les intégrer au data warehouse avec des correspondances régulières à partir d'une instance Oracle Database.
- Oracle Analytics Cloud
Avant de connecter Oracle Analytics Cloud à Oracle Autonomous Data Warehouse, demandez à un administrateur de base de données d'ajouter l'adresse IP (ou la plage d'adresses) de votre instance Oracle Analytics Cloud à la liste des adresses approuvées. L'administrateur de base de données doit ajouter une règle de sécurité autorisant le trafic TCP/IP d'Oracle Analytics Cloud à la base de données.
Remarques
Lors du chargement et de l'optimisation des données à partir d'Oracle E-Business Suite et d'autres sources dans un emplacement de data warehouse centralisé à des fins d'analyse, envisagez les options d'implémentation suivantes.
Instructions | Raffinerie de données | Plate-forme de persistance des données | Accès et interprétation |
---|---|---|---|
Recommandé | Outils Oracle Autonomous Data Warehouse | Oracle Autonomous Data Warehouse | Oracle Analytics Cloud |
Autres options | Oracle Data Integrator | Oracle Exadata Database Service | |
Raisonnement | Oracle Autonomous Data Warehouse inclut un ensemble de fonctionnalités intégré et facile à utiliser permettant l'assimilation et l'affinement des données. Ces outils sont disponibles dans le menu Actions de base de données. | Oracle Autonomous Data Warehouse est une base de données entièrement autonome et simple d'utilisation qui évolue de manière flexible, offre des performances de requête rapides et ne nécessite aucune administration de base de données. Il offre également un accès direct aux données du stockage d'objets via des tables externes. | Oracle Analytics Cloud est une solution entièrement gérée et étroitement intégrée à la couche de données organisée (Oracle Autonomous Data Warehouse). |
Déployer
Le code Terraform de cette architecture de référence est disponible dans GitHub. Vous pouvez extraire le code dans Oracle Cloud Infrastructure Resource Manager en un seul clic, créer la pile et la déployer. Vous pouvez également télécharger le code à partir de GitHub sur votre ordinateur, le personnaliser et le déployer à l'aide de l'interface de ligne de commande Terraform.
- Déployer à l'aide d'Oracle Cloud Infrastructure Resource Manager :
- Cliquez sur
.
Si vous n'êtes pas déjà connecté, entrez les informations d'identification de la location et de l'utilisateur.
- Consultez et acceptez les conditions générales.
- Sélectionnez la région de déploiement de la pile.
- Suivez les instructions et les invites à l'écran pour créer la pile.
- Après avoir créé la pile, cliquez sur Actions Terraform et sélectionnez Planifier.
- Attendre la fin du travail, puis vérifier le plan.
Pour apporter des modifications, revenez à la page Détails de la pile, cliquez sur Modifier la pile et apportez les modifications requises. Exécutez ensuite à nouveau l'action Plan.
- Si aucune autre modification n'est nécessaire, revenez à la page Détails de la pile, cliquez sur Actions Terraform, puis sélectionnez Appliquer.
- Cliquez sur
- Déployer à l'aide de l'interface de ligne de commande Terraform :
- Accédez à GitHub.
- Suivez les instructions du document
README
.
Voir plus
En savoir plus sur les architectures associées et sur les fonctionnalités de cette architecture.
-
Structure des meilleures pratiques pour Oracle Cloud Infrastructure
-
Entreposage de données par service - consolider les feuilles de calcul
-
Stockage de données moderne : exemple d'intégration multi-langage
-
Développement d'applications modernes - Big Data et analyses
-
Oracle E-Business Suite dans le Guide des adaptateurs d'application pour Oracle Data Integrator
Journal des modifications
Ce journal répertorie uniquement les modifications importantes :
28 novembre 2022 |
|
21 avril 2021 | Diagramme mis à jour pour afficher une couche de communication qui connecte les entités cloud et on-premise aux ressources régionales. |
29 novembre 2021 | Ajout de l'option pour télécharger les versions modifiables (.SVG et .DRAWIO) du diagramme d'architecture. |
4 décembre 2020 | Ajout d'étapes pour déployer l'architecture à l'aide d'Oracle Cloud Infrastructure Resource Manager. |
Juin 29, 2020 | Mise à jour du lien GitHub pour pointer vers le dossier de cas d'utilisation spécifique dans le dossier du projet. |