Déploiement d'une plate-forme d'analyse pour Informatica IDMC sur Oracle Cloud
Le partenariat entre Oracle et Informatica rassemble deux leaders du secteur en matière de gestion des données et des bases de données afin d'offrir un entrepôt de données complet et un écosystème d' Lakehouse.
Cette architecture de référence montre comment l'agent sécurisé IDMC Informatica fonctionne dans Oracle Cloud Infrastructure (OCI). Les données peuvent être exportées à partir d'un large éventail de sources sur site et cloud à l'aide de l'un des plus de 300 connecteurs, puis importées dans Oracle Autonomous Database pour être utilisées par des processus d'analyse ou de science des données.
Sans cette intégration, nous pouvons accéder à des informations exploitables à partir de nos données d'application (par exemple, Oracle E-Business Suite), mais nous ne pouvons pas les enrichir avec d'autres sources de données pour obtenir des informations précieuses. Il n'est pas non plus recommandé d'exécuter des charges de travail analytiques sur des systèmes opérationnels.
Cette architecture de référence positionne la solution technologique dans le contexte commercial global :
L'intégration fournit une plate-forme analytique sur laquelle les données d'application contenant un enregistrement des interactions sont combinées avec d'autres ensembles de données traitées dans la couche de gestion et sont affinées en informations exploitables et en informations exploitables dans la couche d'exploitation.
Architecture
Cette architecture de référence montre comment l'agent sécurisé IDMC Informatica fonctionne dans Oracle Cloud Infrastructure (OCI). Les données sont exportées à partir d'applications, de fichiers, de banques d'objets et de bases de données d'entreprise sur site et dans le cloud, puis importées dans Oracle Autonomous Database pour être utilisées par des processus d'analyse ou de science des données.
Le schéma suivant est une représentation fonctionnelle de l'architecture de référence.
En général, l'architecture comprend les divisions logiques suivantes. Cette architecture de référence se concentre sur les composants de l'architecture de raffinage et de persistance des données :
- Assimilation, transformation
Ingère et affine les données à utiliser dans chacune des couches de données de l'architecture.
- Persister, Curer, Créer
Facilite l'accès et la navigation aux données pour afficher la vue métier actuelle et historique. Il contient à la fois des données brutes et des données granulaires et agrégées. Pour les technologies relationnelles, les données peuvent être logiques ou physiquement structurées sous des formes relationnelles, longitudinales, dimensionnelles ou OLAP simples. Pour les données non relationnelles, cette couche contient un ou plusieurs pools de données, issus d'un processus analytique ou optimisés pour une tâche analytique spécifique.
Oracle Autonomous Data Warehouse est un service de base de données doté de fonctions d'autopilotage, d'autosécurisation et d'autoréparation optimisé pour les charges de travail d'entreposage de données. Vous n'avez pas besoin de configurer ou de gérer du matériel, ni d'installer un logiciel. Oracle Cloud Infrastructure gère la création de la base de données, ainsi que la sauvegarde, l'application de patches, la mise à niveau et le réglage de la base de données.
- Analyser, apprendre, prédire
Abstraction de la vue logique métier des données pour les consommateurs. Cette abstraction facilite les approches agiles du développement, de la migration vers l'architecture cible et de la fourniture d'une couche de reporting unique à partir de plusieurs sources fédérées.
Informatica-oci-arch-oracle.zip
Dans l'architecture ci-dessus, la forme de calcul héberge l'agent sécurisé Informatica Cloud. L'agent Informatica Cloud Secure Agent est un programme léger qui exécute toutes les tâches et permet une communication sécurisée entre votre organisation et Informatica Intelligent Data Management Cloud. Lorsque l'agent sécurisé exécute une tâche, il se connecte à la fonction d'hébergement Informatica Cloud pour accéder aux informations sur les tâches. Il se connecte directement et en toute sécurité aux sources et aux cibles, transfère les données entre elles, orchestre le flux des tâches, exécute les processus et effectue toute tâche supplémentaire requise.
L'architecture comprend les composants suivants :
- Location
Une location est une partition sécurisée et isolée qu'Oracle configure dans Oracle Cloud lorsque vous êtes inscrit à Oracle Cloud Infrastructure. Vous pouvez créer, organiser et administrer vos ressources dans Oracle Cloud au sein de votre location. Une location est synonyme d'entreprise ou d'organisation. Généralement, une entreprise dispose d'une location unique et reflète sa structure organisationnelle dans cette location. Une location unique est généralement associée à un seul abonnement et un seul abonnement ne comporte généralement qu'une seule location.
- Région
Une région Oracle Cloud Infrastructure est une zone géographique localisée qui contient des centres de données, appelés domaines de disponibilité. Les régions sont indépendantes les unes des autres et de grandes distances peuvent les séparer (dans les pays ou même les continents).
- Domaine de disponibilité
Les domaines de disponibilité sont des centres de données autonomes et indépendants au sein d'une région. Les ressources physiques de chaque domaine de disponibilité sont isolées des ressources des autres domaines de disponibilité, ce qui garantit la tolérance aux pannes. Les domaines de disponibilité ne partagent pas d'infrastructure telle que l'alimentation ou le refroidissement, ni le réseau interne du domaine de disponibilité. Ainsi, il est peu probable qu'un échec dans un domaine de disponibilité affecte les autres domaines de disponibilité de la région.
- Compartiment
Les compartiments sont des partitions logiques inter-région au sein d'une location Oracle Cloud Infrastructure. Utilisez des compartiments pour organiser vos ressources dans Oracle Cloud, contrôler l'accès aux ressources et définir des quotas d'utilisation. Pour contrôler l'accès aux ressources d'un compartiment donné, vous définissez des stratégies qui indiquent qui peut accéder aux ressources et quelles actions elles peuvent effectuer.
- Réseau cloud virtuel (VCN) et sous-réseaux
Un VCN est un réseau personnalisable défini par logiciel que vous configurez dans une région Oracle Cloud Infrastructure. Tout comme les réseaux de centres de données traditionnels, les réseaux cloud virtuels vous donnent un contrôle total sur votre environnement réseau. Un VCN peut comporter plusieurs blocs CIDR qui ne se chevauchent pas et que vous pouvez modifier après avoir créé le VCN. Vous pouvez segmenter un VCN en sous-réseaux, qui peuvent être ciblés vers une région ou vers un domaine de disponibilité. Chaque sous-réseau se compose d'une plage contiguë d'adresses qui ne chevauchent pas les autres sous-réseaux du VCN. Vous pouvez modifier la taille d'un sous-réseau après sa création. Un sous-réseau peut être public ou privé.
- Liste de sécurité
Pour chaque sous-réseau, vous pouvez créer des règles de sécurité qui spécifient la source, la destination et le type de trafic à autoriser à l'entrée et à la sortie du sous-réseau.
- Table de routage
Les tables de routage virtuelles contiennent des règles permettant d'acheminer le trafic de sous-réseaux vers des destinations en dehors d'un VCN, généralement via des passerelles.
- Passerelle Internet
La passerelle Internet autorise le trafic entre les sous-réseaux publics d'un réseau VCN et le réseau Internet public.
- Passerelle NAT (Network Address Translation)
Une passerelle NAT permet aux ressources privées d'un VCN d'accéder à des hôtes sur Internet, sans les exposer aux connexions Internet entrantes.
- passerelle de service
La passerelle de service fournit l'accès d'un VCN à d'autres services, tels qu'Oracle Cloud Infrastructure Object Storage. Le trafic du VCN vers le service Oracle transite par la structure réseau Oracle et ne traverse jamais Internet.
- Service de bastion
Le bastion Oracle Cloud Infrastructure fournit un accès sécurisé limité et limité dans le temps aux ressources qui n'ont pas d'adresses publiques et qui nécessitent des contrôles stricts d'accès aux ressources, tels que Bare Metal et machines virtuelles, Oracle MySQL Database Service, Autonomous Transaction Processing (ATP), Oracle Container Engine for Kubernetes (OKE) et toute autre ressource qui autorise l'accès SSH (Secure Shell Protocol). Avec le service Oracle Cloud Infrastructure Bastion, vous pouvez activer l'accès aux hôtes privés sans déployer ni gérer d'hôte Jump. En outre, vous obtenez un meilleur état de sécurité avec des droits d'accès basés sur l'identité et une session SSH centralisée, auditée et liée au temps. Le bastion Oracle Cloud Infrastructure élimine le besoin d'une adresse IP publique pour le bastion, éliminant ainsi les tracas et la surface d'attaque potentielle lors de la fourniture d'un accès à distance.
- Compute
Le service Oracle Cloud Infrastructure Compute vous permet de provisionner et de gérer des hôtes de calcul dans le cloud. Vous pouvez lancer des instances de calcul avec des formes qui répondent aux besoins en ressources pour l'UC, la mémoire, la bande passante réseau et le stockage. Une fois qu'une instance de calcul est créée, vous pouvez y accéder en toute sécurité, la redémarrer, attacher et détacher des volumes, puis y mettre fin lorsque vous n'en avez plus besoin.
- Identity and Access Management (IAM)
Oracle Cloud Infrastructure Identity and Access Management (IAM) est le plan de contrôle d'accès pour Oracle Cloud Infrastructure (OCI) et les applications Oracle Cloud. L'API IAM et l'interface utilisateur vous permettent de gérer les domaines d'identité et les ressources au sein du domaine d'identité. Chaque domaine d'identité OCI IAM représente une solution autonome de gestion des identités et des accès ou une population d'utilisateurs différente.
- Stratégie
Une stratégie Oracle Cloud Infrastructure Identity and Access Management spécifie qui peut accéder à quelles ressources et comment. L'accès est accordé au niveau du groupe et du compartiment, ce qui signifie que vous pouvez écrire une stratégie qui offre à un groupe un type d'accès spécifique dans un compartiment spécifique ou dans la location.
- Stockage d'objets
Object Storage offre un accès rapide à de grandes quantités de données structurées et non structurées de tout type de contenu, notamment des sauvegardes de base de données, des données analytiques et des contenus enrichis tels que des images et des vidéos. Vous pouvez stocker et extraire en toute sécurité des données directement à partir d'Internet ou de la plate-forme cloud. Vous pouvez faire évoluer le stockage de manière transparente sans subir de dégradation des performances ou de la fiabilité du service. Utilisez le stockage standard pour le stockage "à chaud" auquel vous devez accéder rapidement, immédiatement et fréquemment. Utilisez le stockage d'archives pour le stockage "à froid" que vous conservez pendant de longues périodes et auquel vous accédez rarement.
- Autonomous Data Warehouse
Oracle Autonomous Data Warehouse est un service de base de données doté de fonctions d'autopilotage, d'autosécurisation et d'autoréparation optimisé pour les charges de travail d'entreposage de données. Vous n'avez pas besoin de configurer ou de gérer du matériel, ni d'installer un logiciel. Oracle Cloud Infrastructure gère la création de la base de données, ainsi que la sauvegarde, l'application de patches, la mise à niveau et le réglage de la base de données.
Recommandations
Utilisez les recommandations suivantes comme point de départ pour intégrer la plate-forme Informatica IDMC sur Oracle Cloud.
Vos besoins peuvent différer de l'architecture décrite ici.
- Virtual cloud network (VCN)
Lorsque vous créez un VCN, déterminez le nombre de blocs CIDR requis et la taille de chaque bloc en fonction du nombre de ressources que vous prévoyez de joindre aux sous-réseaux du VCN. Utilisez des blocs CIDR qui se trouvent dans l'espace d'adresses IP privées standard.
Sélectionnez les blocs CIDR qui ne chevauchent aucun autre réseau (dans Oracle Cloud Infrastructure, votre centre de données on-premise ou un autre fournisseur cloud) sur lequel vous souhaitez configurer des connexions privées.
Après avoir créé un VCN, vous pouvez modifier, ajouter et supprimer ses blocs CIDR.
Lorsque vous concevez les sous-réseaux, tenez compte de vos exigences en matière de flux de trafic et de sécurité. Attachez toutes les ressources d'un niveau ou d'un rôle spécifique au même sous-réseau, qui peut servir de limite de sécurité.
Utiliser des sous-réseaux régionaux.
- Machines virtuelles et autres recommandations
Pour connaître le dimensionnement des machines virtuelles et d'autres recommandations, reportez-vous aux liens de la section Deploy.
- listes de sécurité,
Utilisez des listes de sécurité pour définir des règles entrantes et sortantes qui s'appliquent à l'ensemble du sous-réseau.
Remarques
Lors de l'intégration de la plate-forme Informatica IDMC sur Oracle Cloud, tenez compte des options d'implémentation suivantes.
Intégration Informatica | Data Refinery | Plate-forme de persistance des données |
---|---|---|
Recommandé | Informatica Intelligent Data Management Cloud (IDMC) | Oracle Autonomous Data Warehouse (ADW) |
Autres options | S/O | Exadata |
Raisonnement | Informatica considère Informatica IDMC comme la plate-forme d'intégration d'entreprise la plus complète, basée sur les microservices, basée sur les API et basée sur l'IA. Avec IDMC, un client dispose de la flexibilité nécessaire pour utiliser n'importe quel service cloud, Informatica est disponible pour répondre à ses besoins en matière d'intégration et de gouvernance. | ADW est une base de données facile à utiliser et entièrement autonome, d'une capacité élastique, offrant des performances de requête rapides et ne nécessitant aucune administration de base de données. Il offre également un accès direct aux données du stockage d'objets à l'aide de tables externes. |
Déploiement
Le code Terraform est disponible sous forme d'exemple de pile dans Oracle Cloud Infrastructure Resource Manager. Vous pouvez également télécharger le code à partir de GitHub et le personnaliser selon vos besoins.
- Déployez à l'aide de l'exemple de pile dans Oracle Cloud Infrastructure Resource Manager :
- Accédez à
.
Si vous n'êtes pas déjà connecté, entrez les informations d'identification de la location et de l'utilisateur.
- Sélectionnez la région de déploiement de la pile.
- Suivez les invites à l'écran et les instructions pour créer la pile.
- Après avoir créé la pile, cliquez sur Actions Terraform et sélectionnez Planifier.
- Attendez que le travail soit terminé et vérifiez le plan.
Pour apporter des modifications, revenez à la page Détails de la pile, cliquez sur Modifier la pile et apportez les modifications requises. Exécutez ensuite à nouveau l'action Planifier.
- Si aucune autre modification n'est nécessaire, revenez à la page Détails de la pile, cliquez sur Actions Terraform et sélectionnez Appliquer.
- Accédez à
- Déployez à l'aide du code Terraform dans GitHub :
- Accédez à GitHub.
- Clonez ou téléchargez le référentiel sur votre ordinateur local.
- Suivez les instructions du document
README
.