Préparer et fusionner les données dans Autonomous AI Lakehouse à l'aide d'OCI GoldenGate
Ce démarrage rapide vous guide sur la préparation et la fusion des données d'Autonomous AI Transaction Processing vers Autonomous AI Lakehouse à l'aide d'un déploiement Big Data OCI GoldenGate.
Avant de commencer
Pour continuer, vous devez disposer des éléments suivants :
-
Une base de données source. existante
-
Un lakehouse d'IA autonome cible existant.
-
Bucket Oracle Object Storage existant qui sera utilisé comme zone intermédiaire temporaire.
-
Avant de configurer la réplication de phase et de fusion Autonomous AI Lakehouse, vous devez créer des tables et des schémas cible dans l'instance Autonomous AI Lakehouse cible.
Configuration de l'environnement : bases de données Autonomous AI
-
Téléchargez et décompressez le schéma échantillon de base de données.
-
Configurez le traitement des transactions Autonomous AI source :
-
Dans la console Oracle Cloud, sélectionnez votre instance de traitement des transactions Autonomous AI sur la page Bases d'IA autonomes pour en visualiser les détails et accéder à Database Actions.
-
Sélectionnez Database Actions.
-
Activez l'utilisateur GGADMIN :
-
Sous Administration, sélectionnez Database Users (Utilisateurs de base de données).
-
Localisez GGADMIN, puis sélectionnez son menu représentant des points de suspension (trois points) et sélectionnez Modifier.
-
Dans le panneau Modifier l'utilisateur, entrez le mot du passe GGADMIN, confirmez le mot du passe, puis désactivez Compte verrouillé.
-
Sélectionnez Apply Changes (Appliquer les modifications).
-
-
Chargez le schéma échantillon source et les données :
-
Dans le menu du sélecteur Database Actions, sous Développement, sélectionnez SQL.
-
Copiez le script d'
OCIGGLL_OCIGGS_SETUP_USERS_ATP.sqlet collez- le dans la feuille SQL Worksheet. -
Sélectionnez Exécuter le script. L'onglet Sortie de script affiche des messages de confirmation.
-
Effacez la feuille SQL Worksheet, puis copiez et collez le script SQL à partir de
OCIGGLL_OCIGGS_SRC_USER_SEED_DATA.sql.
A savoir : Vous devrez peut- être exécuter chaque instruction séparément pour que l'outil SQL parvien à exécuter les scripts.
-
-
Pour vérifier que les tables ont bien été créées, fermez la fenêtre SQL et rouvrez-la. Dans l'onglet Navigateur, recherchez le schéma
SRC_OCIGGLL, puis sélectionnez les tables de leurs listes déroulantes respectives. -
Activez la journalisation supplémentaire :
-
Effacez la feuille de calcul SQL.
-
Entrez l'instruction suivante, puis sélectionnez Exécuter l'instruction :
ALTER PLUGGABLE DATABASE ADD SUPPLEMENTAL LOG DATA;
-
-
-
Configurez l'Autonomous AI Lakehouse cible :
-
Dans la console Oracle Cloud, sélectionnez votre instance Autonomous AI Lakehouse sur la page Bases de données Autonomous AI pour visualiser ses détails et accéder aux outils de base de données.
-
Sélectionnez Database Actions.
-
Dans le menu Database Actions, sous Développement, sélectionnez SQL.
-
Copiez et collez le script de
OCIGGLL_OCIGGS_SETUP_USERS_ADW.sqlprécédemment téléchargé dans la feuille SQL Worksheet. -
Sélectionnez Exécuter le script. L'onglet Sortie de script affiche des messages de confirmation.
-
Effacez la feuille SQL, puis copiez et collez le script SQL à partir de
OCIGGLL_OCIGGS_SRC_MIRROR_USER_SEED_DATA.sql. -
Sélectionnez Exécuter le script.
-
Tâche 1 : créer des ressources OCI GoldenGate
Cet exemple de démarrage rapide nécessite des déploiements et des connexions pour la source et la cible.
-
Créez un déploiement Oracle pour l'instance Autonomous AI Transaction Processing source.
-
Créez un déploiement Big Data pour le lakehouse d'IA autonome cible.
-
Créez une connexion pour l'instance Autonomous AI Transaction Processing source.
-
Créez une connexion pour l'instance Autonomous AI Lakehouse cible.
-
Créez une connexion à GoldenGate, puis affectez cette connexion au déploiement Oracle source.
-
Affectez la connexion Autonomous AI Transaction Processing au déploiement Oracle source.
-
Affectez la connexion Autonomous AI Lakehouse au déploiement Big Data cible.
-
Affectez la connexion à Oracle Object Storage au déploiement Big Data cible.
Tâche 2 : ajouter l'extraction
-
Sur la page Déploiements, sélectionnez le déploiement Autonomous AI Transaction Processing source.
-
Sur la page de détails du déploiement, sélectionnez Lancer la console.
-
Connectez-vous avec le nom utilisateur et le mot de passe de l'administrateur du déploiement source.
Tâche 3 : ajouter et exécuter un chemin de distribution
-
Si vous utilisez la banque d'informations d'identification GoldenGate, créez un utilisateur pour le chemin de distribution dans le déploiement Big Data de la cible, sinon passez à l'étape 3.
-
Dans la console de déploiement GoldenGate source, ajoutez une connexion de chemin pour l'utilisateur créé à l'étape 1.
-
Dans la console de déploiement GoldenGate source, sélectionnez Connexions de chemin dans la navigation de gauche.
-
Sélectionnez Ajouter une connexion de chemin (icône Plus), puis procédez comme suit :
-
Dans Alias d'informations d'identification, entrez
GGSNetwork. -
Dans ID utilisateur, saisissez le nom de l'utilisateur créé à l'étape 1.
-
Indiquez le mot de passe de l'utilisateur à deux reprises pour vérification.
-
-
Sélectionnez Soumettre.
La connexion par chemin apparaît dans la liste Connexions par chemin.
-
-
Dans la console de déploiement source, ajoutez un chemin de distribution avec les valeurs suivantes :
-
Sur la page Options source :
-
Dans Extraction source, sélectionnez l'extraction créée dans la tâche 2.
-
Dans Nom de la trace, saisissez un Nom à deux caractères, tel que
E1
-
-
Sur la page Options cible :
-
Dans Hôte cible, entrez le domaine hôte du déploiement cible.
-
Dans Numéro de port, saisissez
443. -
Dans Nom de la trace, saisissez un Nom à deux caractères, tel que
E1 -
Dans Alias, entrez l'alias d'informations d'identification créé à l'étape 2.
-
-
-
Dans la console de déploiement Big Data de la cible cible, vérifiez le Chemin de destinataire créé consécutivements au chemin de distribution.
-
Dans la console de déploiement Big Data cible, sélectionnez Service de destinataire.
-
Consultez les détails du chemin. Ce chemin a été créé consécutivement à la création du chemin de distribution, à l'étape précédente.
-
Tâche 4 : ajouter et exécuter la réplication
-
Dans la console de déploiement Big Data cible, sélectionnez Administrator Service, puis Ajouter une réplication (icône Plus).
-
Ajoutez une réplication avec les valeurs suivantes :
-
Sur la page Informations sur la réplication, sous Type de réplication, sélectionnez Réplication classique et entrez un nom de processus.
-
Dans la page Replicat Options :
-
Dans Nom, saisissez le nom de l'élément de trace dans la tâche 2.
-
Pour Domaine, sélectionnez un domaine.
-
Pour Alias, sélectionnez la connexion Oracle Object Storage et la connexion Autonomous AI Lakehouse créée dans la tâche 1.
-
Dans Table de point de reprise, sélectionnez la table du point de reprise créée pour le déploiement cible.
-
-
Sur la page Options gérées, laissez les champs tels quels, puis sélectionnez Suivant.
-
Dans la page Paramètres de réplication, remplacez la ligne MAP par la suivante :
MAP SRC_OCIGGLL.*, TARGET SRCMIRROR_OCIGGLL.*;
-
-
Sur la page Propriétés, configurez les propriétés suivantes :
-
gg.eventhandler.oci.compartmentID: ajoutez l'OCID du compartiment dans lequel le bucket Oracle Object Storage est stocké. -
gg.eventhandler.oci.bucketMappingTemplate: ajoutez le nom du bucket Oracle Object Storage.
-
-
Sélectionnez Créer et exécuter.
Tâche 5 : vérifier la réplication
-
Dans la console Oracle Cloud, dans le menu de navigation, sélectionnez Oracle AI Database, puis Traitement des transactions par IA autonome.
-
Dans la liste des instances Autonomous AI Transaction Processing, sélectionnez votre instance source pour en visualiser les détails.
-
Sur la page de détails de la base de données, sélectionnez Database Actions.
Remarque : Vous devez être connecté automatiquement. Sinon, connectez-vous avec les informations d'identification de base de données.
-
Sur la page d'accueil de Database Actions, sélectionnez SQL.
-
Entrez ce qui suit dans la feuille de calcul et cliquez sur Exécuter le script.
-
Dans la console de déploiement GoldenGate OCI GoldenGate source, sélectionnez le nom de l'extraction, puis sélectionnez Statistiques. Vérifiez que
SRC_OCIGGLL.SRC_CUSTOMERcomporte 7 insertions.Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1001,0,'Brendt','Paul','10 Jasper Blvd.',107,'(212) 555 2146',19,10); Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1002,0,'McCarthy','Robin','27 Pasadena Drive',11,'(214) 555 3075',29,11); Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1003,0,'Travis','Peter','7835 Hartford Drive',12,'(510) 555 4448',34,12); Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1004,0,'Larson','Joe','87 Carmel Blvd.',13,'(213) 555 5095',45,13); Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1005,0,'Goldschmidt','Tony','91 Torre drive',14,'(619) 555 6529',55,20); Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1006,0,'Baker','William','2890 Grant Avenue',15,'(312) 555 7040',64,21); Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1007,0,'Swenson','Jack','64 Imagination Drive',19,'(202) 555 8125',74,22); -
Dans la console de déploiement Big Data cible, sélectionnez le nom de réplication, puis cliquez sur Statistiques. Vérifiez que
SRC_OCIGGLL.SRC_CUSTOMERcomporte 7 insertions. -
Dans la console Autonomous AI Lakehouse Cloud SQL cible, exécutez la commande suivante pour valider les données répliquées :
select * from SRCMIRROR_OCIGGLL.SRC_CUSTOMER;