Réplication de données d'Autonomous Transaction Processing vers Azure Synapse Analytics

Ce démarrage rapide montre comment configurer une réplication de données d'Autonomous Transaction Processing vers une base de données Azure Synapse à l'aide d'OCI GoldenGate.

Avant de commencer

Pour mener à bien ce démarrage rapide, vous devez disposer des éléments suivants :

  • Espace de travail Synapse Azure
  • Conteneur de stockage Azure associé à l'espace de travail Synapse Azure
  • Informations d'identification de portée de base de données Azure Synapse afin d'accorder des droits d'accès au pool SQL pour accéder au compte de stockage
  • Existence de la table cible : les tables cible doivent exister sur la base de données Synapse avant la réplication. Comme GoldenGate utilise l'instruction SQL de fusion, la table cible doit être une table distribuée par hachage.
  • Connexion de stockage de lac de données OCI GoldenGate Azure affectée au déploiement. S'il n'existe pas, créez une connexion de stockage de lac de données Azure et affectez-la au déploiement.

Configuration de l'environnement : Autonomous Transaction Processing

Si aucune base de données source n'est configurée pour la réplication, procédez comme suit afin de charger un schéma échantillon à utiliser avec le démarrage rapide. Ce démarrage rapide utilise Autonomous Transaction Processing pour la base de données source.

Pour configurer la base de données autonome source, procédez comme suit :

  1. Téléchargez et décompressez le schéma échantillon de base de données.
  2. Dans la console Oracle Cloud, sélectionnez votre instance Autonomous Transaction Processing (ATP) sur la page Bases de données autonomes afin de visualiser ses détails et d'accéder à Database Actions.
  3. Déverrouillez l'utilisateur GGADMIN :
    1. Cliquez sur Actions de base de données, puis sur Utilisateurs de base de données.
    2. Localisez GGADMIN, puis cliquez sur le menu représenté par des points de suspension et sélectionnez Modifier.
    3. Dans le panneau Modifier l'utilisateur, entrez le mot de passe GGADMIN, confirmez le mot de passe, puis désélectionnez Compte verrouillé.
    4. Cliquez sur Appliquer les modifications.
  4. Chargez le schéma échantillon source et les données :
    1. Dans le menu Actions de base de données, sous Développement, sélectionnez SQL.
    2. Copiez le script de OCIGGLL_OCIGGS_SETUP_USERS_ATP.sql et collez-le dans la feuille de calcul SQL.
    3. Cliquez sur Exécuter un script. L'onglet Sortie de script affiche des messages de confirmation.
    4. Effacer la feuille de calcul SQL, puis copier et coller le script SQL à partir de OCIGGLL_OCIGGS_SRC_USER_SEED_DATA.sql.

      Conseil :

      Vous devrez peut-être exécuter chaque instruction séparément pour que l'outil SQL parvienne à exécuter les scripts.
    5. Pour vérifier que les tables ont bien été créées, fermez la fenêtre SQL et rouvrez-la. Dans l'onglet Navigateur, recherchez le schéma SRC_OCIGGLL, puis sélectionnez des tables dans les listes déroulantes correspondantes.
  5. Activez la journalisation supplémentaire :
    1. Effacez la feuille de calcul SQL.
    2. Entrez l'instruction suivante, puis cliquez sur Exécuter l'instruction :
      ALTER PLUGGABLE DATABASE ADD SUPPLEMENTAL LOG DATA;

Configuration de l'environnement : Azure Synapse

  1. Ouvrez Azure Synapse Workspace.
  2. Cliquez sur Nouveau, puis sur Script SQL.
  3. Connectez-vous à votre pool SQL et sélectionnez votre base de données.
  4. Entrez la commande suivante pour créer un cryptage de clé principale :
    CREATE MASTER KEY ENCRYPTION BY PASSWORD='<password>';
  5. Utilisez la commande suivante pour créer des informations d'identification de portée de base de données :
    Veillez à remplacer les espaces réservés <storage-account-name> et <storage-account-access-key> par leurs valeurs réelles.
    CREATE DATABASE SCOPED CREDENTIAL <credential name>
    WITH
    IDENTITY='<storage-account-name>',
    SECRET='<storage-account-access-key>';
  6. Exécutez le script de création de table :
    CREATE TABLE [dbo].[SRC_CUSTOMER] (
       CUSTID         NUMERIC(10) NOTNULL,
       DEAR           NUMERIC(1),
       LAST_NAME      VARCHAR(50),
       FIRST_NAME     VARCHAR(50),
       ADDRESS        VARCHAR(100),
       CITY_ID        NUMERIC(10),
       PHONE          VARCHAR(50),
       AGE            NUMERIC(3),
       SALES_PERS_ID  NUMERIC(10),
       constraint PK_SRC_CUSTOMER primarykeyNONCLUSTERED (CUSTID) NOT ENFORCED
    )
    WITH(DISTRIBUTION=HASH ([CUSTID]), HEAP ) GO
  7. Vérifiez que la table dbo.SRC_Customer a été créée.

Tâche 1 : créer les ressources OCI GoldenGate

Cet exemple de démarrage rapide nécessite des déploiements et des connexions pour la source et la cible.
  1. Créez un déploiement Oracle pour l'instance Autonomous Transaction Processing source.
  2. Créez un déploiement Big Data pour la synchronisation Azure cible.
  3. Créer une connexion à l'instance Autonomous Transaction Processing source.
  4. Création d'une connexion Azure Synapse Analytics.
  5. Créez une connexion Azure Data Lake Storage.
  6. Affectez la connexion Autonomous Transaction Processing au déploiement Oracle source.
  7. Affectez une connexion Azure Synapse au déploiement Big Data cible.

Tâche 2 : ajouter le fichier Extract

  1. Sur la page Déploiements, sélectionnez le déploiement Autonomous Transaction Processing source.
  2. Sur la page des détails du déploiement, cliquez sur Lancer la console.
  3. Connectez-vous avec le nom utilisateur et le mot de passe de l'administrateur du déploiement source.
  4. Ajoutez des informations relatives aux transactions.
  5. Ajoutez un élément Extract.

Tâche 3 : ajoutez et exécutez Distribution Path.

  1. Si vous utilisez la banque d'informations d'identification GoldenGate, créez un utilisateur pour le chemin de distribution dans le déploiement Big Data cible. Sinon, passez à l'étape 3.
  2. Dans la console de déploiement ATP GoldenGate source, ajoutez une connexion de chemin pour l'utilisateur créé à l'étape 1.
    1. Dans la console de déploiement ATP GoldenGate source, cliquez sur Connexions de chemin dans la navigation de gauche.
    2. Cliquez sur Ajouter une connexion de chemin (icône Plus), puis effectuez les opérations suivantes :
      1. Dans Alias d'informations d'identification, entrez GGSNetwork.
      2. Dans ID utilisateur, saisissez le nom de l'utilisateur créé à l'étape 1.
      3. Indiquez le mot de passe de l'utilisateur à deux reprises pour vérification.
    3. Cliquez sur Soumettre.

      La connexion par chemin apparaît dans la liste Connexions par chemin.

  3. Dans la console de déploiement ATP source, ajoutez un chemin de distribution avec les valeurs suivantes :
    1. Sur la page Options source :
      • Dans Extraction source, sélectionnez l'extraction créée dans la tâche 2.
      • Dans Nom de trace, saisissez un nom à deux caractères, tel que E1.
    2. Sur la page Options cible, procédez comme suit :
      • Dans Hôte cible, entrez le domaine hôte du déploiement cible.
      • Dans Numéro de port, saisissez 443.
      • Dans Nom de trace, saisissez un nom à deux caractères, tel que E1.
      • Dans Alias, entrez l'alias d'informations d'identification créé à l'étape 2.
  4. Dans la console de déploiement Big Data cible, vérifiez le fichier Receiver Path créé suite à la création de Distribution Path.
    1. Dans la console de déploiement Big Data cible, cliquez sur Receiver Service.
    2. Consultez les détails du chemin. Ce chemin a été créé à la suite de la création de Distribution Path à l'étape précédente.

Tâche 4 : ajouter et exécuter Replicat

  1. Dans la console de déploiement Big Data cible, cliquez sur Administrator Service, puis sur Ajouter Replicat (icône Plus).
  2. Ajoutez un élément Replicat avec les valeurs suivantes :
    1. Sur la page Informations Replicat, sous le type Replicat, sélectionnez Classic Replicat, entrez un nom de processus, puis cliquez sur Suivant.
    2. Sur la page Options de réplication :
      • Dans Nom, saisissez le nom de la trace de la tâche 2.
      • Dans Domaine, sélectionnez un domaine.
      • Dans Alias, sélectionnez la connexion Azure Synapse Analytics créée dans la tâche 1.
      • Dans Table de point de reprise, sélectionnez la table de point de reprise que vous avez créée pour le déploiement cible.
    3. Sur la page Paramètres Replicat, remplacez MAP *.*, TARGET *.*; par l'élément suivant :
      MAP SRC_OCIGGLL.SRC_CUSTOMER, TARGET dbo.SRC_CUSTOMER;
    4. Cliquez sur Créer et exécuter.
Vous revenez à la page de présentation, dans laquelle vous pouvez consulter les détails de Replicat.

Tâche 5 : vérifier la réplication

Effectuez des mises à jour de l'instance Autonomous Transaction Processing source afin de vérifier la réplication vers Azure Data Lake Storage.
  1. Dans la console Oracle Cloud, ouvrez le menu de navigation, et sélectionnez Oracle Database, puis Autonomous Transaction Processing.
  2. Dans la liste des instances Autonomous Transaction Processing, sélectionnez votre instance source pour en visualiser les détails.
  3. Sur la page des détails de la base de données, cliquez sur Database Actions.

    Remarques :

    Vous devez être connecté automatiquement. Sinon, connectez-vous avec les informations d'identification de base de données.
  4. Sur la page d'accueil Database Actions, sélectionnez SQL.
  5. Entrez ce qui suit dans la feuille de calcul et cliquez sur Exécuter un script.
  6. Dans la console de déploiement OCI GoldenGate source, sélectionnez le nom Extract, puis cliquez sur Statistiques. Vérifiez que SRC_OCIGGLL.SRC_CUSTOMER comporte 7 insertions.
    Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1001,0,'Brendt','Paul','10 Jasper Blvd.',107,'(212) 555 2146',19,10);
    Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1002,0,'McCarthy','Robin','27 Pasadena Drive',11,'(214) 555 3075',29,11);
    Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1003,0,'Travis','Peter','7835 Hartford Drive',12,'(510) 555 4448',34,12);
    Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1004,0,'Larson','Joe','87 Carmel Blvd.',13,'(213) 555 5095',45,13);
    Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1005,0,'Goldschmidt','Tony','91 Torre drive',14,'(619) 555 6529',55,20);
    Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1006,0,'Baker','William','2890 Grant Avenue',15,'(312) 555 7040',64,21);
    Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1007,0,'Swenson','Jack','64 Imagination Drive',19,'(202) 555 8125',74,22)
  7. Dans la console de déploiement Big Data OCI GoldenGate cible, sélectionnez le nom Replicat, puis cliquez sur Statistiques. Vérifiez que SRC_OCIGGLL.SRC_CUSTOMER comporte 7 insertions.
  8. Dans la console Azure, accédez à la console d'espace de travail Azure Synapse. Exécutez Select * à partir de dbo.SRC_CUSTOMER et vérifiez que SRC_OCIGGLL.SRC_CUSTOMER comporte 7 insertions.

Tâche 6 : surveiller les processus et en assurer la maintenance

  1. Surveillez les performances.
  2. Gérez les fichiers de trace.