Répliquer des données d'Autonomous Transaction Processing vers des briques de données

Ce démarrage rapide montre comment répliquer des données à partir d'Autonomous Transaction Processing vers Databricks à l'aide d'OCI GoldenGate.

Avant de commencer

Pour suivre ce démarrage rapide, vous devez disposer des éléments suivants :

Configuration de l'environnement : Autonomous Transaction Processing

Si vous n'avez pas encore de base de données source configurée pour la réplication, vous pouvez suivre ces étapes pour charger un exemple de schéma à utiliser pour ce démarrage rapide. Ce démarrage rapide utilise Autonomous Transaction Processing pour la base de données source.

Pour configurer la base de données autonome source :

  1. Téléchargez et décompressez l'exemple de schéma de base de données.
  2. Dans la console Oracle Cloud, sélectionnez votre instance Autonomous Transaction Processing (ATP) dans la page des bases de données autonomes pour en voir les détails et accéder à Database Actions.
  3. Déverrouillez l'utilisateur GGADMIN :
    1. Cliquez sur Actions de base de données, puis sur Utilisateurs de base de données.
    2. Sélectionnez GGADMIN, puis cliquez sur le menu contextuel associé et sélectionnez Modifier.
    3. Dans le panneau Modifier l'utilisateur, entrez le mot de passe de GGADMIN, confirmez-le, puis désélectionnez Le compte est verrouillé.
    4. Click Apply Changes.
  4. Chargez les exemples de schéma et de données-échantillons sources :
    1. Dans le menu Actions de base de données, sous Développement, sélectionnez SQL.
    2. Copiez et collez le script à partir de OCIGGLL_OCIGGS_SETUP_USERS_ATP.sql dans la feuille de calcul SQL.
    3. Cliquez sur Exécuter le script. L'onglet Sortie du script affiche des messages de confirmation.
    4. Effacer la feuille de calcul SQL, puis copier et coller le script SQL à partir de OCIGGLL_OCIGGS_SRC_USER_SEED_DATA.sql.

      Conseil :

      Vous devrez peut-être exécuter chaque énoncé séparément pour que l'outil SQL exécute les scripts avec succès.
    5. Pour vérifier que les tables ont été créées, fermez la fenêtre SQL et rouvrez-la. Dans l'onglet Navigateur, recherchez le schéma SRC_OCIGGLL, puis sélectionnez des tables dans les listes déroulantes correspondantes.
  5. Activez la journalisation supplémentaire :
    1. Effacez la feuille de calcul SQL.
    2. Entrez l'énoncé suivant, puis cliquez sur Exérer l'énoncé :
      ALTER PLUGGABLE DATABASE ADD SUPPLEMENTAL LOG DATA;

Tâche 2 : Ajouter Extract

  1. Dans la page Déploiements, sélectionnez le déploiement Autonomous Transaction Processing source.
  2. Dans la page des détails du déploiement, cliquez sur Lancer la console.
  3. Connectez-vous avec le nom d'utilisateur et le mot de passe de l'administrateur du déploiement source.
  4. Ajoutez des informations sur les transactions.
  5. Ajoutez un fichier Extract.

Tâche 3 : Ajouter et exécuter Distribution Path

  1. Si vous utilisez le magasin de données d'identification GoldenGate, créez un utilisateur pour le chemin de répartition dans le déploiement du service de mégadonnées cible, sinon passez à l'étape 3.
  2. Dans la console de déploiement source ATP GoldenGate, ajoutez une connexion de chemin pour l'utilisateur créé à l'étape 1.
    1. Dans la console de déploiement ATP GoldenGate source, cliquez sur Connexions de chemin dans la barre de navigation de gauche.
    2. Cliquez sur Ajouter une connexion de chemin (icône plus), puis effectuez les opérations suivantes :
      1. Pour Alias de données d'identification, entrez GGSNetwork.
      2. Pour ID utilisateur, entrez le nom de l'utilisateur créé à l'étape 1.
      3. Entrez deux fois le mot de passe de l'utilisateur pour vérification.
    3. Cliquez sur Soumettre.

      La connexion de chemin apparaît dans la liste Connexions de chemin.

  3. Dans la console de déploiement ATP source, ajoutez un chemin de répartition avec les valeurs suivantes :
    1. Dans la page Options sources :
      • Pour Processus d'extraction source, sélectionnez le processus d'extraction créé au cours de la tâche 2.
      • Pour Nom de la piste, entrez un nom à deux caractères, par exemple E1.
    2. Dans la page Options cibles :
      • Pour hôte cible, entrez le domaine hôte du déploiement cible.
      • Pour Numéro de port, entrez 443.
      • Pour Nom de la piste, entrez un nom à deux caractères, par exemple E1.
      • Pour Alias, entrez l'alias de données d'identification créé à l'étape 2.
  4. Dans la console de déploiement du service de mégadonnées cible, vérifiez la valeur Receiver Path créée à la suite de Distribution Path.
    1. Dans la console de déploiement du service de mégadonnées cible, cliquez sur Receiver Service.
    2. Vérifiez les détails du chemin. Ce chemin a été créé à la suite de Distribution Path créé à l'étape précédente.

Tâche 4 : Ajouter et exécuter Replicat

  1. Dans la console de déploiement du service de mégadonnées cible, cliquez sur Administrator Service, puis sur Add Replicat (icône plus).
  2. Ajoutez une valeur à Replicat avec les valeurs suivantes :
    1. Dans la page Informations sur Replicat, sous le type Replicat, sélectionnez Classic Replicat, entrez un nom de processus, puis cliquez sur Suivant.
    2. Dans la page Replication Options :
      • Pour Nom, entrez le nom de la piste de la tâche 2.
      • Pour Cible, sélectionnez Briques de données.
      • Pour Alias disponible, sélectionnez la connexion Databricks dans la liste déroulante.
      • Pour Emplacement temporaire disponible, sélectionnez Stockage du lac de données Azure.
      • Pour par l'intermédiaire d'un alias intermédiaire, sélectionnez votre connexion ADLS.
    3. Dans la page Managed Options, conservez la valeur par défaut.
    4. Dans la page Paremeter File, remplacez MAP *.*, TARGET *.*; par ce qui suit, puis cliquez sur Next (Suivant) :
      MAP SRC_OCIGGLL.SRC_CUSTOMER, TARGET
            <target_catalog_name>.<target_schema_name>.SRC_CUSTOMER
    5. Dans la page Properties File :
      1. Indiquez le nom du conteneur ADLS cible dans gg.eventhandler.abs.bucketMappingTemplate.
      2. Ajoutez gg.handler.databricks.fileRollInterval=5s.
  3. Click Create and Run.
Vous retournez à la page Aperçu, où vous pouvez consulter les détails de Replicat.

Tâche 5 : Vérifier la réplication

Apportez des mises à jour à l'instance Autonomous Transaction Processing source pour vérifier la réplication vers les briques de données.
  1. In the Oracle Cloud console, open the navigation menu, select Oracle Database, and then select Autonomous Transaction Processing.
  2. Dans la liste des instances Autonomous Transaction Processing, sélectionnez votre instance source pour en voir les détails.
  3. Dans la page des détails de la base de données, cliquez sur Database actions.

    Note :

    Vous devez être connecté automatiquement. Sinon, connectez-vous à l'aide des données d'identification de la base de données.
  4. Dans la page d'accueil Actions de base de données, sélectionnez SQL.
  5. Entrez les informations suivantes dans la feuille de calcul et cliquez sur Exécuter le script.
    Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1001,0,'Brendt','Paul','10 Jasper Blvd.',107,'(212) 555 2146',19,10);
    Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1002,0,'McCarthy','Robin','27 Pasadena Drive',11,'(214) 555 3075',29,11);
    Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1003,0,'Travis','Peter','7835 Hartford Drive',12,'(510) 555 4448',34,12);
    Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1004,0,'Larson','Joe','87 Carmel Blvd.',13,'(213) 555 5095',45,13);
    Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1005,0,'Goldschmidt','Tony','91 Torre drive',14,'(619) 555 6529',55,20);
    Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1006,0,'Baker','William','2890 Grant Avenue',15,'(312) 555 7040',64,21);
    Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values ((1007,0,'Swenson','Jack','64 Imagination Drive',19,'(202) 555 8125',74,22);
    Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1008,0,'Brendt','Paul','10 Jasper Blvd.',107,'(212) 555 2146',19,10);
    Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1009,0,'McCarthy','Robin','27 Pasadena Drive',11,'(214) 555 3075',29,11);
    Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1010,0,'Travis','Peter','7835 Hartford Drive',12,'(510) 555 4448',34,12);
  6. Dans la console de déploiement ATP source, sélectionnez le nom Extract, puis cliquez sur Statistiques. Vérifiez que SRC_OCIGGLL.SRC_CUSTOMER comporte 10 insertions.
  7. Dans la console de déploiement GoldenGate du service de mégadonnées cible, sélectionnez le nom Replicat, puis cliquez sur Statistiques. Vérifiez que SRC_OCIGGLL.SRC_CUSTOMER comporte 10 insertions.

Tâche 6 : Surveiller et tenir à jour les processus

  1. Surveillez la performance.
  2. Gérez les fichiers de piste.