Replicación de datos de Autonomous Transaction Processing en Databricks

En este inicio rápido se muestra cómo replicar datos de Autonomous Transaction Processing en Databricks mediante OCI GoldenGate.

Configuración del entorno: Autonomous Transaction Processing

Si aún no tiene una base de datos de origen configurada para la replicación, puede seguir estos pasos para cargar un esquema de ejemplo que utilizar para este inicio rápido. Este inicio rápido utiliza Autonomous Transaction Processing como base de datos de origen.

Para configurar la instancia de Autonomous Database de origen:

Descargue y descomprima el esquema de base de datos de ejemplo.
En la consola de Oracle Cloud, seleccione la instancia de Autonomous Transaction Processing (ATP) en la página de bases de datos autónomas para ver los detalles y acceder a Database Actions.
Desbloquee el usuario de GGADMIN:
1. Haga clic en Acciones de base de datos y, a continuación, en Usuarios de base de datos.
2. Busque GGADMIN y, a continuación, haga clic en el menú de puntos suspensivos (tres puntos) y seleccione Editar.
3. En el panel Editar usuario, introduzca la contraseña de GGADMIN, confirme la contraseña y, a continuación, anule la selección de La cuenta está bloqueada.
4. Haga clic en Aplicar cambios.
Cargue el esquema y los datos de ejemplo de origen:
1. En el menú Acciones de base de datos, en Desarrollo, seleccione SQL.
2. Copie y pegue el script de OCIGGLL_OCIGGS_SETUP_USERS_ATP.sql en la hoja de trabajo de SQL.
3. Haga clic en Ejecutar script. El separador Salida de script mostrará los mensajes de confirmación.
4. Borrar la hoja de trabajo de SQL y, a continuación, copiar y pegar el script SQL de OCIGGLL_OCIGGS_SRC_USER_SEED_DATA.sql.
  
  Consejo:
  Puede que necesite ejecutar cada sentencia por separado para que la herramienta SQL ejecute los scripts correctamente.
5. Para verificar que las tablas se han creado correctamente, cierre la ventana SQL y vuelva a abrirla. En el separador Navegador, busque el esquema SRC_OCIGGLL y, a continuación, seleccione las tablas en sus respectivas listas desplegables.
Active el registro complementario:
1. Borre la hoja de trabajo de SQL.
2. Introduzca la siguiente sentencia y, a continuación, haga clic en Ejecutar sentencia:
```
ALTER PLUGGABLE DATABASE ADD SUPPLEMENTAL LOG DATA;
```

Antes de empezar

Para completar correctamente este inicio rápido, debe tener lo siguiente:

Una instancia de Autonomous Transaction Processing de origen
Espacio de trabajo de Databricks con Unity Catalog
Credencial de almacenamiento para acceder a la cuenta de Azure Storage
Ubicación externa para acceder a la cuenta de Azure Storage
Esquema disponible en el catálogo de destino
URL de JDBC para el acceso a Databricks
Ladrillos de datos para tokens de acceso
Conexión de almacenamiento de lago de datos de Azure

Tarea 1: Creación de recursos de OCI GoldenGate

En este ejemplo de inicio rápido se necesitan despliegues y conexiones tanto para el origen como para el destino.

Cree un despliegue de Oracle para la instancia de Autonomous Transaction Processing de origen.
Cree un despliegue de Big Data para los bloques de datos de destino.
Cree una conexión a Autonomous Transaction Processing de origen.
Creación de una conexión a Databricks.
Cree una conexión para Azure Data Lake Storage.
Cree una conexión a GoldenGate y, a continuación, asigne esta conexión al despliegue de Oracle de origen.
Asigne la conexión de Autonomous Transaction Processing al despliegue de Oracle de origen.
Asigne la conexión de Databricks al despliegue de Big Data de destino.
Asigne la conexión de Azure Data Lake Storage al despliegue de Big Data de destino.

Tarea 2: Adición de Extract

En la página Despliegues, seleccione el despliegue de Autonomous Transaction Processing de origen.
En la página de detalles del despliegue, haga clic en Iniciar consola.
Conéctese con el nombre de usuario y la contraseña del administrador del despliegue de origen.
Agregue la información de transacción.
Agregue un Extract.

Tarea 3: Adición y ejecución de Distribution Path

Si utiliza el almacén de credenciales GoldenGate, cree un usuario para la ruta de distribución en el despliegue de Big Data de destino; de lo contrario, vaya al paso 3.
En la consola de despliegue de ATP GoldenGate de origen, agregue una conexión de ruta para el usuario creado en el paso 1.
1. En la consola de despliegue GoldenGate de ATP de origen, haga clic en Conexiones de ruta en la navegación izquierda.
2. Haga clic en Agregar conexión de ruta (icono más) y, a continuación, complete lo siguiente:
  1. En Alias de credencial, introduzca GGSNetwork.
  2. En ID de usuario, introduzca el nombre del usuario creado en el paso 1.
  3. Introduzca la contraseña del usuario dos veces para su verificación.
3. Haga clic en Enviar.
  
  La conexión de ruta aparece en la lista Conexiones de ruta.
En la consola de despliegue de ATP de origen, agregue una ruta de distribución con los siguientes valores:
1. En la página Opciones de origen:
  - En Extract de origen, seleccione el Extract creado en la tarea 2.
  - En Nombre de pista, introduzca un nombre de dos caracteres, como E1.
2. En la página Opciones de destino:
  - En Host de destino, introduzca el dominio de host del despliegue de destino.
  - En Número de puerto, introduzca 443.
  - En Nombre de pista, introduzca un nombre de dos caracteres, como E1.
  - En Alias, introduzca el alias de credencial creado en la etapa 2.
En la consola de despliegue de Big Data de destino, consulte Receiver Path creado como resultado de Distribution Path.
1. En la consola de despliegue de Big Data de destino, haga clic en Receiver Service.
2. Revise los detalles de la ruta. Esta ruta se ha creado como resultado de Distribution Path creado en el paso anterior.

Tarea 4: Adición y ejecución del Replicat

En la consola de despliegue de Big Data de destino, haga clic en Administrator Service y, a continuación, haga clic en Add Replicat (icono de signo más).
Agregue un Replicat con los siguientes valores:
1. En la página Información de Replicat, en el tipo Replicat, seleccione Classic Replicat, introduzca un nombre de proceso y, a continuación, haga clic en Siguiente.
2. En la página Replication Options:
  - En Nombre, introduzca el nombre de la pista de la tarea 2.
  - En Destino, seleccione ladrillos de datos.
  - En Alias disponibles, seleccione la conexión de Databricks en la lista desplegable.
  - En Ubicación temporal disponible, seleccione Azure Data Lake Storage.
  - Para mediante alias de almacenamiento provisional, seleccione la conexión ADLS.
3. En la página Managed Options, deje el valor por defecto.
4. En la página Archivo de Parámetro, sustituya MAP *.*, TARGET *.*; por lo siguiente y haga clic en Siguiente:
```
MAP SRC_OCIGGLL.SRC_CUSTOMER, TARGET
      <target_catalog_name>.<target_schema_name>.SRC_CUSTOMER
```
5. En la página Properties File:
  1. Proporcione el nombre del contenedor ADLS de destino en gg.eventhandler.abs.bucketMappingTemplate.
  2. Agregue gg.handler.databricks.fileRollInterval=5s.
Haga clic en Crear y ejecutar.

Vuelva a la página Overview, donde puede revisar los detalles de Replicat.

Tarea 5: Verificación de la replicación

Realice algunas actualizaciones en la instancia de Autonomous Transaction Processing de origen para verificar la replicación en Databricks.

En la consola de Oracle Cloud, abra el menú de navegación, seleccione Oracle Database y, a continuación, seleccione Autonomous Transaction Processing.
En la lista de instancias de Autonomous Transaction Processing, seleccione la instancia de origen para ver los detalles.
En la página de detalles de la base de datos, haga clic en Acciones de base de datos.

Nota

Esta acción le debería conectar de forma automática. Si no es así, conéctese con las credenciales de la base de datos.
En la página inicial de acciones de base de datos, seleccione SQL.

Introduzca lo siguiente en la hoja de trabajo y haga clic en Ejecutar script.

Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1001,0,'Brendt','Paul','10 Jasper Blvd.',107,'(212) 555 2146',19,10);
Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1002,0,'McCarthy','Robin','27 Pasadena Drive',11,'(214) 555 3075',29,11);
Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1003,0,'Travis','Peter','7835 Hartford Drive',12,'(510) 555 4448',34,12);
Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1004,0,'Larson','Joe','87 Carmel Blvd.',13,'(213) 555 5095',45,13);
Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1005,0,'Goldschmidt','Tony','91 Torre drive',14,'(619) 555 6529',55,20);
Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1006,0,'Baker','William','2890 Grant Avenue',15,'(312) 555 7040',64,21);
Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values ((1007,0,'Swenson','Jack','64 Imagination Drive',19,'(202) 555 8125',74,22);
Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1008,0,'Brendt','Paul','10 Jasper Blvd.',107,'(212) 555 2146',19,10);
Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1009,0,'McCarthy','Robin','27 Pasadena Drive',11,'(214) 555 3075',29,11);
Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1010,0,'Travis','Peter','7835 Hartford Drive',12,'(510) 555 4448',34,12);

En la consola de despliegue de ATP de origen, seleccione el nombre Extract y, a continuación, haga clic en Estadísticas. Verifique que SRC_OCIGGLL.SRC_CUSTOMER tenga 10 inserciones.
En la consola de despliegue GoldenGate de Big Data OCI de destino, seleccione el nombre Replicat y, a continuación, haga clic en Statistics. Verifique que SRC_OCIGGLL.SRC_CUSTOMER tenga 10 inserciones.

Documentación de Oracle Cloud Infrastructure