Replicación de datos del procesamiento de transacciones de IA autónoma en Databricks

Antes de empezar

Para completar correctamente este inicio rápido, debe tener lo siguiente:

Instancia de proceso de transacciones de IA autónoma de origen
Espacio de trabajo Databricks con Unity Catalog
Credencial de almacenamiento para acceder a la cuenta de Azure Storage
Ubicación externa para acceder a la cuenta de Azure Storage
Esquema disponible en el catálogo de destino
URL de JDBC para el acceso a Databricks
Ladrillos de datos para tokens de acceso
Una conexión de Azure Data Lake Storage

Configuración del entorno: proceso de transacciones de IA autónoma

Si aún no tiene una base de datos de origen configurada para la replicación, puede seguir estos pasos para cargar un esquema de ejemplo que utilizar para este inicio rápido. Este inicio rápido utiliza Autonomous AI Transaction Processing para la base de datos de origen.

Para configurar el procesamiento de transacciones de IA autónoma de origen:

Descargue y descomprima el esquema de base de datos de ejemplo.
En la consola de Oracle Cloud, seleccione su instancia de Procesamiento de transacciones de IA autónoma (ATP) en la página Base de datos de IA autónoma para ver los detalles y acceder a Database Actions.
Desbloquee el usuario de GGADMIN:
1. Haga clic en Acciones de base de datos y, a continuación, en Usuarios de base de datos.
2. Busque GGADMIN y, a continuación, haga clic en el menú desplegable (tres puntos) y seleccione Editar.
3. En el panel Edit User, introduzca la contraseña de GGADMIN, confirme la contraseña y, a continuación, anule la selección de Account is Locked.
4. Haga clic en Aplicar cambios.
Cargue el esquema y los datos de ejemplo de origen:
1. En el menú Acciones de base de datos, en Desarrollo, seleccione SQL.
2. Copie y pegue el script de OCIGGLL_OCIGGS_SETUP_USERS_ATP.sql en la hoja de trabajo de SQL.
3. Haga clic en Ejecutar script. El separador Salida de script mostrará los mensajes de confirmación.
4. Borrar la hoja de trabajo de SQL y, a continuación, copiar y pegar el script SQL de OCIGGLL_OCIGGS_SRC_USER_SEED_DATA.sql.
  
  Sugerencia:
  Puede que necesite ejecutar cada sentencia por separado para que la herramienta SQL ejecute los scripts correctamente.
5. Para verificar que las tablas se han creado correctamente, cierre la ventana SQL y vuelva a abrirla. En el separador Navegador, busque el esquema SRC_OCIGGLL y, a continuación, seleccione las tablas en sus respectivas listas desplegables.
Active el registro complementario:
1. Borre la hoja de trabajo de SQL.
2. Introduzca la siguiente sentencia y, a continuación, haga clic en Ejecutar sentencia:
```
ALTER PLUGGABLE DATABASE ADD SUPPLEMENTAL LOG DATA;
```

Tarea 1: Creación de recursos de OCI GoldenGate

En este ejemplo de inicio rápido se necesitan despliegues y conexiones tanto para el origen como para el destino.

Cree un despliegue de Oracle para la instancia de Autonomous AI Transaction Processing de origen.
Cree un despliegue de Big Data para los Databricks de destino.
Cree una conexión al procesamiento de transacciones de IA autónoma de origen.
Cree una conexión a Databricks.
Cree una conexión para Azure Data Lake Storage.
Cree una conexión a GoldenGate y, a continuación, asigne esta conexión al despliegue de Oracle de origen.
Asigne la conexión de Autonomous AI Transaction Processing al despliegue de Oracle de origen.
Asigne la conexión de Databricks al despliegue de Big Data de destino.
Asigne la conexión de Azure Data Lake Storage al despliegue de Big Data de destino.

Tarea 2: Adición de Extract

En la página Despliegues, seleccione el despliegue de Autonomous AI Transaction Processing de origen.
En la página de detalles del despliegue, haga clic en Iniciar consola.
Conéctese con el nombre de usuario y la contraseña del administrador del despliegue de origen.
Agregue la información de transacción.
Agregue un Extract.

Tarea 3: Adición y ejecución de Distribution Path

Si utiliza el almacén de credenciales GoldenGate, cree un usuario para la ruta de distribución en el despliegue de Big Data de destino; de lo contrario, vaya al paso 3.
En la consola de despliegue de ATP de origen GoldenGate, agregue una conexión de ruta para el usuario creado en el paso 1.
1. En la consola de despliegue ATP de origen GoldenGate, haga clic en Conexiones de ruta en la navegación izquierda.
2. Haga clic en Agregar conexión de ruta (icono más) y, a continuación, complete lo siguiente:
  1. En Alias de credencial, introduzca GGSNetwork.
  2. En ID de usuario, introduzca el nombre del usuario creado en el paso 1.
  3. Introduzca la contraseña del usuario dos veces para su verificación.
3. Haga clic en Enviar.
  
  La conexión de ruta aparece en la lista Conexiones de ruta.
En la consola de despliegue de ATP de origen, agregue una ruta de distribución con los siguientes valores:
1. En la página Opciones de origen:
  - En Extracto de origen, seleccione el extracto creado en la tarea 2.
  - En Nombre de pista, introduzca un nombre de dos caracteres, como E1.
2. En la página Opciones de destino:
  - En Host de destino, introduzca el dominio de host del despliegue de destino.
  - En Número de puerto, introduzca 443.
  - En Nombre de pista, introduzca un nombre de dos caracteres, como E1.
  - En Alias, introduzca el alias de credencial creado en el paso 2.
En la consola de despliegue de Big Data de destino, consulte Receiver Path creado como resultado de Distribution Path.
1. En la consola de despliegue de Big Data de destino, haga clic en Receiver Service.
2. Revise los detalles de la ruta. Esta ruta se ha creado como resultado de la creación de Distribution Path en el paso anterior.

Tarea 4: Adición y ejecución del Replicat

En la consola de despliegue de Big Data de destino, haga clic en Administrator Service y, a continuación, haga clic en Add Replicat (icono de signo más).
Agregue un archivo Replicat con los siguientes valores:
1. En la página Información de Replicat, en el tipo Replicat, seleccione Classic Replicat, introduzca un nombre de proceso y, a continuación, haga clic en Siguiente.
2. En la página Replication Options:
  - En Nombre, introduzca el nombre de la pista de la tarea 2.
  - En Destino, seleccione Bricks de datos.
  - En Alias disponibles, seleccione la conexión de Databricks en la lista desplegable.
  - En Ubicación temporal disponible, seleccione Azure Data Lake Storage.
  - Para mediante alias de almacenamiento provisional, seleccione la conexión ADLS.
3. En la página Managed Options, deje el valor por defecto.
4. En la página Paremeter File, sustituya MAP *.*, TARGET *.*; por lo siguiente y haga clic en Next (Siguiente):
```
MAP SRC_OCIGGLL.SRC_CUSTOMER, TARGET
      <target_catalog_name>.<target_schema_name>.SRC_CUSTOMER
```
5. En la página Properties File:
  1. Proporcione el nombre del contenedor ADLS de destino en gg.eventhandler.abs.bucketMappingTemplate.
  2. Agregue gg.handler.databricks.fileRollInterval=5s.
Haga clic en Crear y ejecutar.

Vuelva a la página Overview, donde puede revisar los detalles de Replicat.

Tarea 5: Verificación de la replicación

Realice algunas actualizaciones en la instancia de Autonomous Transaction Processing de origen para verificar la replicación en Databricks.

En la consola de Oracle Cloud, abra el menú de navegación, seleccione Oracle Database y, a continuación, seleccione Autonomous Transaction Processing.
En la lista de instancias de Autonomous Transaction Processing, seleccione la instancia de origen para ver los detalles.
En la página de detalles de la base de datos, haga clic en Acciones de base de datos.

Note:
Deberías iniciar sesión automáticamente. Si no es así, conéctese con las credenciales de la base de datos.
En la página inicial de acciones de base de datos, seleccione SQL.

Introduzca lo siguiente en la hoja de trabajo y haga clic en Ejecutar script.

Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1001,0,'Brendt','Paul','10 Jasper Blvd.',107,'(212) 555 2146',19,10);
Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1002,0,'McCarthy','Robin','27 Pasadena Drive',11,'(214) 555 3075',29,11);
Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1003,0,'Travis','Peter','7835 Hartford Drive',12,'(510) 555 4448',34,12);
Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1004,0,'Larson','Joe','87 Carmel Blvd.',13,'(213) 555 5095',45,13);
Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1005,0,'Goldschmidt','Tony','91 Torre drive',14,'(619) 555 6529',55,20);
Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1006,0,'Baker','William','2890 Grant Avenue',15,'(312) 555 7040',64,21);
Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values ((1007,0,'Swenson','Jack','64 Imagination Drive',19,'(202) 555 8125',74,22);
Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1008,0,'Brendt','Paul','10 Jasper Blvd.',107,'(212) 555 2146',19,10);
Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1009,0,'McCarthy','Robin','27 Pasadena Drive',11,'(214) 555 3075',29,11);
Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1010,0,'Travis','Peter','7835 Hartford Drive',12,'(510) 555 4448',34,12);

En la consola de despliegue de ATP de origen, seleccione el nombre Extract y, a continuación, haga clic en Esíticas. Verifique que SRC_OCIGGLL.SRC_CUSTOMER tenga 10 inserciones.
En la consola de despliegue GoldenGate de OCI de Big Data de destino, seleccione el nombre Replicat y, a continuación, haga clic en Estadísticas. Verifique que SRC_OCIGGLL.SRC_CUSTOMER tenga 10 inserciones.