Replicación de datos del procesamiento de transacciones de IA autónoma en Databricks
Este inicio rápido muestra cómo replicar datos de Autonomous AI Transaction Processing en Databricks mediante OCI GoldenGate.
Antes de empezar
Para completar correctamente este inicio rápido, debe tener lo siguiente:
-
Instancia de procesamiento de transacciones de IA autónoma de origen
-
Espacio de trabajo de Databricks con Unity Catalog
-
Credencial de almacenamiento para acceder a la cuenta de Azure Storage
-
Un esquema disponible en el catálogo de destino
-
Tejidos de datos para tokens de acceso
Configuración del entorno: procesamiento de transacciones de IA autónoma
Si aún no tiene una base de datos de origen configurada para la replicación, puede seguir estos pasos para cargar un esquema de ejemplo que utilizar para este inicio rápido. Este inicio rápido utiliza el procesamiento de transacciones de IA autónoma para la base de datos de origen.
Para configurar el procesamiento de transacciones de IA autónoma de origen:
-
Descargue y descomprima el esquema de base de datos de ejemplo.
-
En la consola de Oracle Cloud, seleccione su instancia de procesamiento de transacciones de IA autónoma (ATP) en la página Bases de datos de IA autónomas para ver los detalles y acceder a Database Actions.
-
Desbloquee el usuario de GGADMIN:
-
Seleccione Acciones de base de datos y, a continuación, Usuarios de base de datos.
-
Localice GGADMIN y, a continuación, seleccione el menú de puntos suspensivos (tres puntos) y seleccione Editar.
-
En el panel Editar usuario, introduzca la contraseña de GGADMIN, confirme la contraseña y, a continuación, anule la selección de Cuenta bloqueada.
-
Seleccione Apply Changes (Aplicar cambios).
-
-
Cargue el esquema de ejemplo y datos del origen:
-
En el menú Acciones de base de Datos, en Desarrollo, seleccione SQL.
-
Copie y pegue el script de
OCIGGLL_OCIGGS_SETUP_USERS_ATP.sqlen la hoja de Trabajo de SQL. -
Seleccione Run Script. El separador Salida de script mostrará los mensajes de confirmación.
-
Borre la hoja de trabajo SQL y, luego, copie y pegue el script SQL de
OCIGGLL_OCIGGS_SRC_USER_SEED_DATA.sql.Consejo: puede que necesite ejecutar cada sentencia por separado para que la herramienta SQL ejecute los scripts correctamente.
-
Para verificar que las tablas se han creado correctamente, cierre la ventana SQL y vuelva a abrirla. En el separador Navegador, busque el esquema
SRC_OCIGGLLy, a continuación, seleccione la tabla en sus respectivas listas desplegables.
-
-
Active el registro complementario:
-
Borre la hoja de trabajo de SQL.
-
Introduzca la siguiente sentencia y, a continuación, seleccione Ejecutar sentencia:
ALTER PLUGGABLE DATABASE ADD SUPPLEMENTAL LOG DATA;
-
Tarea 1: Creación de recursos de OCI GoldenGate
En este ejemplo de inicio rápido se necesitan despliegues y conexiones tanto para el origen como para el destino.
-
Cree un despliegue de Oracle para la instancia de Autonomous AI Transaction Processing del origen.
-
Cree un despliegue de Big Data para el tejido de datos de destino.
-
Cree una conexión al procesamiento de transacciones de IA autónoma de origen.
-
Cree una conexión a GoldenGate y, a continuación, asigne esta conexión al despliegue de Oracle de origen.
-
Asigne la conexión de Autonomous AI Transaction Processingg al despliegue de Oracle de origen.
-
Asigne la conexión del tejido de datos al despliegue de Big Data de destino.
-
Asigne la conexión de Azure Data Lake Storage al despliegue de Big Data de destino.
Tarea 2: Adición del Extract
-
En la página Despliegues, seleccione el despliegue de Autonomous AI Transaction Processing de origen.
-
En la página de detalles del despliegue, seleccione Iniciar consola.
-
Conéctese con el nombre de usuario y la contraseña del administrador del despliegue de origen.
Tarea 3: Adición y ejecución de la ruta de distribución
-
Si utiliza el almacén de credenciales de GoldenGate, cree un usuario para la ruta de distribución en el despliegue de Big Data del destino; de lo contrario, vaya al paso 3.
-
En la consola de despliegue de GoldenGate de origen, agregue una conexión de ruta de acceso para el usuario creado en el paso 1.
-
En la consola de despliegue de GoldenGate de origen, seleccione Conexiones de ruta en la navegación izquierda.
-
Seleccione Agregar conexión de ruta de acceso (icono más) y, a continuación, complete lo siguiente:
-
En Alias de credencial, introduzca
GGSNetwork. -
En User ID (ID de usuario), introduzca el nombre del usuario creado en 1.
-
Introduzca la contraseña del usuario dos veces para su verificación.
-
-
Seleccione Enviar.
La conexión de ruta de acceso aparece en la lista Conexiones de ruta.
-
-
En la consola de despliegue del origen, agregue una ruta de distribución con los siguientes valores:
-
En la página Opciones de origen:
-
En Extract de origen, seleccione el Extract creado en el tarea 2.
-
En Nombre de la pista, introduzca un Nombre de dos caracteres como
E1.
-
-
En la página Opciones de destino:
-
En Host de destino, introduzca el dominio de host del despliegue del destino.
-
En Número de puerto, introduzca
443. -
En Nombre de la pista, introduzca un Nombre de dos caracteres como
E1. -
En Alias, introduzca el alias de credencial creado en la etapa 2.
-
-
-
En la consola de despliegue de Big Data de destino, revise la Ruta de receptor creada como resultado de la Ruta de distribución.
-
En la consola de despliegue de Big Data de destino, seleccione Servicio de receptor.
-
Revise los detalles de la ruta. Esta ruta se ha creado como resultado de la Ruta de distribución creada en el paso anterior.
-
Tarea 4: Adición y ejecución del Replicat
-
En la consola de despliegue de Big Data de destino, seleccione Replicats y, a continuación, seleccione Agregar Replicat (icono más).
-
Agregar un Replicat con los siguientes valores:
-
En la página Información de Replicat, en Tipo de Replicat, seleccione Replicat clásico, introduzca un nombre de proceso y, a continuación, seleccione Siguiente.
-
En la página Opciones de Replicación:
-
En Nombre, introduzca el nombre de una pista en la tarea 2.
-
En Destino, seleccione Tejidos de datos.
-
En Alias disponibles, seleccione la conexión del tejido de datos en la lista desplegable.
-
En Ubicación temporal disponible, seleccione Almacenamiento de lago de datos de Azure.
-
Para mediante alias de almacenamiento provisional, seleccione la conexión ADLS.
-
-
En la página Managed Options, deje el valor por defecto.
-
En la página Paremeter File, sustituya
MAP *.*, TARGET *.*;por lo siguiente y seleccione Next (Siguiente):MAP SRC_OCIGGLL.SRC_CUSTOMER, TARGET <target_catalog_name>.<target_schema_name>.SRC_CUSTOMER -
En la página Properties File:
-
Proporcione el nombre del contenedor ADLS de destino en
gg.eventhandler.abs.bucketMappingTemplate. -
Agregue
gg.handler.databricks.fileRollInterval=5s.
-
-
-
Seleccione Crear y ejecutar.
Volverá a la página Visión general, donde podrá revisar los detalles del Replicat.
Tarea 5: Verificación de la replicación
-
En la consola de Oracle Cloud, abra el menú de navegación, seleccione Oracle AI Database y, a continuación, seleccione Procesamiento de transacciones de IA autónoma.
-
En la lista de instancias de Autonomous AI Transaction Processing, seleccione la instancia de origen para ver los detalles.
-
En la página de detalles de la base de datos, seleccione Database Actions.
Nota: Esta acción le debería conectar de forma automática. Si no es así, conéctese con las credenciales de la base de datos.
-
En la página inicial de Database Actions, seleccione SQL.
-
Introduzca lo siguiente en la hoja de trabajo y seleccione Ejecutar script.
-
En la consola de despliegue de GoldenGate de OCI GoldenGate de origen, seleccione el nombre del Extract y, a continuación, seleccione Estadísticas. Verifique que SRC_OCIGGLL.SRC_CUSTOMER tenga 7 inserciones.
Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1001,0,'Brendt','Paul','10 Jasper Blvd.',107,'(212) 555 2146',19,10); Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1002,0,'McCarthy','Robin','27 Pasadena Drive',11,'(214) 555 3075',29,11); Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1003,0,'Travis','Peter','7835 Hartford Drive',12,'(510) 555 4448',34,12); Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1004,0,'Larson','Joe','87 Carmel Blvd.',13,'(213) 555 5095',45,13); Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1005,0,'Goldschmidt','Tony','91 Torre drive',14,'(619) 555 6529',55,20); Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1006,0,'Baker','William','2890 Grant Avenue',15,'(312) 555 7040',64,21); Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1007,0,'Swenson','Jack','64 Imagination Drive',19,'(202) 555 8125',74,22) -
En la consola de despliegue de Big Data OCI GoldenGate de destino, seleccione el nombre del Replicat y, a continuación, seleccione Estadísticas. Verifique que SRC_OCIGGLL.SRC_CUSTOMER tenga 7 inserciones.