Replicación de datos del procesamiento de transacciones de IA autónoma en Microsoft Fabric Lakehouse

En este inicio rápido se muestra cómo replicar datos de Autonomous AI Transaction Processing en Microsoft Fabric Lakehouse mediante OCI GoldenGate.

Antes de empezar

Para completar correctamente este inicio rápido, debe tener lo siguiente:

  • Instancia de procesamiento de transacciones de IA autónoma de origen.
  • Espacio de trabajo de Microsoft Fabric Lakehouse:
    • Cree un registro de la aplicación Microsoft Entra ID. Anote el ID de aplicación (cliente), el ID de directorio (inquilino) y el secreto de cliente.
    • Vaya a Fabric, su espacio de trabajo, haga clic en Gestionar acceso y haga clic en Agregar personas o grupo. Escriba el nombre de la aplicación registrada, seleccione el rol Contribuyente y haga clic en Agregar.
    • Cree una Lakehouse en su espacio de trabajo.

Configuración del entorno: procesamiento de transacciones de IA autónoma

Si aún no tiene una base de datos de origen configurada para la replicación, puede seguir estos pasos para cargar un esquema de ejemplo que utilizar para este inicio rápido. Este inicio rápido utiliza el procesamiento de transacciones de IA autónoma para la base de datos de origen.

Para configurar el procesamiento de transacciones de IA autónoma de origen:

  1. Descargue y descomprima el esquema de base de datos de ejemplo.
  2. En la consola de Oracle Cloud, seleccione su instancia de procesamiento de transacciones de IA autónoma (ATP) en la página Bases de datos de IA autónomas para ver los detalles y acceder a Database Actions.
  3. Desbloquee el usuario de GGADMIN:
    1. Haga clic en Acciones de base de datos y, a continuación, en Usuarios de base de datos.
    2. Busque GGADMIN y, a continuación, haga clic en el menú de puntos suspensivos (tres puntos) y seleccione Editar.
    3. En el panel Editar usuario, introduzca la contraseña de GGADMIN, confirme la contraseña y, a continuación, anule la selección de La cuenta está bloqueada.
    4. Haga clic en Aplicar cambios.
  4. Cargue el esquema y los datos de ejemplo de origen:
    1. En el menú Acciones de base de datos, en Desarrollo, seleccione SQL.
    2. Copie y pegue el script de OCIGGLL_OCIGGS_SETUP_USERS_ATP.sql en la hoja de trabajo de SQL.
    3. Haga clic en Ejecutar script. El separador Salida de script mostrará los mensajes de confirmación.
    4. Borrar la hoja de trabajo de SQL y, a continuación, copiar y pegar el script SQL de OCIGGLL_OCIGGS_SRC_USER_SEED_DATA.sql.

      Consejo:

      Puede que necesite ejecutar cada sentencia por separado para que la herramienta SQL ejecute los scripts correctamente.
    5. Para verificar que las tablas se han creado correctamente, cierre la ventana SQL y vuelva a abrirla. En el separador Navegador, busque el esquema SRC_OCIGGLL y, a continuación, seleccione las tablas en sus respectivas listas desplegables.
  5. Active el registro complementario:
    1. Borre la hoja de trabajo de SQL.
    2. Introduzca la siguiente sentencia y, a continuación, haga clic en Ejecutar sentencia:
      ALTER PLUGGABLE DATABASE ADD SUPPLEMENTAL LOG DATA;

Tarea 1: Creación de recursos de OCI GoldenGate

Tarea 2: Adición del Extract

  1. En la página Despliegues, seleccione el despliegue de Autonomous AI Transaction Processing de origen.
  2. En la página de detalles del despliegue, haga clic en Iniciar consola.
  3. Conéctese con el nombre de usuario y la contraseña del administrador del despliegue de origen.
  4. Agregue la información de transacción.
  5. Agregue un Extract.

Tarea 3: Adición de una ruta de distribución

  1. Si utiliza el almacén de credenciales GoldenGate, cree un usuario para la ruta de distribución en el despliegue de Big Data de destino; de lo contrario, vaya al paso 3.
  2. En la consola de despliegue de ATP GoldenGate de origen, agregue una conexión de ruta para el usuario creado en el paso 1.
    1. En la consola de despliegue GoldenGate de ATP de origen, haga clic en Conexiones de ruta en la navegación izquierda.
    2. Haga clic en Agregar conexión de ruta (icono más) y, a continuación, complete lo siguiente:
      1. En Alias de credencial, introduzca GGSNetwork.
      2. En ID de usuario, introduzca el nombre del usuario creado en el paso 1.
      3. Introduzca la contraseña del usuario dos veces para su verificación.
    3. Haga clic en Enviar.

      La conexión de ruta aparece en la lista Conexiones de ruta.

  3. En la consola de despliegue de ATP de origen, agregue una ruta de distribución con los siguientes valores:
    1. En la página Opciones de origen:
      • En Extract de origen, seleccione el Extract creado en la tarea 2.
      • En Nombre de pista, introduzca un nombre de dos caracteres, como E1.
    2. En la página Opciones de destino:
      • En Host de destino, introduzca el dominio de host del despliegue de destino.
      • En Número de puerto, introduzca 443.
      • En Nombre de pista, introduzca un nombre de dos caracteres, como E1.
      • En Alias, introduzca el alias de credencial creado en la etapa 2.
  4. En la consola de despliegue de Big Data de destino, consulte Receiver Path creado como resultado de Distribution Path.
    1. En la consola de despliegue de Big Data de destino, haga clic en Receiver Service.
    2. Revise los detalles de la ruta. Esta ruta se ha creado como resultado de Distribution Path creado en el paso anterior.

Tarea 4: Adición y ejecución del Replicat

  1. En la consola de despliegue de Big Data de destino, haga clic en Administrator Service y, a continuación, haga clic en Add Replicat (icono de signo más).
  2. Agregue un Replicat con los siguientes valores:
    1. En la página Información de Replicat, en el tipo Replicat, seleccione Classic Replicat, introduzca un nombre de proceso y, a continuación, haga clic en Siguiente.
    2. En la página Replication Options:
      • En Nombre, introduzca el nombre de la pista de la tarea 2.
      • En Destino, seleccione Microsoft Fabric Lakehouse.
      • En Formato, seleccione el formato que desea ingerir en Microsoft Fabric Lakehouse.
      • En Alias disponibles, seleccione la conexión de Microsoft Fabric Lakehouse en la lista desplegable.
    3. En la página Managed Options, deje el valor por defecto.
    4. En la página Parámetros Replicat, deje el valor por defecto.
    5. En la página Propiedades de Replicat, actualice las siguientes propiedades:
      • gg.eventhandler.onelake.workspace=<target_workspace_name>
      • gg.eventhandler.onelake.lakehouse=<target_lakehouse_name>
  3. Haga clic en Crear y ejecutar.
Vuelva a la página Overview, donde puede revisar los detalles de Replicat.

Tarea 5: Verificación de la replicación

Realice algunas actualizaciones en la instancia de Autonomous Transaction Processing de origen para verificar la replicación en Microsoft Fabric Lakehouse.
  1. En la consola de Oracle Cloud, abra el menú de navegación, seleccione Oracle Database y, a continuación, seleccione Autonomous Transaction Processing.
  2. En la lista de instancias de Autonomous Transaction Processing, seleccione la instancia de origen para ver los detalles.
  3. En la página de detalles de la base de datos, haga clic en Acciones de base de datos.
    Nota

    Esta acción le debería conectar de forma automática. Si no es así, conéctese con las credenciales de la base de datos.
  4. En la página inicial de acciones de base de datos, seleccione SQL.
  5. Introduzca lo siguiente en la hoja de trabajo y haga clic en Ejecutar script.
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1000,'Houston',20,743113);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1001,'Dallas',20,822416);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1002,'San Francisco',21,157574);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1003,'Los Angeles',21,743878);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1004,'San Diego',21,840689);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1005,'Chicago',23,616472);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1006,'Memphis',23,580075);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1007,'New York City',22,124434);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1008,'Boston',22,275581);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1009,'Washington D.C.',22,688002);
  6. En la consola de despliegue de ATP de origen, seleccione el nombre del Extract y, a continuación, haga clic en Estadísticas. Verifique que SRC_OCIGGLL.SRC_CITY tenga 10 inserciones.
  7. En la consola de despliegue GoldenGate de Big Data OCI de destino, seleccione el nombre Replicat y, a continuación, haga clic en Statistics. Verifique que SRC_OCIGGLL.SRC_CITY tenga 10 inserciones.

Tarea 6: Supervisión y mantenimiento de procesos