Replicación de datos de Autonomous Transaction Processing en Apache Iceberg

Descubra cómo replicar datos de Autonomous Transaction Processing en Apache Iceberg en OCI GoldenGate.

Antes de empezar

Para completar correctamente este inicio rápido, debe tener:

  • Una Autonomous Transaction Processing de origen
  • Un entorno de destino de Apache Iceberg:
    • OCI GoldenGate admite Azure Data Lake Storage, Amazon S3 y Google Cloud Storage como servicios de almacenamiento para las tablas de Apache Iceberg.
    • OCI GoldenGate admite catálogos de Hadoop, Nessie, AWS Glue, Polaris, REST y JDBC para Apache Iceberg.

Configuración del entorno: Autonomous Transaction Processing

Si aún no tiene una base de datos de origen configurada para la replicación, puede seguir estos pasos para cargar un esquema de ejemplo que utilizar para este inicio rápido. Este inicio rápido utiliza Autonomous Transaction Processing para la base de datos de origen.

Para configurar la instancia de Autonomous Database de origen:

  1. Descargue y descomprima el esquema de base de datos de ejemplo.
  2. En la consola de Oracle Cloud, seleccione la Instancia de Autonomous Transaction Processing (ATP) en la página Bases de datos autónomas para ver los detalles y acceder a Database Actions.
  3. Desbloquee el usuario de GGADMIN:
    1. Haga clic en Acciones de bases de datos y, a continuación, en Usuarios de bases de datos.
    2. Busque GGADMIN y, a continuación, haga clic en su menú de puntos suspensivos (tres puntos) y seleccione Editar.
    3. En el panel Editar usuario, introduzca la contraseña de GGADMIN, confirme la contraseña y, a continuación, anule la selección de La cuenta está bloqueada.
    4. Haga clic en Aplicar cambios.
  4. Cargue el esquema de ejemplo y datos del origen:
    1. En el menú Acciones de bases de datos, en Desarrollo, seleccione SQL.
    2. Copie y pegue el script de OCIGGLL_OCIGGS_SETUP_USERS_ATP.sql en la hoja de Trabajo de SQL.
    3. Haga clic en Ejecutar script. El separador Salida de script mostrará los mensajes de confirmación.
    4. Borre la hoja de trabajo SQL y, luego, copie y pegue el script SQL de OCIGGLL_OCIGGS_SRC_USER_SEED_DATA.sql.

      Sugerencia:

      Puede que necesite ejecutar cada sentencia por separado para que la herramienta SQL ejecute los scripts correctamente.
    5. Para verificar que las tablas se han creado correctamente, cierre la ventana SQL y vuelva a abrirla. En el separador Navegador, busque el esquema SRC_OCIGGLL y, a continuación, seleccione la tabla en sus respectivas tablas desplegables.
  5. Active el registro complementario:
    1. Borre la hoja de trabajo de SQL.
    2. Introduzca la siguiente sentencia y, a continuación, haga clic en Ejecutar Sentencia:
      ALTER PLUGGABLE DATABASE ADD SUPPLEMENTAL LOG DATA;

Tarea 1: Creación de los recursos

En este ejemplo de inicio rápido se necesitan despliegues y conexiones tanto para el origen como para el destino.

  1. Cree un despliegue de Oracle para la instancia de origen de Autonomous Transaction Processing.
  2. Cree un despliegue de Big Data para el destino Apache Iceberg.
  3. Creación de una conexión de Autonomous Transaction Processing.
  4. Cree una conexión Apache Iceberg.
  5. Cree una conexión de servidor GoldenGate y asignarla al despliegue de Oracle.
  6. Asigne la conexión ATP al despliegue de la Oracle.
  7. Asigne la conexión Iceberg al despliegue de Big Data.

Tarea 2: Adición del Extract

  1. En la página Despliegues, seleccione el despliegue de Autonomous Transaction Processing de origen.
  2. En la página Iniciar consola, haga clic en .
  3. Conéctese con el nombre de usuario y la contraseña del administrador del despliegue de origen.
  4. Agregue la información de transacción.
  5. Agregue un Extract.

Tarea 3: Adición y ejecución de Distribution Path

  1. Si utiliza el almacén de credenciales GoldenGate, cree un usuario para la ruta de distribución en el despliegue de Big Data del destino; de lo contrario, vaya al paso 3.
  2. En la consola del despliegue de ATP GoldenGate de origen, agregue una conexión de ruta de acceso para el usuario creado en la etapa 1.
    1. En la consola de despliegue de ATP GoldenGate de origen, haga clic en Conexiones de ruta en la navegación izquierda.
    2. Haga clic en Agregar conexión de ruta (icono más) y, a continuación, complete lo siguiente:
      1. En Alias de credencial, introduzca GGSNetwork.
      2. En User ID (ID de usuario), introduzca el nombre del usuario creado en 1.
      3. Introduzca la contraseña del usuario dos veces para su verificación.
    3. Haga clic en Enviar.

      La conexión de ruta de acceso aparece en la lista Conexiones de ruta.

  3. En la consola de despliegue de ATP de origen, agregue una ruta de distribución con los siguientes valores:
    1. En la página Opciones de origen:
      • En Extract de origen, seleccione el Extract creado en el tarea 2.
      • En Nombre de la pista, introduzca un Nombre de dos caracteres como E1.
    2. En la página Opciones de destino:
      • En Host de destino, introduzca el dominio de host del despliegue del destino.
      • En Número de puerto, introduzca 443.
      • En Nombre de la pista, introduzca un Nombre de dos caracteres como E1.
      • En Alias, introduzca el alias de credencial creado en la etapa 2.
  4. En la consola de despliegue de Big Data de destino, revise el Receiver Path creado como resultado del Distribution Path.
    1. En la consola de despliegue de Big Data de destino, haga clic en Receiver Service.
    2. Revise los detalles de la ruta. Esta ruta se ha creado como resultado de la ruta Distribution Path creada en el paso anterior.

Tarea 4: Adición y ejecución del Replicat

Para agregar y ejecutar un Replicat:
  1. En la consola GoldenGate de despliegue de OCI, en la página de inicio del servicio de administración, haga clic enAgregar Replicat (icono de signo mas).
  2. En el panel Agregar Replicat, en la página Información de Replicat, complete los campos según sea necesario y, a continuación, haga clic en Siguiente:
    • En Tipo de Replicat, seleccione Replicat clásico.
    • Introduzca un nombre de proceso que no tenga más de 5 caracteres.
    • Introduzca una descripción para ayudar a distinguir este proceso de otros.
  3. En la página Opciones de Replicat, complete los campos según sea necesario y, a continuación, haga clic en Siguiente:
    1. En Pista de replicación, introduzca el nombre de la pista de Extract.
    2. En Destino, seleccione Apache Iceberg.
    3. En Formato, seleccione el formato que desea ingerir en Apache Iceberg. El valor por defecto es Parquet.
    4. En Alias disponibles, seleccione la conexión de Apache Iceberg en la lista desplegable.
  4. En la página Managed Options, deje la configuración por defecto y haga clic en Next.
  5. En la página Parámetros de Replicat, deje la configuración por defecto y haga clic en Siguiente.
  6. En la página Propiedades de Replicat, actualice los campos marcados, TODO y, a continuación, haga clic en Crear y ejecutar.
    Consulte Detalles de destino de Apache Iceberg para obtener más información.

Tarea 5: Verificación de la replicación

Para verificar la replicación, realice actualizaciones en la instancia de ATP de origen.
  1. En la consola de Oracle Cloud, abra el menú de navegación, seleccione Oracle Database y, a continuación, seleccione Autonomous Database.
  2. En la lista de bases de datos autónomas, seleccione la instancia de origen para ver los detalles.
  3. En la página Detalles de la base datos, haga clic en Acciones del archivo.
  4. En la página Acciones de Database, seleccione SQL.
  5. Introduzca las siguientes sentencias de inserción en la hoja de trabajo de SQL y, a continuación, haga clic en Ejecutar script:
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1000,'Houston',20,743113);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1001,'Dallas',20,822416);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1002,'San Francisco',21,157574);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1003,'Los Angeles',21,743878);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1004,'San Diego',21,840689);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1005,'Chicago',23,616472);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1006,'Memphis',23,580075);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1007,'New York City',22,124434);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1008,'Boston',22,275581);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1009,'Washington D.C.',22,688002);
  6. En la Consola de Despliegue de ATP del Origen, seleccione el nombre del Extract y, a continuación, haga clic en Estadísticas. Verifique que SRC_OCIGGLL.SRC_CITY tenga 10 inserciones.
  7. En la consola de despliegue de big data de destino, seleccione el nombre del Replicat y, a continuación, haga clic en Estadísticas. Verifique que SRC_OCIGGLL.SRC_CITY tenga 10 inserciones.