Replicación de datos del procesamiento de transacciones de IA autónoma en Apache Iceberg

Descubre cómo replicar datos del procesamiento de transacciones de IA autónoma en Apache Iceberg en OCI GoldenGate.

Antes de empezar

Para completar correctamente este inicio rápido, debe tener:

Configuración del entorno: procesamiento de transacciones de IA autónoma

Si aún no tiene una base de datos de origen configurada para la replicación, puede seguir estos pasos para cargar un esquema de ejemplo que utilizar para este inicio rápido. Este inicio rápido utiliza el procesamiento de transacciones de IA autónoma para la base de datos de origen.

Para configurar el procesamiento de transacciones de IA autónoma de origen:

  1. Descargue y descomprima el esquema de base de datos de ejemplo.

  2. En la consola de Oracle Cloud, seleccione su instancia de procesamiento de transacciones de IA autónoma (ATP) en la página Bases de datos de IA autónomas para ver los detalles y acceder a Database Actions.

  3. Desbloquee el usuario de GGADMIN:

    1. Seleccione Acciones de base de datos y, a continuación, Usuarios de base de datos.

    2. Localice GGADMIN y, a continuación, seleccione el menú de puntos suspensivos (tres puntos) y seleccione Editar.

    3. En el panel Editar usuario, introduzca la contraseña de GGADMIN, confirme la contraseña y, a continuación, anule la selección de Cuenta bloqueada.

    4. Seleccione Apply Changes (Aplicar cambios).

  4. Cargue el esquema de ejemplo y datos del origen:

    1. En el menú Acciones de base de Datos, en Desarrollo, seleccione SQL.

    2. Copie y pegue el script de OCIGGLL_OCIGGS_SETUP_USERS_ATP.sql en la hoja de Trabajo de SQL.

    3. Seleccione Run Script. El separador Salida de script mostrará los mensajes de confirmación.

    4. Borre la hoja de trabajo SQL y, luego, copie y pegue el script SQL de OCIGGLL_OCIGGS_SRC_USER_SEED_DATA.sql.

      Consejo: puede que necesite ejecutar cada sentencia por separado para que la herramienta SQL ejecute los scripts correctamente.

    5. Para verificar que las tablas se han creado correctamente, cierre la ventana SQL y vuelva a abrirla. En el separador Navegador, busque el esquema SRC_OCIGGLL y, a continuación, seleccione la tabla en sus respectivas listas desplegables.

  5. Active el registro complementario:

    1. Borre la hoja de trabajo de SQL.

    2. Introduzca la siguiente sentencia y, a continuación, seleccione Ejecutar sentencia:

      ALTER PLUGGABLE DATABASE ADD SUPPLEMENTAL LOG DATA;

Tarea 1: Creación de los recursos

En este ejemplo de inicio rápido se necesitan despliegues y conexiones tanto para el origen como para el destino.

  1. Cree un despliegue de Oracle para la instancia de Autonomous AI Transaction Processing del origen.

  2. Cree un despliegue de Big Data para el destino Apache Iceberg.

  3. Cree una conexión de procesamiento de transacciones de IA autónoma.

  4. Cree una conexión Apache Iceberg.

  5. Cree una conexión de servidor GoldenGate y asignarla al despliegue de Oracle.

  6. Asigne la conexión de procesamiento de transacciones de IA autónoma al despliegue de Oracle.

  7. Asigne la conexión de Apache Iceberg al despliegue de Big Data.

Tarea 2: Adición del Extract

  1. En la página Despliegues, seleccione el despliegue de Autonomous AI Transaction Processing de origen.

  2. En la página de detalles del despliegue, seleccione Iniciar consola.

  3. Conéctese con el nombre de usuario y la contraseña del administrador del despliegue de origen.

  4. Agregue un Extract.

Tarea 3: Adición y ejecución de la ruta de distribución

  1. Si utiliza el almacén de credenciales de GoldenGate, cree un usuario para la ruta de distribución en el despliegue de Big Data del destino; de lo contrario, vaya al paso 3.

  2. En la consola de despliegue de GoldenGate de origen, agregue una conexión de ruta de acceso para el usuario creado en el paso 1.

    1. En la consola de despliegue de GoldenGate de origen, seleccione Conexiones de ruta en la navegación izquierda.

    2. Seleccione Agregar conexión de ruta de acceso (icono más) y, a continuación, complete lo siguiente:

      1. En Alias de credencial, introduzca GGSNetwork.

      2. En User ID (ID de usuario), introduzca el nombre del usuario creado en 1.

      3. Introduzca la contraseña del usuario dos veces para su verificación.

    3. Seleccione Enviar.

      La conexión de ruta de acceso aparece en la lista Conexiones de ruta.

  3. En la consola de despliegue del origen, agregue una ruta de distribución con los siguientes valores:

    1. En la página Opciones de origen:

      • En Extract de origen, seleccione el Extract creado en el tarea 2.

      • En Nombre de la pista, introduzca un Nombre de dos caracteres como E1.

    2. En la página Opciones de destino:

      • En Host de destino, introduzca el dominio de host del despliegue del destino.

      • En Número de puerto, introduzca 443.

      • En Nombre de la pista, introduzca un Nombre de dos caracteres como E1.

      • En Alias, introduzca el alias de credencial creado en la etapa 2.

  4. En la consola de despliegue de Big Data de destino, revise la Ruta de receptor creada como resultado de la Ruta de distribución.

    1. En la consola de despliegue de Big Data de destino, seleccione Servicio de receptor.

    2. Revise los detalles de la ruta. Esta ruta se ha creado como resultado de la Ruta de distribución creada en el paso anterior.

Tarea 4: Adición y ejecución del Replicat

Para agregar y ejecutar un Replicat:

  1. En el menú de navegación de la consola de despliegue de Big Data de destino, seleccione Replicats y, a continuación, Add Replicat (icono más).

  2. En el panel Agregar Replicat, en la página Información de Replicat, complete los campos según sea necesario y, a continuación, seleccione Siguiente:

    • En Tipo de replicación, seleccione Replicat clásico

    • Introduzca un nombre de proceso que no tenga más de 5 caracteres.

    • Introduzca una descripción para ayudar a distinguir este proceso de otros.

  3. En la página Opciones de Replicat, complete los campos según sea necesario y, a continuación, seleccione Siguiente:

    1. En Pista de replicación, introduzca el nombre de la pista de Extract.

    2. En Destino, seleccione Apache Iceberg.

    3. En Formato, seleccione el formato que desea ingerir en Apache Iceberg. El valor por defecto es Parquet.

    4. En Alias disponibles, seleccione la conexión de Apache Iceberg en la lista desplegable.

  4. En la página Managed Options, deje la configuración por defecto y seleccione Next (Siguiente).

  5. En la página Parámetros de Replicat, deje la configuración por defecto y seleccione Siguiente.

  6. En la página Propiedades de Replicat, actualice los campos marcados como TODO y, a continuación, seleccione Crear y ejecutar.

    Consulte Detalles de destino de Apache Iceberg para obtener más información.

Tarea 5: Verificación de la replicación

Para verificar la replicación, realice actualizaciones en la instancia de ATP de origen.

  1. En la consola de Oracle Cloud, abra el menú de navegación, seleccione Oracle AI Database y, a continuación, seleccione Procesamiento de transacciones de IA autónoma.

  2. En la lista de instancias de Autonomous AI Transaction Processing, seleccione la instancia de origen para ver los detalles.

  3. En la página de detalles de base de datos, seleccione Acciones de base de datos.

    Nota: Esta acción le debería conectar de forma automática. Si no es así, conéctese con las credenciales de la base de datos.

  4. En la página de inicio de Database actions, seleccione SQL.

  5. Introduzca lo siguiente en la hoja de trabajo y seleccione Ejecutar script.

    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1000,'Houston',20,743113);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1001,'Dallas',20,822416);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1002,'San Francisco',21,157574);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1003,'Los Angeles',21,743878);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1004,'San Diego',21,840689);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1005,'Chicago',23,616472);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1006,'Memphis',23,580075);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1007,'New York City',22,124434);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1008,'Boston',22,275581);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1009,'Washington D.C.',22,688002);
  6. En la consola, seleccione el nombre del Extract y, a continuación, seleccione Estadísticas. Verifique que SRC_OCIGGLL.SRC_CITY tenga 10 inserciones.

  7. En la consola de despliegue de Big Data OCI GoldenGate de destino, seleccione el nombre del Replicat y, a continuación, seleccione Estadísticas. Verifique que SRC_OCIGGLL.SRC_CITY tenga 10 inserciones.

  8. En la consola de Oracle Cloud, desplácese hasta el cubo de Oracle Object Storage y compruebe su contenido.