Replicación de datos de Autonomous Transaction Processing en Databricks
En este inicio rápido se muestra cómo replicar datos de Autonomous Transaction Processing en Databricks mediante OCI GoldenGate.
Configuración del entorno: Autonomous Transaction Processing
Si aún no tiene una base de datos de origen configurada para la replicación, puede seguir estos pasos para cargar un esquema de ejemplo que utilizar para este inicio rápido. Este inicio rápido utiliza Autonomous Transaction Processing como base de datos de origen.
Para configurar la instancia de Autonomous Database de origen:
- Descargue y descomprima el esquema de base de datos de ejemplo.
- En la consola de Oracle Cloud, seleccione la instancia de Autonomous Transaction Processing (ATP) en la página de bases de datos autónomas para ver los detalles y acceder a Database Actions.
- Desbloquee el usuario de GGADMIN:
- Haga clic en Acciones de base de datos y, a continuación, en Usuarios de base de datos.
- Busque GGADMIN y, a continuación, haga clic en el menú de puntos suspensivos (tres puntos) y seleccione Editar.
- En el panel Editar usuario, introduzca la contraseña de GGADMIN, confirme la contraseña y, a continuación, anule la selección de La cuenta está bloqueada.
- Haga clic en Aplicar cambios.
- Cargue el esquema y los datos de ejemplo de origen:
- Active el registro complementario:
Antes de empezar
Para completar correctamente este inicio rápido, debe tener lo siguiente:
- Una instancia de Autonomous Transaction Processing de origen
- Espacio de trabajo de Databricks con Unity Catalog
- Credencial de almacenamiento para acceder a la cuenta de Azure Storage
- Ubicación externa para acceder a la cuenta de Azure Storage
- Esquema disponible en el catálogo de destino
- URL de JDBC para el acceso a Databricks
- Ladrillos de datos para tokens de acceso
- Conexión de almacenamiento de lago de datos de Azure
Tarea 1: Creación de recursos de OCI GoldenGate
En este ejemplo de inicio rápido se necesitan despliegues y conexiones tanto para el origen como para el destino.
- Cree un despliegue de Oracle para la instancia de Autonomous Transaction Processing de origen.
- Cree un despliegue de Big Data para los bloques de datos de destino.
- Cree una conexión a Autonomous Transaction Processing de origen.
- Creación de una conexión a Databricks.
- Cree una conexión para Azure Data Lake Storage.
- Cree una conexión a GoldenGate y, a continuación, asigne esta conexión al despliegue de Oracle de origen.
- Asigne la conexión de Autonomous Transaction Processing al despliegue de Oracle de origen.
- Asigne la conexión de Databricks al despliegue de Big Data de destino.
- Asigne la conexión de Azure Data Lake Storage al despliegue de Big Data de destino.
Tarea 2: Adición de Extract
- En la página Despliegues, seleccione el despliegue de Autonomous Transaction Processing de origen.
- En la página de detalles del despliegue, haga clic en Iniciar consola.
- Conéctese con el nombre de usuario y la contraseña del administrador del despliegue de origen.
- Agregue la información de transacción.
- Agregue un Extract.
Tarea 3: Adición y ejecución de Distribution Path
- Si utiliza el almacén de credenciales GoldenGate, cree un usuario para la ruta de distribución en el despliegue de Big Data de destino; de lo contrario, vaya al paso 3.
- En la consola de despliegue de ATP GoldenGate de origen, agregue una conexión de ruta para el usuario creado en el paso 1.
- En la consola de despliegue de ATP de origen, agregue una ruta de distribución con los siguientes valores:
- En la consola de despliegue de Big Data de destino, consulte Receiver Path creado como resultado de Distribution Path.
- En la consola de despliegue de Big Data de destino, haga clic en Receiver Service.
- Revise los detalles de la ruta. Esta ruta se ha creado como resultado de Distribution Path creado en el paso anterior.
Tarea 4: Adición y ejecución del Replicat
Vuelva a la página Overview, donde puede revisar los detalles de Replicat.
Tarea 5: Verificación de la replicación
Realice algunas actualizaciones en la instancia de Autonomous Transaction Processing de origen para verificar la replicación en Databricks.