Replicación de datos de Autonomous Transaction Processing en Databricks
En este inicio rápido se muestra cómo replicar datos de Autonomous Transaction Processing en Databricks mediante OCI GoldenGate.
Antes de empezar
Para completar correctamente este inicio rápido, debe tener lo siguiente:
- Una instancia de Autonomous Transaction Processing de origen
- Espacio de trabajo Databricks con Unity Catalog
- Credencial de almacenamiento para acceder a la cuenta de Azure Storage
- Ubicación externa para acceder a la cuenta de Azure Storage
- Esquema disponible en el catálogo de destino
- URL de JDBC para el acceso a Databricks
- Ladrillos de datos para tokens de acceso
- Conexión de almacenamiento de lago de datos de Azure
Configuración del entorno: Autonomous Transaction Processing
Si aún no tiene una base de datos de origen configurada para la replicación, puede seguir estos pasos para cargar un esquema de ejemplo que utilizar para este inicio rápido. Este inicio rápido utiliza Autonomous Transaction Processing para la base de datos de origen.
Para configurar la instancia de Autonomous Database de origen:
- Descargue y descomprima el esquema de base de datos de ejemplo.
- En la consola de Oracle Cloud, seleccione la instancia de Autonomous Transaction Processing (ATP) en la página Bases de datos autónomas para ver los detalles y acceder a Database Actions.
- Desbloquee el usuario de GGADMIN:
- Haga clic en Acciones de base de datos y, a continuación, en Usuarios de base de datos.
- Busque GGADMIN y, a continuación, haga clic en el menú desplegable (tres puntos) y seleccione Editar.
- En el panel Edit User, introduzca la contraseña de GGADMIN, confirme la contraseña y, a continuación, anule la selección de Account is Locked.
- Haga clic en Aplicar cambios.
- Cargue el esquema y los datos de ejemplo de origen:
- Active el registro complementario:
Tarea 1: Creación de recursos de OCI GoldenGate
En este ejemplo de inicio rápido se necesitan despliegues y conexiones tanto para el origen como para el destino.
- Cree un despliegue de Oracle para la instancia de Autonomous Transaction Processing de origen.
- Cree un despliegue de Big Data para los Databricks de destino.
- Cree una conexión a Autonomous Transaction Processing de origen.
- Creación de una conexión a Databricks.
- Cree una conexión para Azure Data Lake Storage.
- Cree una conexión a GoldenGate y, a continuación, asigne esta conexión al despliegue de Oracle de origen.
- Asigne la conexión de Autonomous Transaction Processing al despliegue de Oracle de origen.
- Asigne la conexión de Databricks al despliegue de Big Data de destino.
- Asigne la conexión de Azure Data Lake Storage al despliegue de Big Data de destino.
Tarea 2: Adición de Extract
- En la página Despliegues, seleccione el despliegue de Autonomous Transaction Processing de origen.
- En la página de detalles del despliegue, haga clic en Iniciar consola.
- Conéctese con el nombre de usuario y la contraseña del administrador del despliegue de origen.
- Agregue la información de transacción.
- Agregue un Extract.
Tarea 3: Adición y ejecución de Distribution Path
- Si utiliza el almacén de credenciales GoldenGate, cree un usuario para la ruta de distribución en el despliegue de Big Data de destino; de lo contrario, vaya al paso 3.
- En la consola de despliegue de ATP de origen GoldenGate, agregue una conexión de ruta para el usuario creado en el paso 1.
- En la consola de despliegue de ATP de origen, agregue una ruta de distribución con los siguientes valores:
- En la consola de despliegue de Big Data de destino, consulte Receiver Path creado como resultado de Distribution Path.
- En la consola de despliegue de Big Data de destino, haga clic en Receiver Service.
- Revise los detalles de la ruta. Esta ruta se ha creado como resultado de la creación de Distribution Path en el paso anterior.
Tarea 4: Adición y ejecución del Replicat
Vuelva a la página Overview, donde puede revisar los detalles de Replicat.
Tarea 5: Verificación de la replicación
Realice algunas actualizaciones en la instancia de Autonomous Transaction Processing de origen para verificar la replicación en Databricks.