Adición de una extracción para MongoDB
Un Extract es un proceso que se ejecuta en la conexión del origen de datos de fuente y extrae, o captura, datos. Descubra cómo agregar un Extract para MongoDB.
Adición de un Extract (26ai)
Antes de comenzar, asegúrese de que:
-
Revise los detalles específicos de este tipo de conexión de origen.
-
Configurar un juego de réplicas de MongoDB:
-
OCI GoldenGate for Big Data utiliza el log de operaciones (oplog) para leer los registros de captura de datos de cambio (CDC). El oplog es una recopilación limitada en MongoDB que mantiene un registro sucesivo de todas las operaciones que modifican la base de datos. Los archivos Oplog se crean cuando se activa un juego de réplicas en MongoDB.
-
MongoDB Atlas viene preconfigurado con un conjunto Replicat. Para despliegues MongoDB locales, debe configurar y desplegar manualmente un juego de Replicat para activar la funcionalidad oplog y CDC. Para MongoDB local, debe desplegar un juego de réplicas.
-
-
Tenga MongoDB versión 3.6 o posterior.
-
Tenga soporte de OCI GoldenGate para capturar las siguientes operaciones:
INSERT,UPDATE,DELETE.
Para agregar una extracción para MongoDB:
-
In the OCI GoldenGate deployment console navigation menu, select Extracts.
-
En la página Extracts, seleccione Add Extract.
-
En el panel Agregar extracción, en la página Información de extracción, complete los siguientes campos según sea necesario y, a continuación, seleccione Siguiente:
-
Introduzca un nombre de proceso que no tenga más de 8 caracteres.
-
Introduzca una descripción (opcional) que le ayude a distinguir este proceso de otros.
-
Seleccione un Origen en la lista desplegable.
-
-
En la página Opciones de extracción, complete los siguientes campos según sea necesario y, a continuación, seleccione Siguiente:
-
Para Pista de extracción:
-
Introduzca un nombre para el proceso de Extract.
-
Introduzca un nombre de subdirectorio para definir una ubicación personalizada para el archivo de pista generado.
-
Introduzca Secuencia de pista para definir el número de inicio para los archivos de pista.
-
Introduzca un Tamaño de Pista para definir el tamaño máximo para el archivo del pista generado.
-
Seleccione un Perfil de cifrado. El perfil Cartera local está seleccionado por defecto si no se ha creado un perfil de cifrado.
-
Seleccione un algoritmo de cifrado:
-
NONE
-
AES256
-
AES192
-
AES128
-
-
-
En Credenciales de origen, seleccione:
-
Dominio
-
Alias
-
Cuándo y dónde comenzar
-
-
-
En la página Opciones gestionadas, complete los siguientes campos opcionales según sea necesario y, a continuación, seleccione Siguiente:
-
Nombre del perfil
-
Crucial para estado de despliegue
-
Iniciar automáticamente
-
Reinicio automático
Nota: la adición de un perfil y la configuración de las opciones Inicio automático y Reinicio automático permite que el despliegue se reinicie automáticamente después de una interrupción de la red. Consulte Configuración de procesos gestionados para obtener más información.
-
-
En la página Archivo de Parámetros, actualice la asignación de origen con
TABLE source.*;Nota: Esta es la asignación de recopilación/base de datos de origen.
TABLE *.*;da como resultado el proceso de extracción de todas las bases de datos/recopilaciones. -
Seleccione Crear y ejecutar para crear e iniciar el Extract. Si selecciona Crear, puede iniciar manualmente la extracción más adelante desde la página Extracts.
Adición de un Extract (21c)
-
En la Consola de Despliegue de OCI GoldenGate, asegúrese de que está en la página Visión General del Servicio de Administración y, a continuación, seleccione Agregar Extract (icono de signo mas).
-
En la página Agregar Extract, en el tipo de Extract, seleccione una de las opciones siguientes y, a continuación, seleccione Siguiente:
-
Carga Inicial
-
Captura de cambios en los datos
-
-
En la página Opciones de Extract, complete los campos como se indica a continuación y, a continuación, seleccione Siguiente:
-
En Nombre de proceso, introduzca un nombre para Extract.
-
En Alias de conexión, seleccione el alias de conexión en la lista desplegable.
-
En Origen, seleccione Archivo.
-
En Nombre de archivo, introduzca tres caracteres como mínimo para el nombre de archivo.
-
(Opcional) En Opciones gestionadas, puede configurar lo siguiente:
-
Nombre del perfil
-
Iniciar automáticamente
-
Reinicio automático
Nota: la adición de un perfil y la configuración de las opciones Inicio automático y Reinicio automático permite que el despliegue se reinicie automáticamente después de una interrupción de la red. Consulte Configuración de Procesos Gestionados para obtener más información.
-
-
-
En la página Archivo de Parámetros, actualice la asignación de origen con
TABLE source.*;Nota: Esta es la asignación de recopilación/base de datos de origen.
TABLE *.*;da como resultado el proceso de extracción de todas las bases de datos/recopilaciones. -
Seleccione Crear y ejecutar.
Volverá a la página Visión general del servicio de administración. Seleccione el nombre de Extract para ver los detalles y los informes de Extract.
Incidencias conocidas
Fallo de réplicas al utilizar el archivo de pista de extracción de MongoDB con BINARY_JSON_FORMAT
Cuando un Replicat utiliza un archivo de pista generado a partir de una extracción MongoDB con BINARY_JSON_FORMAT en el archivo de parámetros Extract, el Replicat falla con el siguiente error:
ERROR 2023-08-04 17:13:13.000421 [main] - Unable to decode column 0 : Input length = 1
java.nio.charset.MalformedInputException: Input length = 1 at
java.nio.charset.CoderResult.throwException(CoderResult.java:281) ~[?:1.8.0_311]at java.nio.charset.CharsetDecoder.decode(CharsetDecoder.java:816) ~[?:1.8.0_311] at
oracle.goldengate.datasource.UserExitDataSource.createColumnValue(UserExitDataSource.java:1106)
[ggdbutil-21.9.0.0.3.001.jar:21.9.0.0.3.001] Exception in thread "main"
oracle.goldengate.util.GGException: Unable to decode column 0 : Input length = 1 at
oracle.goldengate.datasource.UserExitDataSource.createColumnValue(UserExitDataSource.java:1203)
Solución alternativa: cuando se elimina BINARY_JSON_FORMAT de los parámetros Extract, el Replicat se ejecuta correctamente y los documentos se representan en formato JSON extendido.