Despliegue una plataforma de análisis para Informatica IDMC en Oracle Cloud
La colaboración entre Oracle e Informatica reúne a dos líderes del sector en gestión de datos y bases de datos para ofrecer un completo almacén de datos empresariales y ecosistema de Data Lakehouse.
Esta arquitectura de referencia muestra cómo funciona Informatica IDMC Secure Agent en Oracle Cloud Infrastructure (OCI). Los datos se pueden exportar desde una amplia gama de orígenes locales y en la nube mediante cualquiera de los más de 300 conectores y, a continuación, importarlos a una instancia de Oracle Autonomous Database para que los procesos de análisis o ciencia de datos los consuman.
Sin esta integración, podemos acceder a información procesable desde los datos de nuestra aplicación (por ejemplo, Oracle E-Business Suite), pero no podemos enriquecerla con otras fuentes de datos para obtener información valiosa. Tampoco se recomienda ejecutar cargas de trabajo analíticas en sistemas operativos.
Esta arquitectura de referencia coloca la solución tecnológica en el contexto de negocio general:
La integración proporciona una plataforma analítica en la que los datos de la aplicación que contienen un registro de interacciones se combinan con otros juegos de datos curados en la capa de gestión y se refinan en información e información procesables en la capa de explotación.
Arquitectura
Esta arquitectura de referencia muestra cómo funciona Informatica IDMC Secure Agent en Oracle Cloud Infrastructure (OCI). Los datos se exportan desde aplicaciones, archivos, almacenes de objetos y bases de datos empresariales locales y basadas en la nube y, a continuación, se importan a Oracle Autonomous Database para que los consuman los procesos de análisis o de ciencia de datos.
El siguiente diagrama es una representación funcional de la arquitectura de referencia.
En general, la arquitectura incluye las siguientes divisiones lógicas. Esta arquitectura de referencia se centra en los componentes de arquitectura de renovación de datos y persistencia de datos:
- Ingestión, transformación
Ingiere y refina los datos para su uso en cada una de las capas de datos de la arquitectura.
- Conservar, curar, crear
Facilita el acceso y la navegación de los datos para mostrar la vista de negocio actual e histórica. Contiene tanto datos raw como datos granulares y agregados depurados. Para las tecnologías relacionales, los datos pueden ser lógicos o estructurados físicamente en formas relacionales, longitudinales, dimensionales o OLAP simples. Para los datos no relacionales, esta capa contiene uno o más pools de datos, ya sea de salida de un proceso analítico o de datos optimizados para una tarea analítica específica.
Oracle Autonomous Data Warehouse es un servicio de base de datos autogestionado, autoprotegido y autorreparable que se optimiza para cargas de trabajo de almacenamiento de datos. No es necesario configurar ni gestionar ningún hardware, o instalar cualquier software. Oracle Cloud Infrastructure gestiona la creación de la base de datos, así como la copia de seguridad, la aplicación de parches, la actualización y el ajuste de la base de datos.
- Análisis, aprendizaje y previsión
Resume la vista de negocio lógica de los datos para los consumidores. Esta abstracción facilita enfoques ágiles del desarrollo, la migración a la arquitectura de destino y el suministro de una única capa de informes de varios orígenes federados.
Informatica-oci-arch-oracle.zip
En la arquitectura anterior, la unidad de computación aloja el agente seguro de Informatica Cloud. Informatica Cloud Secure Agent es un programa ligero que ejecuta todas las tareas y permite una comunicación segura entre el firewall de su organización y Informatica Intelligent Data Management Cloud. Cuando el agente seguro ejecuta una tarea, se conecta a la utilidad de alojamiento de Informatica Cloud para acceder a la información de la tarea. Se conecta de forma directa y segura a orígenes y destinos, transfiere datos entre ellos, organiza el flujo de tareas, ejecuta procesos y realiza cualquier requisito de tarea adicional.
La arquitectura tiene los siguientes componentes:
- arrendamiento
Un arrendamiento es una partición segura y aislada que Oracle configura en Oracle Cloud al registrarse en Oracle Cloud Infrastructure. Puede crear, organizar y administrar sus recursos en Oracle Cloud dentro de su arrendamiento. Un arrendamiento es sinónimo de una compañía u organización. Normalmente, una compañía tendrá un solo arrendamiento y reflejará su estructura organizativa dentro de ese arrendamiento. Un único arrendamiento suele estar asociado a una sola suscripción, y una única suscripción suele tener un solo arrendamiento.
- Región
Una región de Oracle Cloud Infrastructure es un área geográfica localizada que contiene uno o más centros de datos, denominados dominios de disponibilidad. Las regiones son independientes de otras regiones y las grandes distancias pueden separarse (entre países e incluso continentes).
- Dominio de disponibilidad
Los dominios de disponibilidad son centros de datos independientes dentro de una región. Los recursos físicos de cada dominio de disponibilidad están aislados de los recursos de los otros dominios de disponibilidad, lo que proporciona tolerancia a fallos. Los dominios de disponibilidad no comparten una infraestructura tal como la alimentación, la refrigeración o la red interna del dominio de disponibilidad. Por tanto, es poco probable que un fallo en un dominio de disponibilidad afecte a los otros dominios de disponibilidad de la región.
- Compartimento
Los compartimentos son particiones lógicas entre regiones dentro de un arrendamiento de Oracle Cloud Infrastructure. Utilice compartimentos para organizar los recursos en Oracle Cloud, controlar el acceso a los recursos y definir cuotas de uso. Para controlar el acceso a los recursos de un compartimento determinado, debe definir políticas que especifiquen quién puede acceder a los recursos y qué acciones pueden realizar.
- Red virtual en la nube (VCN) y subredes
Una VCN es una red personalizable definida por software que se configura en una región de Oracle Cloud Infrastructure. Al igual que las redes de centros de datos tradicionales, las VCN le proporcionan un control total de su entorno de red. Una VCN puede tener varios bloques CIDR no superpuestos que puede cambiar después de crear la VCN. Puede segmentar una VCN en subredes que se pueden acotar a una región o a un dominio de disponibilidad. Cada subred consta de un rango contiguo de direcciones que no se solapan con las demás subredes de VCN. Puede cambiar el tamaño de una subred después de la creación. Una subred puede ser pública o privada.
- Lista de Seguridad
Para cada subred, puede crear reglas de seguridad que especifiquen el origen, el destino y el tipo de tráfico que se debe permitir dentro y fuera de la subred.
- Tabla de ruta
Las tablas de rutas virtuales contienen reglas para enrutar el tráfico desde subredes a destinos fuera de una VCN, normalmente a través de gateways.
- Gateway de internet
El gateway de Internet permite el tráfico entre las subredes públicas de una VCN y la red pública de Internet.
- Gateway de traducción de direcciones de red (NAT)
Un gateway de NAT permite que los recursos privados en una VCN accedan a los hosts en Internet, sin exponer dichos recursos a las conexiones de Internet entrantes.
- Gateway de servicio
El gateway de servicios proporciona acceso desde una VCN a otros servicios, como Oracle Cloud Infrastructure Object Storage. El tráfico desde la VCN al servicio Oracle recorre el tejido de red de Oracle y no internet.
- Servicio bastión
Oracle Cloud Infrastructure Bastion proporciona acceso seguro restringido y limitado por el tiempo a recursos que no tienen puntos finales públicos y que requieren estrictos controles de acceso a los recursos, como máquinas virtuales y con hardware dedicado, Oracle MySQL Database Service, Autonomous Transaction Processing (ATP), Oracle Container Engine for Kubernetes (OKE) y cualquier otro recurso que permita el acceso de protocolo de shell seguro (SSH). Con el servicio Bastion de Oracle Cloud Infrastructure, puede activar el acceso a hosts privados sin desplegar y mantener un host de salto. Además, obtiene una estrategia de seguridad mejorada con permisos basados en identidades y una sesión SSH centralizada, auditada y con límite de tiempo. Bastion de Oracle Cloud Infrastructure elimina la necesidad de una IP pública para el acceso bastión, eliminando la molestia y la posible superficie de ataque al proporcionar acceso remoto.
- Recursos informáticos
El servicio Oracle Cloud Infrastructure Compute permite aprovisionar y gestionar hosts de recursos informáticos en la nube. Puede iniciar instancias informáticas con unidades que cumplan los requisitos de recursos para CPU, memoria, ancho de banda de red y almacenamiento. Después de crear una instancia informática, puede acceder a ella de forma segura, reiniciarla, asociar y desconectar volúmenes y terminarla cuando ya no la necesite.
- Identity and Access Management (IAM)
Oracle Cloud Infrastructure Identity and Access Management (IAM) es el plano de control de acceso de Oracle Cloud Infrastructure (OCI) y las aplicaciones de Oracle Cloud. La API de IAM y la interfaz de usuario permiten gestionar los dominios de identidad y los recursos del dominio de identidad. Cada dominio de identidad de OCI IAM representa una solución independiente de gestión de identidad y acceso o un grupo de usuarios diferente.
- Política
Una política de Oracle Cloud Infrastructure Identity and Access Management especifica quién puede acceder a qué recursos y cómo. El acceso se otorga en el nivel de grupo y compartimento, lo que significa que puede escribir una política que proporcione a un grupo un tipo específico de acceso dentro de un compartimento específico, o al arrendamiento.
- Object Storage
El almacenamiento de objetos proporciona acceso rápido a grandes cantidades de datos estructurados y no estructurados de cualquier tipo de contenido, incluidas copias de seguridad de bases de datos, datos analíticos y contenido enriquecido, como imágenes y vídeos. Puede almacenar datos de forma segura y, a continuación, recuperarlos directamente desde Internet o desde la plataforma en la nube. Puede ampliar el almacenamiento sin problemas sin experimentar ninguna degradación del rendimiento o la fiabilidad del servicio. Utilice el almacenamiento estándar para el almacenamiento "en caliente" al que necesita acceder de forma rápida, inmediata y frecuente. Utilice el almacenamiento de archivos para el almacenamiento "en frío" que conserva durante largos períodos de tiempo y a los que rara vez se accede o que rara vez se accede.
- Autonomous Data Warehouse
Oracle Autonomous Data Warehouse es un servicio de base de datos autogestionado, autoprotegido y autorreparable que se optimiza para cargas de trabajo de almacenamiento de datos. No es necesario configurar ni gestionar ningún hardware, o instalar cualquier software. Oracle Cloud Infrastructure gestiona la creación de la base de datos, así como la copia de seguridad, la aplicación de parches, la actualización y el ajuste de la base de datos.
Recomendaciones
Utilice las siguientes recomendaciones como punto de partida para integrar la plataforma Informatica IDMC en Oracle Cloud.
Sus requisitos pueden diferir de la arquitectura descrita aquí.
- Red virtual en la nube (VCN)
Al crear una VCN, determine el número de bloques CIDR necesarios y el tamaño de cada bloque según el número de recursos que planea asociar a subredes en la VCN. Utilice bloques CIDR que estén dentro del espacio de dirección IP privada estándar.
Seleccione bloques CIDR que no se solapen con ninguna otra red (en Oracle Cloud Infrastructure, su centro de datos local u otro proveedor en la nube) en la que desea configurar conexiones privadas.
Después de crear una VCN, puede cambiar, agregar y eliminar sus bloques CIDR.
Al diseñar las subredes, tenga en cuenta los requisitos de seguridad y flujo de tráfico. Conecte todos los recursos de un nivel o rol específico a la misma subred, que puede servir como límite de seguridad.
Utilice subredes regionales.
- Máquinas virtuales y otras recomendaciones
Para obtener información sobre el tamaño de las máquinas virtuales y otras recomendaciones, consulte los enlaces de la sección Desplegar.
- Listas de seguridad
Utilice listas de seguridad para definir reglas de entrada y salida que se aplican a toda la subred.
Consideraciones
Al integrar la plataforma Informatica IDMC en Oracle Cloud, tenga en cuenta estas opciones de implantación.
Integración de Informatica | Refinería de datos | Plataforma de persistencia de datos |
---|---|---|
Recomendado | Informatica Intelligent Data Management Cloud (IDMC) | Oracle Autonomous Data Warehouse (ADW) |
Otras opciones | N/D | Exadata |
Racional | Informatica considera que Informatica IDMC es la plataforma de integración empresarial como servicio más completa, basada en microservicios, basada en API y basada en IA. Con IDMC, un cliente dispone de flexibilidad para utilizar cualquier servicio en la nube que Informatica pueda satisfacer sus necesidades de integración y gobernanza. | ADW es una base de datos fácil de usar y totalmente autónoma que se escala de forma flexible, ofrece un rápido rendimiento de consultas y no requiere administración. También ofrece acceso directo a los datos desde el almacenamiento de objetos mediante tablas externas. |
Despliegue
El código de Terraform está disponible como pila de ejemplo en Oracle Cloud Infrastructure Resource Manager. También puede descargar el código de GitHub y personalizarlo según sus necesidades.
- Despliegue mediante la pila de ejemplo en Oracle Cloud Infrastructure Resource Manager:
- Vaya a
.
Si aún no ha iniciado sesión, introduzca el arrendamiento y las credenciales de usuario.
- Seleccione la región en la que desea desplegar la pila.
- Siga las indicaciones y las instrucciones en pantalla para crear la pila.
- Después de crear la pila, haga clic en Acciones de Terraform y seleccione Plan.
- Espere a que se complete el trabajo y revise el plan.
Para realizar cambios, vuelva a la página Detalles de pila, haga clic en Editar pila y realice los cambios necesarios. A continuación, vuelva a ejecutar la acción Plan.
- Si no es necesario realizar más cambios, vuelva a la página Detalles de pila, haga clic en Acciones de Terraform y seleccione Aplicar.
- Vaya a
- Realice el despliegue con el código de Terraform en GitHub:
- Vaya a GitHub.
- Clone o descargue el repositorio en la computadora local.
- Siga las instrucciones del documento
README
.