Plataforma de datos - Almacén de datos con integración de E-Business
Los analistas necesitan una forma eficiente de consolidar datos de varios sistemas financieros, hojas de cálculo y otros orígenes de datos en un origen de confianza, mantenible y optimizado para consultas.
Con Oracle Autonomous Data Warehouse (ADW) y Oracle Analytics Cloud, puede cargar y optimizar datos de Oracle E-Business Suite y otros orígenes en una ubicación de almacén de datos centralizada para el análisis, para que los departamentos puedan obtener estadísticas útiles.
Esta arquitectura de referencia posiciona la solución tecnológica en el contexto de negocio general:
Las líneas de negocio normalmente no tienen acceso a los datos ni a la información en el momento oportuno o eficiente. Los analistas recopilan los datos manualmente, trabajan con ellos de forma individual y, a continuación, comparten copias de archivos a través del correo electrónico o los servidores de archivos. Los datos no están centralizados, por lo que es difícil garantizar la precisión y la seguridad de los datos. El análisis puede tardar mucho tiempo y los resultados no se pueden repetir fácilmente.
Un data mart es una forma sencilla de un almacén de datos que se centra en un único tema o área funcional, como ventas, marketing o finanzas, y a menudo se crea y controla mediante un único departamento dentro de una organización. Dado su enfoque de un solo sujeto, los data marts suelen extraer datos de solo unos pocos orígenes. Las fuentes podrían incluir sistemas internos, almacenes de datos centrales o datos externos.
Los almacenes de datos y los data marts controlados pueden proporcionar información enriquecida a los usuarios profesionales y, de forma más eficaz, ofrecer los indicadores clave de rendimiento de la organización sin depender en gran medida de los recursos de TI y la disponibilidad.
Arquitectura
Esta arquitectura utiliza transformaciones de datos, una capacidad incluida en Oracle Autonomous Data Warehouse, para cargar y optimizar datos de varios orígenes en un Autonomous Data Warehouse centralizado y, a continuación, utiliza Oracle Analytics Cloud para analizar los datos a fin de proporcionar estadísticas útiles.

Descripción de la ilustración data-platform-ebs.png
La arquitectura se centra en las siguientes divisiones lógicas:
- Ingestión, transformación
Introduce y acota los datos para utilizarlos en cada una de las capas de datos de la arquitectura.
- Conservar, curar y crear
Facilita el acceso y la navegación de los datos para mostrar la vista de negocio actual. Para las tecnologías relacionales, los datos pueden ser lógicos o físicamente estructurados en formas relacionales, longitudinales, dimensionales u OLAP simples. Para datos no relacionales, esta capa contiene uno o más grupos de datos, ya sea de salida de un proceso analítico o de datos optimizados para una tarea analítica específica.
- Análisis, aprendizaje y predicción
Resta la vista lógica de negocio de los datos para los consumidores. Esta abstracción facilita enfoques ágiles para el desarrollo, la migración a la arquitectura de destino y la provisión de una única capa de informes de varias fuentes federadas.
En el siguiente diagrama se muestra una asignación de la arquitectura anterior a los servicios proporcionados en Oracle Cloud Infrastructure mediante las mejores prácticas de seguridad.
La arquitectura tiene los siguientes componentes:
- Autonomous Data Warehouse
Oracle Autonomous Data Warehouse es un servicio de base de datos autogestionado, autoprotegido y autorreparable optimizado para cargas de trabajo de almacenamiento de datos. No es necesario configurar ni gestionar ningún hardware, ni instalar ningún software. Oracle Cloud Infrastructure gestiona la creación de la base de datos, así como la realización de copias de seguridad, la aplicación de parches, la actualización y el ajuste de la base de datos.
- Data Integration
Las transformaciones de datos de Oracle son una herramienta de integración de Oracle Data Integrator (ODI) que se puede desplegar desde acciones de base de datos de Autonomous Database (Herramientas de base de datos). Proporciona una solución totalmente unificada para crear, desplegar y gestionar almacenes de datos complejos o como parte de arquitecturas centradas en los datos en un entorno SOA o de inteligencia empresarial. Además, combina todos los elementos de integración de datos, movimiento de datos, sincronización de datos, calidad de datos y gestión de datos para garantizar que la información sea oportuna, precisa y coherente en todos los sistemas complejos.
- Análisis
Oracle Analytics Cloud es un servicio en la nube pública ampliable y seguro que permite a los analistas de negocio usar capacidades de análisis de autoservicio modernas y basadas en IA para la preparación de datos, la visualización, la generación de informes empresariales, el análisis aumentado y el procesamiento y la generación de lenguaje natural. Con Oracle Analytics Cloud, también obtiene capacidades de gestión de servicios flexibles, incluida la configuración rápida, la ampliación y la aplicación de parches sencillos y la gestión automatizada del ciclo de vida.
La arquitectura también incluye los siguientes componentes:
- Región
Una región de Oracle Cloud Infrastructure es un área geográfica localizada que contiene uno o más centros de datos, denominados dominios de disponibilidad. Las regiones son independientes de otras regiones, y grandes distancias pueden separarlos (entre países o incluso continentes).
- Compartimento
Los compartimentos son particiones lógicas entre regiones dentro de un arrendamiento de Oracle Cloud Infrastructure. Utilice compartimentos para organizar los recursos en Oracle Cloud, controlar el acceso a los recursos y definir cuotas de uso. Para controlar el acceso a los recursos de un compartimento determinado, debe definir políticas que especifiquen quién puede acceder a los recursos y qué acciones pueden realizar.
- Identity and Access Management (IAM)
Oracle Cloud Infrastructure Identity and Access Management (IAM) es el plano de control de acceso de Oracle Cloud Infrastructure (OCI) y las aplicaciones de Oracle Cloud. La API de IAM y la interfaz de usuario permiten gestionar los dominios de identidad y los recursos del dominio de identidad. Cada dominio de identidad de OCI IAM representa una solución independiente de gestión de identidad y acceso o un grupo de usuarios diferente.
- Política
Una política de Oracle Cloud Infrastructure Identity and Access Management especifica quién puede acceder a qué recursos y cómo. El acceso se otorga en el nivel de grupo y compartimento, lo que significa que puede escribir una política que proporcione a un grupo un tipo específico de acceso dentro de un compartimento específico o al arrendamiento.
- Dominio de disponibilidad
Los dominios de disponibilidad son centros de datos independientes dentro de una región. Los recursos físicos de cada dominio de disponibilidad están aislados de los recursos de los otros dominios de disponibilidad, lo que proporciona tolerancia a fallos. Los dominios de disponibilidad no comparten infraestructura tal como suministro eléctrico o sistema de refrigeración o la red del dominio de disponibilidad interno. Por tanto, es poco probable que un fallo en un dominio de disponibilidad afecte a los otros dominios de disponibilidad de la región.
- Red virtual en la nube (VCN) y subred
Una VCN es una red personalizable definida por software que se configura en una región de Oracle Cloud Infrastructure. Al igual que las redes de centros de datos tradicionales, las VCN le ofrecen un control total sobre su entorno de red. Una VCN puede tener varios bloques CIDR no superpuestos que puede cambiar después de crear la VCN. Puede segmentar una VCN en subredes que se pueden acotar a una región o a un dominio de disponibilidad. Cada subred consta de un rango contiguo de direcciones que no se solapan con las otras subredes de la VCN. Puede cambiar el tamaño de una subred después de la creación. Una subred puede ser pública o privada.
- Gateway de Internet
El gateway de Internet permite el tráfico entre las subredes públicas de una VCN y la red pública de Internet.
- VPN de sitio a sitio
La VPN de sitio a sitio proporciona conectividad VPN IPSec entre la red local y las VCN en Oracle Cloud Infrastructure. El conjunto de protocolos IPSec cifra el tráfico IP antes de que los paquetes se transfieran del origen al destino y descifra el tráfico cuando llega.
- Gateway de enrutamiento dinámico (DRG)
El DRG es un enrutador virtual que proporciona una ruta para el tráfico de red privada entre las VCN de la misma región, entre una VCN y una red fuera de la región, como una VCN en otra región de Oracle Cloud Infrastructure, una red local o una red en otro proveedor en la nube.
- Gateway de traducción de direcciones de red (NAT)
Un gateway de NAT permite que los recursos privados de una VCN accedan a los hosts en Internet, sin exponer dichos recursos a las conexiones de Internet entrantes.
- Gateway de servicio
El gateway de servicios proporciona acceso desde una VCN a otros servicios, como Oracle Cloud Infrastructure Object Storage. El tráfico de la VCN al servicio de Oracle recorre el tejido de red de Oracle y no usa nunca Internet.
- Tabla de rutas
Las tablas de rutas virtuales contienen reglas para enrutar el tráfico desde subredes a destinos fuera de una VCN, normalmente a través de gateways.
- Lista de seguridad
Para cada subred, puede crear reglas de seguridad que especifiquen el origen, el destino y el tipo de tráfico que se debe permitir dentro y fuera de la subred.
- Grupo de seguridad de red (NSG)
El grupo de seguridad de red (NSG) actúa como un firewall virtual para sus recursos en la nube. Con el modelo de seguridad de confianza cero de Oracle Cloud Infrastructure, se deniega todo el tráfico y puede controlar el tráfico de red dentro de una VCN. Un NSG consta de un juego de reglas de seguridad de entrada y salida que se aplican solo a un juego especificado de VNIC en una única VCN.
- Host bastión
El host bastión es una instancia informática que sirve como punto de entrada seguro y controlado a la topología desde fuera de la nube. El host bastión se aprovisiona normalmente en una zona desmilitarizada (DMZ). Permite proteger recursos confidenciales colocándolos en redes privadas a las que no se puede acceder directamente desde fuera de la nube. La topología tiene un único punto de entrada conocido que puede supervisar y auditar con regularidad. Por lo tanto, puede evitar exponer los componentes más sensibles de la topología sin comprometer el acceso a ellos.
- Object Storage
El almacenamiento de objetos proporciona acceso rápido a grandes cantidades de datos estructurados y no estructurados de cualquier tipo de contenido, incluidas copias de seguridad de bases de datos, datos analíticos y contenido enriquecido, como imágenes y vídeos. Puede almacenar datos de forma segura y, a continuación, recuperarlos directamente desde Internet o desde la plataforma en la nube. Puede ampliar el almacenamiento sin problemas sin experimentar ninguna degradación del rendimiento o la fiabilidad del servicio. Utilice el almacenamiento estándar para el almacenamiento "en caliente" al que necesita acceder de forma rápida, inmediata y frecuente. Utilice el almacenamiento de archivos para el almacenamiento "en frío" que conserva durante largos períodos de tiempo y a los que rara vez se accede o que rara vez se accede.
Recomendaciones
Utilice las siguientes recomendaciones como punto de partida para cargar y optimizar datos de Oracle E-Business Suite y otros orígenes en una ubicación de almacén de datos centralizada para el análisis.
Sus requisitos pueden diferir de la arquitectura descrita aquí.
- Refinería de datos
Con las transformaciones de datos, un servicio incorporado de Oracle Autonomous Data Warehouse, puede crear asignaciones entre los orígenes y destinos de datos para acotar y limpiar los datos mediante los métodos ETL y E-LT.
- Integración de datos para soportar EBS
Los módulos de conocimiento de Oracle E-Business Suite le ayudan a extraer datos de las aplicaciones empresariales e integrarlos en el almacén de datos con asignaciones regulares de Oracle Database.
- Oracle Analytics Cloud
Antes de conectar Oracle Analytics Cloud a Oracle Autonomous Data Warehouse, haga que un administrador de base de datos agregue la dirección IP (o rango de direcciones) de la instancia de Oracle Analytics Cloud a la lista de direcciones aprobadas. El administrador de la base de datos debe agregar una regla de seguridad que permita el tráfico TCP/IP de Oracle Analytics Cloud a la base de datos.
Consideraciones
Al cargar y optimizar datos de Oracle E-Business Suite y otros orígenes en una ubicación de almacén de datos centralizada para el análisis, tenga en cuenta las siguientes opciones de implantación.
Guía | Refinería de datos | Plataforma de persistencia de datos | Acceso e interpretación |
---|---|---|---|
Recomendado | Herramientas de Oracle Autonomous Data Warehouse | Oracle Autonomous Data Warehouse | Oracle Analytics Cloud |
Otras opciones | Oracle Data Integrator | Oracle Exadata Database Service | |
Racional | Oracle Autonomous Data Warehouse incluye un conjunto de capacidades integrado y fácil de usar para la ingestión y el acotación de datos. Estas herramientas se pueden encontrar en el menú Acciones de base de datos. | Oracle Autonomous Data Warehouse es una base de datos fácil de usar y totalmente autónoma que se amplía de forma flexible, ofrece un rápido rendimiento de consultas y no requiere administración. También ofrece acceso directo a los datos desde el almacenamiento de objetos a través de tablas externas. | Oracle Analytics Cloud es una capa de datos controlada totalmente gestionada e integrada con ella (Oracle Autonomous Data Warehouse). |
Desplegar
El código de Terraform para esta arquitectura de referencia está disponible en GitHub. Puede extraer el código de Oracle Cloud Infrastructure Resource Manager con un solo clic, crear la pila y desplegarla. También puede descargar el código de GitHub en la computadora, personalizar el código y desplegar la arquitectura mediante la CLI de Terraform.
- Realice el despliegue con Oracle Cloud Infrastructure Resource Manager:
- Haga clic en
.
Si aún no ha iniciado sesión, introduzca las credenciales de usuario y arrendamiento.
- Revise y acepte las condiciones.
- Seleccione la región en la que desea desplegar la pila.
- Siga las indicaciones e instrucciones en pantalla para crear la pila.
- Después de crear la pila, haga clic en Acciones de Terraform y seleccione Plan.
- Espere hasta que se termine el trabajo y, a continuación, revise el plan.
Para realizar cambios, vuelva a la página Detalles de pila, haga clic en Editar pila y realice los cambios necesarios. A continuación, vuelva a ejecutar la acción Plan.
- Si no es necesario realizar más cambios, vuelva a la página Detalles de pila, haga clic en Acciones de Terraform y seleccione Aplicar.
- Haga clic en
- Realice el despliegue con la CLI de Terraform:
- Vaya a GitHub.
- Siga las instrucciones del documento
README
.
Explorar más
Obtenga más información sobre las arquitecturas relacionadas y las funciones de esta arquitectura.
-
Almacenes y subalmacenes de datos de departamentos: consolidación de hojas de cálculo
-
Almacenamiento de datos moderno: ejemplo de integración políglota
-
Oracle E-Business Suite en Application Adapters Guide for Oracle Data Integrator
Log de Cambios
Este log solo muestra los cambios significativos:
28 de noviembre de 2022 |
|
21 de abril de 2021 | Diagrama actualizado para mostrar una capa de comunicación que conecta las entidades locales y en la nube con los recursos regionales. |
29 de noviembre de 2021 | Se ha agregado la opción para descargar versiones editables (.SVG y .E/S) del diagrama de arquitectura. |
4 de diciembre de 2020 | Se han agregado pasos para desplegar la arquitectura mediante Oracle Cloud Infrastructure Resource Manager. |
29 de junio de 2020 | Se actualizó el enlace de GitHub para que apunte a la carpeta de casos de uso específica de la carpeta del proyecto. |