Plataforma de datos - Almacén de datos de departamento para línea de negocio (LOB)

Utilice Oracle Autonomous Data Warehouse y Oracle Analytics Cloud para cargar y optimizar datos de Oracle E-Business Suite, hojas de cálculo, terceros y otras fuentes en un almacén de datos centralizado para que los departamentos puedan analizar los datos y obtener estadísticas útiles.

Esta arquitectura de referencia posiciona la solución tecnológica en el contexto empresarial general:



Normalmente, las líneas de negocio no tienen acceso oportuno o eficiente a datos e información. Los analistas recopilan los datos manualmente, trabajan con ellos de forma individual y luego comparten copias de archivos a través de servidores de correo electrónico o de archivos. Los datos no están centralizados, por lo que garantizar la exactitud y la seguridad de los datos es difícil. El análisis puede tardar mucho tiempo y los resultados no son fácilmente repetibles.

Un almacén de datos departamental es una forma sencilla de almacén de datos que se centra en un solo tema o área funcional, como ventas, marketing o finanzas, y que a menudo se crea y controla mediante un solo departamento dentro de una organización. Dado su enfoque de un solo tema, los almacenes de datos departamentales suelen extraer datos de unas pocas fuentes. Las fuentes podrían incluir sistemas internos, un almacén de datos central o datos externos.

Los almacenes de datos empresariales y departamentales controlados pueden proporcionar información enriquecida a los usuarios profesionales y ofrecer de forma más eficaz los indicadores clave de rendimiento de la organización sin depender en gran medida de los recursos de TI y la disponibilidad.

Arquitectura

Esta arquitectura utiliza Oracle Autonomous Data Warehouse para cargar y optimizar datos de varios sistemas financieros, hojas de cálculo y otros orígenes de datos en un almacén de datos centralizado y, a continuación, utiliza Oracle Analytics Cloud para analizar los datos a fin de proporcionar información práctica.

Esta arquitectura admite varios casos de uso. La ruta de acceso más directa proporciona un método sencillo para adquirir, transformar y cargar datos en el almacén de datos mediante herramientas embebidas en Oracle Autonomous Data Warehouse (ADW). Otras rutas soportan escenarios que utilizan un lago de datos o escenarios con requisitos de extracción, transformación y carga (ETL) más complejos.


A continuación se muestra la descripción de data-platform-ebs.png
Descripción de la ilustración data-platform-ebs.png

plataforma-datos-ebs-oracle.zip

La arquitectura se centra en las siguientes divisiones lógicas:

  • Ingestión, transformación y conexión

    Ingiere y refina los datos para su uso en cada una de las capas de datos de la arquitectura.

  • Conservar, curar, crear

    Facilita el acceso y la navegación de los datos para mostrar la vista de negocio actual. Para las tecnologías relacionales, los datos pueden ser lógicos o estructurados físicamente en formas relacionales, longitudinales, dimensionales o OLAP simples. Para datos no relacionales, esta capa contiene una o más agrupaciones de datos, ya sea de salida de un proceso analítico o de datos optimizados para una tarea analítica específica.

  • Análisis, aprendizaje y previsión

    Resume la visión empresarial lógica de los datos para los consumidores. Esta abstracción facilita enfoques ágiles del desarrollo, la migración a la arquitectura de destino y la provisión de una sola capa de informes de múltiples fuentes federadas.

En el siguiente diagrama se muestra una asignación de la arquitectura a los servicios proporcionados en Oracle Cloud Infrastructure con seguridad básica.



oci-adb-oac-arch-public-oracle.zip

La arquitectura cuenta con los siguientes componentes:

  • Autonomous Data Warehouse

    Oracle Autonomous Data Warehouse es un servicio de base de datos autogestionable, autoseguro y autoreparador optimizado para cargas de trabajo de almacenamiento de datos. No es necesario configurar ni administrar ningún hardware ni instalar ningún software. Oracle Cloud Infrastructure maneja la creación de la base de datos, así como la copia de seguridad, aplicación de parches, actualización y ajuste de la base de datos.

  • Analíticas

    Oracle Analytics Cloud es un servicio en la nube pública escalable y seguro que proporciona un juego completo de capacidades para explorar y realizar análisis colaborativos para usted, para su grupo de trabajo y para su empresa.

    Con Oracle Analytics Cloud también obtiene capacidades flexibles de gestión de servicios, como configuración rápida, escalado y aplicación de parches fáciles y gestión automatizada del ciclo de vida.

  • Integración de datos

    Oracle Autonomous Data Warehouse incluye herramientas para adquirir, cargar y transformar datos para muchos escenarios departamentales.

    Para casos de uso avanzado, puede utilizar Oracle Cloud Infrastructure Data Integration, un servicio en la nube nativo totalmente gestionado, sin servidor que le ayuda con tareas comunes de extracción, carga y transformación (ETL), como ingerir datos de diferentes orígenes, limpiar, transformar y cambiar la configuración de esos datos y, a continuación, cargarlos eficazmente en orígenes de datos de destino en Oracle Cloud Infrastructure.

La arquitectura también incluye los siguientes componentes:
  • Región

    Una región de Oracle Cloud Infrastructure es un área geográfica localizada que contiene uno o más centros de datos, denominados dominios de disponibilidad. Las regiones son independientes de otras regiones, y las grandes distancias pueden separarlas (entre países e incluso continentes).

  • Compartimento

    Los compartimentos son particiones lógicas entre regiones dentro de un arrendamiento de Oracle Cloud Infrastructure. Utilice compartimentos para organizar los recursos en Oracle Cloud, controlar el acceso a los recursos y definir cuotas de uso. Para controlar el acceso a los recursos de un compartimento determinado, debe definir políticas que especifiquen quién puede acceder a los recursos y qué acciones pueden realizar.

  • Identity and Access Management (IAM)

    Oracle Cloud Infrastructure Identity and Access Management (IAM) es el plano de control de acceso para Oracle Cloud Infrastructure (OCI) y las aplicaciones de Oracle Cloud. La API de IAM y la interfaz de usuario le permiten gestionar los dominios de identidad y los recursos del dominio de identidad. Cada dominio de identidad de OCI IAM representa una solución de gestión de identidad y acceso independiente o un grupo de usuarios diferente.

  • Política

    Una política de Oracle Cloud Infrastructure Identity and Access Management especifica quién puede acceder a qué recursos y cómo. El acceso se otorga en el nivel de grupo y compartimento, lo que significa que puede escribir una política que proporcione a un grupo un tipo específico de acceso dentro de un compartimento específico, o al arrendamiento.

  • Dominio de disponibilidad

    Los dominios de disponibilidad son centros de datos independientes dentro de una región. Los recursos físicos de cada dominio de disponibilidad están aislados de los recursos de los otros dominios de disponibilidad, lo que proporciona tolerancia a fallos. Los dominios de disponibilidad no comparten infraestructura, como alimentación o refrigeración, ni la red interna del dominio de disponibilidad. Por lo tanto, es improbable que un fallo en un dominio de disponibilidad afecte a los otros dominios de la región.

  • Red virtual en la nube (VCN) y subred

    Una VCN es una red personalizable y definida por software que se configura en una región de Oracle Cloud Infrastructure. Al igual que las redes de centros de datos tradicionales, las redes virtuales le proporcionan un control completo de su entorno de red. Una VCN puede tener varios bloques CIDR no superpuestos que puede cambiar después de crear la VCN. Puede segmentar una VCN en subredes, que se pueden acotar a una región o a un dominio de disponibilidad. Cada subred está compuesta por un rango contiguo de direcciones que no se solapan con las demás subredes de la VCN. Puede cambiar el tamaño de una subred después de la creación. Una subred puede ser pública o privada.

  • Lista de seguridad

    Para cada subred, puede crear reglas de seguridad que especifiquen el origen, el destino y el tipo de tráfico que se debe permitir dentro y fuera de la subred.

  • Tabla de ruta

    Las tablas de rutas virtuales contienen reglas para enrutar el tráfico desde subredes hasta destinos fuera de una VCN, normalmente a través de gateways.

  • Gateway de internet

    El gateway de Internet permite el tráfico entre las subredes públicas de una VCN y la red pública de Internet.

  • VPN de sitio a sitio

    La VPN de sitio a sitio proporciona conectividad VPN IPSec entre la red local y las VCN en Oracle Cloud Infrastructure. El conjunto de protocolos IPSec cifra el tráfico IP antes de transferir los paquetes del origen al destino y descifra el tráfico cuando llega.

  • Gateway de enrutamiento dinámico (DRG)

    El DRG es un enrutador virtual que proporciona una ruta para el tráfico de red privada entre las redes virtuales de la misma región, entre una VCN y una red fuera de la región, como una VCN de otra región de Oracle Cloud Infrastructure, una red local o una red de otro proveedor en la nube.

  • Gateway de traducción de direcciones de red (NAT)

    Un gateway de NAT permite a los recursos privados de una VCN acceder a los hosts de Internet, sin exponer dichos recursos a las conexiones de Internet entrantes.

  • Gateway de servicio

    El gateway de servicios proporciona acceso desde una VCN a otros servicios, como Oracle Cloud Infrastructure Object Storage. El tráfico desde la VCN al servicio Oracle recorre el tejido de red de Oracle y no Internet.

  • Grupo de seguridad de red (NSG)

    El grupo de seguridad de red (NSG) actúa como firewall virtual para sus recursos en la nube. Con el modelo de seguridad de confianza cero de Oracle Cloud Infrastructure, se deniega todo el tráfico y puede controlar el tráfico de red dentro de una VCN. Un NSG está formado por un conjunto de reglas de seguridad de entrada y salida que se aplican sólo a un conjunto especificado de VNIC en una única VCN.

  • Object Storage

    El almacenamiento de objetos proporciona acceso rápido a grandes cantidades de datos estructurados y no estructurados de cualquier tipo de contenido, incluidas copias de seguridad de bases de datos, datos analíticos y contenido enriquecido, como imágenes y vídeos. Puede almacenar datos de forma segura y, a continuación, recuperarlos directamente desde Internet o desde la plataforma en la nube. Puede ampliar el almacenamiento sin problemas sin que se produzca ninguna degradación del rendimiento o la fiabilidad del servicio. Utilice el almacenamiento estándar para el almacenamiento "activo" al que tenga que acceder de forma rápida, inmediata y frecuente. Utilice el almacenamiento de archivos para el almacenamiento "en frío" que retiene durante largos períodos de tiempo y a los que rara vez o rara vez accede.

Recomendaciones

Utilice las siguientes recomendaciones como punto de partida para cargar y optimizar datos de varios orígenes de fibra plana en una ubicación centralizada del almacén de datos para su análisis.

Sus requisitos pueden diferir de la arquitectura descrita aquí.

  • Refinería de datos

    Las herramientas de Autonomous Database están integradas en Oracle Autonomous Data Warehouse y proporcionan la capacidad de cargar, transformar, catalogar, obtener estadísticas e incluso desarrollar modelos de negocio de forma sencilla y directa. Estas herramientas se pueden encontrar en el menú Database Actions.

  • Oracle Analytics Cloud

    Antes de conectar Oracle Analytics Cloud a Oracle Autonomous Data Warehouse, haga que un administrador de base de datos agregue la dirección IP (o rango de direcciones) de su instancia de Oracle Analytics Cloud a la lista de direcciones permitidas. El administrador de la base de datos debe agregar una regla de seguridad que permita el tráfico TCP/IP de Oracle Analytics Cloud a la base de datos.

Consideraciones

Al cargar y optimizar datos de varios orígenes de fibra plana en una ubicación centralizada del almacén de datos para su análisis, tenga en cuenta estas opciones de implantación.

Orientación Refinería de datos Plataforma de Persistencia de Datos Acceso e interpretación
Recomendación Herramientas de Oracle Autonomous Database (acciones de base de datos) Oracle Autonomous Data Warehouse Oracle Analytics Cloud
Otras opciones Integración de datos de Oracle Cloud Infrastructure Oracle Exadata Database Service  
Racional Oracle Autonomous Data Warehouse es una base de datos fácil de usar y totalmente autónoma que ofrece acceso directo e ingestión de una variedad de orígenes de datos, como archivos CSV y orígenes de datos relacionales. Oracle Autonomous Data Warehouse es una base de datos fácil de usar y totalmente autónoma que escala de forma flexible, ofrece un rendimiento de consulta rápido y no requiere administración de base de datos. También ofrece acceso directo a los datos del almacenamiento de objetos a través de tablas externas. Oracle Analytics Cloud es una capa de datos seleccionada totalmente gestionada e íntegramente (Oracle Autonomous Data Warehouse).

Desplegar

El código Terraform de esta arquitectura de referencia está disponible en GitHub. Puede extraer el código a Oracle Cloud Infrastructure Resource Manager con un solo clic, crear la pila y desplegarlo. De manera alternativa, puede descargar el código de GitHub en el equipo, personalizar el código y desplegar la arquitectura mediante la interfaz de línea de comandos (CLI) de Terraform.

  • Desplegar mediante Oracle Cloud Infrastructure Resource Manager:
    1. Haga clic en Despliegue en Oracle Cloud

      Si aún no ha iniciado sesión, introduzca las credenciales de arrendamiento y usuario.

    2. Revise y acepte las condiciones.
    3. Seleccione la región en la que desea desplegar la pila.
    4. Siga las indicaciones e instrucciones de la pantalla para crear la pila.
    5. Después de crear la pila, haga clic en Acciones de Terraform y seleccione Plan.
    6. Espere a que se termine el trabajo y, a continuación, revise el plan.

      Para realizar cambios, vuelva a la página Detalles de Pila, haga clic en Editar Pila y realice los cambios necesarios. A continuación, vuelva a ejecutar la acción Plan.

    7. Si no son necesarios otros cambios, vuelva a la página Detalles de Pila, haga clic en Acciones de Terraform y seleccione Aplicar.
  • Desplegar mediante el código Terraform en GitHub:
    1. Vaya a GitHub.
    2. Clonar o descargar el repositorio en el equipo local.
    3. Siga las instrucciones del documento README.

Log de Cambios

Este log muestra solo los cambios significativos: