Acerca del uso de Oracle Modern Data Platform para la generación de informes y previsiones empresariales

Este diseño explora el uso de Oracle Modern Data Platform para la generación de informes y previsiones empresariales.

Considere el caso de uso en el que una empresa tiene una gran cantidad de datos de ventas de productos de orígenes internos y externos. Si bien los datos de ventas históricos y recientes tienen valor para la compañía, la mayoría solo se utilizan datos de meses o años recientes en el negocio diario. Los consumidores de estos datos son usuarios profesionales que utilizan estos datos para la generación de informes, el análisis y la previsión. Quieren que sus informes y paneles de control devuelvan resultados rápidamente para maximizar la productividad de los empleados.

Tradicionalmente, las empresas dependían de almacenes de datos basados en bases de datos relacionales para informar casos de uso como el mencionado anteriormente. Sin embargo, estas implementaciones tenían varias limitaciones: la escalabilidad y el rendimiento eran las más destacadas de esas limitaciones.

Arquitectura

Un enfoque más moderno es utilizar una arquitectura de data lakehouse compuesta por OCI Object Storage, tecnologías de Big Data como Hadoop, Spark y bases de datos columnares o tradicionales para la generación de informes.

Oracle Cloud Infrastructure (OCI) tiene una amplia gama de herramientas y servicios que se adaptan a todos los aspectos de una plataforma de datos moderna. En esta solución, analizamos un pequeño subconjunto de servicios de OCI que abordan los requisitos arquitectónicos.

  1. OCI Object Storage: una plataforma de almacenamiento de alto rendimiento a escala de Internet que ofrece durabilidad de datos fiable y rentable. Puede almacenar una cantidad ilimitada de datos no estructurados de cualquier tipo de contenido, incluidos los datos analíticos y el contenido rico, como imágenes y vídeos.
  2. Oracle Big Data Service: servicio de Hadoop gestionado diseñado para un juego variado de cargas de trabajo y casos de uso de Big Data. Desde clústeres de corta duración que se utilizan para abordar tareas específicas hasta clústeres de larga duración que se pueden escalar horizontalmente para satisfacer las necesidades de una organización a un bajo costo y con los más altos niveles de seguridad.
  3. Oracle Autonomous Database: una base de datos fácil de usar y totalmente autónoma que se escala de forma flexible y ofrece un rápido rendimiento de consultas. Como servicio, en Autonomous Database no se necesita administración de base de datos.
  4. Oracle Analytics Cloud: un servicio en la nube pública escalable y seguro que ofrece a los consumidores y analistas empresariales funciones de autoservicio modernas que funcionan con IA para la preparación de datos, la visualización, la generación de informes empresariales, los análisis aumentados y el procesamiento de lenguaje natural.

La siguiente imagen ilustra la arquitectura.
Descripción de oci-modern-data-reporting-arch.png a continuación
Descripción de la ilustración oci-modern-data-reporting-arch.png

oci-modern-data-reporting-arch-oracle.zip

Cada uno de los componentes de arquitectura enumerados anteriormente funciona de la siguiente manera:
  • La capa de OCI Object Storage proporciona una forma fiable y rentable de almacenar grandes cantidades de datos. Al utilizar Object Storage, tiene un almacén de datos de persistencia común que pueden utilizar varias herramientas y servicios. Esto también garantiza que la capa de procesamiento de datos se pueda ampliar o reducir de forma independiente del almacenamiento.
  • La capa de procesamiento de Oracle Big Data Service proporciona una plataforma para ingerir, transformar y agregar cantidades masivas de datos.
  • La capa de base de datos sirve como un método rápido y eficiente que sirve a las herramientas de informes de clientes con datos seleccionados. En esta capa se conservan los datos recientes y solo los pertinentes.
  • Oracle Analytics Cloud proporciona la capacidad de visualizar datos y realizar previsiones.

Esta arquitectura soporta los siguientes componentes:

  • Integración de datos de OCI

    Oracle Cloud Infrastructure Data Integration es un servicio totalmente gestionado, sin servidor y en la nube que extrae, carga, transforma, limpia y vuelve a formar datos de una variedad de orígenes de datos en servicios de Oracle Cloud Infrastructure de destino, como Autonomous Data Warehouse y Oracle Cloud Infrastructure Object Storage. ETL (extract transform load) aprovecha el procesamiento de escalabilidad horizontal totalmente gestionado en Spark, y ELT (extract load transform) aprovecha las capacidades de reducción de SQL completas de Autonomous Data Warehouse para minimizar el movimiento de datos y mejorar el tiempo de obtención de valor para los datos recién ingeridos. Los usuarios diseñan los procesos de integración de datos mediante una interfaz de usuario intuitiva y sin código que optimiza los flujos de integración para generar el motor y la orquestación más eficientes, asignando y ampliando automáticamente el entorno de ejecución. Oracle Cloud Infrastructure Data Integration proporciona exploración interactiva y preparación de datos y ayuda a los ingenieros de datos a protegerse contra el cambio de esquema mediante la definición de reglas para manejar los cambios de esquema.

  • Flujo

    Oracle Cloud Infrastructure Streaming proporciona una solución de almacenamiento duradera, escalable y totalmente gestionada para la ingesta de flujos de datos continuos y de elevado volumen que puede utilizar y procesar en tiempo real. Puede utilizar Streaming para ingerir datos de gran volumen, como logs de aplicación, datos de telemetría operativa y datos de flujo de clics en la web, o para otros casos de uso en los que se producen y procesan datos de forma continua y secuencial en un modelo de mensajería de publicación-suscripción.