Sobre o Uso do Oracle Modern Data Platform para Relatórios e Previsão de Negócios

Esse design explora o uso do Oracle Modern Data Platform para relatórios e previsões de negócios.

Considere o caso de uso em que uma empresa tem uma grande quantidade de dados de vendas de produtos de origens internas e externas. Embora os dados históricos e recentes de vendas tenham valor para a empresa, na maioria das vezes apenas os dados dos últimos meses ou anos são usados no dia a dia dos negócios. Os consumidores desses dados são usuários de negócios que usam esses dados para relatórios, análises e previsões. Eles querem que seus relatórios e painéis retornem resultados rapidamente para maximizar a produtividade dos funcionários.

Tradicionalmente, as empresas dependiam de data warehouses com base em bancos de dados relacionais para relatar casos de uso como o mencionado acima. No entanto, essas implementações tiveram várias limitações - escalabilidade e desempenho sendo a mais proeminente dessas limitações.

Arquitetura

Uma abordagem mais moderna é usar uma arquitetura de data lakehouse que consiste em OCI Object Storage, tecnologias de Big Data, como Hadoop, Spark e banco de dados colunar ou tradicional para geração de relatórios.

A Oracle Cloud Infrastructure (OCI) tem uma ampla variedade de ferramentas e serviços que atendem a todos os aspectos de uma plataforma de dados moderna. Nesta solução, analisamos um pequeno subconjunto de serviços da OCI que atende aos requisitos de arquitetura.

  1. OCI Object Storage: Uma plataforma de armazenamento de alto desempenho em escala de internet que oferece durabilidade de dados confiável e econômica. Ele pode armazenar uma quantidade ilimitada de dados não estruturados de qualquer tipo de conteúdo, incluindo dados analíticos e conteúdo avançado, como imagens e vídeos.
  2. Oracle Big Data Service: Um serviço Hadoop gerenciado que é projetado para um conjunto diversificado de casos de uso e cargas de trabalho de Big Data. De clusters de vida curta usados para lidar com tarefas específicas a clusters de vida longa que podem ser dimensionados horizontalmente para atender aos requisitos de uma organização a um custo baixo e com os mais altos níveis de segurança.
  3. Oracle Autonomous Database: Um banco de dados fácil de usar e totalmente autônomo que é dimensionado elasticamente e oferece rápido desempenho para consultas. Como serviço, o Autonomous Database não exige administração de banco de dados.
  4. Oracle Analytics Cloud: Um serviço de nuvem pública escalável e seguro que capacita analistas de negócios e consumidores com recursos modernos de análise com autoatendimento para preparação de dados, visualização, relatórios empresariais, análise aumentada e processamento de linguagem natural.

A imagem a seguir ilustra a arquitetura.
Veja a seguir a descrição da oci-modern-data-reporting-arch.png
Descrição da ilustração oci-modern-data-reporting-arch.png

oci-modern-data-reporting-arch-oracle.zip

Cada um dos componentes de arquitetura listados acima trabalham juntos da seguinte maneira:
  • A camada do OCI Object Storage fornece uma maneira confiável e econômica de armazenar grandes quantidades de dados. Ao usar o Object Storage, você tem um armazenamento de dados de persistência comum que pode ser usado por várias ferramentas e serviços. Isso também garante que a camada de processamento de dados possa ser ampliada ou reduzida independentemente do armazenamento.
  • A camada de processamento do Oracle Big Data Service fornece uma plataforma para ingerir, transformar e agregar quantidades em massa de dados.
  • A camada de banco de dados serve como um método rápido e eficiente que atende a ferramentas de relatórios de clientes com dados selecionados. Dados recentes e, ou apenas pertinentes, persistem nesta camada.
  • O Oracle Analytics Cloud oferece a capacidade de visualizar dados e fazer previsões.

Essa arquitetura suporta os seguintes componentes:

  • Integração de Dados da OCI

    O Oracle Cloud Infrastructure Data Integration é um serviço totalmente gerenciado, sem servidor e nativo da nuvem que extrai, carrega, transforma, limpa e remodela dados de várias origens de dados para os serviços de destino do Oracle Cloud Infrastructure, como Autonomous Data Warehouse e Oracle Cloud Infrastructure Object Storage. O ETL (extract transform load) aproveita o processamento de expansão totalmente gerenciado no Spark, e o ELT (extract load transform) aproveita os recursos completos de push-down de SQL do Autonomous Data Warehouse para minimizar a movimentação de dados e melhorar o tempo de retorno dos dados recém-ingeridos. Os usuários projetam processos de integração de dados usando uma interface de usuário intuitiva e sem código que otimiza fluxos de integração para gerar o mecanismo e a orquestração mais eficientes, alocando e dimensionando automaticamente o ambiente de execução. O Oracle Cloud Infrastructure Data Integration fornece exploração interativa e preparação de dados e ajuda os engenheiros de dados a se protegerem contra divergências de esquema definindo regras para tratar alterações de esquema.

  • Streaming

    O Oracle Cloud Infrastructure Streaming fornece uma solução de armazenamento totalmente gerenciada, escalável e durável para ingestão de streams contínuos de alto volume de dados que você pode consumir e processar em tempo real. Você pode usar o serviço Streaming para ingestão de dados de alto volume, como logs de aplicativo, telemetria operacional, fluxo de cliques na Web ou para outros casos de uso em que os dados sejam produzidos e processados de forma contínua e sequencial em um modelo de mensagem do serviço publish-subscribe.