Essa arquitetura demonstra as habilidades de um data lake na nuvem usando os serviços Oracle Data and AI para processar dados de uma ampla gama de recursos de dados empresariais. Dados podem ser descobertos de várias origens dentro e fora da Oracle e depois ingeridos para transformação. A transformação dos dados brutos em dados mensuráveis e acionáveis requer que os dados sejam processados em vários estágios:
- Descobrir
- Ingestão
- Transformação
- Curar
- Analise, aprenda e preveja
- Medir e agir
Os seguintes recursos se estendem por toda a região do Oracle Cloud Infrastructure (OCI):
- Governança
- Segurança, Identidade e Gerenciamento de Acesso
- O FastConnect no local permite transferência de dados on-line com os recursos de Computação Flexível e Armazenamento Flexível do OCI
- A parceria da Oracle com o Azure Interconnect permite a migração para a nuvem e a criação de aplicativos nativos da nuvem.
A região é dividida em camadas funcionais que hospedam componentes físicos ou funcionais:
- Estágio de descoberta: você pode descobrir dados de uma ampla variedade de origens, como Aplicativos Empresariais, Azure e outros bancos de dados, Oracle Data Cloud, Webclicks, Fluxos de Eventos, Sensores e Mídia ou Armazenamentos de Objetos de Arquivo.
-
Camada do Data Refinery: Os dados passam pelo estágio de Ingestão nessa camada.
- Os serviços de Ingestão de Lotes (Integração de Dados OCI, ODI e Ferramentas de BD) consomem dados de aplicativos. O Oracle Autonomous Data Warehouse consome dados refinados do aplicativo. O armazenamento em Nuvem na camada Data Persistence Platform consome dados brutos.
- A Captura de Dados de Alteração (GoldenGate e ODI) e a Transferência em Massa (FastConnect Data Transfer, MFT, CLI) permitem que dados brutos sejam movidos de todos os caminhos de refinaria de dados para o armazenamento na nuvem na camada Persistência de Dados e Processamento.
- O serviço Streaming Ingest (Streaming Service, Big Data Service) consome os dados de Fluxo de Eventos. O serviço Streaming Processing (GoldenGate Stream Analytics) consome os dados do fluxo e os transfere para o armazenamento na nuvem na camada de Persistência e Processamento de Dados.
-
Camada de Persistência e Processamento de Dados: Os dados passam pelos estágios Transformar e Curtar. Essa camada facilita a navegação de dados para mostrar a exibição de negócios atual.
A camada de Persistência de Dados & Processamento estrutura os dados com base no fato de a tecnologia de banco de dados usada ser relacional ou não relacional. A Governança (Catálogo de Dados) se aplica aos dados do aplicativo e aos dados brutos quando eles passam por essa camada.
-
Camada de Acesso e Interpretação: os dados passam pelo estágio Analisar, Aprender e Prever. Essa camada torna os dados prontos para acesso e interpretação usando Análises, Aprendizado de Máquina e Serviços de AI, como Detecção de Anomalias. Você pode visualizar dados refinados do aplicativo usando o serviço Oracle Analytics Cloud. Os cientistas de dados podem aproveitar os serviços de Aprendizado de Máquina (Data Science, Notebooks OML e OML) para criar e treinar modelos com uma interface de usuário familiar. O Machine Learning consome dados brutos que podem ser usados para modelos de treinamento. Os serviços Streaming Analytics (GoldenGate Stream Analytics) fornecem visualizações de dados para disponibilizar os dados para acesso e interpretação.
As APIs disponíveis por meio de um API Gateway e Functions podem ser usadas pelos desenvolvedores para criar seus próprios aplicativos e aproveitar os dados brutos usando serviços de aprendizado de máquina e IA.
- Estágio da Medida e da Ação: o Oracle Applications Data Warehouse pode aproveitar os dados analisados, usá-los, aprender com eles e prever resultados. Análises Avançadas, Painéis de Controle e Relatórios, Modelos de Aprendizado de Máquina, Aplicativos Orientados a Dados, Serviços Ativados por IA e todos se beneficiam com o uso de medidas e com base nas previsões. As organizações podem monetizar os dados tomando decisões de negócios baseadas em dados usando aplicativos orientados a dados. Eles podem treinar modelos de aprendizado de máquina, criar painéis de controle e relatórios e análises avançadas.