Consumir e Transformar Dados Usando um Fluxo de Dados
Fluxo de dados é um diagrama lógico que representa o fluxo de dados dos ativos de dados de origem, como um banco de dados ou um arquivo sem formatação, para ativos de dados de destino, como um data lake ou data warehouse.
O fluxo de dados da origem ao destino pode sofrer uma série de transformações para agregar, limpar e moldar os dados. Engenheiros de dados e desenvolvedores de ETL podem analisar ou reunir informações e usar esses dados para tomar decisões de negócios impactantes.
Neste tutorial, você:
- Crie um projeto no qual você possa salvar o fluxo de dados.
- Adicione os operadores de origem e selecione as entidades de dados a serem usadas no fluxo de dados.
- Use operadores de modelagem e aplique transformações.
- Identifique o ativo de dados de destino para carregar os dados.
Antes de Começar
Para consumir e transformar dados usando um fluxo de dados, você deve ter o seguinte:
- Acesso a um espaço de trabalho do Data Integration. Consulte Estabelecer Conexão com o Data Integration.
- Ativos de dados de origem e de destino criados.
-
A permissão
PAR_MANAGE
ativada no bucket de preparação.allow any-user to manage buckets in compartment <compartment-name> where ALL {request.principal.type = 'disworkspace', request.principal.id = '<workspace-ocid>', request.permission = 'PAR_MANAGE'}
Os bancos de dados autônomos usam o Object Storage para preparar dados e precisam de solicitações pré-autenticadas.
1. Criando um Projeto e um Fluxo de Dados
No Oracle Cloud Infrastructure Data Integration, os fluxos de dados e tarefas só podem ser criados em um projeto ou pasta.
Para criar um projeto e um fluxo de dados:
2. Adicionando Operadores de Origem
Adicione operadores de origem para identificar as entidades de dados a serem usadas para o fluxo de dados. Uma entidade de dados representa uma tabela de banco de dados neste tutorial.
3. Filtrando e Transformando Dados
O operador de Filtro produz um subconjunto de dados de um operador de upstream com base em uma condição.
Usando o Data Xplorer, você pode explorar uma amostra de dados, revisar metadados de perfil e aplicar transformações na guia Dados do painel Propriedades. Os operadores de expressão são adicionados à tela para cada transformação aplicada.
4. Associando Dados
Depois de aplicar filtros e transformações, você poderá juntar as entidades de dados de origem usando um identificador de cliente exclusivo e, em seguida, carregar os dados em uma entidade de dados de destino.
5. Adicionando um Operador de Destino
Recursos Adicionais
O Que Vem a Seguir
Depois que você ingerir e transformar dados usando um fluxo de dados, crie uma tarefa de integração para configurar e executar o fluxo de dados.