Replicar dados do PostgreSQL para o Snowflake

Aprenda a replicar dados do PostgreSQL para o Snowflake usando o OCI GoldenGate.

Antes de começar

Para concluir este início rápido com sucesso, você deve ter o seguinte:

Configuração do ambiente: PostgreSQL

Para configurar o ambiente para esse Início Rápido:

  1. Execute os comandos a seguir para instalar o PostgreSQL.

    1. Instale o servidor PostgreSQL:

      sudo yum install postgresql-server
    2. Instale o módulo postgresql-contrib para evitar esta exceção SQL:

      sudo yum install postgresql-contrib
    3. Crie um novo cluster de banco de dados PostgreSQL:

      sudo postgresql-setup --initdb
    4. Ative o postgresql.service:

      sudo systemctl enable postgresql.service
    5. Inicie o postgresql.service:

      sudo systemctl start postgresql.service
  2. Por padrão, o PostgreSQL só permite conexões locais. Permitir conectividade remota com o PostgreSQL.

    1. No /var/lib/pgsql/data/postgresql.conf, prepare o banco de dados para replicação.

    2. Localize e remova o comentário de listen_addresses = 'localhost' e altere o localhost para um asterisco (`):

      listen_addresses = '*'
    3. Defina os seguintes parâmetros da seguinte forma:

      • wal_level = logical

      • max_replication_slots = 1

      • max_wal_senders = 1

      • track_commit_timestamp = on

      Observação:

      Configure o /var/lib/pgsql/data/pg_hba.conf para garantir que a autenticação do cliente seja definida para permitir conexões de um host do Oracle GoldenGate. Por exemplo, adicione o seguinte:

      #Allow connections from remote hosts
      
      host all all 0.0.0.0/0 md5

      Consulte O arquivo pg_hba.conf para obter mais informações.

      1. Reinicie o servidor PostgreSQL:
      sudo systemctl restart postgresql.service
      1. Se estiver usando o Oracle Cloud Compute para hospedar o PostgreSQL, abra a porta 5432:
      sudo firewall-cmd --permanent --add-port=5432/tcp
      sudo firewall-cmd --reload
      sudo firewall-cmd --list-all
    4. Abra a porta 5432 na lista de segurança da sua VCN.

    5. Estabeleça Conexão com o PostgreSQL.

      > sudo su - postgres
      > psql

      Observação: Se preferir, você poderá informar sudo su - postgres psql se o exemplo acima não funcionar.

    6. Configure o PostgreSQL.

      1. Faça download do seedSRCOCIGGLL_PostgreSQL.sql e execute-o para configurar o banco de dados e carregar os dados de amostra.

      2. Execute os seguintes comandos para configurar o usuário (certifique-se de substituir <password> por uma senha real):

      create user ggadmin with password '<password>';
      alter user ggadmin with SUPERUSER;
      GRANT ALL PRIVILEGES ON DATABASE ociggll TO ggadmin;

Configuração do ambiente: Snowflake

  1. Crie um usuário do GoldenGate no Snowflake com privilégios apropriados.

  2. Crie tabelas de destino usando o esquema de amostra.

Verifique se as tabelas e o usuário foram criados com sucesso.

Tarefa 1: Criar os recursos do OCI GoldenGate

Este exemplo de início rápido exige implantações e conexões para a origem e o destino.

  1. Crie uma implantação para o banco de dados PostgreSQL de origem.

  2. Crie uma implantação de Big Data para o banco de dados Snowflake de destino.

  3. Crie uma conexão PostgreSQL com os seguintes valores:

    1. Para Tipo, selecione PostgreSQL Server no menu suspenso.

    2. Para Nome do banco de dados, digite ociggll.

    3. Para Host, informe o IP público da instância do serviço Compute na qual o PostgreSQL é executado.

    4. Para Porta, informe 5432.

    5. Para Username, digite ggadmin.

    6. Em Senha, informe a sua senha.

    7. Para Protocolo de Segurança, selecione Simples na lista drop-down.

  4. Crie uma conexão Snowflake com os seguintes valores:

    1. Para o URL de Conexão, digite jdbc:snowflake://<account_identifier>.snowflakecomputing.com/?warehouse=<warehouse name>&db=OCIGGLL.

      Observação: Certifique-se de substituir <account_identifier> e <warehouse name> pelos valores apropriados.

    2. Para Tipo de Autenticação, selecione Autenticação básica na lista drop-down.

    3. Para Nome do Usuário, informe um nome.

    4. Em Senha, informe uma senha.

  5. (Opcional) Se sua implantação do Big Data não tiver um ponto final público, crie uma conexão com o GoldenGate e atribua essa conexão à implantação do PostgreSQL de origem.

  6. Designe a conexão PostgreSQL de origem à implantação do PostgreSQL.

  7. Designe a conexão do Snowflake à implantação do Big Data de destino.

Tarefa 2: Ativar log complementar

Para ativar o registro em log complementar:

  1. Inicie a console de implantação do PostgreSQL GoldenGate do:

    1. Na página Implantações, selecione a implantação do PostgreSQL para ver os detalhes.

    2. Na página Detalhes da implantação do PostgreSQL, selecione Iniciar console.

    3. Na página de acesso da console de implantação, informe as credenciais de administrador do GoldenGate fornecidas na Tarefa 1, etapa 1.

      Observação: O acesso será obrigatório se o IAM não tiver sido selecionado como o armazenamento de credenciais ao criar uma implantação.

  2. Na console de implantação, selecione Conexões de BD na navegação esquerda, depois o banco de dados PostgreSQL de origem e, em seguida, Trandata.

  3. Na página TRANDATA, ao lado de Informações TRANDATA, selecione Adicionar TRANDATA (ícone de mais).

  4. No painel Trandata, para Nome do Esquema, digite src_ociggll e selecione Enviar.

    Observação: Use o campo de pesquisa para procurar src_ociggll e verificar se as tabelas foram adicionadas.

Tarefa 3: Criar os processos de Extract

  1. Adicionar a Extração da Captura de Dados de Alteração:

    1. Na navegação esquerda, selecione Extrações,

    2. Na página Extracts, selecione Adicionar Extract (ícone de mais) e preencha os campos da seguinte forma:

      • Na página Informações da Extração:

        1. Para Tipo de extração, selecione Alterar Extração de Captura de Dados.

        2. Para Nome do Processo, informe um nome para o processo Extract, como ECDC.

        3. Selecione Próximo.

      • Na página Opções de Extração:

        1. Para credenciais de Origem, selecione Oracle GoldenGate na lista drop-down Domínio

        2. Selecione o banco de dados PostgreSQL de origem na lista drop-down Alias.

        3. Para Extrair Nome da Trilha, informe um nome de trilha de dois caracteres, como C1.

        4. Selecione Próximo.

      • Na página Parâmetros de Extração, substitua MAP *.*, TARGET *.*; pelo seguinte:

        TABLE SRC_OCIGGLL.*;
    3. Selecione Criar e Executar.

  2. Adicione a Extração de Carga Inicial:

    1. Na página Extracts, selecione Adicionar Extract e preencha o formulário Adicionar Extract da seguinte forma:

      • Na página Informações da Extração:

        1. Para o tipo de Extração, selecione Extração de Carga Inicial.

        2. Para Nome do Processo, informe um nome, como EIL.

        3. Selecione Próximo.

      • Na página Opções de Extração:

        1. Para credenciais de Origem, selecione Oracle GoldenGate na lista drop-down Domínio.

        2. Selecione o banco de dados PostgreSQL na lista drop-down Alias.

        3. Para Nome da Trilha de Extração, informe um nome de trilha de dois caracteres, como I1.

        4. Selecione Próximo.

      • Na página Parâmetros de Extração, substitua o conteúdo da área de texto pelo seguinte:

        EXTRACT EIL
        USERIDALIAS PostgreSQL_Compute, DOMAIN OracleGoldenGate
        EXTFILE I1, PURGE
        TABLE src_ociggll.*;

        Observação: certifique-se de remover o parâmetro SOURCEDB na frente de USERIDALIAS antes de seguir em frente.

    2. Selecione Criar e Executar.

Você retorna à página Extracts, na qual é possível observar o início do processo Extract.

Tarefa 4: Criar o Caminho de Distribuição para Extract de Carga Inicial

Para criar um Caminho de Distribuição para a Extração da Carga Inicial:

  1. Na console do Oracle Cloud, na página Implantações, selecione a implantação do Big Data de destino.

  2. Na página de detalhes da implantação, selecione Iniciar Console e, em seguida, faça log-in como usuário administrador.

  3. Se estiver usando o armazenamento de credenciais do IAM, prossiga para a etapa Criar um Caminho de Distribuição. Se estiver usando o armazenamento de credenciais do GoldenGate, crie um usuário com o qual o GoldenGate de origem use para estabelecer conexão com o GoldenGate de destino.

    1. No menu de navegação, selecione Administração de Usuários.

    2. Selecione Adicionar Novo Usuário (ícone de adição), preencha os campos da seguinte forma e selecione Submeter:

      • Para Username, informe ggsnet.

      • Para Atribuição, selecione Operador.

      • Digite a senha duas vezes para verificação.

  4. No console de implantação do PostgreSQL de origem, crie uma Conexão de Caminho para o usuário criado na etapa anterior.

    1. No menu de navegação, selecione Conexões de Caminho.

    2. Selecione Adicionar Conexão de Caminho (ícone de mais), preencha os campos da seguinte forma e selecione Submeter:

      • Para o Alias de Credencial, digite dpuser.

      • Para ID do Usuário, digite ggsnet

      • Para Senha, digite a mesma senha usada na etapa anterior.

  5. Criar um Caminho de Distribuição.

    1. Na barra de menus do serviço, selecione Caminhos e, em seguida, selecione Adicionar Caminho de Distribuição (ícone de mais).

    2. Preencha o formulário Adicionar Caminho da seguinte forma:

      • Na página Informações do Caminho:

        1. Para Nome do Caminho, informe um nome para este caminho.

        2. Selecione Próximo.

      • Na página Opções de Origem:

        1. Para Extração de Origem, deixe em branco.

        2. Para Nome da Trilha, informe o nome de trilha de Extração da Carga Inicial (I1).

        3. Selecione Próximo.

      • Na página Opções de Destino:

        1. Para Destino, selecione wss.

        2. Para Host do Destino, informe o URL de implantação do destino, sem o https:// ou qualquer barra à esquerda.

        3. Para o Número de Porta, informe 443.

        4. Para Nome da Trilha, informe I1.

        5. Para Método de Autenticação de Destino, selecione Alias de ID de Usuário.

        6. Para Domínio, informe o nome do domínio criado na etapa anterior.

        7. Para Alias, informe o alias criado na etapa anterior (dpuser).

        8. Selecione Próximo.

    3. Selecione Criar e Executar.

    Você retorna à página Serviço de Distribuição, na qual pode revisar o caminho criado.

  6. Na console de implantação de destino, verifique o caminho do Receptor criado como resultado do caminho de Distribuição:

    1. Selecione Caminhos.

    2. Verifique os detalhes do Caminho.

Tarefa 5: Adicionar o Processo de Replicat para Carga Inicial

  1. Na console de implantação do Big Data de destino, adicione o processo Replicat de Carga Inicial.

    1. No menu de navegação, selecione Replicações e, em seguida, Adicionar Replicat (ícone de mais).

    2. Na página Replicats, preencha os campos Adicionar Replicat da seguinte forma:

      1. Na página Informações de Replicação:

        1. Para Tipo de replicado, selecione Clássico ou Coordenado.

        2. Para Nome do Processo, informe um nome, como RIL.

        3. Selecione Próximo.

      2. Na página Opções de Replicat:

        1. Para Nome da Trilha de Replicação, informe o nome da Trilha da Tarefa 2 (I1).

        2. Para Credenciais de Destino, selecione o Domínio e o Apelido da conexão do Snowflake.

        3. Para Alias disponíveis, selecione um alias no menu suspenso, como Snowflake.

        4. (Opcional) Ativar armazenamento externo para selecionar um local de preparação disponível no menu suspenso.

        5. Selecione Próximo.

      3. Na página Arquivo de Parâmetros, adicione o seguinte mapeamento:

        INSERTALLRECORDS
        MAP src_ociggll.src_city, TARGET SRCMIRROR_OCIGGLL.SRC_CITY;
        MAP src_ociggll.src_region, TARGET SRCMIRROR_OCIGGLL.SRC_REGION;
        MAP src_ociggll.src_customer, TARGET SRCMIRROR_OCIGGLL.SRC_CUSTOMER;
        MAP src_ociggll.src_orders, TARGET SRCMIRROR_OCIGGLL.SRC_ORDERS;
        MAP src_ociggll.src_order_lines, TARGET SRCMIRROR_OCIGGLL.SRC_ORDER_LINES;
        MAP src_ociggll.src_product, TARGET SRCMIRROR_OCIGGLL.SRC_PRODUCT;
      4. Na página Propriedades, revise as propriedades e selecione Criar e Executar.

        Você retorna à página Replicats, na qual pode revisar os detalhes do Replicat.

  2. Para verificar a Carga Inicial, conecte-se ao banco de dados do Snowflake e execute as seguintes consultas:

    select * from SRCMIRROR_OCIGGLL.SRC_CITY;
    select * from SRCMIRROR_OCIGGLL.SRC_CUSTOMER;

A saída deve retornar os dados que foram carregados nas tabelas do banco de dados de destino como resultado da Carga Inicial.

Tarefa 6: Criar o Caminho de Distribuição para a Captura de Dados de Alteração

  1. No console de implantação do PostgreSQL de origem, selecione Serviço de Distribuição.

  2. Selecione Adicionar Caminho de Distribuição.

  3. Preencha o formulário Adicionar Caminho da seguinte forma:

    1. Na página Informações do Caminho:

      1. Para Nome do Caminho, informe um nome.

      2. Selecione Próximo.

    2. Na página Opções de Origem:

      1. Para Extração de Origem, selecione a Extração da Captura de Dados de Alteração (ECDC).

      2. Para Nome da Trilha, selecione o arquivo da trilha de Captura de Dados de Alteração (C1).

      3. Selecione Próximo.

    3. Na página Opções de Destino:

      1. Para Destino, selecione wss.

      2. Para Host de Destino, informe o URL da console de implantação de destino (você pode encontrar isso na página de detalhes da implantação, sem https:// ou qualquer barra à direita).

      3. Para o Número de Porta, informe 443.

      4. Para Nome da Trilha, informe C1.

      5. Para Método de Autenticação de Destino, selecione Alias de ID de Usuário.

      6. Em Domínio, digite o nome do domínio.

      7. Para Alias, informe o alias.

    4. Selecione Criar Caminho e Executar.

  4. Na console de implantação do Big Data de destino, selecione Serviço do Receptor e verifique o caminho do Receptor criado.

Tarefa 7: Adicionar um processo de Replicat para Captura de Dados de Alteração

Execute atualizações no banco de dados PostgreSQL de origem para verificar a replicação no Snowflake.

  1. Adicione o processo de Replicat.

    1. Na console de implantação do Big Data de destino, selecione Serviço de Administração e, no menu de navegação, selecione Replicações.

    2. Na página Replicatos, selecione Adicionar Replicat (ícone de mais) e preencha o form Adicionar Replicat da seguinte forma:

      • Na página Informações do Replicat:

        1. Para Tipo de replicado, selecione Clássico ou Coordenado.

        2. Para Nome do Processo, informe um nome, como RCDC.

        3. Selecione Próximo.

      • Na página Opções de Replicat:

        1. Para Nome da Trilha Replicat, informe o nome da Trilha da Tarefa 3 (C1).

        2. Para Credenciais de Destino, selecione o Domínio e o Alias da conexão do Snowflake.

        3. (Opcional) Ativar armazenamento externo para selecionar um local de preparação disponível no menu suspenso.

      • Na página Arquivos de Parâmetros, adicione o seguinte mapeamento e selecione Próximo:

        MAP src_ociggll.src_city, TARGET SRCMIRROR_OCIGGLL.SRC_CITY;
        MAP src_ociggll.src_region, TARGET SRCMIRROR_OCIGGLL.SRC_REGION;
        MAP src_ociggll.src_customer, TARGET SRCMIRROR_OCIGGLL.SRC_CUSTOMER;
        MAP src_ociggll.src_orders, TARGET SRCMIRROR_OCIGGLL.SRC_ORDERS;
        MAP src_ociggll.src_order_lines, TARGET SRCMIRROR_OCIGGLL.SRC_ORDER_LINES;
        MAP src_ociggll.src_product, TARGET SRCMIRROR_OCIGGLL.SRC_PRODUCT;
      • Na página Propriedades, revise as propriedades e selecione Criar e Executar.

        Você retorna à página Replicats, na qual pode revisar os detalhes do Replicat.

  2. Verificar Captura de Dados de Alteração:

    1. Execute atualizações no banco de dados PostgreSQL de origem para verificar a replicação no Snowflake. Execute o seguinte script para executar inserções no banco de dados PostgreSQL:

      Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1000,'Houston',20,743113);
      Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1001,'Dallas',20,822416);
      Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1002,'San Francisco',21,157574);
      Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1003,'Los Angeles',21,743878);
      Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1004,'San Diego',21,840689);
      Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1005,'Chicago',23,616472);
      Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1006,'Memphis',23,580075);
      Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1007,'New York City',22,124434);
      Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1008,'Boston',22,275581);
      Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1009,'Washington D.C.',22,688002);
  3. No console de implantação do PostgreSQL de origem, selecione RCDC e, em seguida, Estatísticas. Verifique se o src_ociggll.src_city tem 10 inserções.

    Observação: Se o Extract não tiver inserções capturadas, reinicie o Extract ECDC.

  4. Na console de implantação do Big Data de destino, selecione o RCDC, revise seus Detalhes e Estatísticas para verificar o número de Inserções.

Tarefa 8: Monitorar e manter processos

  1. Monitorar o processo de replicação.

  2. Gerenciar arquivos de Trilha.