Replicar dados do Autonomous Transaction Processing para o Databricks

Esse início rápido demonstra como replicar dados do Autonomous Transaction Processing para Databricks usando o OCI GoldenGate.

Antes de começar

Para concluir este início rápido com sucesso, você deve ter o seguinte:

Configuração do ambiente: Autonomous Transaction Processing

Se você ainda não tiver um banco de dados de origem configurado para replicação, poderá seguir estas etapas para carregar um esquema de amostra a ser usado para esse início rápido. Esse início rápido usa o Autonomous Transaction Processing para o banco de dados de origem.

Para configurar o Autonomous Database de origem:

  1. Faça download e descompacte o esquema de banco de dados de amostra.
  2. Na console do Oracle Cloud, selecione a instância do Autonomous Transaction Processing (ATP) na página Autonomous Databases para exibir seus detalhes e acessar o Database Actions.
  3. Desbloqueie o usuário GGADMIN:
    1. Clique em Ações do banco de dados e, em seguida, clique em Usuários do Banco de Dados.
    2. Localize GGADMIN e clique em seu menu de reticências (três pontos) e selecione Editar.
    3. No painel Editar Usuário, informe a senha GGADMIN, confirme a senha e desmarque A conta está Bloqueada.
    4. Clique em Aplicar Alterações.
  4. Carregue os dados e o esquema de amostra de origem:
    1. No menu do Database Actions, em Desenvolvimento, selecione SQL.
    2. Copie e cole o script de OCIGGLL_OCIGGS_SETUP_USERS_ATP.sql na planilha SQL.
    3. Clique em Executar Script. A guia Saída do Script exibe mensagens de confirmação.
    4. Limpe a planilha SQL e copie e cole o script SQL de OCIGGLL_OCIGGS_SRC_USER_SEED_DATA.sql.

      Dica:

      Talvez seja necessário executar cada instrução separadamente para que a ferramenta SQL execute os scripts com sucesso.
    5. Para verificar se as tabelas foram criadas com sucesso, feche a janela SQL e reabra-a novamente. Na guia Navegador, procure o esquema SRC_OCIGGLL e selecione tabelas em suas respectivas listas drop-down.
  5. Ative o registro em log complementar:
    1. Desmarque a Planilha SQL.
    2. Insira a seguinte instrução e clique em Run Statement:
      ALTER PLUGGABLE DATABASE ADD SUPPLEMENTAL LOG DATA;

Tarefa 2: Adicionar o Extract

  1. Na página Implantações, selecione a implantação do Autonomous Transaction Processing de origem.
  2. Na página de detalhes da implantação, clique em Iniciar Console.
  3. Faça log-in com o nome de usuário e a senha do administrador da implantação de origem.
  4. Adicionar informações de transação.
  5. Adicione um Extract..

Tarefa 3: Adicionar e executar o Distribution Path

  1. Se estiver usando o armazenamento de credenciais GoldenGate, crie um usuário para o Caminho de Distribuição na implantação do Big Data de destino; caso contrário, pule para a Etapa 3.
  2. Na console de implantação do ATP GoldenGate de origem, adicione uma Conexão de Caminho para o usuário criado na Etapa 1.
    1. Na console de implantação GoldenGate do ATP de origem, clique em Conexões de Caminho na navegação esquerda.
    2. Clique em Adicionar Conexão de Caminho (ícone de mais) e conclua o seguinte:
      1. Para Alias da Credencial, digite GGSNetwork.
      2. Para ID do Usuário, digite o nome do usuário criado na Etapa 1.
      3. Digite a senha do usuário duas vezes para verificação.
    3. Clique em Enviar.

      A conexão de caminho aparece na lista Conexões de Caminho.

  3. Na console de implantação ATP de origem, adicione um Caminho de Distribuição com os seguintes valores:
    1. Na página Opções de Origem:
      • Para Extract de Origem, selecione o Extract criado na Tarefa 2.
      • Para Nome da Trilha, digite um nome de dois caracteres, como E1.
    2. Na página Opções de Destino:
      • Para Host de Destino, informe o domínio do host da implantação de destino.
      • Para Port Number, digite 443.
      • Para Nome da Trilha, digite um nome de dois caracteres, como E1.
      • Para Alias, informe o Alias da Credencial criado na Etapa 2.
  4. Na console de implantação do Big Data de destino, verifique o Receiver Path criado como resultado do Distribution Path.
    1. Na console de implantação do Big Data de destino, clique em Receiver Service.
    2. Verifique os detalhes do caminho. Esse caminho foi criado como resultado do Distribution Path criado na etapa anterior.

Tarefa 4: Adicionar e executar o Replicat

  1. Na console de implantação do Big Data de destino, clique em Administrator Service e, em seguida, clique em Add Replicat (ícone de mais).
  2. Adicione um Replicat com os seguintes valores:
    1. Na página Informações de Replicat, no tipo Replicat, selecione Classic Replicat, digite um Nome de Processo e clique em Próximo.
    2. Na página Opções de Replicação:
      • Para Nome, digite o nome da Trilha da Tarefa 2.
      • Para Destino, selecione Databricks.
      • Para Alias Disponível, selecione a conexão Databricks na lista drop-down.
      • Para Local de Preparação Disponível, selecione Armazenamento do Azure Data Lake.
      • Para via alias de tabela intermediária, selecione sua conexão ADLS.
    3. Na página Opções Gerenciadas, deixe o padrão.
    4. Na página Arquivo do Paremeter, substitua MAP *.*, TARGET *.*; pelo seguinte e clique em Próximo:
      MAP SRC_OCIGGLL.SRC_CUSTOMER, TARGET
            <target_catalog_name>.<target_schema_name>.SRC_CUSTOMER
    5. Na página Arquivo de Propriedades:
      1. Forneça o nome do contêiner do ADLS de destino em gg.eventhandler.abs.bucketMappingTemplate.
      2. Adicione gg.handler.databricks.fileRollInterval=5s.
  3. Clique em Criar e Executar.
Você retorna à página Visão Geral, na qual pode revisar os detalhes de Replicat.

Tarefa 5: Verificar a replicação

Execute algumas atualizações na instância do Autonomous Transaction Processing de origem para verificar a replicação nos Databricks.
  1. Na console do Oracle Cloud, abra o menu de navegação, selecione Oracle Database e, em seguida, selecione Autonomous Transaction Processing.
  2. Na lista de instâncias do Autonomous Transaction Processing, selecione sua instância de origem para exibir os detalhes dela.
  3. Na página de detalhes do banco de dados, clique em Database Actions.

    Observação:

    Você deverá ter feito log-in automaticamente. Caso contrário, faça log-in com as credenciais do banco de dados.
  4. Na página inicial do Database Actions, selecione SQL.
  5. Insira o seguinte na planilha e clique em Run Script.
    Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1001,0,'Brendt','Paul','10 Jasper Blvd.',107,'(212) 555 2146',19,10);
    Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1002,0,'McCarthy','Robin','27 Pasadena Drive',11,'(214) 555 3075',29,11);
    Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1003,0,'Travis','Peter','7835 Hartford Drive',12,'(510) 555 4448',34,12);
    Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1004,0,'Larson','Joe','87 Carmel Blvd.',13,'(213) 555 5095',45,13);
    Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1005,0,'Goldschmidt','Tony','91 Torre drive',14,'(619) 555 6529',55,20);
    Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1006,0,'Baker','William','2890 Grant Avenue',15,'(312) 555 7040',64,21);
    Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values ((1007,0,'Swenson','Jack','64 Imagination Drive',19,'(202) 555 8125',74,22);
    Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1008,0,'Brendt','Paul','10 Jasper Blvd.',107,'(212) 555 2146',19,10);
    Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1009,0,'McCarthy','Robin','27 Pasadena Drive',11,'(214) 555 3075',29,11);
    Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1010,0,'Travis','Peter','7835 Hartford Drive',12,'(510) 555 4448',34,12);
  6. Na console de implantação do ATP de origem, selecione o nome Extract e clique em Estatísticas. Verifique se SRC_OCIGGLL.SRC_CUSTOMER tem 10 inserções.
  7. Na console de implantação GoldenGate do Big Data OCI de destino, selecione o nome Replicat e clique em Estatísticas. Verifique se SRC_OCIGGLL.SRC_CUSTOMER tem 10 inserções.

Tarefa 6: Monitorar e manter processos

  1. Monitorar o desempenho.
  2. Gerenciar arquivos de Trilha.