Replicar dados do PostgreSQL para o Google BigQuery
Saiba como usar o OCI GoldenGate para replicar dados do PostgreSQL para o Google BigQuery.
Antes de começar
Para concluir este início rápido com sucesso, você deve ter o seguinte:
Para concluir este início rápido com sucesso, você deve ter o seguinte:
-
Uma instalação do PostgreSQL para servir como banco de dados de origem (Consulte Configuração do ambiente)
-
Abra a porta 5432 na lista de segurança da sua VCN
-
Crie uma conexão com o Google Cloud Storage.
Observação: Certifique-se de que o bucket do GCS e o conjunto de dados do BigQuery existam no mesmo local/região.
Configuração do ambiente: PostgreSQL
Para configurar o ambiente para esse Início Rápido:
-
Execute os comandos a seguir para instalar o PostgreSQL.
-
Instale o servidor PostgreSQL:
sudo yum install postgresql-server -
Instale o módulo postgresql-contrib para evitar esta exceção SQL:
sudo yum install postgresql-contrib -
Crie um novo cluster de banco de dados PostgreSQL:
sudo postgresql-setup --initdb -
Ative o postgresql.service:
sudo systemctl enable postgresql.service -
Inicie o postgresql.service:
sudo systemctl start postgresql.service
-
-
Por padrão, o PostgreSQL só permite conexões locais. Permitir conectividade remota com o PostgreSQL.
-
No
/var/lib/pgsql/data/postgresql.conf, prepare o banco de dados para replicação. -
Localize e remova o comentário de
listen_addresses = 'localhost'e altere o localhost para um asterisco (`):listen_addresses = '*' -
Defina os seguintes parâmetros da seguinte forma:
-
wal_level = logical -
max_replication_slots = 1 -
max_wal_senders = 1 -
track_commit_timestamp = on
Observação:
Configure o
/var/lib/pgsql/data/pg_hba.confpara garantir que a autenticação do cliente seja definida para permitir conexões de um host do Oracle GoldenGate. Por exemplo, adicione o seguinte:#Allow connections from remote hosts host all all 0.0.0.0/0 md5Consulte O arquivo pg_hba.conf para obter mais informações.
- Reinicie o servidor PostgreSQL:
sudo systemctl restart postgresql.service- Se estiver usando o Oracle Cloud Compute para hospedar o PostgreSQL, abra a porta 5432:
sudo firewall-cmd --permanent --add-port=5432/tcp sudo firewall-cmd --reload sudo firewall-cmd --list-all -
-
Abra a porta 5432 na lista de segurança da sua VCN.
-
Estabeleça Conexão com o PostgreSQL.
> sudo su - postgres > psqlObservação: Se preferir, você poderá informar
sudo su - postgres psqlse o exemplo acima não funcionar. -
Configure o PostgreSQL.
-
Faça download do seedSRCOCIGGLL_PostgreSQL.sql e execute-o para configurar o banco de dados e carregar os dados de amostra.
-
Execute os seguintes comandos para configurar o usuário (certifique-se de substituir
<password>por uma senha real):
create user ggadmin with password '<password>'; alter user ggadmin with SUPERUSER; GRANT ALL PRIVILEGES ON DATABASE ociggll TO ggadmin; -
-
Tarefa 1: Criar os recursos do OCI GoldenGate
-
Crie uma implantação para o banco de dados PostgreSQL de origem.
-
Crie uma implantação de Big Data para o Google BigQuery de destino.
-
Crie uma conexão com o Google BigQuery de destino.
-
Crie uma conexão com o banco de dados PostgreSQL de origem.
-
Para Tipo, certifique-se de selecionar o PostgreSQL Server.
-
Para Nome do banco de dados, digite
ociggll. -
Para Host, informe o IP público da instância do serviço Compute na qual o PostgreSQL é executado.
-
Para Porta, informe
5432. -
Para Username, digite
ggadmin. -
Em Senha, informe uma senha.
-
Para Protocolo de Segurança, selecione Simples.
-
-
Crie uma conexão com o GoldenGate e, em seguida, designe essa conexão à implantação do PostgreSQL de origem.
-
Designe a conexão de origem à implantação do PostgreSQL de origem..
-
Designe a relação de destino à implantação de Big Data de destino.
Tarefa 2: Ativar log complementar
Para ativar o registro em log complementar:
-
Inicie a console de implantação do PostgreSQL GoldenGate do:
-
Na página Implantações, selecione a implantação do PostgreSQL para ver os detalhes.
-
Na página Detalhes da implantação do PostgreSQL, selecione Iniciar console.
-
Na página de acesso da console de implantação, informe as credenciais de administrador do GoldenGate fornecidas na Tarefa 1, etapa 1.
Observação: O acesso será obrigatório se o IAM não tiver sido selecionado como o armazenamento de credenciais ao criar uma implantação.
-
-
Na console de implantação, selecione Conexões de BD na navegação esquerda, depois o banco de dados PostgreSQL de origem e, em seguida, Trandata.
-
Na página TRANDATA, ao lado de Informações TRANDATA, selecione Adicionar TRANDATA (ícone de mais).
-
No painel Trandata, para Nome do Esquema, digite
src_ocigglle selecione Enviar.Observação: Use o campo de pesquisa para procurar
src_ocigglle verificar se as tabelas foram adicionadas.
Tarefa 3: Criar o Processo de Extract
Para adicionar a Extração de Captura de Dados de Alteração:
-
Na navegação esquerda, selecione Extrações.
-
Na página Extracts, selecione Adicionar Extract (ícone de mais) e preencha os campos da seguinte forma:
-
Na página Informações da Extração:
-
Para Tipo de extração, selecione Alterar Extração de Captura de Dados.
-
Para Nome do Processo, informe um nome para o processo Extract, como
ECDC. -
Selecione Próximo.
-
-
Na página Opções de Extração:
-
Para credenciais de Origem, selecione Oracle GoldenGate na lista drop-down Domínio
-
Selecione o banco de dados PostgreSQL de origem na lista drop-down Alias.
-
Para Extrair Nome da Trilha, informe um nome de trilha de dois caracteres, como
C1. -
Selecione Próximo.
-
-
Na página Parâmetros de Extração, substitua
MAP *.*, TARGET *.*;pelo seguinte:TABLE SRC_OCIGGLL.*;
-
-
Selecione Criar e Executar.
Você retornará à página Extracts, onde poderá observar o início das Extracts.
Tarefa 4: Criar o Caminho de Distribuição para a Captura de Dados de Alteração
Para criar um Caminho de Distribuição para Captura de Dados de Alteração, conclua o seguinte:
-
Na console do Oracle Cloud, na página Implantações, selecione a implantação do Big Data de destino.
-
Selecione Adicionar Caminho de Distribuição.
-
Preencha o formulário Adicionar Caminho da seguinte forma:
-
Na página Informações do Caminho:
-
Para Nome do Caminho, informe um nome.
-
Selecione Próximo.
-
-
Na página Opções de Origem:
-
Para Extração de Origem, selecione a Extração da Captura de Dados de Alteração (
ECDC). -
Para Nome da Trilha, selecione o arquivo da trilha de Captura de Dados de Alteração (
C1). -
Selecione Próximo.
-
-
Na página Opções de Destino:
-
Para Destino, selecione wss.
-
Para Host de Destino, informe o URL da console de implantação de destino (você pode encontrar isso na página de detalhes da implantação, sem https:// ou qualquer barra à direita).
-
Para o Número de Porta, informe
443. -
Para Nome da Trilha, informe
C1. -
Para Método de Autenticação de Destino, selecione Alias de ID de Usuário.
-
Em Domínio, digite o nome do domínio.
-
Para Alias, informe o alias.
-
-
Selecione Criar Caminho e Executar.
-
Tarefa 5: Adicionar uma Replicação
-
No menu de navegação da console de implantação do Big Data de destino, selecione Replicações e, em seguida, selecione Adicionar Replicat (ícone de mais).
-
Na página Replicatos, selecione Adicionar Replicat (ícone de mais) e preencha o form Adicionar Replicat da seguinte forma:
-
Na página Informações do Replicat:
-
Para Tipo de replicat, selecione Paralelo ou Replicação Coordenada.
-
Para Nome do Processo, informe um nome, como
RCDC. -
Selecione Próximo.
-
-
Na página Opções de Replicat:
-
Para Nome da Trilha Replicat, informe o nome da Trilha da Tarefa 3 (
C1). -
Para Credenciais de Destino, selecione o Domínio e o Alias para a conexão do Google Big Query.
-
Para Locais de preparação disponíveis, selecione o Google Cloud Storage no menu suspenso.
-
Para via alias de preparação, selecione a conexão do Google Cloud Storage na lista drop-down.
-
-
Na página Arquivo de Parâmetros, adicione o seguinte mapeamento e selecione Próximo:
MAP *.*, TARGET *.*; -
Na página Arquivo de Propriedades, configure as propriedades necessárias conforme necessário. Procure os marcados como
#TODOe selecione Próximo.Algumas propriedades a serem consideradas para modificação incluem:
gg.eventhandler.gcs.bucketMappingTemplate: forneça o nome do bucket que será usado como armazenamento de preparação
-
-
Selecione Criar e Executar.
Você retorna à página Replicats, na qual pode revisar os detalhes do Replicat.
Tarefa 6: Verificar Captura de Dados de Alteração
Execute atualizações no banco de dados PostgreSQL de origem para verificar a replicação do Google BigQuery.
-
Execute o seguinte script para executar inserções no banco de dados PostgreSQL:
Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1000,'Houston',20,743113); Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1001,'Dallas',20,822416); Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1002,'San Francisco',21,157574); Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1003,'Los Angeles',21,743878); Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1004,'San Diego',21,840689); Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1005,'Chicago',23,616472); Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1006,'Memphis',23,580075); Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1007,'New York City',22,124434); Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1008,'Boston',22,275581); Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1009,'Washington D.C.',22,688002); -
No console de implantação do PostgreSQL de origem, selecione o nome do processo Extract (
ECDC) e, em seguida, selecione Estatísticas. Verifique se src_ociggll.src_city tem 10 inserções.Observação: Se o Extract não tiver inserções capturadas, reinicie o Extract
ECDC. -
Na console de implantação do Big Data de destino, selecione o nome do Replicat, exiba seus Detalhes e marque Estatísticas para verificar o número de inserções.