Observação:
- Este tutorial requer acesso ao Oracle Cloud. Para se inscrever em uma conta gratuita, consulte Conceitos Básicos do Oracle Cloud Infrastructure Free Tier.
- Ele usa valores de exemplo para credenciais, tenancy e compartimentos do Oracle Cloud Infrastructure. Ao concluir seu laboratório, substitua esses valores por valores específicos do seu ambiente de nuvem.
Acessar Buckets do OCI Object Storage do Cluster do Oracle Big Data Service Usando o Controlador de Recursos
Introdução
O Oracle Big Data Service é um serviço baseado em nuvem fornecido pela Oracle que permite aos usuários criar e gerenciar clusters Hadoop, clusters Spark, Trino e outros serviços de big data. A Oracle Cloud Infrastructure (OCI) permite integração perfeita entre clusters do Oracle Big Data Service e o OCI Object Storage usando o controlador de recursos.
Este tutorial o guiará pelas tarefas de configuração e acesso ao bucket do OCI Object Storage de um cluster do Oracle Big Data Service, aproveitando o controlador de recursos para autenticação segura.
Objetivos
-
Configure o Oracle Big Data Service para acessar o OCI Object Storage usando o controlador de recursos.
-
Configure políticas no OCI.
-
Teste o acesso ao bucket no cluster do Oracle Big Data Service.
Pré-requisitos
-
Cluster do Oracle Big Data Service implantado.
-
Acesso a uma tenancy do OCI.
-
Permissões para criar políticas no OCI.
Tarefa 1: Criar Políticas
-
Faça log-in na Console do OCI, navegue até Identidade e Segurança e clique em Políticas.
-
Crie as políticas a seguir para conceder ao cluster do Oracle Big Data Service acesso ao bucket do OCI Object Storage.
allow any-user to read buckets in tenancy where ALL {request.principal.id='<BDS OCID>', target.bucket.name='<bucket name>'} allow any-user to read objects in tenancy where ALL {request.principal.id='<BDS OCID>', target.bucket.name='<bucket name>'}
Observação: Substitua
<BDS OCID>
e<bucket name>
pelo OCID do cluster do Oracle Big Data Service e pelo nome do bucket, respectivamente.
Tarefa 2: Criar Controlador de Recursos no Cluster do Oracle Big Data Service
-
Vá para a Console do OCI, navegue até Analytics and AI e clique em Big data Service.
-
Clique no cluster implantado.
-
Clique em Controlador de Recursos e Criar Controlador de Recursos.
-
Informe o Nome para exibição e a duração do tempo de vida do token de sessão (em horas) e clique em Criar.
Tarefa 3: Atualizar Configuração do HDFS (Hadoop Distributed File System)
-
Vá para a Console do Apache Ambari, navegue até HDFS, Configurações e Avançado.
-
Atualize as propriedades a seguir para a configuração do HDFS.
fs.oci.client.custom.authenticator=com.oracle.oci.bds.commons.auth.BDSResourcePrincipalAuthenticator fs.oci.client.regionCodeOrId=us-region-1 fs.oci.rp.pem.passphrase.path=/etc/security/tokens/rpst.pass fs.oci.rp.pem.path=/etc/security/tokens/rpst.pem fs.oci.rp.rpst.path=/etc/security/tokens/rpst.token
Observação: O grupo
bds_rp_users
possui o tokenrpst
e as chaves desse controlador de recursos no cluster. -
Salve as alterações e reinicie os serviços necessários no Apache Ambari.
Tarefa 4: Definir Variáveis de Ambiente (Opcional)
Para aplicativos que acessam o bucket por meio do SDK (Software Development Kit) da OCI ou de outros clientes, certifique-se de que as variáveis de ambiente a seguir estejam definidas.
OCI_RESOURCE_PRINCIPAL_VERSION=2.2
OCI_RESOURCE_PRINCIPAL_PRIVATE_PEM=/etc/security/tokens/rpst.pem
OCI_RESOURCE_PRINCIPAL_REGION=us-region-1
OCI_RESOURCE_PRINCIPAL_RPST=/etc/security/tokens/rpst.token
Tarefa 5: Testar o Acesso ao Bucket do OCI Object Storage
Faça SSH no cluster do Oracle Big Data Service e teste o acesso ao bucket usando comandos HDFS.
hdfs dfs -ls oci://<bucket name>@<namespace>/
Observação: Certifique-se de substituir
<bucket name>
pelo bucket do OCI usado em políticas e no valor<namespace>
.
Solução de problemas e dicas
-
Core-site.xml
Verificação: Se o conteúdo do bucket não estiver acessível, verifique se o arquivocore-site.xml
foi gerado corretamente pelo Apache Ambari e contém os valores corretos de configuração do controlador de recursos. -
Reinicialização do HDFS: Após atualizar a configuração do HDFS, certifique-se de que todos os serviços necessários sejam reiniciados para aplicar as alterações.
-
Escopo da Política: Verifique novamente se as políticas estão definidas e aplicadas corretamente ao cluster do Oracle Big Data Service.
Próximas Etapas
-
Explore integrações avançadas do OCI SDK para acesso a dados mais sofisticado.
-
Fazer Upload e Download de Dados Usando
DistCp
: Após configurar o acesso ao bucket, você pode usar o comandoDistCp
do Hadoop para transferir com eficiência grandes conjuntos de dados entre o HDFS e o OCI Object Storage. Isso é especialmente útil para backup, migração ou movimentação de dados em larga escala. -
Programar Transferência de Dados com o Oozie: Automatize o processo de upload e download programando jobs regulares do DistCp usando o Oozie para backups recorrentes ou sincronização de dados.
Links Relacionados
-
Introdução a um Cluster de Big Data ODH Altamente Disponível
-
Interface de Linha de Comando e Kits de Desenvolvimento de Software do OCI
Confirmações
- Autors - Pavan Upadhyay (Engenheiro de Nuvem Principal), Saket Bihari (Engenheiro de Nuvem Principal)
Mais Recursos de Aprendizagem
Explore outros laboratórios em docs.oracle.com/learn ou acesse mais conteúdo de aprendizado gratuito no canal Oracle Learning YouTube. Além disso, visite education.oracle.com/learning-explorer para se tornar um Oracle Learning Explorer.
Para obter a documentação do produto, visite o Oracle Help Center.
Access OCI Object Storage Buckets from Oracle Big Data Service Cluster Using Resource Principal
G16228-01
September 2024